Um cliente uma vez me enviou um site que tinha sido "otimizado para SEO por uma agência profissional" por 18 meses. Rankings estavam estagnados. Tráfego caiu ano após ano. O relatório da agência tinha 47 páginas e incluía uma seção sobre "alinhamento de voz de marca". O que não incluía era o fato de que 3.400 páginas estavam retornando status codes 200 mas tinham tags noindex embutidas na meta. Três mil e quinhentas páginas. Desaparecidas. Invisíveis. A agência nunca tinha feito o crawl do site.
Arrumei em uma semana. Com Screaming Frog e Google Search Console.
Essa é a coisa sobre SEO técnico — recompensa pessoas que realmente olham para os dados em vez de falar sobre eles. E honestamente, para 90% dos sites que audito pela Seahawk, não preciso de Ahrefs, Semrush, ou qualquer uma das grandes plataformas para encontrar os problemas que estão prejudicando a performance. Duas ferramentas. Um processo. Aqui está.Seahawk, I don't need Ahrefs, Semrush, or any of the big platforms to find the problems that are genuinely hurting performance. Two tools. One process. Here it is.
---
Antes de Fazer Crawl de Qualquer Coisa, Configure Screaming Frog Corretamente
A maioria das pessoas abre o Screaming Frog, cola uma URL e clica em iniciar. Tudo bem para um blog com 50 páginas. Para qualquer coisa maior, você fica esperando 40 minutos por um rastreamento que te dá dados errados.
A configuração importa mais do que a velocidade de rastreamento.
A primeira coisa que faço: vou para Configuration > Spider e me certifico de que estou rastreando o protocolo correto. Se o site está em HTTPS (deveria estar), começo a partir da homepage HTTPS canônica. Também desativo o rastreamento de certos tipos de arquivo — PDFs, imagens, vídeos — a menos que eu especificamente queira auditar aqueles. Isso reduz o tempo de rastreamento pela metade.Configuration > Spider and make sure I'm crawling the correct protocol. If the site is on HTTPS (it should be), I'm starting from the canonical HTTPS homepage. I also turn off crawling of certain file types — PDFs, images, videos — unless I specifically want to audit those. It halves the crawl time.
Então defino Configuration > Respect Canonical Tags como desativado. Contra-intuitivo, eu sei. Mas quero ver toda URL canonicalizada para que eu possa auditar se a canonicalização está realmente correta. Se o Screaming Frog pula páginas canonicalizadas, você nunca saberá que elas existem.Configuration > Respect Canonical Tags to off. Counter-intuitive, I know. But I want to see every canonicalised URL so I can audit whether the canonicalisation is actually correct. If Screaming Frog skips canonicalised pages, you'll never know they exist.
Mais uma coisa: em Configuration > Custom Extraction, configuro uma regra de extração para puxar a <title> bruta e a meta description diretamente do código-fonte HTML. Por quê? Porque alguns sites WordPress — particularmente aqueles rodando Yoast junto com um page builder — geram duas tags title. A coluna padrão do Screaming Frog só mostra a primeira. A regra de extração mostra tudo.Configuration > Custom Extraction, I set up an extraction rule to pull the raw <title> and meta description directly from the HTML source. Why? Because some WordPress sites — particularly ones running Yoast alongside a page builder — output two title tags. Screaming Frog's default column only shows you the first one. The extraction rule shows you everything.
---
O Primeiro Passo: O Que Procuro nos Dados do Rastreamento
Assim que o rastreamento termina, não começo com links quebrados. Todo mundo começa com links quebrados. Começo com a aba Response Codes e filtro por redirecionamentos 3xx.Response Codes tab and filter for 3xx redirects.
Em 2021, a Seahawk Media pegou um cliente de e-commerce — varejista de móveis de médio porte, cerca de 8.000 URLs. O time de dev deles tinha estado lidando com redirecionamentos ad hoc por dois anos. Encontramos 19 cadeias de redirecionamento, algumas com até quatro saltos. A Página A redirecionava para a Página B, que redirecionava para a Página C, que redirecionava para a Página D. Google diz que segue até 10 saltos, mas na prática, qualquer coisa além de dois saltos desperdiça orçamento de rastreamento e dilui a equidade de links. Colapsamos tudo em redirecionamentos de salto único. Só isso — sem mudanças de conteúdo, sem link building — moveu três páginas de categoria da página 3 para a página 1 em seis semanas.Google says it follows up to 10 hops, but in practice, anything beyond two hops wastes crawl budget and dilutes link equity. We collapsed everything to single-hop redirects. That alone — no content changes, no link building — moved three category pages from page 3 to page 1 within six weeks.
A ordem em que trabalho através das abas
- Códigos de Resposta → 3xx — cadeias e loops de redirecionamento — redirect chains and loops
- Códigos de Resposta → 4xx — páginas quebradas (filtrar por inlinks para priorizar) — broken pages (filter by inlinks to prioritise)
- Indexabilidade → Não Indexável — noindex, canonicals apontando para outro lugar, bloqueado por robots.txt — noindex, canonicals pointing elsewhere, blocked by robots.txt
- Títulos de Página — ausentes, duplicados, acima de 60 caracteres — missing, duplicated, over 60 characters
- Meta Description — ausente ou duplicada (não é fator de ranking, mas a taxa de cliques importa) — missing or duplicated (not a ranking factor, but click-through matters)
- H1 — ausente, duplicado, ou mais de um por página — missing, duplicated, or more than one per page
- Imagens → Texto Alt Ausente — vitória rápida, especialmente para sites de produtos — quick win, especially for product sites
- Diretivas → Canonical — verifique se correspondem à URL realmente indexável — check these match the actual indexable URL
Essa ordem é deliberada. Trabalho de problemas estruturais (redirecionamentos, páginas quebradas) até problemas on-page. Corrigir uma cadeia de redirecionamento quebrada ajuda toda página nessa cadeia. Corrigir uma meta description ausente ajuda uma página.
---
Camadas no Search Console: Onde as Coisas Ficam Interessantes
Screaming Frog te diz o que está no site. Search Console te diz o que Google acha que está no site. O vão entre esses dois conjuntos de dados é onde os problemas reais vivem.
Abra Cobertura (ou Indexação → Páginas na interface mais nova). Você está olhando para quatro coisas:Coverage (or Indexing → Pages in the newer interface). You're looking at four things:
- Erro — páginas que Google tentou indexar e não conseguiu — pages Google tried to index and couldn't
- Válida com avisos — frequentemente "URL enviada não foi selecionada como canônica", que é uma bagunça que você precisa desembaraçar — often "Submitted URL not selected as canonical," which is a mess you need to untangle
- Excluída — páginas que Google optou por não indexar (rastreadas mas não indexadas, noindex, etc.) — pages Google chose not to index (crawled but not indexed, noindexed, etc.)
- Válida — páginas que Google indexou — pages Google has indexed
O bucket "Excluída" é criminosamente subutilizado. A maioria das pessoas ignora. Eu vou direto para lá. Filtre por "Rastreada — atualmente não indexada." Isso é Google dizendo: encontrei essa página, li, e decidi que não valia a pena indexar. Na maioria das vezes é um problema de conteúdo fino. Ou é uma página que está genuinamente bem mas é muito similar a outra página — um problema clássico com navegação facetada ou arquivos de tag.I found this page, I read it, and I decided it wasn't worth indexing. That's almost always a thin content problem. Or it's a page that's genuinely fine but is too similar to another page — a classic issue with faceted navigation or tag archives.
Correspondência de exclusões do GSC com seu rastreamento do Screaming Frog
Exporte seu rastreamento do Screaming Frog para CSV. Exporte as URLs "Excluídas" do Search Console. Carregue ambas no Google Sheets e execute um VLOOKUP. Qualquer URL que apareça no rastreamento do Screaming Frog e na lista de excluídas do GSC é uma investigação prioritária.and in the GSC excluded list is a priority investigation.
Sei que as pessoas recorrem a scripts Python para isso. Você não precisa. VLOOKUP no Sheets leva quatro minutos e te dá a mesma resposta.
---
Crawl Budget: Só Importa Se Seu Site For Realmente Grande
Certo, vamos ser honestos. Se seu site tem menos de 1.000 páginas, crawl budget não é seu problema. Você pode parar de se preocupar com isso.
Mas quando você passa de uns 10.000 URLs — e muitas lojas WooCommerce ou Magento chegam a isso só por variantes de produtos e URLs filtradas — crawl budget começa a apertar. A documentação do Google Search Central sobre crawl budget é na verdade uma das coisas mais claras que eles já escreveram. Vale a pena ler com atenção.Google Search Central documentation on crawl budget is actually one of the clearer things they've written. Worth reading properly.
Os dois mecanismos que você tem no Search Console são o relatório Crawl Stats e a ferramenta URL Inspection. Crawl Stats mostra a atividade de crawl do Google em 90 dias: páginas rastreadas por dia, tempos de resposta, códigos de resposta. Se você vê um pico de 404s em uma data específica, é um deployment que deu errado. Se o tempo médio de crawl está acima de 2 segundos, o problema é seu servidor, não seu SEO.Crawl Stats report and the URL Inspection tool. Crawl Stats shows you Google's crawl activity over 90 days: pages crawled per day, response times, response codes. If you see a spike in 404s on a specific date, that's a deployment that went wrong. If average crawl time is above 2 seconds, your server is the problem, not your SEO.
---
Link Interno: A Coisa Que Agências Sempre Perdem
Auditei bem mais de cem sites na Seahawk Media onde o cliente estava gastando dinheiro real em link building — guest posts, digital PR, tudo — e tinha páginas órfãs que nenhum link interno apontava para. Google não consegue priorizar o que não consegue encontrar através da estrutura do seu site.orphaned pages that no internal link pointed to. Google can't prioritise what it can't find through your site structure.
No Screaming Frog, filtre o crawl por Inlinks = 0. Qualquer página com zero links internos é uma órfã. Cruze os dados com as páginas indexadas do Search Console. Se a página está indexada mas não tem links internos, significa que Google a encontrou através de um XML sitemap ou de um backlink externo. Isso é frágil. Dê um link interno a ela a partir de uma página relevante e você está dando ao Google um sinal estrutural de que essa página importa.Inlinks = 0. Any page with zero internal links is an orphan. Cross-reference it against Search Console's indexed pages. If the page is indexed but has no internal links, it means Google found it through an XML sitemap or an external backlink. That's fragile. Give it an internal link from a relevant page and you're giving Google a structural signal that this page matters.
Algumas coisas que observo em links internos
- Páginas de paginação que linkam para páginas de produto/artigo, mas essas páginas não linkam de volta para páginas de categoria
- Posts de blog publicados em 2019 que nunca foram linkados a partir de nenhum conteúdo mais recente
- Páginas que têm dezenas de links internos de entrada mas tráfego muito baixo no GSC — frequentemente um sinal de que a própria página tem um problema, não o link
---
Core Web Vitals: Leia os Dados, Não Entre em Pânico
O Search Console tem um relatório de Core Web Vitals. Ele extrai dados do Chrome UX Report de usuários reais, que é field data — usuários reais em dispositivos reais, não uma simulação de laboratório. Isso é mais significativo do que o que você obteria de uma execução única do Lighthouse.Core Web Vitals report. It pulls from real-user Chrome UX Report data, which is field data — actual users on actual devices, not a lab simulation. This is more meaningful than what you'd get from a one-off Lighthouse run.
O relatório agrupa URLs em "Bom," "Precisa melhorar" e "Ruim" por LCP, FID (agora substituído por INP) e CLS. Não tente consertar tudo de uma vez. Ordene pelo grupo "Ruim" e veja qual padrão de URL tem o maior número de páginas com falha. Geralmente é um único template — todas as páginas de produto falhando em CLS, ou todas as páginas de categoria com LCP lento. Corrija o template, corrija centenas de páginas de uma vez.
Uma coisa que aprendi da maneira difícil: problemas de CLS em sites com anúncios ou banners de cookies quase sempre vêm de elementos sendo injetados acima da dobra após o paint inicial. Screaming Frog não vai pegar isso. Você precisa olhar a página de verdade. Use Chrome DevTools com Layout Shift regions habilitado em Rendering.
---
A Verificação do Robots.txt e Sitemap (Leva 10 Minutos, Economiza Semanas)
Acesse yourdomain.com/robots.txt . Leia cada linha. Já vi, com meus próprios olhos, um site de produção ao vivo com Disallow: / no robots.txt. Não um site de staging. Produção. Uma empresa com sete anos de existência. Seu desenvolvedor tinha copiado o robots.txt de staging durante uma migração e nunca verificou. Eles tinham sido essencialmente invisíveis para o Google por quatro meses antes de notarem.yourdomain.com/robots.txt . Read every line. I have seen, with my own eyes, a live production site with Disallow: / in the robots.txt. Not a staging site. Production. A seven-year-old business. Their developer had copied the staging robots.txt during a migration and never checked it. They had been essentially invisible to Google for four months before they noticed.
No Search Console, vá para Sitemaps. Verifique o que foi enviado. Verifique a última vez que o Google o recuperou. Se o sitemap não foi recuperado há mais de uma semana, algo está quebrado. Também verifique a contagem de URLs enviadas versus a contagem de URLs indexadas — se você enviou 4.000 URLs e apenas 1.200 estão indexadas, essa é uma conversa que você precisa ter sobre qualidade do conteúdo, não sobre correções técnicas.Sitemaps. Check what's been submitted. Check the last time Google fetched it. If the sitemap hasn't been fetched in over a week, something is broken. Also check the submitted URL count vs the indexed URL count — if you've submitted 4,000 URLs and only 1,200 are indexed, that's a conversation you need to have about content quality, not about technical fixes.
---
FAQ
Preciso da versão paga do Screaming Frog?
A versão gratuita é limitada a 500 URLs. Para qualquer coisa acima disso — que é a maioria dos sites que valem a pena auditar — você precisa da licença paga. Custa £259 por ano no momento da escrita. Isso é aproximadamente o preço de uma única hora de trabalho de agência. Compre.£259 per year as of writing. That's about the price of a single hour of agency time. Buy it.
Com que frequência devo executar uma auditoria técnica?
Para sites ativos que publicam regularmente ou mudam produtos frequentemente, eu diria trimestralmente. Para sites menores e mais estáticos, duas vezes por ano é adequado. Executar uma auditoria uma vez e tratá-la como "pronta" é como trocar o óleo de um carro uma vez e esperar que ele funcione para sempre.
Screaming Frog mostra status 200 mas GSC mostra que a página não está indexada — por quê?
Quase sempre uma de três coisas: uma meta tag noindex, um cabeçalho HTTP noindex, ou uma tag canonical apontando para outro lugar. Execute a URL pela ferramenta URL Inspection do Search Console e ela dirá exatamente o que encontrou. Essa ferramenta é subestimada — ela mostra a última versão da página rastreada pelo Google, incluindo o HTML renderizado, o que captura as tags noindex injetadas por JavaScript que uma requisição HTTP básica não veria.last crawled version of the page, including the rendered HTML, which catches JavaScript-injected noindex tags that a basic HTTP request wouldn't see.
E quanto aos sites renderizados em JavaScript?
Screaming Frog tem um modo de renderização JavaScript em Configuration > Spider > Rendering. Ative para sites pesados em JS. É mais lento — significativamente mais lento — mas é a única forma de capturar problemas com conteúdo ou links que são injetados por JavaScript depois que o HTML inicial carrega. Para um site React ou Next.js, sempre faça crawl no modo de renderização JS.Configuration > Spider > Rendering. Turn it on for JS-heavy sites. It's slower — significantly slower — but it's the only way to catch issues with content or links that are injected by JavaScript after the initial HTML loads. For a React or Next.js site, always crawl in JS rendering mode.
Google Search Console é suficiente para pesquisa de palavras-chave?
Para descobrir quais queries suas páginas existentes classificam, sim, é excelente. Para descobrir novas oportunidades de palavras-chave, não — você precisará de outra coisa. Mas isso está fora do escopo de uma auditoria técnica.existing pages rank for, yes, it's excellent. For discovering new keyword opportunities, no — you'll need something else. But that's out of scope for a technical audit.
---
Duas ferramentas. Uma planilha. Algumas horas. É genuinamente tudo o que isso leva. As plataformas caras têm seu lugar — não sou contra elas — mas vi muitos donos de site assumirem que pagar mais significa encontrar mais. Os problemas estão quase sempre nos conceitos básicos. Só precisam de alguém que realmente olhe.
