SEO Técnico

SEO Log File Analysis: O que é? Guia completo

Por que os arquivos de log são importantes para o SEO?

Para começar, eles contêm informações que não estão disponíveis em outro lugar

Os arquivos de registro também são uma das únicas maneiras de ver o comportamento real do Google em seu site. Eles fornecem dados úteis para análise e podem ajudar a informar otimizações valiosas e decisões baseadas em dados .

A análise regular do arquivo de log pode ajudá-lo a entender qual conteúdo está sendo rastreado e com que frequência, além de responder a outras perguntas sobre o comportamento de rastreamento dos mecanismos de pesquisa em seu site.

Pode ser uma tarefa intimidante de se realizar, portanto, esta postagem fornece um ponto de partida para sua jornada de análise de arquivos de log.

O que são arquivos de log?

Os arquivos de log são registros de quem acessou um site e que conteúdo acessou. Eles contêm informações sobre quem fez a solicitação de acesso ao site (também conhecido como ‘O Cliente’).

Pode ser um robô de mecanismo de pesquisa, como o Googlebot ou Bingbot, ou uma pessoa visualizando o site. Os registros do arquivo de log são coletados e mantidos pelo servidor web do site e, geralmente, são mantidos por um determinado período de tempo.

Quais dados um arquivo de log contém?

Um arquivo de registro normalmente se parece com isto:

27.300.14.1 - - [14 / set / 2017: 17: 10: 07 -0400] “GET https://marketingdebuscanoticias.com.br/destaque/ HTTP / 1.1” 200 “ https://marketingdebuscanoticias.com.br ” “Mozilla / 5.0 (compatível; Googlebot / 2.1; + http://www.google.com/bot.html ) ”

Dividido, contém:

  • O IP do cliente.
  • Um carimbo de data / hora com a data e hora da solicitação.
  • O método de acesso ao site, que pode ser GET ou POST.
  • O URL solicitado, que contém a página acessada.
  • O código de status da página solicitada, que exibe o sucesso ou a falha da solicitação.
  • O Agente do Usuário , que contém informações extras sobre o cliente que está fazendo a solicitação, incluindo o navegador e o bot (por exemplo, se estiver vindo de um celular ou desktop).

Determinadas soluções de hospedagem também podem fornecer outras informações, que podem incluir:

  • O nome do host.
  • O IP do servidor.
  • Bytes baixados.
  • O tempo necessário para fazer a solicitação.

Como acessar arquivos de log

Conforme mencionado, os arquivos de log são armazenados pelo servidor da web por um determinado período de tempo e são disponibilizados apenas para o (s) webmaster (s) do site.

A forma de acessá-los depende da solução de hospedagem, e a melhor forma de saber como podem ser acessados ​​é pesquisando em seus documentos, ou até mesmo no Google!

Para alguns, você pode acessar arquivos de log de um CDN ou até mesmo de sua linha de comando . Eles podem ser baixados localmente para o seu computador e analisados ​​a partir do formato em que foram exportados.

Por que a análise do arquivo de log é importante?

A execução da análise do arquivo de log pode ajudar a fornecer informações úteis sobre como o seu site é visto pelos rastreadores do mecanismo de pesquisa.

Isso pode ajudá-lo a informar uma estratégia de SEO, encontrar respostas para perguntas ou justificar otimizações que você pode estar procurando fazer.

Não se trata apenas de orçamento de rastreamento

O orçamento de rastreamento é uma permissão concedida pelo Googlebot para o número de páginas que rastreará durante cada visita individual ao site. John Mueller, do Google, confirmou que a maioria dos sites não precisa se preocupar muito com o rastreamento do orçamento.

No entanto, ainda é útil entender quais páginas o Google está rastreando e com que frequência.

Gosto de ver isso como uma garantia de que o site está sendo rastreado com eficiência e eficácia . Garantir que as páginas principais do site sejam rastreadas e que novas páginas, e muitas vezes alteradas, sejam encontradas e rastreadas rapidamente é importante para todos os sites.


Inscreva-se em nossa newsletter e fique por dentro de tudo o que acontece no mundo do marketing digital


Diferentes analisadores de SEO

Existem várias ferramentas diferentes disponíveis para ajudar na análise do arquivo de log, incluindo:

  • Splunk.
  • Logz.io.
  • Screaming Frog Log File Analyzer.

Se você estiver usando uma ferramenta de rastreamento, geralmente há a capacidade de combinar os dados do arquivo de log com o rastreamento do seu site para expandir ainda mais o conjunto de dados e obter insights ainda mais ricos com os dados combinados.

Estatísticas de registro do Search Console

O Google também oferece alguns insights sobre como eles estão rastreando seu site no Relatório de estatísticas de rastreamento do Google Search Console.

Não vou entrar em muitos detalhes neste post, pois você pode descobrir através do seu relatório do Google Search Console.

Basicamente, o relatório permite que você veja as solicitações de rastreamento do Googlebot nos últimos 90 dias.

Você poderá ver uma análise dos códigos de status e solicitações de tipo de arquivo, bem como qual tipo do Googlebot (desktop, celular, anúncio, imagem etc.) está fazendo a solicitação e se são novas páginas encontradas (descoberta) ou anteriormente páginas rastreadas (atualização).

Captura de tela do Google Search Console – Análise de rastreamento, setembro de 2021

O GSC também compartilha algumas páginas de exemplo que são rastreadas, junto com a data e a hora da solicitação.

No entanto, é importante ter em mente que este é um exemplo de amostra de páginas, portanto, não exibirá a imagem completa que você verá nos arquivos de log do seu site.

Executando Análise de Arquivo de Log

Depois de ter os dados do arquivo de log, você pode usá-los para realizar algumas análises.

Como os dados do arquivo de log contêm informações de cada vez que um cliente acessa seu site, a primeira etapa recomendada em sua análise é filtrar os rastreadores que não são do mecanismo de pesquisa, de forma que você só veja os dados dos robôs dos mecanismos de pesquisa.

Se você estiver usando uma ferramenta para analisar arquivos de log, deve haver uma opção para escolher de qual agente do usuário deseja extrair as informações.

Você pode já ter alguns insights que está procurando ou perguntas para as quais pode encontrar respostas.

No entanto, se não, aqui estão alguns exemplos de perguntas que você pode usar para iniciar a análise do arquivo de registro:

  • Quanto do meu site está realmente sendo rastreado pelos mecanismos de pesquisa?
  • Quais seções do meu site são / não estão sendo rastreadas?
  • Qual a profundidade do rastreamento do meu site?
  • Com que frequência certas seções do meu site estão sendo rastreadas?
  • Com que frequência as páginas atualizadas regularmente são rastreadas?
  • Em quanto tempo novas páginas serão descobertas e rastreadas pelos mecanismos de pesquisa?
  • Como a mudança na estrutura / arquitetura do site afetou o rastreamento do mecanismo de pesquisa?
  • Com que rapidez meu site está sendo rastreado e os recursos baixados?

Além disso, aqui estão algumas sugestões de coisas para revisar a partir dos dados do arquivo de log e usar em sua análise.

Códigos de status HTTP

Você pode usar arquivos de log para entender como o orçamento de rastreamento está sendo distribuído em seu site.

O agrupamento dos códigos de status das páginas rastreadas exibirá quanto recurso está sendo fornecido a 200 páginas de código de status importantes em comparação com o uso desnecessário em páginas quebradas ou de redirecionamento.

Você pode obter os resultados dos dados do arquivo de log e dinamizá-los para ver quantas solicitações estão sendo feitas para diferentes códigos de status .

Você pode criar tabelas dinâmicas no Excel, mas pode considerar o uso de Python para criar as tabelas dinâmicas se tiver uma grande quantidade de dados para revisar.

Bruno Aires

Profissional de Marketing Digital com 11 anos de experiência em SEO, técnico e planejamento estratégico, já atuou em diversas agências e empresas com nichos de atuação bastante diversificado de farmácia ao setor bancário. É fundador e mantenedor do portal MBN - Marketing de Busca e Notícias.

Recent Posts

A Evolução do Marketing em Motores de Busca

Desde os seus primórdios até os dias atuais, o SEM tem passado por transformações significativas,…

27/06/2024

ROI de SEO: Como calcular o retorno sobre investimento em SEO

Neste mundo digital em constante evolução, entender o valor do investimento em SEO (Search Engine…

01/04/2024

Google BARD: o que é, como funciona e como usar

Neste artigo abrangente, mergulharemos fundo no fascinante mundo do Google BARD e entenderemos o que…

26/08/2023

Estratégia de SEO: O que os CMOs precisam saber sobre SEO?

A otimização do mecanismo de pesquisa é um dos principais impulsionadores das vendas e do…

28/06/2023

Como usar hreflang para melhorar o SEO internacional

Com a globalização dos negócios e o aumento do comércio eletrônico, o SEO internacional se…

03/03/2023

Instagram lança novos recursos para o Reels

O Instagram adiciona novas funcionalidades ao seu formato de vídeo curto Reels, fornecendo aos criadores…

03/06/2022