SEO Técnico

Sitemap XML: o que é e como otimizá-lo

Hoje vamos falar sobre sitemap XML! Neste guia conterá tudo o que você precisa saber sobre como gerar e otimizar sitemaps XML, além de uma lista de verificação de práticas recomendadas.

Conforme a web evolui, o mesmo acontece com o Google e o SEO.

Isso significa que o que é considerado melhor prática está frequentemente em fluxo. O que pode ter sido um bom conselho ontem, não é hoje.

Isso é especialmente verdadeiro para sitemaps, que são quase tão antigos quanto o próprio SEO.

O problema é que, quando cada homem e seu cachorro postam respostas em fóruns, publicam recomendações em blogs e ampliam as opiniões nas redes sociais, leva tempo para separar conselhos valiosos da desinformação.

Portanto, embora a maioria de nós compartilhe um entendimento geral de que o envio de um sitemap para o Google Search Console é importante, você pode não conhecer os passos básicos de como implementá-los de uma forma que direcione os principais indicadores de desempenho (KPIs) de SEO.

Vamos esclarecer a confusão em torno das práticas recomendadas para mapas de sites hoje.

O que é um Sitemap XML

Em termos simples, um sitemap XML é uma lista dos URLs do seu site.

Ele atua como um roteiro para informar aos mecanismos de pesquisa qual conteúdo está disponível e como acessá-lo.

arquitetura de um site x sitemap xml

No exemplo acima, um mecanismo de pesquisa encontrará todas as nove páginas em um sitemap com uma visita ao arquivo XML do sitemap.

No site, ele terá que pular por cinco links internos para encontrar a página 9.

Essa capacidade de um sitemap XML de ajudar os rastreadores a uma indexação mais rápida é especialmente importante para sites que:

  • Ter milhares de páginas e / ou uma arquitetura de site profunda.
  • Adicione novas páginas com frequência.
  • Altere frequentemente o conteúdo das páginas existentes.
  • Sofra de links internos fracos e páginas órfãs.
  • Falta um perfil de link externo forte.

Observação lateral: o envio de um sitemap com URLs noindex também pode acelerar a desindexação. Isso pode ser mais eficiente do que remover URLs no Google Search Console se você tiver muitos para desindexar. Mas use isso com cuidado e certifique-se de adicionar esses URLs apenas temporariamente aos seus sitemaps.

Qual a principal lição

Embora os mecanismos de pesquisa possam tecnicamente encontrar seus URLs sem eles, ao incluir páginas em um sitemap XML você está indicando que as considera páginas de destino de qualidade.

Embora não haja garantia de que um sitemap XML fará com que suas páginas sejam rastreadas, muito menos indexadas ou classificadas, enviar um certamente aumenta suas chances.

Formato de um sitemap XML

O sitemap de um site usando todasas tags disponíveis terá a seguinte estrutura:

<?xml version="1.0" encoding="UTF-8"?>

<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">

  <url>

    <loc>http://www.example.com/foo.html</loc>

    <lastmod>2018-06-04</lastmod>

    <changefreq>weekle</changefreq>

    <priority>0.5</priority>


  </url>

</urlset>

Mas como um Analista de SEO deve usar cada uma dessas tags? Todos os metadados são valiosos?

Vamos explorar melhor essas dúvidas!

Loc (também conhecido como localização) tag

Esta tag obrigatória contém a versão canônica absoluta da localização do URL.

Deve refletir com precisão o protocolo do seu site (http ou https) e se você optou por incluir ou excluir www.

Para sites internacionais, é aqui também que você pode implementar o tratamento de hreflang .

Usando o atributo xhtml: link para indicar as variantes de idioma e região para cada URL, você reduz o tempo de carregamento da página, o que as outras implementações de elementos de link em <head> ou cabeçalhos HTTP não podem oferecer.

Yoast tem um artigo bastante interessante sobre hreflang para aqueles que desejam saber mais.

Tag Lastmod (também conhecida como Última modificação)

Uma tag opcional, mas altamente recomendada, usada para comunicar a data e hora da última modificação do arquivo.

John Mueller reconheceu que o Google usa os metadados lastmod para saber quando a página foi alterada pela última vez e se deve ser rastreada. Contradizendo o conselho da Illyes  em 2015.

A hora da última modificação é especialmente crítica para sites de conteúdo, pois ajuda o Google a entender que você é o editor original.

Também é poderoso para comunicar a novidade, mas certifique-se de atualizar a data de modificação apenas quando tiver feito alterações significativas.

Tentar enganar os mecanismos de pesquisa dizendo que seu conteúdo é novo , quando não é, pode resultar em uma penalidade para o Google.

Tag Changefreq (também conhecida como Change Frequency)

Era uma vez, essa tag opcional sugeria com que frequência o conteúdo do URL deveria mudar para os mecanismos de pesquisa.

Mas Mueller afirmou  que “a frequência de mudança não desempenha realmente um papel muito importante nos mapas do site” e que “é muito melhor apenas especificar o carimbo de data / hora diretamente”.

Tag priority

Esta tag opcional que diz ostensivamente aos mecanismos de pesquisa o quão importante uma página é em relação aos seus outros URLs em uma escala entre 0,0 e 1,0.

Na melhor das hipóteses, sempre foi apenas uma dica para os mecanismos de pesquisa e tanto Mueller quanto Illyes declararam claramente que o ignoram.

Seu site precisa de um mapa do site XML, mas não necessariamente os metadados de prioridade e frequência de alteração.

Use as tags lastmod com precisão e concentre sua atenção em garantir que os URLs corretos sejam enviados.

Tipos de Sitemaps

Existem muitos tipos diferentes de sitemaps. Vejamos aqueles de que você realmente precisa.

Índice de mapa de site XML

Os mapas de sites XML têm algumas limitações:

  • No máximo 50.000 URLs.
  • Um limite de tamanho de arquivo descompactado de 50 MB.

Os sitemaps podem ser compactados usando gzip (o nome do arquivo se tornaria algo semelhante a sitemap.xml.gz) para economizar largura de banda para o seu servidor. Mas, uma vez descompactado, o mapa do site ainda não pode exceder nenhum dos limites.

Sempre que você exceder qualquer um dos limites, precisará dividir seus URLs em vários sitemaps XML.

Esses mapas de site podem então ser combinados em um único arquivo de índice de mapa de site XML, geralmente denominado sitemap-index.xml. Basicamente, um sitemap para sitemaps.

Para sites excepcionalmente grandes que desejam uma abordagem mais granular, você também pode criar vários arquivos de índice de mapa de site. Por exemplo:

  • sitemap-index-artigos.xml
  • sitemap-index-produtos.xml
  • sitemap-index-categorias.xml

Mas esteja ciente de que você não pode aninhar arquivos de índice de mapa de site.

Para que os mecanismos de pesquisa encontrem facilmente todos os seus arquivos de sitemap de uma vez, você desejará:

  • Envie seu (s) índice (s) de sitemap para o Google Search Console e as Ferramentas do Google para webmasters.
  • Especifique o (s) URL (s) de índice do seu sitemap em seu arquivo robots.txt. Apontando os mecanismos de pesquisa diretamente para o seu sitemap, enquanto você deseja que eles façam o rastreamento.
User-agent: *
Disallow: /wp-admin.*
...

Sitemap: https://www.seudominio.com.br/sitemap-index.gz

Você também pode enviar sitemaps fazendo ping para o Google.

Mas cuidado:

O Google não presta mais atenção às entradas hreflang em “mapas de sites não verificados”.

Sitemap XML de imagens

Os sitemaps de imagens foram projetados para melhorar a indexação do conteúdo da imagem.

No SEO moderno, no entanto, as imagens são incorporadas ao conteúdo da página, portanto, serão rastreadas junto com o URL da página.

Além disso, é uma prática recomendada utilizar a marcação JSON-LD schema.org/ImageObject para chamar as propriedades da imagem aos mecanismos de pesquisa, pois ela fornece mais atributos do que um mapa de site XML de imagem.

Por causa disso, um sitemap XML de imagem é desnecessário para a maioria dos sites. Incluir um sitemap de imagem só desperdiçaria orçamento de rastreamento.

A exceção a isso é se as imagens ajudarem a impulsionar seus negócios, como um site de fotos de ações ou um site de comércio eletrônico que obtém sessões da página de produtos da pesquisa de imagens do Google.

Saiba que as imagens não precisam estar no mesmo domínio do seu site para serem enviadas em um sitemap. Você pode usar um CDN, desde que seja verificado no Search Console.

Sitemap XML de vídeo

Semelhante a imagens, se os vídeos são essenciais para o seu negócio, envie um mapa do site de vídeo em XML. Caso contrário, um sitemap de vídeo é desnecessário.

Salve seu orçamento de rastreamento para a página em que o vídeo está incorporado, garantindo a marcação de todos os vídeos com JSON-LD como um schema.org/VideoObject.

Sitemap para Google Notícias

Apenas sites registrados no Google Notícias devem usar este mapa do site.

Se estiver, inclua artigos publicados nos últimos dois dias, até um limite de 1.000 URLs por mapa do site, e atualize com novos artigos assim que forem publicados.

Ao contrário de alguns conselhos online, os mapas do site do Google Notícias não suportam URL de imagem.

O Google recomenda usar a imagem schema.org ou og: imagem para especificar a miniatura do seu artigo para o Google Notícias.

Sitemap XML mobile

sso não é necessário para a maioria dos sites.

Por quê? Porque Mueller confirmou que os sitemaps móveis são apenas para páginas de feature phone. Não para compatibilidade com smartphone.

Portanto, a menos que você tenha URLs exclusivos projetados especificamente para telefones em destaque, um mapa do site móvel não terá nenhum benefício.

Sitemap HTML

Sitemaps XML cuidam das necessidades do mecanismo de pesquisa. Sitemaps HTML foram projetados para ajudar os usuários humanos a encontrar conteúdo.

A questão é: se você tem uma boa experiência do usuário e links internos bem elaborados, precisa de um mapa do site em HTML?

Verifique as visualizações de página do seu sitemap HTML no Google Analytics. Provavelmente, é muito baixo. Caso contrário, é uma boa indicação de que você precisa melhorar a navegação no seu site.

Os mapas do site HTML geralmente são vinculados aos rodapés do site. Obtendo o valor do link de cada página do seu site.

Pergunte a si mesmo. Esse é o melhor uso desse link patrimonial? Ou você está incluindo um sitemap em HTML como uma referência às práticas recomendadas de sites legados?

Se poucos humanos o usarem. E os mecanismos de pesquisa não precisam disso, pois você tem links internos fortes e um sitemap XML. Esse mapa do site HTML tem uma razão de existir? Eu diria que não.

Sitemap XML dinâmico

Sitemaps estáticos são simples de criar usando uma ferramenta como o Screaming Frog.

O problema é que, assim que você cria ou remove uma página, seu mapa do site fica desatualizado. Se você modificar o conteúdo de uma página, o mapa do site não atualizará automaticamente a tag lastmod.

Portanto, a menos que você adore criar e enviar mapas de sites manualmente para cada alteração, é melhor evitar mapas de sites estáticos.

Os sitemaps XML dinâmicos, por outro lado, são atualizados automaticamente pelo seu servidor para refletir as alterações relevantes do site à medida que ocorrem.

Para criar um sitemap XML dinâmico:

  • Peça ao seu desenvolvedor para codificar um script personalizado, certificando-se de fornecer especificações claras
  • Use uma ferramenta de gerador de sitemap dinâmico
  • Instale um plugin para o seu CMS, por exemplo, plugins como Yoast SEO e RankMath para WordPress

Dito isso:

Sitemaps XML dinâmicos e um índice de sitemap são as práticas mais modernas. Sitemaps para celular e HTML, não.

Use imagem, vídeo e sitemaps do Google Notícias apenas se a indexação aprimorada desses tipos de conteúdo direcionar seus KPIs.

Otimização de indexação de sitemap XML

Agora vamos à parte divertida. Como você usa sitemaps XML para direcionar KPIs de SEO.

Incluir apenas páginas relevantes para SEO em Sitemaps XML

Um sitemap XML é uma lista de páginas que você recomenda rastrear, o que não é necessariamente todas as páginas do seu site.

Um motor de pesquisa chega ao seu site com uma “permissão” para quantas páginas ela rastreará.

O sitemap XML indica que você considera os URLs incluídos mais importantes do que aqueles que não estão bloqueados, mas não estão no mapa do site.

Você o está usando para dizer aos mecanismos de pesquisa “Eu realmente apreciaria se você se concentrasse nesses URLs em particular”.

Essencialmente, ele ajuda você a usar o orçamento de rastreamento de forma eficaz.

Ao incluir apenas páginas relevantes para o SEO, você ajuda os mecanismos de pesquisa a rastrear seu site de forma mais inteligente para colher os benefícios de uma melhor indexação.

Você deve excluir:

  • Páginas não canônicas.
  • Páginas duplicadas.
  • Páginas paginadas.
  • URLs baseados em parâmetro ou ID de sessão.
  • Páginas de resultados de pesquisa do site.
  • Responder a URLs de comentários.
  • Compartilhe via URLs de e-mail.
  • URLs criados por filtragem desnecessários para SEO.
  • Páginas de arquivo.
  • Quaisquer redirecionamentos (3xx), páginas ausentes (4xx) ou páginas de erro do servidor (5xx).
  • Páginas bloqueadas por robots.txt.
  • Páginas com noindex.
  • Páginas de recursos acessíveis por um formulário de geração de leads (por exemplo, documentos em PDF).
  • Páginas utilitárias que são úteis para os usuários, mas não pretendem ser páginas de destino (página de login, entre em contato, política de privacidade, páginas da conta, etc.).

compartilho um exemplo de Michael Cottam sobre priorização de páginas:

Digamos que seu site tenha 1.000 páginas. 475 dessas 1.000 páginas são conteúdo relevante para SEO. Você destaca essas 475 páginas em um mapa do site XML, essencialmente pedindo ao Google para despriorizar a indexação do restante.

Agora, digamos que o Google rastreie essas 475 páginas e decida, algoritmicamente, que 175 são de grau “A”, 200 são “B +” e 100 “B” ou “B-”. Essa é uma nota média forte e provavelmente indica um site de qualidade para o qual enviar os usuários.

Compare isso com o envio de todas as 1.000 páginas por meio do mapa do site XML. Agora, o Google olha para as 1.000 páginas que você diz ser conteúdo relevante para SEO e vê que mais de 50% são páginas “D” ou “F”. Sua nota média não parece mais tão boa e isso pode prejudicar suas sessões orgânicas.

Mas lembre-se de que o Google usará o seu sitemap XML apenas como uma pista do que é importante no seu site.

Só porque não está no seu sitemap XML, não significa necessariamente que o Google não indexará essas páginas.

Quando se trata de SEO, a qualidade geral do site é um fator chave.

Para avaliar a qualidade do seu site, consulte os relatórios relacionados ao mapa do site no Google Search Console (GSC).

Dito isso:

Gerencie o orçamento de rastreamento limitando URLs de sitemap XML apenas a páginas relevantes para SEO e invista tempo para reduzir o número de páginas de baixa qualidade em seu site.

Aproveite totalmente os relatórios do Sitemap

A seção de sitemaps no novo Google Search Console não é tão rica em dados quanto o que era oferecido anteriormente.

Seu uso principal agora é confirmar que seu índice de sitemap foi enviado com sucesso.

Se você optou por usar convenções de nomenclatura descritivas, em vez de numéricas, também pode ter uma ideia do número de diferentes tipos de páginas SEO que foram “descobertas” – também conhecidas como todos os URLs encontrados pelo Google por meio de mapas de sites, bem como outros métodos, como como links a seguir.

No novo GSC, a área mais valiosa para SEOs em relação aos mapas de site é o relatório de Cobertura do Índice.

O relatório será padronizado para “Todas as páginas conhecidas”. Aqui você pode:

  • Resolva quaisquer problemas de “Erro” ou “Válido com avisos”. Isso geralmente se origina de diretivas conflitantes de robôs . Um resolvido, certifique-se de validar sua correção por meio do relatório de cobertura.
  • Observe as tendências de indexação. A maioria dos sites adiciona conteúdo valioso continuamente, então as páginas “válidas” (também conhecidas como indexadas pelo Google) devem aumentar constantemente. Entenda a causa de quaisquer mudanças dramáticas.
  • Selecione “Válido” e procure em detalhes o tipo “Indexado, não enviado no mapa do site”. Estas são as páginas em que você e o Google discordam quanto ao valor. Por exemplo, você pode não ter enviado o URL da sua política de privacidade, mas o Google indexou a página. Nesses casos, não há ações a serem tomadas. O que você precisa estar olhando para fora são URLs indexados que decorrem de manipulação pobre paginação , tratamento de parâmetros pobre , conteúdo duplicado ou páginas que estão sendo acidentalmente deixado de fora de sitemaps.

Depois, limite o relatório aos URLs relevantes de SEO que você incluiu no mapa do site, alterando a lista suspensa para “Todas as páginas enviadas”. Em seguida, verifique os detalhes de todas as páginas “Excluídas”.

Os motivos para a exclusão de URLs de mapa do site podem ser colocados em quatro grupos de ação:

  1. Ganhos rápidos : Para conteúdo duplicado, canonciais, diretivas de robôs, códigos de status HTTP 40X, redirecionamentos ou exclusões de legalidades, coloque em prática a correção apropriada.
  2. Página de investigação : para as exclusões “URL enviado descartado” e “anomalia de rastreamento”, investigue mais detalhadamente usando a ferramenta Buscar como o Google.
  3. Melhorar a página : para as páginas “Rastreadas – atualmente não indexadas”, revise o conteúdo da página (ou tipo de página, pois geralmente haverá muitos URLs de uma raça semelhante) e os links internos. Provavelmente, ele está com conteúdo superficial, não original ou órfão.
  4. Melhorar o domínio : para as páginas “descobertas – atualmente não indexadas”, o Google observa o motivo típico de exclusão, pois “tentaram rastrear o URL, mas o site estava sobrecarregado”. Não se deixe enganar. É mais provável que o Google tenha decidido que “ não vale a pena o esforço ” rastrear devido a links internos ruins ou baixa qualidade do conteúdo visto do domínio. Se você vir um número maior dessas exclusões, analise o valor de SEO da página (ou tipos de página) que você enviou por meio de mapas do site, concentre-se na otimização do orçamento de rastreamento e analise sua arquitetura de informações, incluindo parâmetros, tanto de um link quanto de conteúdo perspectiva.

Seja qual for o seu plano de ação, certifique-se de anotar os KPIs de referência.

A métrica mais útil para avaliar o impacto dos esforços de otimização do sitemap é a taxa de indexação “Todas as páginas enviadas” – calculada tirando a porcentagem de páginas válidas do total de URLs descobertos.

Trabalhe para obter isso acima de 80%.

Por que não 100%? Porque se você concentrou toda a sua energia em garantir que todos os URLs relevantes para SEO que você tem atualmente sejam indexados, provavelmente você perdeu oportunidades de expandir sua cobertura de conteúdo.

Observação : se você for um grande site da Web que optou por dividir seu site em vários índices de mapa de site, poderá filtrar por esses índices. Isso não só permitirá que você:

  1. Veja o gráfico de visão geral em um nível mais granular.
  2. Veja um grande número de exemplos relevantes ao investigar um tipo de exclusão.
  3. Enfrente a otimização da taxa de indexação seção por seção.

Dito isso:

Além de identificar avisos e erros, você pode usar o relatório de Cobertura do Índice como uma ferramenta de investigação do mapa do site XML para isolar problemas de indexação.

Lista de verificação de práticas recomendadas para mapas de sites XML

Invista tempo para:

✓ Incluir tags hreflang em mapas de sites XML

✓ Inclua as tags <loc> e <lastmod>

✓ Compactar arquivos de mapa do site usando gzip

✓ Use um arquivo de índice de mapa de site

✓ Use imagem, vídeo e sitemaps de notícias do Google apenas se a indexação direcionar seus KPIs

✓ Gere mapas de sites XML dinamicamente

✓ Certifique-se de que os URLs sejam incluídos apenas em um único mapa do site

✓ URLs de índice de mapas de sites de referência em robots.txt

✓ Envie o índice do sitemap para o Google Search Console e para as Ferramentas do Google para webmasters

✓ Incluir apenas páginas relevantes de SEO em mapas de sites XML

✓ Corrija todos os erros e avisos

✓ Analisar tendências e tipos de páginas válidas

✓ Calcule as taxas de indexação das páginas enviadas

✓ Abordar as causas de exclusão das páginas enviadas

Agora, verifique o seu próprio mapa do site e certifique-se de que está fazendo tudo certo.

Bruno Aires

Profissional de Marketing Digital com 11 anos de experiência em SEO, técnico e planejamento estratégico, já atuou em diversas agências e empresas com nichos de atuação bastante diversificado de farmácia ao setor bancário. É fundador e mantenedor do portal MBN - Marketing de Busca e Notícias.

Recent Posts

A Evolução do Marketing em Motores de Busca

Desde os seus primórdios até os dias atuais, o SEM tem passado por transformações significativas,…

27/06/2024

ROI de SEO: Como calcular o retorno sobre investimento em SEO

Neste mundo digital em constante evolução, entender o valor do investimento em SEO (Search Engine…

01/04/2024

Google BARD: o que é, como funciona e como usar

Neste artigo abrangente, mergulharemos fundo no fascinante mundo do Google BARD e entenderemos o que…

26/08/2023

Estratégia de SEO: O que os CMOs precisam saber sobre SEO?

A otimização do mecanismo de pesquisa é um dos principais impulsionadores das vendas e do…

28/06/2023

Como usar hreflang para melhorar o SEO internacional

Com a globalização dos negócios e o aumento do comércio eletrônico, o SEO internacional se…

03/03/2023

Instagram lança novos recursos para o Reels

O Instagram adiciona novas funcionalidades ao seu formato de vídeo curto Reels, fornecendo aos criadores…

03/06/2022