Páginas órfãs como indentificá-las em seu site

Páginas órfãs: como identificá-las em seu site?

SEO Estratégico
0 Shares

Encontrar páginas em seus sites sem links é difícil, mas não impossível.

Se houver páginas em seu site que os usuários e mecanismos de pesquisa não conseguem alcançar, esse é um problema que você precisa corrigir, e rápido.

Esses tipos de páginas têm um nome: páginas órfãs.

Hoje vou falar sobre esse tema e você aprenderá o que são páginas órfãs, por que consertá-las é importante para o SEO e como encontrar todas as páginas órfãs em seu site.

Vamos lá?

O que é uma página órfã?

Uma página sem links para ela é chamada de página órfã.

Mecanismos de pesquisa, como o Google, geralmente encontram novas páginas de uma das seguintes maneiras:

  • O rastreador segue um link de outra página.
  • O rastreador encontra o URL listado no mapa do site XML .

Portanto, se você deseja que o Google rastreie e indexe sua página, eles precisam ser capazes de localizá-la, e claro de forma simples.

Por que as páginas órfãs são um problema de SEO?

Os mecanismos de pesquisa não podem encontrar páginas órfãs por meio de links, então as páginas órfãs geralmente não são indexadas e nunca aparecem nos resultados da pesquisa.

Mesmo que suas páginas órfãs estejam listadas no seu sitemap XML, elas ainda são um problema para o SEO.

Páginas órfãs são um problema tanto para usuários quanto para os rastreadores.

Os usuários não podem acessar essas páginas por meio da estrutura natural do seu site, portanto, se houver informações importantes ou úteis nessas páginas, será desperdiçado.

Isso cria, sem dúvida alguma, uma experiência de usuário frustrante.

Sem links internos, nenhuma autoridade é passada para as páginas e os motores de busca não têm contexto semântico ou estrutural para avaliar a página.

Sem nenhuma maneira de saber onde a página se encaixa no seu site como um todo, pode ser mais difícil determinar para quais consultas a página é relevante.

Páginas órfãs vs. sem saída

Antes de se aprofundar nas páginas órfãs, vamos tirar um momento para esclarecer brevemente a diferença entre dois  termos de SEO  que podem causar confusão.

Páginas órfãs

Como já esclareci, uma página órfã é uma página da web que não tem link nem pode ser acessada por nenhuma outra página no mesmo site.

Página sem saída

Uma página sem saída, por outro lado, é uma página da web que não vincula a nenhuma outra página interna ou a nenhum site externo, criando assim um “beco sem saída”.

Quando as pessoas acessam esta página, elas podem acessá-la novamente ou simplesmente abandonar o site.

Quando os rastreadores dos mecanismos de pesquisa chegam à esse tipo de página, eles não têm para onde ir e nenhum link pode ser rastreado.

Hoje, com tantos modelos e temas disponíveis, é mais difícil criar um beco sem saída – mas dificilmente não é impossível.

Um beco sem saída pode ser facilmente resolvido adicionando links ao conteúdo da página ou certificando-se de que a barra lateral ou a navegação do rodapé sejam preenchidas em todas as páginas.

Resolvida a diferença entre os dois tipos de páginas?

Então vamos encontrar suas páginas órfãs!

Encontrando páginas órfãs em seu site

1. Identifique suas páginas rastreáveis

Você precisará de uma lista de todos as URLs que podem ser acessados ​​rastreando os links do seu site.

Você precisará de seu próprio rastreador – uma ferramenta de SEO como o ScreamingFrog é uma boa escolha para fazer isso. (Em sua versão free há um limite de rastreamento de até 500 URL, caso seu site seja maior do que isso vale a pena contratar a ferramenta).

Qualquer que seja o rastreador que você for usar, certifique-se de que esteja configurado para rastrear apenas páginas que podem ser indexadas por mecanismos de pesquisa.

Com isso, quero dizer que não deve rastrear páginas que são:

  • Noindex
  • Oculto dos motores de busca pelo robots.txt.

Comece o rastreamento a partir da página inicial do site.

Certifique-se de usar o URL canônico, incluindo https ou http adequado e www ou não www.

Depois de rastrear seu site, exporte suas URLs para uma planilha.

2. Resolva 2 causas comuns de páginas órfãs

Existem duas causas comuns de páginas órfãs que devem ser identificadas e tratadas imediatamente.

Ambas as causas são essencialmente duplicatas de página que devem redirecionar automaticamente de forma consistente para apenas um URL.

Caso contrário, é provável que algumas versões da página não estejam vinculadas e, como resultado, sejam órfãs.

Nesse caso, o fato de serem órfãos não é o principal problema, mas sim o fato de serem duplicatas.

Eles podem aparecer mais tarde, enquanto você estiver procurando por páginas órfãs, e precisam ser resolvidos, portanto, é uma boa ideia tirá-los do caminho com antecedência.

Https / http não canônico ou www / não www

Todas as páginas públicas em seu site devem usar http ou https de forma consistente (de preferência https), e www ou não www de forma consistente.

Para verificar se esse é o caso, tente digitar todas essas variações da página inicial do seu site no navegador:

  • https://www.exemplo.com.br
  • http://www.exemplo.com.br
  • https://exemplo.com.br
  • http://exemplo.com.br

Existem outros formatos possíveis de se acessar o mesmo link, mas como forma de facilitar essa auditoria vamos manter as 4 possibilidades.

Todas as quatro variações devem redirecionar automaticamente para o mesmo URL exato.

Para consistência, essa página deve ser canônica para si mesma.

Se uma dessas variações não redirecionar corretamente, pode ser um sinal de problemas semelhantes no site de forma mais ampla.

Verifique outros URLs, usando essa variação, para ver se é um problema mais difundido.

Você deve testar algumas outras páginas do seu site e verificar o arquivo .htaccess do seu site para se certificar de que os redirecionamentos para essas páginas foram configurados corretamente.

Como forçar https no .htaccess?
RewriteEngine On
RewriteCond %{HTTPS} off 
RewriteRule ^(.*)$ https://%{HTTP_HOST}%{REQUEST_URI} [L,R=301]

Caso você force o https, verifique se todas as páginas do seu site possuem um certificado de SSL (verifique com sua plataforma de hospedagem) ou seus usuários receberão um aviso de página não segura do navegador.

Como forçar www ou não www no .htaccess?
#Force www:
RewriteEngine on
RewriteCond %{HTTP_HOST} ^exemplo.com.br [NC]RewriteRule ^(.*)$ https://www.exemplo.com.br/$1 [L,R=301,NC]

#Force non-www:
RewriteEngine on
RewriteCond %{HTTP_HOST} ^www.exemplo.com.br [NC]RewriteRule ^(.*)$ https://exemplo.com.br/$1 [L,R=301]

Novamente, verifique se isso não criará nenhum erro de servidor.

Trailing Slashes

Outra coisa a se observar é o uso consistente de barras finais “/” em suas URLs

Por exemplo, esses dois URLs podem produzir o mesmo conteúdo, mas os URLs não são idênticos:

  • https://exemplo.com/pagina1/
  • https://exemplo.com/pagina1

Verifique algumas páginas do seu site com e sem a barra final e certifique-se de que redirecionam automaticamente para a mesma URL e de forma consistente.

Verifique se isso está configurado corretamente em .htaccess.

Como forçar a barra final em suas URLs no .htaccess?
# incluindo trailing slash no diretório 
RewriteCond %{REQUEST_FILENAME} !-f RewriteCond %{REQUEST_URI} !/$ RewriteRule . %{REQUEST_URI}/ [L,R=301]

3. Obtenha uma lista de URLs do Google Analytics

Os crawlers, por definição, terão dificuldade em encontrar páginas órfãs.

Portanto, usar qualquer ferramenta de SEO para encontrá-las pode ser problemático.

Um dos melhores lugares para começar a procurar por páginas órfãs são seus próprios dados do Google Analytics (ou qualquer outro pacote de análise que você usa).

Enquanto as páginas em questão tiverem o Google Analytics instalado, se a página  foi visitada, há um registro disso em algum relatório do Google Analytics.

Para obter uma lista abrangente de URLs, na barra lateral esquerda, vá para Comportamento> Conteúdo do site> Todas as páginas:

Identificando páginas órfãs pelo Google Analytics

Como nossas páginas órfãs são difíceis de encontrar, o número de vezes que elas foram visitadas provavelmente será bem baixo.

Clique em “Visualizações de página” para que a seta aponte para cima, indicando que a lista de URIs está classificada em ordem crescente do menor para o maior das visualizações de página.

Isso moverá as páginas mais provavelmente órfãs para o topo:

Visualizando páginas com menos visualizações no GA

Para garantir que nossa lista seja a mais abrangente possível, vá para o intervalo de datas no canto superior direito.

Defina a data de início para um tempo anterior ao início do Google Analytics e clique no botão Aplicar :

Definindo intervalo de tempo para encontrar URLs órfãs no GA.

Agora precisaremos expandir nossa lista de URLs o máximo possível.

No canto inferior direito, clique no menu suspenso Exibir linhas e selecione o maior número de linhas.

Nosso maior obstáculo é que o Analytics só pode listar até 5.000 URLs de cada vez:

Definindo a maior quantidade de linhas

Se você tiver mais do que isso, terá que exportar 5.000 páginas por vez até que tenha todos os seus dados de visitante do Google Analytics.

No entanto, estamos classificando as visualizações de página em ordem crescente, portanto, nossa lista deve incluir todas e provavelmente incluirá a maioria dos URLs órfãos que tiveram um visitante.

Provavelmente levará um pouco de tempo para que o Analytics busque todos os dados.

Seja paciente e não tente apressar as coisas, ou você correrá o risco de travar seu navegador.

Assim que os URLs forem carregados, vá para o canto superior direito, selecione exportar e exporte uma planilha do Google, arquivo Excel ou planilha CSV para obter seus URLs.

Se você for um pouco mais técnico, pode usar a API do Google Analytics para acelerar esse processo; tente usar a métrica de visualizações de página em relação à dimensão pagePath.

Exportando as URLs para o Planilhas Google.

Agora copie os URLs do arquivo de análise exportado para a planilha da página órfã, assim:

Identificando páginas órfãs via GA e planilhas Google.

Precisamos colocá-los no formato de URL para que sejam úteis.

Para fazer isso, insira uma nova coluna e cole o URL da página inicial, assim:

Concatenando os links rastreados com o links do GA

Em seguida, arraste a fórmula para baixo para obter a lista completa de URLs:

image 7

4. Identifique seus URLs órfãos

Para identificar nossos URLs órfãos, precisaremos comparar a lista de URLs rastreáveis e a lista de URLs do Analytics encontrados em nossa planilha.

Em nosso exemplo hipotético, é óbvio que https://example.com/11 é uma página órfã, mas, na realidade, você quase sempre terá muito mais URLs para pesquisar e precisaremos automatizar o processo de identificação de nossos URLs órfãos .

Para fazer isso, precisamos de uma fórmula que verifique se cada URL em nossa lista do Analytics também pode ser encontrado em nossa lista de URLs rastreáveis .

Aqui está um exemplo de uma fórmula que fará isso:

Adicionando fórmula de correspondência de URL

A fórmula de “correspondência” que usei na célula E2 aqui é:

= MATCH (D2; $A$2:$A$11;0)

Esta fórmula verifica se o URL na célula D2 está no intervalo $ A $ 2: $ A $ 11.

(Se você não estiver muito familiarizado com planilhas, os cifrões estão lá para garantir que, quando arrastamos a fórmula para baixo na coluna, o intervalo não mudará.)

O valor “0” informa ao Google Sheets que as colunas não são necessariamente classificadas. (Consulte a documentação do Planilhas Google .)

Se houver uma correspondência, a fórmula retorna sua posição no intervalo, que neste caso é a primeira posição no intervalo.

O que mais nos interessa, entretanto, é se não houver correspondência.

Como você pode ver, a fórmula retorna o erro “# N / A” para https://example.com/11, porque não foi encontrada em nossa lista de URLs rastreáveis . Isso significa que é uma página órfã.

Para obter uma lista de nossas páginas órfãs, então, tudo o que precisamos fazer é classificar nossa coluna Match para coletar todos os resultados “# N / A” em um só lugar.

Filtrando os resultados de compatibilidade

Podemos então copiar nossa lista de URLs órfãos e colá-los em uma nova planilha onde podemos resolver como corrigi-los.

5. Outros lugares para procurar URLs órfãos

Você pode repetir esse processo para identificar URLs órfãos usando fontes de dados diferentes do Google Analytics.

Qualquer uma das ferramentas a seguir terá uma lista de páginas rastreadas de seu site:

  • SEMrush
  • Ahrefs
  • Moz Link Explorer
  • Raven Tools

Eu não recomendaria se inscrever em nenhum deles exclusivamente para procurar páginas órfãs, porque eles precisarão rastrear essas páginas de alguma forma para encontrá-las.

SEMrush e Ahrefs têm ferramentas e práticas específicas para ajudá-lo a descobrir páginas órfãs.

É possível que, em alguns casos, essas ferramentas encontrem páginas que não podem ser rastreadas diretamente porque foram encontradas usando outros meios, geralmente em algum ponto da história quando a página era rastreável:

Trabalhe com sua equipe de desenvolvimento para ver se eles podem obter a lista completa de URLs no site diretamente do servidor, já que esta deve ser a lista mais completa disponível em qualquer lugar.

Você também pode examinar seus arquivos de log para encontrar esses dados.

Os arquivos de log contêm informações sobre:

  • Quem visitou seu site.
  • De onde eles vieram.
  • Quais páginas eles visitaram.

Você pode realizar um segundo rastreamento do seu site, ignorando diretivas como “nofollow” e “noindex”, e compará-lo com o rastreamento original.

Pode haver páginas que só podem ser acessadas por rastreadores que ignoram essas diretivas e essas podem ser outra fonte de páginas órfãs.

Por fim, você pode obter uma lista de URLs no relatório de Search Analytics do Google Search Console .

Mesmo que essas páginas estejam obviamente indexadas se estiverem aparecendo aqui, você ainda pode encontrar páginas que não podem ser rastreadas de seus links internos que precisarão ser corrigidas.


As páginas órfãs não podem ser indexadas pelos mecanismos de pesquisa se não aparecerem no mapa do site – e podem criar outros problemas de SEO, mesmo que apareçam.

Quando você tiver passado por essas etapas e encontrado suas páginas órfãs, pergunte a si mesmo:

  • Esta página é importante? Se for, encontre onde integrá-la. Se não, exclua.
  • Esta página é classificada por alguma palavra-chave, apesar de ser uma página órfã? Se for, encontre onde integrá-la. Se não, exclua.
  • Onde a página deve existir na taxonomia do seu site ?
  • Esta página é uma duplicata ou quase duplicada? Considere otimizar esse conteúdo em uma página semelhante que não seja órfã.
  • Esta página está otimizada? Ele poderia ser otimizada e melhor vinculada?
  • A página foi vinculada a fontes externas?

Use os métodos descritos aqui para encontrar suas páginas órfãs e resolver o problema.

0 Shares
Bruno Aires
Profissional de Marketing Digital com 11 anos de experiência em SEO, técnico e planejamento estratégico, já atuou em diversas agências e empresas com nichos de atuação bastante diversificado de farmácia ao setor bancário. É fundador e mantenedor do portal MBN - Marketing de Busca e Notícias.
0 0 votes
Article Rating
Subscribe
Notify of
guest
0 Comentários
Inline Feedbacks
View all comments