Saiba como o Google descobre, rastreia e exibe as páginas Web

Imagem

Ao sentar em frente ao seu computador e fazer uma pesquisa no Google, você visualiza quase que instantaneamente uma lista de resultados de toda a Web. Como o Google encontra páginas que correspondem à sua consulta e determina a ordem dos resultados de pesquisa?

Em termos mais simples, pesquisar na Web é como procurar em um livro muito grande com um índice impressionante que diz exatamente onde tudo está localizado. Quando você faz uma pesquisa no Google, nossos programas verificam nosso índice para determinar os resultados de pesquisa mais relevantes que devem ser retornados (“publicados”) para você.

Os três principais processos de retorno de resultados de pesquisa são:

  1. Rastreamento: o Google sabe sobre seu site? Podemos encontrá-lo?
  2. Indexação: o Google pode indexar seu site?
  3. Veiculação: o site tem conteúdo bom e útil, relevante para a pesquisa do usuário?

Rastreamento

O rastreamento é o processo pelo qual o Googlebot descobre páginas novas e atualizadas para serem incluídas no índice do Google.

Usamos um grande conjunto de computadores para buscar (ou “rastrear”) bilhões de páginas na Web. O programa que faz a busca é chamado Googlebot (também conhecido como robô, bot ou spider). O Googlebot usa um processo de algoritmos: programas de computador que determinam quais sites devem ser indexados, com que frequência e quantas páginas devem ser buscadas em cada site.

O processo de rastreamento do Google começa com uma lista de URLs de páginas da Web, gerada a partir de processos anteriores de rastreamento e aumentada com dados do sitemap fornecidos por webmasters. Conforme o Googlebot visita cada um desses sites, ele detecta os links de cada página e os inclui na lista de páginas a serem rastreadas. Novos sites, alterações em sites existentes e links inativos serão detectados e usados para atualizar o índice do Google.

O Google não aceita pagamento para rastrear um site com mais frequência e mantém a área de pesquisa de negócios separada dos serviços geradores de receita do Google AdWords.

Indexação

O Googlebot processa cada uma das páginas que ele rastreia para compilar um imenso índice com todas as palavras encontradas e sua localização em cada página. Além disso, processamos as informações incluídas nos principais atributos e tags de conteúdo, como tags de título e atributos alternativos. O Googlebot pode processar muitos tipos de conteúdo, mas não todos. Por exemplo, não podemos processar o conteúdo de alguns arquivos de mídia media ou páginas dinâmicas.
Publicação de resultados

Quando um usuário insere uma consulta, nossas máquinas pesquisam o índice de páginas correspondentes e retornam os resultados que acreditamos ser os mais relevantes para os usuários. A relevância é determinada por mais de 200 fatores, entre eles o PageRank de uma determinada página. O PageRank é a medida da importância de uma página com base nos links de entrada de outras páginas. Em outras palavras, cada link para uma página no seu site proveniente de outro site adiciona um PageRank ao seu site. Nem todos os links são iguais: o Google trabalha com afinco para melhorar a experiência do usuário, identificando links de spam e outras práticas que afetam negativamente os resultados de pesquisa. Os melhores tipos de links são aqueles retornados com base na qualidade do conteúdo.

Para que seu site seja bem classificado nas páginas de resultados de pesquisa, é importante verificar se o Google pode rastrear e indexar seu site corretamente. Nossas Diretrizes para webmasters destacam algumas das melhores práticas que podem ajudar você a evitar as armadilhas comuns e melhorar a classificação de seu site.

Os recursos Você quis dizer e Preenchimento automático do Google foram criados para ajudar os usuários a poupar tempo com a exibição de termos, consultas populares e erros de ortografia comuns relacionados. Como os nossos resultados de pesquisa do google.com.br, as palavras-chave usadas por esses recursos são geradas automaticamente por nossos rastreadores da Web e algoritmos de pesquisa. Exibimos essas previsões apenas quando achamos que podem economizar o tempo do usuário. Se um site estiver bem classificado para uma palavra-chave, é porque determinamos com base em algoritmos que seu conteúdo é mais relevante para a consulta do usuário.

Fonte: Ferramentas Webmaster

Deixe um comentário

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair / Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair / Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair / Alterar )

Foto do Google+

Você está comentando utilizando sua conta Google+. Sair / Alterar )

Conectando a %s