Google começa a preencher formulários HTML para indexar novas páginas

O Google anunciou que está testando uma nova tecnologia na sua máquina de busca. Agora para tentar descobrir novas páginas e URLs o GoogleBot ao encontrar um formulário em um página de “alta qualidade”, tenta preenchê-lo automaticamente. Check boxes, Select menus e Radio buttons são escolhidos de acordo com as opções descritas no HTML. Para as caixas de texto que não possuem informação de preenchimento, o Google usa termos do próprio site para completar o formulário. Vale lembrar que só serão indexados páginas a partir de formulários do tipo GET e que não tenham qualquer tipo de campos de senha ou identificação de usuário.

Apesar de parecer trivial, acredita-se que na chamada Deep Web, Hidden Web, ou Invisible Web (profunda, escondida ou invisível) pode estar se escondendo uma grande parte da Internet que as máquinas de busca não conhecem. Esses esforços tendem a aumentar a quantidade de informação disponível para os usuários, melhorando as buscas do nosso dia-a-dia .


7 Replies to “Google começa a preencher formulários HTML para indexar novas páginas

  1. Vale lembrar que é possível controlar a atividade do GoogleBot através do robots.txt bloqueando a indexação de determinadas páginas. :)

  2. Isso mesmo Renê! As políticas de privacidade continuam valendo.

    É Marcus. Eles limitam ao GET por que geralmente é como se faz busca em sites. O POST é usado pra login, postagem em forum, site, aí já viu o que ia dar hehehe

    Abraço!

  3. mais seria interessante por ex, ele entrando em foruns que só consegue-se ler com cadastro, assim, acharíamos muito mais informações no google, e o site ganharia com isso, pois receberia mais visitas.

  4. Bem que o Google Bot poderia deixar um comentário aqui no Google Discovery… :(

Comente!