GOOGLE SERIE: #3 indexer le web caché

Article

 

Depuis le 11 Avril, Googlebot peut remplir les forms HTML et crawler les résultats retournés – ce qui réduit la part du
web invisible et augmente la somme de datas ingérée par Google (environ 100 exabytes l’année passée).

Lorsque le bot rencontre un élément <FORM> sur un site jugé pertinent, il peut choisir d’effectuer un certain nombre
de requêtes. Pour les check box, les select ou les boutons radio, il utilise les valeurs présentes dans le HTML, tandis que dans le cas d’une text box il extrait les chaînes de caractères présentes dans la page. Les valeurs sélectionnées pour chaque input, Googlebot peut alors soumettre la requête et crawler l’URL générée.

Partager:
  • Print this article!
  • Digg
  • Sphinn
  • del.icio.us
  • Facebook
  • Mixx
  • Google Bookmarks
  • E-mail this story to a friend!
  • FriendFeed
  • LinkedIn
  • Netvibes
  • Turn this article into a PDF!
  • Technorati
  • Twitter
  • Twitthis
  • MySpace
  • RSS
  • Wikio FR
  • Yahoo! Buzz
Catégories : Usages émergeants
Commentaires

subscribe to comments RSS

Pas de commentaire pour cet article

N'hésitez pas á ajouter votre commentaire

* Champ obligatoire

+ de réseaux

 
Partager:
  • Print this article!
  • Digg
  • Sphinn
  • del.icio.us
  • Facebook
  • Mixx
  • Google Bookmarks
  • E-mail this story to a friend!
  • FriendFeed
  • LinkedIn
  • Netvibes
  • Turn this article into a PDF!
  • Technorati
  • Twitter
  • Twitthis
  • MySpace
  • RSS
  • Wikio FR
  • Yahoo! Buzz
 

Blog.tequilarapido.com est édité par l'agence tequilarapido.