Comme je l’écrivais hier, on peut pratiquement définir le web caché comme étant celui qui échappe aux moteurs de recherche. En effet, même s’ils sont très efficaces, ils n’indexent qu’une petite partie du Web.

En plus, ils ne sont pas à jour immédiatement et il faut parfois attendre très longtemps (plusieurs jours) avant que les précieuses pages recherchées émergent. Et nous savons bien que cette apparition n’a rien de miraculeux … ce serait plutôt un business.

La pertinence selon les moteurs de recherche actuels

Elle dépend de :

  • Critères statistiques mais ne sont pas porteurs de sens
  • Des mots clés rencontrés, pas de la phrase
    • on ne tient pas compte des mots « creux »
    • on s’attache à toutes les occurences différentes des mots (non au groupe flexion)
    • on ne tient pas compte de l’ordre des mots
  • Position relative du mot dans la page, pas dans le texte
    • c’est un titre
    • il est dans le premier quart
  • Indice de popularité
    • c’est le « PageRank » de Google (voir la note en bas)
  • Méta-données
  • et bien sûr du facteur économique
    • Positionnement et référencement payant

Avec l’avénement du Web 2.0, on l’a bien vu, les outils de création de contenu se sont multipliés, ils sont devenus tellement plus faciles d’emploi … que le nombre de rédacteurs augmente plus vite que celui des lecteurs, déjà élevés par ailleurs. Bref, lorsqu’on cherche une information avec un moteur de recherche, on a de plus en plus de réponses. Globalement, l’ensemble des réponses est de plus en plus bruité … de moins en moins pertinent. Et si la loi de Cole était vraie !

Par exemple, considérons le bloging ce phénomène de société (même moi je m’y suis mis) dont les moteurs tiennent déjà le plus grand compte. Comme une forte tendance des blogs est de relayé les petits potins entre copins, une autre d’être plus des chambres d’écho des buzz du moment que des lieux d’une réelle création éditoriale, on sent bien que plus il y aura de Web 2.0 plus il y aura du bruit sur la toile ;-)

Tant que les moteurs de recherche seront sensibles aux statistiques, les agiteurs de la blogosphère qui n’ont rien à dire continueront de causer dans le poste ! et les moteurs seront dans le brouillard.

Emergence de nouvelles stratégies de recherche

Alors il faudra bien en sortir. Déjà des usages mutent. La prise de conscience du Web caché avait déjà eu pour incidence pour pousser les bonnes pratiques suivantes :

D’autres usages se développent. Par exemple, le social-bookmarking est une de ces pratiques. del.icio.us est le site paradigmatique de cette voie du favori pertinent. En offrant la possibilité de créer des réseaux de personnes, il augmente encore le caractère social de son dispositif. J’ai choisi de motoriser mon blog avec WordPress en lisant del.icio.us !

Un autre usage : la folksonomy. C’est un mot-valise issu de la contraction des mots folks ( »les gens » en français) et taxonomy ( »taxinomie » en français, la science du classement ou le système de classification hiérarchisés). Il s’agit d’une méthode de classification collaborative de contenus Web à l’aide de tags. Réalisée par une communauté d’internautes, son but est de proposer une alternative subjective et sensible aux moteurs automatiques pour faciliter la recherche et l’identification des contenus. Quelques exemples : Technorati pour classer les billets publiés sur les blogs, Flickr pour les photos et del.icio.us pour les favoris …

Et dans la vraie vie ?

Au bureau, je vois progressivement des collègues changer de page Internet par défaut. Ils avaient massivement opté pour Google … maintenant, on trouve del.icio.uc ou netvibes ou …

Et vous ?

Note : PageRank

Le PageRank est un terme anglais qui peut se traduire par « rang de page ». Cet indice de popularité, conçu par Larry Page, est calculé pour toute page Web et est utilisé par le moteur de recherche Google classer les résultats.

Note : Qui sont Larry Page et Sergey Brin ?

Larry Page (né en 1973) et Sergey Mikhaïlovitch Brin (né aussi en 1973) sont les fondateurs du site et du moteur de recherche Google. Le premier est américain, le second est d’origine russe.