Archive for mars, 2007

Web 0.0, ce web qu’on nous cache !

Reprenons nos investigations … à la recherche du web caché. Je ne connais guère que 3 façons d’aller à un endroit précis. Je connais l’adresse, je trouve l’adresse ou je découvre une nouvelle adresse.

Les pages du web 0.0 sont indubitablement de celles qu’on découvre. Si elles sont cachées, je ne les connaissais pas et les moteurs ne me donnaient pas le moyen de les trouver. En reformulant ma question, j’en arrive à ceci. Peut-on s’organiser pour que cette découverte soit possible, puis fructueuse ? Il est clair que tout cela doit se faire dans le respect des sites et des lois. Il s’agira donc de découvrir ce qui est licite d’accès ou d’accès licite.

Pour ne pas aller au hasard, à la crétin.fr, il est naturel de se demander s’il n’existe pas une manière d’utiliser les moteurs de recherche pour trouver ce qu’ils ne nous donnent pas habituellement comme réponse. Notons tout de suite que cette approche repose entièrement sur ce que les moteurs ont décidé d’indexer. Je le dis autrement : il s’agit d’accéder au plus caché de se qui n’est pas caché. Et nous mettrons de côté l’authentiquement caché, celui n’est pas indexé et est déconnecté (sans lien) de ce qui est indexé.

Pour cela, il faut utiliser la recherche expressive des requêtes offertes. Prenons Google comme bac à sable pour quelques expériences à la recherche de pages « normalement » impossibles à trouver.

Si je cherche les pages avec cheval et vapeur, je demanderai :

  • cheval vapeur
  • +cheval +vapeur
  • (+ cheval +vapeur)

Si je ne veux pas voiture :

  • cheval vapeur -voiture
  • (+cheval +vapeur) -voiture
  • etc.

L’utilisation de la négation ne peut pas se faire seule. Pas possible de trouver toutes les pages où il n’est pas question de voiture. L’opérateur de Google n’est pas une négation mais un sauf.

  • -voiture

Cette requête n’est donc pas possible.

En revanche, comme Google ne travaille pas au niveau d’ensemble mais évalue d’abord la requête selon une logique formelle qui lui est propre et lance une seule requête, il est possible d’écrire des requêtes que le bon sens jugera impossibles et d’obtenir tout de même des réponses … Exemple :

  • cheval -cheval vapeur -vapeur

Essayez, vous serez étonné ! Cela donne une réponse … Ca ne marche à tous les coups. « moteur voiture -moteur -voiture » est sans réponse mais « moteur voitures -moteur -voitures » a une réponse. Pour ceux qui regarderont le code source de la page, ils comprendront meiux ce qui se passe dans les coulisses de Google. A vous de jouer !

Effet de bord : En préparant ce post, je suis tombé sur un bug de Google. Si vous cherchez « a b -a -b » et que vous cliquez sur « Rechercher » puis dans la page de réponses sur « Recherche avancée », vous verrez que la requête a été modifiée en « ab -a -b ». Ce qui ne donne bien évidemment pas les mêmes réponses.


Web 2.0 et mauvaises manières

Puisque nous sommes dans l’univers entoilé du web, la navigation et les interactions entre vous et les sites que vous visitez ne peuvent se concevoir qu’avec les moyens existants … je veux dire avec les moyens que vous connaissez.

Pas si sûr ;-( Le web 2.0 nous cache des mécanismes dont vous avez peut-être fait les frais. J’ai déjà plusieurs fois entendu l’histoire suivante.

J’étais en train de surfer sur un site de commerce électronique et comme par hasard on m’a téléphoné pour me proposer la vente de ce que je venais de regarder.

Les amis qui m’ont raconté cela m’ont dit leur agacement voire même leur sentiment d’avoir été espionnés. Vous serez d’accord avec eux pour considérer qu’il s’agit là vraiment de très mauvaises manières de faire du commerce.

Comment cela est-il possible ? Oh, c’est très facile, vous pouriez même le faire à votre tour. Dans une page web 2.0, vous savez avec de l’Ajax, il est possible de façon asynchrone et indépendante des submits d’avoir un échange client / serveur. C’est ce que fait google avec sa Map ou son Suggest. Pendant que vous regardez la carte, les cartes voisines se chargent déjà dans votre poste client, ce qui vous donnera cette impression de fluidité. Ou pour Suggest, les mots proches apparaîtront au fur et à mesure de votre saisie. Détournez ce dispositif et suivez ce que fait une personne en « piégeant » la page et le tour est joué. Si en plus, vous avez une session ouverte … il ne reste plus qu’à pousser vers un commercial l’information « M. X visite notre site, il vient de regarder pendant 3 minutes notre page sur les baladeur mp3 … ».

Sans sombrer dans la paranoïa la plus débridée, je vous laisse imaginer d’autres perversités tirant profit de l’asynchronisme sans submit.


  • Catégories

  • Calendrier

    mars 2007
    L M M J V S D
    « Fév   Avr »
     1234
    567891011
    12131415161718
    19202122232425
    262728293031  
  • Archives

  • Copyright © 1996-2010 Blogabriel. All rights reserved.
    iDream theme by Templates Next | Powered by WordPress