Author Archive

Lemmatisation

Définition : Il s’agit d’associer à un mot sa forme canonique. Toutes les flexions d’un même mot renvoie vers cette même forme. Pour toutes les formes conjuguées d’un verbe en français, la forme canonique est le verbe à l’infinitif présent.

Exemples d’outils de lemmatisation automatiques

  • Morlex : Le verbe en français
  • Flemm : Analyseur Flexionnel du français pour des corpus étiquetés

Web 0.0, ce web qu’on nous cache !

Reprenons nos investigations … à la recherche du web caché. Je ne connais guère que 3 façons d’aller à un endroit précis. Je connais l’adresse, je trouve l’adresse ou je découvre une nouvelle adresse.

Les pages du web 0.0 sont indubitablement de celles qu’on découvre. Si elles sont cachées, je ne les connaissais pas et les moteurs ne me donnaient pas le moyen de les trouver. En reformulant ma question, j’en arrive à ceci. Peut-on s’organiser pour que cette découverte soit possible, puis fructueuse ? Il est clair que tout cela doit se faire dans le respect des sites et des lois. Il s’agira donc de découvrir ce qui est licite d’accès ou d’accès licite.

Pour ne pas aller au hasard, à la crétin.fr, il est naturel de se demander s’il n’existe pas une manière d’utiliser les moteurs de recherche pour trouver ce qu’ils ne nous donnent pas habituellement comme réponse. Notons tout de suite que cette approche repose entièrement sur ce que les moteurs ont décidé d’indexer. Je le dis autrement : il s’agit d’accéder au plus caché de se qui n’est pas caché. Et nous mettrons de côté l’authentiquement caché, celui n’est pas indexé et est déconnecté (sans lien) de ce qui est indexé.

Pour cela, il faut utiliser la recherche expressive des requêtes offertes. Prenons Google comme bac à sable pour quelques expériences à la recherche de pages « normalement » impossibles à trouver.

Si je cherche les pages avec cheval et vapeur, je demanderai :

  • cheval vapeur
  • +cheval +vapeur
  • (+ cheval +vapeur)

Si je ne veux pas voiture :

  • cheval vapeur -voiture
  • (+cheval +vapeur) -voiture
  • etc.

L’utilisation de la négation ne peut pas se faire seule. Pas possible de trouver toutes les pages où il n’est pas question de voiture. L’opérateur de Google n’est pas une négation mais un sauf.

  • -voiture

Cette requête n’est donc pas possible.

En revanche, comme Google ne travaille pas au niveau d’ensemble mais évalue d’abord la requête selon une logique formelle qui lui est propre et lance une seule requête, il est possible d’écrire des requêtes que le bon sens jugera impossibles et d’obtenir tout de même des réponses … Exemple :

  • cheval -cheval vapeur -vapeur

Essayez, vous serez étonné ! Cela donne une réponse … Ca ne marche à tous les coups. « moteur voiture -moteur -voiture » est sans réponse mais « moteur voitures -moteur -voitures » a une réponse. Pour ceux qui regarderont le code source de la page, ils comprendront meiux ce qui se passe dans les coulisses de Google. A vous de jouer !

Effet de bord : En préparant ce post, je suis tombé sur un bug de Google. Si vous cherchez « a b -a -b » et que vous cliquez sur « Rechercher » puis dans la page de réponses sur « Recherche avancée », vous verrez que la requête a été modifiée en « ab -a -b ». Ce qui ne donne bien évidemment pas les mêmes réponses.


Web 2.0 et mauvaises manières

Puisque nous sommes dans l’univers entoilé du web, la navigation et les interactions entre vous et les sites que vous visitez ne peuvent se concevoir qu’avec les moyens existants … je veux dire avec les moyens que vous connaissez.

Pas si sûr ;-( Le web 2.0 nous cache des mécanismes dont vous avez peut-être fait les frais. J’ai déjà plusieurs fois entendu l’histoire suivante.

J’étais en train de surfer sur un site de commerce électronique et comme par hasard on m’a téléphoné pour me proposer la vente de ce que je venais de regarder.

Les amis qui m’ont raconté cela m’ont dit leur agacement voire même leur sentiment d’avoir été espionnés. Vous serez d’accord avec eux pour considérer qu’il s’agit là vraiment de très mauvaises manières de faire du commerce.

Comment cela est-il possible ? Oh, c’est très facile, vous pouriez même le faire à votre tour. Dans une page web 2.0, vous savez avec de l’Ajax, il est possible de façon asynchrone et indépendante des submits d’avoir un échange client / serveur. C’est ce que fait google avec sa Map ou son Suggest. Pendant que vous regardez la carte, les cartes voisines se chargent déjà dans votre poste client, ce qui vous donnera cette impression de fluidité. Ou pour Suggest, les mots proches apparaîtront au fur et à mesure de votre saisie. Détournez ce dispositif et suivez ce que fait une personne en « piégeant » la page et le tour est joué. Si en plus, vous avez une session ouverte … il ne reste plus qu’à pousser vers un commercial l’information « M. X visite notre site, il vient de regarder pendant 3 minutes notre page sur les baladeur mp3 … ».

Sans sombrer dans la paranoïa la plus débridée, je vous laisse imaginer d’autres perversités tirant profit de l’asynchronisme sans submit.


Blog, est-ce que ça a du sens en entreprise ?

Ce n’est pas une question technique

J’ai plusieurs fois entendu cette question et c’est vrai qu’elle mérite vraiment d’être posée. En effet, il s’agit d’un outil simple à prendre en main, il n’est pas onéreux … bref, il est facile à mettre à dispositon de nouveaux utilisateurs. Mais ce n’est pas pour autant qu’on le trouve dans nos entreprises françaises.

Quels freins ?

Alors quels sont les freins ? Qui bloque la signature ? On entend des remarques comme « qu’est-ce qu’on va bien pouvoir écrire ? » ou « qui lira tout ça ? » ou encore « si j’écris, je dois réfléchir, je ne peux pas écrire n’importe quoi … qu’est-ce qu’on va penser ? »

Mais en fait, qu’est-ce qui caractérise un blog ?

Si on répond simplement à cette question, on fait un grand pas. Allons-y ! Un blog, c’est le moyen pour quelqu’un qui a régulièrement des choses à dire de pouvoir les publier sans avoir recours à des systèmes de publication complexe comme il y en a encore beaucoup. En d’autres termes : un auteur, un calendrier, des articles datés.

Qui a besoin de ça ?

Y a-t-il dans l’entreprise des gens qui ont besoin de ça ? S’il y en a, le blog en entreprise, ça a du sens.

Les premières personnes auxquelles je pense tout naturellement ce sont les responsables de service, de département, de l’entreprise. Ils ont tous des informations à diffuser, ils sont par essence des communiquants dans l’entreprise puisqu’ils en dirige tout ou partie. S’ils n’ont pas le temps d’écrire, ils ont autour d’eux des personnes qui peuvent rédiger la note et la publier.

Il y a aussi tous les communiquants internes.

Et les lecteurs, doivent-ils surfer sur tous les blogs pour être informés ? Non, bien sûr. Les flux RSS sont là pour ça. En plus, ils ont cet avantage remarquable sur les mails de n’être pas vecteurs de spam.

Alors, qu’est-ce qu’on attend ?


Wiki, ma boîte à outils

  1. Comment choisir son moteur de Wiki ?
  2. Quelles fonctionnalités lui ajouter ?
  3. Comment mesurer son audience ?
  4. Comment importer des articles ?
  5. Comment récupérer des articles pour les injecter dans un autre Wiki ?
  6. etc.

Bref, le Wiki est mûr, c’est sûr et c’est dur de trouver les bonnes réponses à tant de questions. Alors, voici quelques liens utiles. Car, comme on dit chez Cisco « Don’t worry, it’s on the Web ! »

Choix de moteurs

  • WikiMatrix : comparateur (actuellement 81 moteurs différents)
  • WikiPedia : tableau comparatif (lecture difficile, ergo -)

Liste de moteurs

  • C2.com : triée par langage de programmation du moteur
  • WikiPedia : triée par socle technologique sousjacent

Top 10 de moteurs

  • C2.com : le top 10 du site historique

Fonctionnalités complémentaires

L’ajout de fonctionnalités complémentaires dépend du moteur et de son socle technologique. Si certains moteurs sont particulièrement riches en plug-in ou add-on prêts à l’installation (par exemple : MediaWiki), d’autres ne proposent rien. En tout cas, la présence d’un socle technologique performant permet d’envisager des développements complémentaires (par exemple : développement en PHP, base de données SQL).

Un Wiki « de base » est très rudimentaire. Il est très vite nécessaire de pouvoir répondre aux utilisateurs qui auront trouvé l’herbe plus verte chez les voisins et vous le feront savoir bien vite … Dis, tu ne pourrais pas ajouter une fonctionnalité pour faire des sondages ? Et puis, est-ce que tu n’aurais aussi la possibilité de nous montrer l’audience de nos pages ?

Outils complémentaires

  • WikiPedia : liste spéficique pour MediaWiki triée par catégorie d’outils

Wiki d’entreprise

Sans avoir la prétention de couvrir ce sujet, nous pouvons indiquer quelques truismes. Pour qu’un Wiki puisse être retenu comme une solution crédible dans une entreprise, il doit répondre à un certain nombre d’exigences parmi lesquelles :

Catalogues

Les catalogues de Wiki permettent de juger par l’exemple de la valeur de tel ou tel moteur.


Blog, comment j’ai choisi mon moteur

Quand j’ai souhaité ouvrir ce blog, la question technologique n’était pas la moindre : quel moteur allais-je choisir et selon quels critères ? Alors, premier réflex (conditionné), je demande à Google. Faites le test … avec une recherche sur « blog ». La réponse de Google est éloquante : de la pub, de la pub et du bruit. Alors, je me reprends et je tente « choisir un moteur de blog ». C’est là que les choses ont effectivement changé.

En effet, j’ai trouvé des blogs et j’ai commencé à lire ce que des blogers avaient écrit. J’ai par exemple lu le blog de Claire Bernier

Au lieu du mode « Google et ses algorithmes de search », je suis passé au « réseau social des blogueurs ». Il y a comme un glissement de la pertinence … Le web est envahi, submergé. Les modalités de recherche classiques ne sont plus pertinentes.

Après avoir lu des pages de blogs, je suis passé à des articles de wiki … Bref, c’est en passant par le Web 2.0 que j’ai trouvé une grande quantité d’avis autorisés sur le sujet. J’ai encore fait appel à un site de comparaison très bien fait weblogmatrix. Ce comparateur m’a notamment quel moteur était le plus comparé aux autres …

J’hésitais encore entre 2 ou 3 moteurs. J’ai alors pris l’option suivante : choisir le moteur le plus utilisé parmi les plus récents. Cela m’a donné : WordPress.

Il me restait à vérifier par la pratique. Je n’ai pas été déçu : il est très facile à installer, une très bonne version française est disponible, les fonctionnalités sont remarquables, l’administration très solide … Les styles de présentation comme les plugins sont très nombreux. Bref, je ne peux que vous le recommander.

Ah oui, j’allais oublié … WordPress est gratuit !


Web 2.0, comment exister ?

Besoin de référencement ?

Le référencement est un sujet qui nous touche tous un jour ou l’autre. Nous écrivons des pages et des pages et nous aimerions bien être lu, recevoir des commentaires ou des contributions de bonne qualité … Il y a beaucoup de raisons pour vouloir exister sur le Web, pour vouloir être repéré. Alors comment faire ?

Acheter une place au soleil

Si la fortune est avec nous, nous pouvons faire comme les grandes sociétés et acheter aux enchères des mots précieux chez Google ou chez un autre motoriste de recherche Web 1.0. Nous pouvons aussi louer les services d’agence de référencement qui savent y faire. Bref, avec de l’argent, nous tenons là une première solution.

Mais attention, ce n’est pas parce qu’on est enfin visible qu’on le sera éternellement. il faut entretenir cette visibilité acquise. Et donc payer une rente.

Se faire remarquer

Une autre voie est celle de la pertinence, nettement plus délicate. Ai-je quelque chose à dire et est-ce intelligent ? Si un moteur de recherche indexe ce contenu pertinent, il y a des chances pour qu’il puisse émerger naturellement … C’est tout de même très hasardeux et faut donc aider un peu la nature.

Aider la nature

Une des meilleure façon est le coup de pouce. Vous demandez à un ou plusieurs sites déjà bien en vue de parler de vous en mettant des liens bien placés. Vous pouvez aussi bien travailler votre présentation, les mots que vous mettez dans vos pages, les méta tag, le nom de domaine de votre site … Tous ces bons conseils ne manquent sur Internet.

Et le Web 2.0 ?

Ce que nous venons de raconter est très Web 1.0. Dans le Web 2.0, le référencement doit être en partie repensé. D’abord les pages du Web 2.0 ne sont plus techniquement faites comme celles du Web 1.0. Ensuite, de nouveaux outils sont apparus et leurs pratiques diffèrent. Quels éléments pour mieux situer la question :

  • Une même page Web 2.0 peut être localement modifiée (utilisation d’Ajax et de la fonction XMLHttpRequest) plusieurs fois et être l’équivalent de nombreuses pages Web 1.0. Et pourtant, pour le référencement, une seule sera prise en compte.
  • Tout au partie des pages peut être modifié par des modifications de style (manipulation de CSS en Ajax). Une division (div) peut être cachée. Pourtant le moteur de recherche pourra l’avoir indexée.
  • L’engouement pour les blogs et toute sorte d’autres outils suscite de plus en plus de création de contenu dans le Web. Quand on recherche de l’information pertinente, les stratégies évoluent. Pour ne pas avoir à fouiller trop longtemps dans les listes de plus en plus longues de résultats de Google, nous en venons à développer de nouvelles stratégies de recherche d’informations. Par exemple, on abandonne le célèbre moteur et on cherche dans Wikipedia.

Bref, pour exister sur le nouveau Web 2.0, il faut exister au sens du premier et ajouter du spécifiquement Web 2.0. Le travail à entreprendre est donc de détecter tous les lieux où cela se joue. A suivre …


La loi d’Amdahl : Gain de performance

Cette loi se rapporte au gain de performance qu’on peut attendre d’un ordinateur en améliorant une composante de sa performance. Sous sa forme générale, elle indique que le gain de performance égale le temps d’exécution d’une tâche complète sans l’amélioration divisé par le temps d’exécution de la même tâche avec l’amélioration.

Avons-nous déjà calculé ce gain dans nos projets web 2.0 afin de les quantifier ? Cela nous donnerait-il pas le moyen de fournir des données tangibles, puisque numériques, aux détracteurs de la 2e toile ?

Qui est Amdhal ?

Gene Myron Amdahl (né le 16 novembre 1922), américain d’origine norvégienne, est un architecte d’ordinateur et un entrepreneur de pointe, principalement connus pour son travail sur les ordinateurs centraux chez IBM et plus tard dans ses propres compagnies, particulièrement Amdahl Corporation créée en 1970.


Web 2.0, ergonomie et esthétique

Le déplacement des usages en entraîne d’autres …

Les usages évoluent parce que la technique nous facilite la mise en oeuvre de telle ou telle fonctionnalité ou combinaison de focntionnalités. Nous assistons donc avec beaucoup d’intérêt à la maturation d’un premier Web. Accompagnant ces usages qui ne demandaient qu’à se libérer, nous voyons aussi des changements dans l’ergonomie et dans l’esthétique des sites.

L’utilisation de framework Ajax ouvre une nouvelle souplesse, une nouvelle interactivité. La page n’est plus rafraîchie globalement mais localement, avec parcimonie ! Avec un Web plus économe, nous tenons un filon qui mérité vraiment d’être exploité. Déjà les hommes du réseau ont fait leur calcul … ce serait entre 30 et 70% de la bande passante qui serait libérée. C’est donc de la puissance en plus, des données en plus …

Souplesse

L’exemple paradigmatique est Google Maps. Vous localisez un coin de la planète, et pendant que vous le regardez, des échanges entre votre navigateur et les serveurs de Google vous préparent en mémoire, dans votre PC, tout le voisinage auquel vous voudrez certainement accéder. La souplesse est obtenue une anticipation qui tient compte des suites probables de ce qui fait actuellement.

Interactivité

Ne plus avoir à attendre une fin de saisie de tout un formulaire pour en déclencher la validation sur le serveur est un bouleversement pour les utilisateurs. A la fin de la saisie d’une zone ou d’un ensemble de zones, des traitements locaux peuvent être réalisés. On passe ainsi à une interactivité plus fine et pouvant répondre « sur le champ » à une erreur de saisie.

Rapidité

De ne plus avoir à répondre au niveau de la page, mais de pouvoir agir au plus tôt et localement, permet de fractionner les traitements à faire sur une page. Ils deviennent plus courts et sont déclenchés progressivement, au rythme de l’avancée de l’internaute dans la page. C’est peut-être la même puissance qui est consommée, mais ce n’est plus en une fois avec un utilisateur qui s’impatiente.

En ayant soin de bien découper ce qui se joue au sein d’une page complexe, l’attente en fin de page peut globalement disparaître dans la somme de petites attentes (dont certaines sont peut-être même anticipables). C’est comme si l’attente Web 2.0 était soluble dans la page ;-)

Ergonomie et esthétique

Fréquemment, j’ai constaté qu’il y avait une confusion entre les termes ergonomie et esthétique (celle exprimée dans les chartes graphiques). Il n’est pas rare que l’ergonomie soit traitée dans la charte graphique des entreprises à la façon d’un mal nécessaire par lequel il faut bien passé. C’est dommage à plus d’un titre.

Tout d’abord, l’ergonomie est une saine préoccupation, c’est le cas de le dire. On a tous remarqué, par exemple, que les ascenceurs haorizontaux sont calamiteux. Il fatigue le bras dans un effort perpendiculaire de celui habituel que l’on fait avec une souris, ils ne sont pas facilement utilisables (manque d’équivalent), ils signifient aussi qu’une partie de la page n’est visible et qu’il faut aller la voir avant de passer la ligne et qu’à chaque ligne il faudra faire cet aller / retour … Bref, l’horreur !

Sécurité et esthétique

Le plus beau mélange dans cet autre mélange des genres. Imaginer un peu la situation suivante, pour faire pro, on décide de placer dans une page un grigri qui a tous les aspects extérieurs d’un dispositif de sécurité. Alors, on se dit chouette, voilà un site sérieux … Et puis, vous apprenez plus tard qu’en fait c’était de la décoration … Transposons avec cet exemple : des poutres métaliques doivent être démontées. Sur ces poutres, il y a plein de gros boulons apparents sur les cotés et en dessous. Vous demandez que la poutre soit démontée … Les ouvriers commencent par ôter les boulots de côtés et au dernier … la poutre tombe alors qu’il reste tous ceux du dessous. Vous apprenez alors que ces derniers boulots étaient là pour faire beau.

Esthétique

A côté de l’ergonomie repensée avec la prise en compte des technologies sousjacentes du Web 2.0, il y a l’immense champ de l’esthétique. Les feuilles de style en cascade, les fameuses CSS, sont omniprésentes. Composantes centrales d’Ajax, de plus en plus parfaitement respectées par les navigateurs de toute facture, elles permettent de réaliser des petits bijoux.

Vous ne croyez pas que certains développeurs Web 2.0 sont des artistes authentiques ?


Wiki, des catégories d’usages

A la maturité du wiki répondent des usages qui maintenant se fixent progressivement. Des catégories très nettes se dessinent. Pour chacune, je donne quelques exemples.

  • Usage personnel
    • système d’information personnel
  • Usage ludique
    • Jeux
    • Rédaction à plusieurs d’un livre, d’une histoire
  • Usage commercial
    • achats en ligne, commentaires et notes sur les produits
    • guide d’achats, comparateurs
    • catalogue en ligne avec commentaires des clients
    • juridique, informations et droit des consommateurs
  • Usage professionnel
    • espace de travail collaboratif
    • formations
    • base de contact
    • télétravail
  • Usage social
    • associatif
    • citoyen, débats, élections
    • communautaire
    • foules intelligentes, encyclopédies

Pour que les wikis vivent, c’est-à-dire, pour qu’on y trouve un intérêt, il faut réussir à motiver leurs contributeurs. Tous ces usages ont bien en commun cette même question : quelles sont les conditions pour que ça marche ?

Conditions pour des usages professionnels

La formation est la première des conditions, cela va de soi ? Pas si sûr. Souvent, le wiki commence avec une expérimentation puis un service … Même si on y va progressivement, il ne faut pas négliger de former les futurs utilisateurs. Cela a notamment pour effet de manifester l’intérêt que l’entreprise porte à cet outil puisse qu’elle investit.

Deuxièmement, il faut préparer le lancement du wiki. Certes, l’installation est très facile et on peut l’utiliser tel quel. Mais, c’est tout de même mieux avec un petit travail de localisation, avec une charte graphique suivie, avec un premier contenu intéressant et des mots wiki laissés en appel de contribution.

La troisième condition est de mettre en place une animation continue du wiki. En effet, ça ne marche pas tout seul. Il faut susciter la participation, la valoriser, modérer, sanctionner aussi quand il y a des débordements.

La suivante et non la moindre est la gestion du contenu. Il s’agit de réorganiser de temps en temps une ou plusieurs parties en fusionnant des pages ou en découpant des articles trop longs. Il faudra aussi parfois supprimer des morceaux devenus obsolètes.

Et puis n’oublions pas qu’un wiki professionnel doit respecter les règles de l’administration des systèmes. Les utilisateurs ont des comptes, des droits. Il entre ou quitte l’entreprise.


  • Catégories

  • Calendrier

    novembre 2024
    L M M J V S D
    « Mai    
     123
    45678910
    11121314151617
    18192021222324
    252627282930  
  • Archives

  • Copyright © 1996-2010 Blogabriel. All rights reserved.
    iDream theme by Templates Next | Powered by WordPress