Author Archive

De l’information trouvée à la vérité : nécessité d’un apprentissage humaniste

Dans les débuts d’Internet, nos visites étaient motivées par le besoin de trouver de l’information et une bonne dose de curiosité, ne sachant si nous allions justement trouver ce que nous cherchions. Assez rapidement, nos recherches se sont faites plus pertinentes essentiellement pour quatre raisons :

• les outils sont plus adaptés à la recherche,
• le référencement des informations publiées s’est amélioré,
• la quantité d’informations croissant, la qualité globale de l’ensemble y a gagné,
• les utilisateurs ont aussi acquis de nouveaux usages et les ont perfectionnés.

Peu à peu, alors que nous allions chercher de l’information, nous avons attendu d’Internet qu’il nous donne l’information, toujours plus absolue. Notre sens critique a perdu en acuité. Le déplacement du « c’est écrit » de son support matériel qu’était le livre vers l’immatériel numérique se traduit par la recherche de la vérité dans Internet.

Maintenant que l’Internet est accédé par plus de 50% de la population des pays développés, son enseignement devient indispensable. Et ce n’est pas d’apprendre à manier une souris qu’il s’agit ! C’est un enseignement qui doit prendre place dans ce que l’on appelait les humanités. Quand les rapports entre les personnes qui se connaissent ou pas, s’expriment de plus en plus au travers des réseaux sociaux, il est urgent de prendre conscience de la dérive des usages, pour ne pas dire des usages en dérive.


L’élamite et le hatti

Comme tous les ans, l’Ecole des Langues et Civilisations de l’Orient Ancien (ELCOA) propose une journée d’études consacrée aux langues rares. C’est un moment tout aussi rare que les langues rencontrées à cette occasion. Le cru de cette année porte sur deux langues agglutinantes mal connues du moyen orient. L’élamite, comme son nom l’indique, était parlé en Elam, contrée située au sud-ouest de l’actuel Iran. Le hatti était parlé en Anatolie avant l’arrivée des Hittites.

Où en sont les recherches aujourd’hui ? Rendez-vous à l’ICP le 19 novembre 2010 pour le savoir.


Convergence search et réseau social, qui gagnera ?

Les réseaux sociaux (rs) se partagent l’audience mondiale avec les moteurs de recherche (mr). Au top 10 des sites les plus visités[1] se trouvent par ordre décroissant : Google (mr), Facebook (rs), Youtube (rs), Yahoo ! (mr), Windows live (mr), Baidu (mr), Wikipedia (rs), Blogger (rs), MSN (mr) et Twitter (rs). Soit 5 de chaque catégorie.

La bipartition au sommet de la popularité Internet entre moteurs de recherche et réseaux sociaux motive l’apparition de nouveaux sites aux usages ajustés. Citons en deux : l’immédiateté et la proximité.

Immédiateté. Puisque les internautes et les mobinautes ont un rapport de plus en plus immédiat avec le Web grâce aux réseaux sociaux où publier se fait à la vitesse du clic, leur besoin de recherche suit la même tendance. Ils veulent trouver jusqu’aux informations publiées et diffusées les plus récentes. Des moteurs d’un nouveau type apparaissent pour répondre à cette demande, ce sont les moteurs en temps réels[2] dont les nouvelles exigences sont la vitesse d’actualisation et la segmentation des sources sociales (réseaux, blogs, sites d’information etc.).

Proximité. Avec les progrès de la géolocalisation, les moteurs ont acquis une autre dimension sociale : ils ont appris à répondre au plus près de l’utilisateur ou de ses contacts.

Nous assistons à des tentatives répétées pour faire converger les moteurs de recherche et les réseaux sociaux. Qu’est-ce que cela va donner ? Google essaie de pénétrer de force le monde des réseaux sociaux. Mais le géant a jeté l’éponge pour Wave. L’outil de communication collaboratif n’a pas eu le succès attendu : « Wave n’a pas eu autant d’utilisateurs que nous l’aurions souhaité. » C’est la phrase que toute la presse a retenue de l’explication donnée par un responsable de la société. Google s’est aussi fait rappeler à l’ordre pour Buzz par un collège international d’autorités de type CNIL. Les réseaux qui marchent sont des succès inattendus. En 2004, un étudiant de 20 ans crée thefacebook.com dans sa chambre à Harvard. Et deux semaines plus tard, les 2/3 de l’école s’inscrivent. Six ans plus tard, plus d’un demi-milliard de comptes ont été ouverts sur le site. Google a la mémoire courte, son moteur est lui aussi un succès inattendu.

Je ne crois pas le vainqueur du rapprochement search et réseau social soit un acteur significatif de ces deux mondes. Je vote pour un nouvel entrant qui émergera à la suite d’un succès inattendu.


[1] En se référant à l’analyse de www.alexa.com pour le mois de juillet 2010.
[2] http://www.netpublic.fr/2010/08/8-moteurs-de-recherche-en-temps-reel-efficaces-et-novateurs/


Age et compétences

Depuis l’irruption d’Internet dans nos vies, nous observons des bouleversements dont certains nous semblent paradoxaux.

  • Quand nos usages privés dépassent en quantité et en qualité nos usages professionnels,
  • Quand nos équipements domestiques sont plus performants que ceux que nos entreprises mettent à notre disposition pour travailler,
  • Quand les personnes se forment seules, chez elles sur leur matériel,
  • Quand ce sont les enfants qui apprennent à leurs parents,
  • Quand ce sont les élèves qui enseignent leurs professeurs,
  • Quand ce sont les dernières recrues qui expliquent aux anciens des entreprises,

cela signifie t-il que les jeunes sont plus compétents ?

La maîtrise d’un outil rend-elle plus compétent ? Quand peut-on dire que l’on maîtrise un outil ?

Force est de constater que la maîtrise technique masque la maîtrise des usages. La maîtrise technique s’apprend scolairement, par l’acquisition de gestes techniques qu’il faudra savoir répéter. La maîtrise des usages demande du temps pour l’appropriation des gestes et leur intégration dans la logique du métier. Elle nécessite la connaissance du métier.


Eugène Lejeune, artiste peintre

Eugène Lejeune est né à Beaumont-les-Autels (Eure-et-Loir) le 15 décembre 1818. Son père, Marie François (15.08.1782, paroisse St Eustache à Paris – 14.01.1864 à Beaumont-les-Autels), est alors maire de Beaumont-le-Chartif où il consigne la naissance de son fils dans le registre communal. Parmi les témoins, le baron Urs Joseph Augustin de Besenval (1776-1836), Lieutenant Colonel du deuxième régiment suisse de la Garde Nationale, veuf depuis 1814 qui en 1825 est propriétaire de la fabrique de faïence dite « de réverbère » de Beaumont-le-Chartif dont Marie François Lejeune est directeur en 1824.

Jean-Baptiste Lejeune, grand-père d’Eugène, était luthier de l’Académie royale de musique. Il exerça son art à Paris, rue Montmartre, de 1775 à 1816. Il était lui même issu d’une famille de luthiers. Les violons Lejeune sont toujours recherchés pour leur qualité.

Eugène est le premier enfant du couple. Sa mère, Anne Victoire née Durand (16.07.1792, paroisse Notre-Dame de Chartres – 09.07.1844 à Chartres) est la fille de l’imprimeur chartrain Jean-François Innocent Durand (28.12.1767, paroisse Ste Foy de Chartres – 27.11.1829 à Chartres) et de Marie Anne Le Tellier (15.12.1770 à Chartres – 21.10.1817 à Chartres) elle-même issue d’une autre famille d’imprimeurs chartrains.

Eugène étudie la peinture dans les ateliers de Paul Delaroche et de Charles Gleyre. Paul Delaroche avait commencé à enseigner en 1832 ou 1833. A la suite d’un bizutage tragique, il dut fermer son atelier en 1843 et c’est Charles Gleyre qui reprit l’atelier. Eugène, devenu artiste peintre, demeure à Paris et expose au Salon à partir de 1845.

Eugène se spécialise dans les portraits, les scènes . Il illustre aussi plusieurs livres. On peut citer à titre d’exemplaires « Reines et rois de France ». Dans les années 1848-1854, il collabore au « Journal des mères et des enfants » fondé par le fouriériste Jules Delbrück (1813-1889). Ce Journal des mères et des enfants divisé en deux parties présente la particularité d’être destiné dans sa première partie (la plus grande) aux enfants et dans sa seconde partie (plus petite) aux parents. Cette revue parut chaque mois de novembre 1848 à octobre 1854 avec de légères modifications du titre. « M. Jules Delbruck, dont le nom se rattache étroitement à la fondation des crèches, l’auteur de la crèche modèle, le savant rédacteur du recueil l’Éducation nouvelle, est un de ceux qui ont le plus fait pour le perfectionnement de l’enfance ; l’attrait, voilà son principe. Transformer les leçons en récréations instructives, c’est la marche dont tous ses écrits tendent à montrer la nécessité aux familles. » (Delasiauve, Journal de médecine mentale, 1866).

Eugène épouse Joséphine Halley (1826 à Cerdon, Ain – 28.01.1879 à Paris 14e). Son prénom bien napoléonien laisse supposer certaines sympathies politiques chez ses parents. Pour l’heure, je n’ai pas réussi à déterminer ni la date et le lieu de leur mariage. Ils auront une fille, Marie Elise (17.10.1853 à Paris 11e – 4.01.1890 à Paris 6e).

En 1861, il demeure rue de l’Ouest à Paris. Eugène est garde national pendant la guerre de 1870-1871.

Le peintre s’éteint à Paris le 8 avril 1894 à l’âge de 75 ans.

Plusieurs musées conservent des oeuvres : au musée de Brest « Intérieur de cuisine », au musée de Chartres « Le Cardinal Pie », « La niche aux lapins », « Michel Chasles », « Adolphe Chasles » et « Pierre Nicole ».

J’ai aussi réuni près de 100 photos de ses oeuvres, études ou gravures qui peuvent être vues ici.


La loi de Nielsen, la vitesse de connexion

Nielsen a donné son nom à la loi Nielsen, dans laquelle il postule que la vitesse de connexion au réseau pour l’utilisateur final augmente de 50% par an, soit le double tous les 21 mois. Il rapproche cette loi de celle de Moore sur la croissance dans la puissance des processeurs et observe que le taux de croissance de sa loi est plus lent que la loi de Moore.

Nielsen est aussi connu pour avoir également défini cinq composantes de la qualité de l’expérience utilisateur :

l’apprenabilité, l’efficacité, la mémorabilité, le faible taux d’erreur, la satisfaction.

Qui est Nielsen ?

Jakob Nielsen (né en 1957 à Copenhague au Danemark) a obtenu un doctorat en interaction homme machine à l’ Université technique de Copenhague. Il est un consultant en ergonomie et est reconnu comme un expert en usage Internet (Web Usability, si l’anglais vous manque) que l’on appelle aussi l’expérience utilisateur (User experience, ou UX, pour mes amis anglophiles).


La loi de Lanchester, ou la loi de puissance

La loi de puissance est une relation mathématique entre une quantité qui décroit lentement tandis que l’autre augmente. Cette loi a plusieurs avatars, dont quelques-uns sont bien connus dans le vaste monde de l’Internet. A commencer par celui qui a été rendu célèbre par Jeff Besos, le créateur d’Amazon, sous le nom de la longue traine (long tail, si l’anglais vous manque). Un autre avatar fameux est la loi de Pareto que vous connaissez certainement encore mieux sous son sobriquet de loi des 80/20.

Le nom de cette loi s’explique mathématiquement, en effet, elle peut s’écrire de la façon suivante :

log(y) = k.log(x)+log(a)

ou encore

y = a.(x puissance k)


La loi de Pareto, ou loi des 80 / 20

Au début, ce sont des observations, beaucoup d’observations faites sur des données fiscales, qui conduisent Pareto à formuler empiriquement qu’environ 80 % des effets sont le produit de 20 % des causes. Plus tard, cela sera formalisé en mathématiques sous le nom de distribution de Pareto.

Ce ratio de 80 / 20 dépasse largement le cadre dans lequel il a été observé puis formulé. Il s’applique aussi parfaitement au monde des projets. Nous savons bien que pour développer 80% des besoins exprimés, 20% d’effort peuvent suffire … Et si on réclame les 20% de fonctionnalités manquantes, il faudra consentir 80% d’effort, c’est à dire 4 fois plus.

L’entêtement à vouloir atteindre 100% est dévastateur ! Surtout, si quand on sait que les utilisateurs n’utilisent qu’entre 10 à 20% des systèmes qu’on leur destine (pour vérifier cette dernière assertion, répondez simplement à cette question : quelle part de Word utilisez-vous ?)

Qui était Pareto ?

Vilfredo Pareto était un économiste et sociologue italien (né à Paris en 1848 et mort en 1923 en Suisse).


Comment définir une ontologie ?

Pour faire simple

Une ontologie est une façon de partager des connaissances entre l’homme et la machine, celle-ci  en permet le traitement.

Ces connaissances sont un ensemble structuré de concepts (sous la forme d’une hiérarchie ou d’un graphe). Les concepts manipulés peuvent être des choses, des événements, des relations, etc.

Mais vous voulez peut-être en savoir plus …

Le Web de données, alias Web 3.0, alias Web sémantique, n’est plus un sujet de pure recherche. Déjà en 1999, Tim Berners-Lee expliquait que « le Web Sémantique est une extension de l’Internet où les informations sont définies sémantiquement afin de faciliter le partage et la coopération ». Aujourd’hui, on voit de plus en plus de projets, et les responsables informatiques et les décideurs des entreprises ou des administrations se renseignent pour comprendre les promesses de ce nouveau continent et envisager ce que leur système d’information y gagnera. Mais les premières difficultés rencontrées sont le vocabulaire et les concepts qu’il faut manipuler. Les oeuvres de vulgarisation sont encore peu nombreuses, il y a encore beaucoup à faire …

Dans ce billet, il est question d’ontologie. Je vais donner quelques définitions, à différents niveaux, de cet objet particulier et central dont le seul mot déjà peut rebuter.

Si vous êtes passés par Wikipedia, vous aurez vu qu’il y a bien d’autres acceptions : philosophique, médicale ou géopolitique. Le vocabulaire est bien chargé ! Pour autant, vous allez voir que ce n’est pas si terrible que ça. Wikipedia propose une page intéressante sur l’ontologie, au sens du Web de données ; la page anglaise est plus fournie encore. La visite d’autres sites spécialisés, comme par exemple celui du CNTRL, ne donne en revanche aucune définition sur notre sujet.

On trouve aussi de bonnes synthèses (en français), comme celles de Benoit Lavoie ou de Gautier Poupeau.

A – En 1993, Tom Gruber donne la célèbre définition suivante “An explicit specification of a conceptualisation” (une ontologie est une spécification explicite d’une conceptualisation). Cette définition a la vertu d’être courte, mais elle laisse sur sa fin lecteur d’aujourd’hui compte-tenu des développements du Web de données.

B – En 2003, Sean Bechhofer, Ian Horrocks and Peter F. Patel-Schneider définissent l’ontologie comme un artefact de l’ingénierie

  • constituée par un vocabulaire spécifique, elle est utilisée pour décrire une certaine réalité
  • et un ensemble d’hypothèses explicites sur le sens voulu du vocabulaire.

Ainsi, une ontologie décrit une spécification formelle d’un certain domaine

  • elle en est une compréhension partagée
  • et un modèle formel et manipulable par une machine.

C – La définition de l’IEEE (2003)

Une ontologie est semblable à un dictionnaire ou un glossaire, mais avec plus de détails et une structure qui permettent aux ordinateurs de traiter leur contenu. Une ontologie se compose d’un ensemble de concepts, d’axiomes, et de relations qui décrivent un domaine d’intérêt.

D – En 2007, le même Tom Gruber précise.

Dans le contexte de l’informatique et des sciences de l’information, une ontologie définit un ensemble de primitives de représentation pour modéliser un domaine de connaissance.

Les primitives de représentation sont généralement

  • des classes (ou des ensembles),
  • des attributs (ou des propriétés),
  • et des relations (ou des liens qui relient des éléments de classe)

Les définitions des primitives de représentation incluent

  • des informations sur leurs significations
  • et des contraintes sur leurs applications, qui doit être logiquement cohérente.

Dans le contexte des systèmes de base de données, l’ontologie peut être considérée

  • comme un niveau d’abstraction des modèles de données, analogue aux modèles hiérarchiques et relationnels,
  • mais destinée à la modélisation des connaissances sur les individus, leurs attributs et leurs relations avec d’autres individus.

Les ontologies sont généralement décrites dans les langages qui permettent l’abstraction indépendamment des structures de données et des stratégies de mise en œuvre. En pratique, les langages de description des ontologies ont une puissance expressive plus proche de la logique du premier ordre que celle des langages utilisés pour les modèles de bases de données. Pour cette raison, on dit des ontologies qu’elles sont de niveau « sémantique », tandis que les schémas de bases de données sont des modèles de données de niveau «logique» ou «physique».

Du fait de leur indépendance par rapport aux modèles de données de niveau inférieur, les ontologies sont utilisées pour l’intégration de bases de données hétérogènes, permettant une interopérabilité entre des systèmes disparates, et la spécification d’interfaces de services indépendants de la connaissance. Dans le stack technologique des standards du Web sémantique, les ontologies représentent explicitement une couche.

E – Kore Nordmann (2009)

Les ontologies sont un concept théorique en sciences de l’information destiné à représenter formellement des connaissances dans un logiciel capable de les traiter et de raisonner avec. Souvent aussi la lisibilité pour l’homme est un aspect central.

F – Pour faire simple, suite (2010)

Si je reprends ce que j’écrivais au début de cette page et que je complète un peu à l’aide des autres définitions que nous avons maintenant parcourues, on peut esquisser ceci :

Une ontologie décrit généralement des

  • individus : des objets de base,
  • classes : des ensembles, des collections ou des types d’objets,
  • attributs : des propriétés, des fonctionnalités, des caractéristiques ou des paramètres que les objets possèdent et partagent,
  • relations : des liens qui relient  les objets,
  • événements : des changements qui affectent des attributs ou des relations.

Ces descriptions sont la formalisation d’un ensemble de connaissances exprimées dans un langage

  • compréhensible par un humain
  • et qui peut être traité par un logiciel à des fins de raisonnement.

La formalisation d’une ontologie en structure les termes et les concepts à l’aide d’un graphe où les relations sont

  • des relations sémantiques,
  • des relations d’inclusion (subsomption).

L’ontologie est donc la spécification explicite d’une conceptualisation … Nous avons retrouvé la définition donnée par Tom Gruber en 1993 !

Concluons

Les définitions sont nombreuses et couvrent parfois des aspects différents. A l’évidence, il n’existe pas une seule bonne définition. Il faut donc y voir la marque d’une richesse que confirme la difficulté de créer une ontologie. Mais c’est là un autre sujet ! Il existe aujourd’hui plusieurs langages standard pour décrire une ontologie. La gamme d’outils commerciaux ou open source se développe. Ce seront les thèmes de prochains billets. A suivre …


La loi de Godwin : Débat et discrédit

En 1990, Mike Godwin fait la constatation suivante « Plus une discussion en ligne dure longtemps, plus la probabilité d’y trouver une comparaison impliquant les nazis ou Hitler s’approche de 1. » (« As an online discussion grows longer, the probability of a comparison involving Nazis or Hitler approaches 1. »)

Depuis plusieurs années, cette remarque empirique a été appliquée à Internet et plus particulièrement aux forums. On y lit que certains s’interrogent pour savoir « à quel moment ce forum atteindra-t-il le point Godwin ? » Il est ainsi du devoir de tout modérateur de guetter les signes avant-coureurs de la survenue de ce point …

Qui est Godwin ?

Mike Godwin est un avocat américain qui a été chercheur à l’Université de Yale et est aujourd’hui le directeur juridique et le coordinateur juridique de la fondation Wikimedia.


  • Catégories

  • Calendrier

    novembre 2024
    L M M J V S D
    « Mai    
     123
    45678910
    11121314151617
    18192021222324
    252627282930  
  • Archives

  • Copyright © 1996-2010 Blogabriel. All rights reserved.
    iDream theme by Templates Next | Powered by WordPress