méthode

Analyse grammaticale automatique de l’arménien classique avec DataLift

Je me suis demandé combien de temps cela me prendrait de faire une analyse grammaticale … Ca ne m’a pris que 10 minutes. Voici comment (et vous pourrez vous y essayer aussi).

  1. Installer Datalift, il suffit de télécharger Datalift ici et de le deziper
  2. Vous créez un projet, appelons-le « armenien »
  3. Vous ajoutez la première source, ce sera un texte arménien tokennisé (voir mon post précédent sur la tokennisation de l’arménien). Là j’ai choisi la préface du livre V de l’Adversus Haereses d’Irénée de Lyon (voir le post où je l’ai posté). Avec le tokenniseur, j’ai créé un CSV avec 3 colonnes (chapitre ; rang ; mot). Je l’ai appelé : preface.csv
  4. Vous ajoutez la deuxième source, là j’ai pris mon CSV de lemmisation. Il a 3 colonnes aussi (mot ; lemme ; analyse). Je l’ai appelé : lemmisation.csv
  5. Vous élevez les deux jeux de données pour en faire des sources RDF. Pour l’élévaton de preface.csv, j’ai demandé le changement de type de la colonne « rang » pour que son contenu soit des entiers. J’ai donc obtenu ainsi : preface-csv-rdf-1 et lemmisation-csv-rdf-1
  6. Il ne reste plus qu’à interconnecter. J’ai écrit la requête d’interconnexion suivante :
    PREFIX P-LEMME: <http://localhost:9091/project/armenien/source/lemmisation-csv-rdf-1#>
    PREFIX P-TEXTE: <http://localhost:9091/project/armenien/source/preface-csv-rdf-1#>

    SELECT ?rang ?mot ?lemme ?analyse WHERE {
    ?s P-TEXTE:mot ?mot;
    P-TEXTE:rang ?rang.
    ?s2 P-LEMME:mot ?mot;
    P-LEMME:lemme ?lemme;
    P-LEMME:analyse ?analyse.
    }
    ORDER BY ?rang

  7. J’ai opté pour une sortie en CSV. Je vous recopie les premières lignes

    rang,mot,lemme,analyse
    2,սիրելի,սիրել,verb.pot.nom.acc.loc.sg.
    3,ամենայն,ամենայն,pron.nom.acc.sg.
    5,ի,ի,prep.
    6,չորս,չորք,num.acc.loc.pl.
    7,գիրս,գիր,noun.acc.loc.pl./nom.acc.sg.poss1.
    8,յառաջ,յառաջ,adj.
    9,քան,քան,conj./prep.
    10,զայս,այս (սա),pron.acc.sg.
    11,քեզ,դու,pron.acc.dat.sg.
    12,առաքեալս,առաքել,verb.pfv.acc.loc.pl./nom.acc.loc.sg.poss1.
    13,ի,ի,prep.
    14,մէնջ,մեք,pron.abl.pl.
    15,եւ,եւ,conj.
    17,նոցա,նա,pron.gen.dat.abl.pl.
    18,յայտնի,յայտնի//յայտնել,adj.nom.acc.loc.sg.//verb.pres.3per.sg.pass.
    19,երեւեցելոց,երեւել,verb.pfv.gen.dat.abl.pl.
    20,եւ,եւ,conj.

Et voilà, le tour est joué ! Chaque ligne commence par le rang du mot analysé dans le texte de départ. Vous voyez ainsi que le premier mot n’est pas présent. Cela signifie tout simplement que cette forme du mot n’est pas renseigné dans mon lemmisateur. Le 16e est dans le même cas.

Voilà à quoi peut servir Datalift, dans le monde de la linguistique.

1 Comment more...

Age et compétences

Depuis l’irruption d’Internet dans nos vies, nous observons des bouleversements dont certains nous semblent paradoxaux.

  • Quand nos usages privés dépassent en quantité et en qualité nos usages professionnels,
  • Quand nos équipements domestiques sont plus performants que ceux que nos entreprises mettent à notre disposition pour travailler,
  • Quand les personnes se forment seules, chez elles sur leur matériel,
  • Quand ce sont les enfants qui apprennent à leurs parents,
  • Quand ce sont les élèves qui enseignent leurs professeurs,
  • Quand ce sont les dernières recrues qui expliquent aux anciens des entreprises,

cela signifie t-il que les jeunes sont plus compétents ?

La maîtrise d’un outil rend-elle plus compétent ? Quand peut-on dire que l’on maîtrise un outil ?

Force est de constater que la maîtrise technique masque la maîtrise des usages. La maîtrise technique s’apprend scolairement, par l’acquisition de gestes techniques qu’il faudra savoir répéter. La maîtrise des usages demande du temps pour l’appropriation des gestes et leur intégration dans la logique du métier. Elle nécessite la connaissance du métier.


La loi de Nielsen, la vitesse de connexion

Nielsen a donné son nom à la loi Nielsen, dans laquelle il postule que la vitesse de connexion au réseau pour l’utilisateur final augmente de 50% par an, soit le double tous les 21 mois. Il rapproche cette loi de celle de Moore sur la croissance dans la puissance des processeurs et observe que le taux de croissance de sa loi est plus lent que la loi de Moore.

Nielsen est aussi connu pour avoir également défini cinq composantes de la qualité de l’expérience utilisateur :

l’apprenabilité, l’efficacité, la mémorabilité, le faible taux d’erreur, la satisfaction.

Qui est Nielsen ?

Jakob Nielsen (né en 1957 à Copenhague au Danemark) a obtenu un doctorat en interaction homme machine à l’ Université technique de Copenhague. Il est un consultant en ergonomie et est reconnu comme un expert en usage Internet (Web Usability, si l’anglais vous manque) que l’on appelle aussi l’expérience utilisateur (User experience, ou UX, pour mes amis anglophiles).


La loi de puissance

La loi de puissance est une relation mathématique entre une quantité qui décroit lentement tandis que l’autre augmente. Cette loi a plusieurs avatars, dont quelques uns sont bien connus dans le vaste monde de l’Internet. A commencer par celui qui a été rendu célèbre par Jeff Besos, le créateur d’Amazon, sous le nom de la longue traine (long tail, si l’anglais vous manque). Un autre avatar fameux est la loi de Pareto que vous connaissez certainement encore mieux sous son sobriquet de loi des 80/20.

Le nom de cette loi s’explique mathématiquement, en effet, elle peut s’écrire de la façon suivante :

log(y) = k.log(x)+log(a)

ou encore

y = a.(x puissance k)


La loi de Pareto, ou loi des 80 / 20

Au début, ce sont des observations, beaucoup d’observations faites sur des données fiscales, qui conduisent Pareto à formuler empiriquement qu’environ 80 % des effets sont le produit de 20 % des causes. Plus tard, cela sera formalisé en mathématiques sous le nom de distribution de Pareto.

Ce ratio de 80 / 20 dépasse largement le cadre dans lequel il a été observé puis formulé. Il s’applique aussi parfaitement au monde des projets. Nous savons bien que pour développer 80% des besoins exprimés, 20% d’effort peuvent suffire … Et si on réclame les 20% de fonctionnalités manquantes, il faudra consentir 80% d’effort, c’est à dire 4 fois plus.

L’entêtement à vouloir atteindre 100% est dévastateur ! Surtout, si quand on sait que les utilisateurs n’utilisent qu’entre 10 à 20% des systèmes qu’on leur destine (pour vérifier cette dernière assertion, répondez simplement à cette question : quelle part de Word utilisez-vous ?)

Qui était Pareto ?

Vilfredo Pareto était un économiste et sociologue italien (né à Paris en 1848 et mort en 1923 en Suisse).


Lean, Agile, Scrum : dix nouveaux témoignages en vidéo

Après mon premier article, je reviens pour vous livrer une nouvelle moisson :

En français, 5 nouvelles vidéos :

  • Présentation des méthodes agiles 1, 2, 3, 4, 5 (le scrum au quotidien)

En anglais, 5 nouvelles vidéos :

Quelle est ou quelles sont les vidéos qui vous trouvez les plus intéressantes ?


Lean, Agile, Scrum : des témoignages en vidéo

Voici une série de témoignages sur le Lean et l’Agilité trouvés sur DailyMotion. Ce sont des vidéos très intéressantes qui méritent vraiment qu’on s’y attarde. Du bon eLearning !

En français

Et en anglais

Si vous avez d’autres témoignages à partager, merci de les mettre en commentaire ! Notamment, j’aimerai bien savoir celle qui vous a le plus intéressé.

Bien sûr, si vous allez sur YouTube, vous devriez en trouver encore bien d’autres …


Agilité, une enquête très motivante pour se lancer

Les résultats d’une enquête nationale sur les méthodes agiles viennent d’être publiés sur le site du French Scrum User Group. Pour tous ceux qui hésitent à franchir le pas … la lecture de ce document de 17 pages (en français !) donne des réponses chiffrées très motivantes.

Les chapîtres livrent plusieurs résultats intéressants. La seconde moitié livre notamment un bilan quantitatif où les données sont très tranchées … Vraiment, il faut lire ces résultats … et on en reparle !


  • Catégories

  • Calendrier

    février 2017
    L M M J V S D
    « Juil    
     12345
    6789101112
    13141516171819
    20212223242526
    2728  
  • Archives

  • Copyright © 1996-2010 Blogabriel. All rights reserved.
    iDream theme by Templates Next | Powered by WordPress