gabriel « Blogabriel

30

Mar/13

Petit panorama d’outils sur les ontologies : les moteurs de recherche

by gabriel under ontologie, outils, web de données, web sémantique

(Mise à jour le 14 avril 2013)

Devant la difficulté de créer une ontologie, on peut vouloir en trouver une qui corresponde à son besoin. Mieux, on peut vouloir trouver une ontologie existante car elle aura déjà fait ses preuves, elle aura peut-être une communauté d’adorateurs. Bref, il n’est pas besoin de vous dire l’utilité des moteurs de recherche qui vous permettront de trouver l’ontologie de vos rêves.

L’utilisation de ces moteurs est un peu particulière. L’expression de la recherche se fait en langage naturel avec des mots clés et les résultats produits sont classés. Certaines informations supplémentaires sont souvent fournies.

Mais la difficulté n’est pas dans la recherche à proprement parlé. Une fois que vous avez une liste de résultats, la vraie question est : laquelle choisir ! C’est pour cette raison qu’il existe une nouvelle catégorie d’outils comme LOV (une version indépendante est hébergée à l’OKFN), un des modules de Datalift, destiné à cataloguer, trouver et choisir des ontologies. Ca mérite le détour.

Voici quelques outils, il y en a beaucoup d’autres (vous pouvez d’ailleurs me laisser un commentaire pour je mette à jour cette page).

Catégorie : ceux qui marchent

FalconS pour chercher et trouver des objets, des concepts, des ontologies ou des documents. Pour les ontologies, les résultats sont rendus avec des graphes.
LOV, l’outil de référence, recherche parmi des ontologies de référence.
ontologi.es est une liste de liens … c’est très sommaire, mais ça peut servir (merci Raphaël)
ontosearch pour chercher par des termes.
Sindice, l’outil facile et utile pour trouver en soumettant des termes, des URI, des propriétés et un mode avancé pour aller plus loin. Il y a encore d’autres fonctions utiles …
Swoogle est un ancien outil toujours en ligne, il n’a pas évolué depuis 2007.
SWSE permet de rechercher des entités RDF (résultat universitaire, 2011)
vocab.cc est un projet open source, qui permet de rechercher des vocabulaires de données liées. Il fournit un classement des URI. (Il tombe en 404 quand il ne trouve pas)
vocab.org est destiné à être un espace d’URI ouvert pour des vocabulaires tels que RDF schema ou des documents d’espaces de noms XML (merci Raphaël)
Watson est un moteur intéressant car il évolue régulièrement (à suivre).

Catégorie : les morts-vivants, on ne sait pas trop

Catégorie : les disparus

schemapedia … ce dernier était le plus intéressant car il fournissait non seulement des vocabulaires mais de nombreux exemples quant à leur utilisation. Malheureusement, il était basé sur la plate-forme Talis et il s’en est allé avec cette plate-forme. Le code est toute fois ouvert sur Google Code (merci Raphaël).

29

Mar/13

Petit panorama d’outils sur les ontologies

by gabriel under ontologie, outils, web de données, web sémantique

Définition

Commençons par rappeler ce qu’est une ontologie dans le monde du web des données. Pour cela, je vous renvoie à mon post Comment définir une ontologie ?

Synonyme

Le mot ontologie est souvent inconnu. Plutôt que d’être mal compris, il vaut mieux parfois proposer un synonyme. Vous pouvez choisir le mot « vocabulaire », il est régulièrement utilisé dans ce sens.

Expression

Pour exprimer une ontologie, il faut un langage. Le plus courant est aujourd’hui OWL. Ce chouette langage qui tire son nom d’un acronyme, Web Ontology Language, a été proposé dès 2004 au W3C (une version française de la proposition est disponible). En 2009, une proposition pour OWL 2 a été soumise, sa dernière version date de 2012.

Opérations

Avant de trouver des outils pour manipuler des ontologies, commençons par nous demander ce qu’on peut vouloir faire. Très simplement, on peut créer, modifier (ou transformer), éditer, tester, cataloguer, rechercher, comparer … des ontologies.

Donc, il nous faut des éditeurs (pour créer, modifier, éditer), des documenteurs, des validateurs (pour tester), des catalogueurs, des moteurs de recherche, des comparateurs, sans oublier des outils d’aide à des traitements plus complexes comme l’alignement d’ontologies, la gestion de version, le split d’ontologie ou son contraire la fusion (merge), la différence, etc…

Le premier travail, qui est loin d’être facile, c’est la création d’une ontologie (cela peut prendre plusieurs mois !), il n’est guère plus facile de propager les modifications induites par l’évolution d’une ontologie. Humm, ça sent les verrous technos !

Alors, il faut y aller en douceur : il y a des outils simples et puis des outils carrément pas simples. Et il y a des outils indépendants et des outils intégrés ou intégrables dans des plateformes, comme par exemple la plateforme Datalift.

Encore deux précisions importantes. La première est que la création d’une ontologie est une oeuvre de l’esprit plutôt que le résultat d’un traitement sauf pour la découverte automatisée de l’ontologie d’un ou plusieurs documents structurés, dans ce cas l’ontologie ad hoc n’apporte pas d’information, elle calque la réalité observée, pas plus. La deuxième est que plusieurs travaux scientifiques ont produit des outils qui ne sont malheureusement pas toujours pérenniser … et le 404 ou le 500 ne sont pas loin.

Dans les prochains posts, j’aborderai différentes catégories d’outils et je vous invite à réagir pour nous enrichir mutuellement de nos connaissances !

28

Mar/13

Petit panorama d’outils d’édition collaborative légère

by gabriel under outils

Le monde des PAD se peuple peu à peu … Vous connaissez peut-être l’une de ces solutions :

Etherpad, un open source dont le site officiel est http://etherpad.org/
Titanpad, qui lui ressemble beaucoup
Framapad, très ressemblant aussi, mais en français, différence utile parfois
Et il y en a d’autres…

En fait, ils sont tous issus de la même souche, à savoir Etherpad, et le site http://blog.etherpad.org/public-sites/ vous donne la liste à jour des clônes. Sur le site d’Etherpad, on trouve le logiciel libre au téléchargement (pour Linux, Mac ou Windows). La documentation est bien entendue comprise dans le download, elle mérite le coup d’oeil, ce n’est pas classique.

Il existe une version encore plus légère, c’est Etherpad-lite, elle est basée sur node.js.

3

Jan/13

Les 6 lois de Kranzberg sur la technologie

by gabriel under codex informatica, développement durable, loi

Voici ces lois, dont la plus célèbre est la première :

La technologie n’est ni bonne ni mauvaise et elle n’est pas neutre.
L’invention est la mère de la nécessité.
La technologie vient par paquets, petits et grands.
Même si la technologie pourrait bien être un élément primordial dans de nombreuses questions d’intérêt public, les facteurs non techniques l’emportent dans les décisions de politique technologique.
Toute l’histoire est pertinente, mais l’histoire de la technologie est la plus pertinente.
La technologie est une activité très humaine – et telle est donc l’histoire de la technologie.

Qui était Melvin Kranzberg ?

Melvin Kranzberg (1917 – 1995) était un professeur d’histoire qui s’est peu à peu spécialisé dans l’histoire de la technologie.

21

Déc/12

Cubieboard, une autre brique du web des objets

by gabriel under cubieboard, web des objets

Bâti sur un processeur ARM « Allwinner A10 » (développé par ARM Ltd, architecture RISC 32 bits) le Cubieboard est un ordinateur qui tient en une seule carte aux petites dimensions (10 cm x 6 cm).

Ses caractéristiques en font un bon candidat pour créer des individus du web des objets doués pour la vidéo. En effet, le A10 est une puce qui offre à la fois une lecture vidéo locale de 2160p travers une interface SATA/USB2.0 et une lecture de vidéo sur Internet de 1080p via Ethernet ou le WIFI. 1080p, c’est un ensemble de modes vidéo haute définition (HDTV) qui se caractérise par une résolution verticale de 1080 lignes horizontales et un balayage progressif (p). L’image n’est pas entrelacé, comme c’est le cas avec la norme d’affichage 1080i. Pour un écran 16:9, cette résolution de 1080 signifie une surface de 1920 × 1080, soient 2,1 mégapixels. On voit bien l’orientation du Cubieboard. Avec le support du 2160p, on est résolument dans la UHDTV.

Il intégre des Codec Vidéo et Audio et des ports HDMI, SATA, USB, MMC, infra-rouge… Côté mémoire, ce n’est pas mal non plus avec 0.5 ou 1 Go de DDR3 à 480 MHz. Et, pour finir, il tourne sous plusieurs distrib de Linux ou d’Androïd.

Pour en savoir plus, les bonnes pages sont :

Allwinner A10

Un starter guide

16

Déc/12

5 P pour écrire l’histoire de l’humanité

by gabriel under épigraphie, histoire

Pierre

Lorsque l’homme commence à écrire, il grave dans la pierre. Ce matériau est disponible partout en grande quantité. Mais il n’est pas très pratique, vous en conviendrez. Il est parfois très dur, souvent lourd… On a du mal à imaginer un roman de Victor Hugo dans une version pierre ! Mais il a aussi quelques avantages. Il est particulièrement pérenne et c’est ainsi que les témoins de cet âge ne manquent pas.

Pierre gravée trouvée à Erebuni

Papyrus

Dans le delta du Nil, l’Égypte disposait d’une plante qui lui assura longtemps le monopole de la fabrication du principal support de l’écrit d’une période estimée de 2600 avant JC à 650 après JC. Les tiges de la plante, débitées en lamelles étroites, étaient disposées perpendiculairement les unes sur les autres pour former une surface homogène. Après avoir été compressées, martelées et polies, les feuilles obtenues étaient collées les unes aux autres. Les rouleaux obtenus pouvaient avoir une longueur allant jusqu’à 15 mètres. La largeur n’excédait en revanche pas 40 centimètres. Par exemple, le papyrus d’Iena sur lequel on a retrouvé des fragments du cinquième livre de l’Adversus Haereses d’Irénée de Lyon a une largeur de 23 à 24 cm et une longeur dépassant probablement le mètre.

C’est sous cette forme de rouleau, appelé Volumen, que les commerçants vendaient le précieux papyrus dans tout l’Empire. Un tel support était fragile, c’est pourquoi il était aussi utilisé soit en feuille découpée dans les rouleaux. Ces feuilles étaient assemblées en codex, des livres en cahier obtenu par pliage.

En Europe, c’est au VIIIe s. que disparait l’usage trimillénaire du papyrus avec l’invasion arabe.

Parchemin

Lors de la guerre qui opposa l’Egypte au royaume de Pergame (en grec Πέργαμον), nous raconte Pline l’Ancien (livre XIII ch. XXI), le roi égyptien Ptolémée Epiphane fit interdire tout commerce de paryrus avec l’ennemi. Eumène II (197-158), roi de Pergame (actuellement Bergama en Turquie), venait de fonder une bibliothèque : la cité développa alors l’usage de la peau de chèvre ou de mouton.

« Cet objet, dont l’immortalité des hommes dépend, devint d’un usage commun », Pline l’Ancien.

Papier

L’invention du papier, tel que nous le connaissons, est chinoise. Je ne vous raconte pas la suite, … vous connaissez.

Avec le papyrus et le parchemin, le papier brûle. Combien de grandes bibliothèques n’ont-elles pas disparu en fumée ? Même la bibliothèque secrête d’Yvan le Terrible, celle qu’il avait fait placé sous terre à l’abri des incendies, aurait été la proie des flamme.

PC

Et le 5e P est celui du PC, celui de l’ère de l’ordinateur personnel. Ce P est le plus immatériel, celui dont la pérennité est sans cesse compromise. Il est le premier qui ne peut pas exister seul. Sans électricité, il n’est pas possible d’écrire ou de lire. Nous en remettrons à ce P pour la postérité de nos écrits ?

Il se dégage comme une loi, plus le support est pratique, moins il est pérenne.

21

Nov/12

200 ans, première grammaire de l’arménien en français

by gabriel under arménien, langue, linguistique

Roger Bellaud, docteur en médecine, publiait en 1812 la première grammaire de l’arménien en langue française. En 96 pages, précédées de viii pages de titre et avertissement, il s’agit là d’un « essai sur la langue arménienne » comme nous l’apprend le titre exact de ce petit livre imprimé à Paris par l’Imprimerie Impériale.

Auparavant, les grammaires publiées en France étaient en latin. On peut citer par exemple celle qui, en 1714, se trouve dans le Dictionnaire Latin / Arménien composé par Villotte, un père Jésuite.

17

Nov/12

Overo, une brique pour le web des objets

by gabriel under overo, web des objets

En 2003, Gordon Kruberg crée la société Gumstix. Il lui donne un drôle de nom pour rappeler que son ambition est de fabriquer des ordinateurs de la taille d’un chewing-gum : gum-stick.

Il crée des cartes mères de très petites dimensions qui restent la propriété de l’entreprise. La première carte s’appelle Overo Earth, elle est basée sur un processeur 600 MHz, le TI OMAP 3503 (chip de chez Texas Instruments, Open Multimedia Applications Platform, conçu pour les développements multimédia mobile). La deuxième carte, Overo Air, a apporté le Bluetooth et le réseau sans fil. La troisième carte, Overo Water, est une évolution au niveau du processeur, c’est dorénavant un 720 Mhz, le TI OMAP 3530. La dernière carte, Overo Fire, comme la 2e améliorait la 1ère, a apporté le Bluetooth et le réseau sans fil à la 3e, l’Overo Water. Pour la mémoire, elles sont dotées de 256 MB de mémoire flash et de 256 MB de SDRAM. En dehors de ces cartes qui déclinent les 4 éléments, on trouve aussi une gamme Verdex Pro avec des processeurs à 300, 400, 500 et 600 MHz …

En revanche, il change de philosophie pour les cartes d’extension. En effet, ces dernières sont publiés sous licence « Creative Commone Share-Alike« , ou CC-SA. Ce qui veut dire que les créations dérivées seront à partager selon la même licence (SA). Et c’est là que ça devient intéressant avec une caméra HD, un accéléromètre, …

Pour le développement, il opte pour une pile logicielle basée sur Linux : le framework OpenEmbedded. Voici une bonne page d’info pour s’en débrouiller et une communauté partage un wiki. On trouve aussi des vidéos sur le site de Gumstix, mais aussi sur Youtube.

Avez-vous utilisé cette techno ? Qu’en pensez-vous ? Laissez un commentaire, merci.

28

Oct/12

Arduino, une petite sélection de bons tutoriels

by gabriel under arduino, web des objets

Intro, by TED

Pour commencer, il faut rendre hommage à l’équipe qui a créé ce petit objet si plein de ressources. Cette conférence TED vous donnera la meilleure rétrospective (c’était en juin 2012) sous le titre Massimo Banzi: How Arduino is open-sourcing imagination. Comme souvent, pour les meilleures conférences, vous trouverez le texte dans beaucoup de langues, dont le français.

Tuto, en vidéo

Jeremy Blum, en association avec Element14, a enregistré 14 tutoriels video sur l’arduino. Cela va du simple au complexe… C’est bien fait et utile. Bonne projection !

Intro et Tuto, textes

Le premier lien à consulter, c’est la page d’accueil de la référence Arduino en français. Une autre bonne page de référence, c’est celle du crouwd by wikipedia.

Sur le site Flossmanuals (une excellente plateforme de partage et de co-création plurilingue), on peut consulter en html ou télécharger un document en PDF d’une lecture agréable et facile (et en français). Le même est aussi disponible en livre électronique en ePub.

Si vous avez d’autres bonnes pages à me signaler pour que je complète ce post, je vous en remercie d’avance.

25

Oct/12

Open data cardinal

by gabriel under Actualités, opendata, web de données

Le Pape Benoît XVI a convoqué un consistoire pour la création de six nouveaux cardinaux. Le Sacré Collège sera donc formé de 211 membres, parmi lesquels 120 seront électeurs.

L’occasion est donc toute trouvée de publier de l’open data cardinal. Vous pouvez télécharger ici la liste de Sacré Collège telle qu’elle sera effective au 24 novembre 2012.

Si l’on considère les représentations par continent, il y aura 18 représentants pour l’Afrique dont 10 électeurs, 22 pour l’Amérique du Nord dont 14 électeurs, 30 pour l’Amérique du Sud dont 20 électeurs, 20 pour l’Asie dont 11 électeurs, 117 pour l’Europe dont 61 électeurs et 4 pour l’Océanie dont 2 électeurs. Par pays, l’Italie à elle seule comptera 50 cardinaux dont 28 électeurs.

Blogabriel

Le blog de Gabriel, innovation, recherche et développement … et arménien classique

Author Archive

Petit panorama d’outils sur les ontologies : les moteurs de recherche

Petit panorama d’outils sur les ontologies

Petit panorama d’outils d’édition collaborative légère

Les 6 lois de Kranzberg sur la technologie

Cubieboard, une autre brique du web des objets

5 P pour écrire l’histoire de l’humanité

200 ans, première grammaire de l’arménien en français

Overo, une brique pour le web des objets

Arduino, une petite sélection de bons tutoriels

Open data cardinal

Méta

Catégories

Calendrier

Archives

Recent Posts

Archives

Tags

mars 2026
L	M	M	J	V	S	D
« Mai
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30	31