outils

Petit panorama d’outils sur les ontologies : les moteurs de recherche

(Mise à jour le 14 avril 2013)

Devant la difficulté de créer une ontologie, on peut vouloir en trouver une qui corresponde à son besoin. Mieux, on peut vouloir trouver une ontologie existante car elle aura déjà fait ses preuves, elle aura peut-être une communauté d’adorateurs. Bref, il n’est pas besoin de vous dire l’utilité des moteurs de recherche qui vous permettront de trouver l’ontologie de vos rêves.

L’utilisation de ces moteurs est un peu particulière. L’expression de la recherche se fait en langage naturel avec des mots clés et les résultats produits sont classés. Certaines informations supplémentaires sont souvent fournies.

Mais la difficulté n’est pas dans la recherche à proprement parlé. Une fois que vous avez une liste de résultats, la vraie question est : laquelle choisir ! C’est pour cette raison qu’il existe une nouvelle catégorie d’outils comme LOV (une version indépendante est hébergée à l’OKFN), un des modules de Datalift, destiné à cataloguer, trouver et choisir des ontologies. Ca mérite le détour.

Voici quelques outils, il y en a beaucoup d’autres (vous pouvez d’ailleurs me laisser un commentaire pour je mette à jour cette page).

Catégorie : ceux qui marchent

  • FalconS pour chercher et trouver des objets, des concepts, des ontologies ou des documents. Pour les ontologies, les résultats sont rendus avec des graphes.
  • LOV, l’outil de référence, recherche parmi des ontologies de référence.
  • ontologi.es est une liste de liens … c’est très sommaire, mais ça peut servir (merci Raphaël)
  • ontosearch pour chercher par des termes.
  • Sindice, l’outil facile et utile pour trouver en soumettant des termes, des URI, des propriétés et un mode avancé pour aller plus loin. Il y a encore d’autres fonctions utiles …
  • Swoogle est un ancien outil toujours en ligne, il n’a pas évolué depuis 2007.
  • SWSE permet de rechercher des entités RDF (résultat universitaire, 2011)
  • vocab.cc est un projet open source, qui permet de rechercher des vocabulaires de données liées. Il fournit un classement des URI. (Il tombe en 404 quand il ne trouve pas)
  • vocab.org est destiné à être un espace d’URI ouvert pour des vocabulaires tels que RDF schema ou des documents d’espaces de noms XML (merci Raphaël)
  • Watson est un moteur intéressant car il évolue régulièrement (à suivre).

Catégorie : les morts-vivants, on ne sait pas trop

Catégorie : les disparus

  • schemapedia … ce dernier était le plus intéressant car il fournissait non seulement des vocabulaires mais de nombreux exemples quant à leur utilisation. Malheureusement, il était basé sur la plate-forme Talis et il s’en est allé avec cette plate-forme. Le code est toute fois ouvert sur Google Code (merci Raphaël).

  • Petit panorama d’outils sur les ontologies

    Définition

    Commençons par rappeler ce qu’est une ontologie dans le monde du web des données. Pour cela, je vous renvoie à mon post Comment définir une ontologie ?

    Synonyme

    Le mot ontologie est souvent inconnu. Plutôt que d’être mal compris, il vaut mieux parfois proposer un synonyme. Vous pouvez choisir le mot « vocabulaire », il est régulièrement utilisé dans ce sens.

    Expression

    Pour exprimer une ontologie, il faut un langage. Le plus courant est aujourd’hui OWL. Ce chouette langage qui tire son nom d’un acronyme, Web Ontology Language, a été proposé dès 2004 au W3C (une version française de la proposition est disponible). En 2009, une proposition pour OWL 2 a été soumise, sa dernière version date de 2012.

    Opérations

    Avant de trouver des outils pour manipuler des ontologies, commençons par nous demander ce qu’on peut vouloir faire. Très simplement, on peut créer, modifier (ou transformer), éditer, tester, cataloguer, rechercher, comparer … des ontologies.

    Donc, il nous faut des éditeurs (pour créer, modifier, éditer), des documenteurs, des validateurs (pour tester), des catalogueurs, des moteurs de recherche, des comparateurs, sans oublier des outils d’aide à des traitements plus complexes comme l’alignement d’ontologies, la gestion de version, le split d’ontologie ou son contraire la fusion (merge), la différence, etc…

    Le premier travail, qui est loin d’être facile, c’est la création d’une ontologie (cela peut prendre plusieurs mois !), il n’est guère plus facile de propager les modifications induites par l’évolution d’une ontologie. Humm, ça sent les verrous technos !

    Alors, il faut y aller en douceur : il y a des outils simples et puis des outils carrément pas simples. Et il y a des outils indépendants et des outils intégrés ou intégrables dans des plateformes, comme par exemple la plateforme Datalift.

    Encore deux précisions importantes. La première est que la création d’une ontologie est une oeuvre de l’esprit plutôt que le résultat d’un traitement sauf pour la découverte automatisée de l’ontologie d’un ou plusieurs documents structurés, dans ce cas l’ontologie ad hoc n’apporte pas d’information, elle calque la réalité observée, pas plus. La deuxième est que plusieurs travaux scientifiques ont produit des outils qui ne sont malheureusement pas toujours pérenniser … et le 404 ou le 500 ne sont pas loin.

    Dans les prochains posts, j’aborderai différentes catégories d’outils et je vous invite à réagir pour nous enrichir mutuellement de nos connaissances !


    Petit panorama d’outils d’édition collaborative légère

    Le monde des PAD se peuple peu à peu … Vous connaissez peut-être l’une de ces solutions :

    • Etherpad, un open source dont le site officiel est http://etherpad.org/
    • Titanpad, qui lui ressemble beaucoup
    • Framapad, très ressemblant aussi, mais en français, différence utile parfois
    • Et il y en a d’autres…

    En fait, ils sont tous issus de la même souche, à savoir Etherpad, et le site http://blog.etherpad.org/public-sites/ vous donne la liste à jour des clônes. Sur le site d’Etherpad, on trouve le logiciel libre au téléchargement (pour Linux, Mac ou Windows). La documentation est bien entendue comprise dans le download, elle mérite le coup d’oeil, ce n’est pas classique.

    Il existe une version encore plus légère, c’est Etherpad-lite, elle est basée sur node.js.


  • Catégories

  • Calendrier

    novembre 2024
    L M M J V S D
    « Mai    
     123
    45678910
    11121314151617
    18192021222324
    252627282930  
  • Archives

  • Copyright © 1996-2010 Blogabriel. All rights reserved.
    iDream theme by Templates Next | Powered by WordPress