Quand on veut se lancer dans le monde du Web des données (alias Web sémantique ou Web 3.0, mais sincèrement il vaut mieux parler de Web des données), le plus simple est de partir de ses données, en commençant par celles qui sont structurées. Prenez donc parmi vos feuilles de calcul, vos documents XML, vos bases de données, etc.
Trouver des vocabulaires (des ontologies) existants qui se rapportent au domaine de vos données ou créer vos vocabulaires. Vous pouvez utiliser
- le Linked Open Vocabularies (LOV) de Mondéca,
- le moteur de recherche swoogle,
- consulter la liste publiée par Protégé,
- ou celle de Co-ode
- il doit bien y avoir encore d’autres outils… cherchez bien
- pour aligner vos ontologies, vous pouvez regarder par exemple ici.
Il faut alors utiliser des « convertisseurs » pour transformer les données initiales en données sémantisées. Des bibliothèques commencent à se constituer. Elles sont très inégales.
- RDFizer
- Virtuoso Sponger
- Triplify
- Triplisty
- Ici encore, vous en trouverez d’autres en cherchant…
Dans tous les cas, avancer de façon agile, c’est à dire mesurée. Cela vous donnera des idées …
Le projet de recherche et développement DataLift réalise une infrastructure open source dont les premiers étages sont consacrés 1) à la sélection d’ontologie et 2) à la conversion.