Author Archive

How to Publish Linked Data on the Web / Comment publier des données liées sur le Web ? (1/10)

Chris Bizer (Web-based Systems Group, Freie Universität Berlin, Germany), Richard Cyganiak (Web-based Systems Group, Freie Universität Berlin, Germany) et Tom Heath (Knowledge Media Institute, The Open University, Milton Keynes, UK) ont écrit ce beau tutorial de référence dont je veux donner ici une traduction pour en faciliter la diffusion dans l’espace francophone.

Je publierai cette traduction en 10 fois, respectant ainsi la découpe en section de l’original.

Résumé

Ce document fournit un tutoriel sur la façon de publier des données liées sur le Web. Après un aperçu général de la notion de données liées, nous présentons plusieurs recettes pratiques pour la publication d’information sous forme de données liées sur le Web.

1 – Introduction : les données liées sur le Web

L’objectif des données liées est de permettre aux gens de partager des données structurées sur le Web aussi facilement qu’ils peuvent partager des documents d’aujourd’hui.

Le terme de données liées (en anglais : linked data) a été inventé par Tim Berners-Lee dans sa note d’architecture Linked Data sur le Web de données liées. Le terme se réfère à un style de publication et d’interconnexion des données structurées sur le Web. L’hypothèse de base est que plus les données sont étroitement liées à d’autres données, plus leur valeur et leur utilité augmente. En résumé, les données liées concernent tout simplement l’utilisation du Web pour créer des liens typés entre données provenant de sources différentes.

Les principes de base des données liées sont les suivantes :

  1. utiliser le modèle de données RDF pour publier des données structurées sur le Web
  2. utiliser des liens RDF pour interconnecter les données provenant de sources différentes

L’application de ces deux principes conduit à la création de données communes sur le Web, un espace où les gens et les organisations peuvent déposer et consommer des données de toutes sortes. Cet espace commun de données est souvent appelé le Web de données ou de Web sémantique.

Le Web de données peut être consultés à l’aide d’un navigateur de données liées (en anglais : Linked Data browser), tout comme le Web des documents est accessible en utilisant un navigateur HTML. Toutefois, au lieu de suivre des liens entre les pages HTML, les navigateurs de données liées permettent aux utilisateurs de naviguer entre les différentes sources de données en suivant les liens RDF. Cela permet à l’utilisateur de démarrer d’une source de données pour passer ensuite d’autres sites Web, potentiellement une infinité de sources de données connectées par des liens de RDF. Par exemple, si un utilisateur étudie les données sur une personne provenant d’une source, il peut être intéressé à poursuivre sur des informations sur la ville où réside cette personne. En suivant un lien RDF, l’utilisateur peut naviguer vers l’information sur cette ville figurant dans un autre ensemble de données.

Tout comme le Web traditionnel de documents peut être exploré en suivant les liens hypertextes, le Web de données peut être exploré en suivant les liens RDF. En travaillant sur les données explorées, les moteurs de recherche peuvent fournir des capacités de recherche sophistiquées, semblables à celles fournies par les bases de données relationnelles classiques. Parce que les résultats des requêtes elles-mêmes sont des données structurées, non pas seulement des liens vers des pages HTML, ils peuvent être immédiatement traitées, permettant ainsi une nouvelle classe d’applications basées sur le Web des données.

La glu qui maintient ensemble le Web traditionnel, celui qu’appelle le Web des documents, ce sont les liens hypertextes entre les pages HTML. La glu du Web de données, ce sont les liens RDF. Un lien RDF établit simplement qu’une donnée est en relation avec une autre donnée. Ces relations peuvent être de différents types. Par exemple, un lien RDF qui relie des données sur des personnes peut indiquer que deux personnes se connaissent, un lien RDF qui connecte les informations d’une personne avec des informations sur des publications dans une base de données bibliographiques pourrait stipuler que la personne est l’auteur d’un document précis.

Il existe déjà beaucoup de données structurées accessibles sur le Web via des API Web 2.0, comme par exemple pour eBay, Amazon, Yahoo et Google Base. Par rapport à ces API, les données liées ont l’avantage de fournir un mécanisme d’accès unique et normalisé au lieu de s’appuyer sur différents formats d’interfaces et de résultat. Cela permet aux sources de données :

  • d’être plus facilement explorées par les moteurs de recherche,
  • d’être accessibles à l’aide de navigateurs génériques de données,
  • d’avoir des liens avec des sources de données différentes.

Après avoir posé les concepts des données liées, le reste de ce document se structure comme suit :

  • la section 2 énonce les principes de base des données liées.
  • la section 3 fournit des conseils pratiques sur la façon de nommer les ressources avec des références URI,
  • la section 4 examine des termes bien connus de vocabulaires et de sources de données qui devraient être réutilisé pour représenter de l’information,
  • la section 5 explique quelles informations doivent être incluses dans les descriptions RDF qui sont publiés sur le Web,
  • la section 6 donne des conseils pratiques sur la façon de générer des liens entre les données RDF à partir de sources de données différentes,
  • la section 7 présente plusieurs recettes complètes pour l’édition de différents types d’information comme données liées sur le Web à l’aide des outils liés publication des données existantes,
  • la section 8 concerne le test et le débogage de sources de données liées,
  • la la section 9 donne un aperçu des mécanismes de substitution pour la découverte de données liées sur le Web.
  • et la la section 10 qui vous fournit des liens vers des documents de référence et de nombreux outils.


Albaniens du Caucase, compléments

Je viens apporter quelques précisions sur un article précédent, intitulé Au Matenadaran, l’alphabet des albans (ou albaniens) du Caucase.

Bernard Outtier, lors de sa conférence « Georges Dumézil, les langues du Caucase, et l’arménien« , expliquait que la langue oudine est une langue « résiduelle » du nord-est du Caucase qui compte aujourd’hui encore quelques 6.000 locuteurs. Les Oudines sont les descendants des Albaniens du Causase. Le manuscrit où on peut voir le fameux alphabet (en photo dans mon article), avait été découvert en 1937 par le savant géorgien I. Abouladzé qui visitait le Madenataran à Erevan. Et c’est en 1941 que Georges Dumézil a fait connaître au monde occidental l’existence de cette langue dans un article publié dans le Journal Asiatique « Une chrétienté disparue, les albaniens du Caucase ».

En 1996, Zaza Aleksidzé a découvert des palimpsestes albaniens à Sainte Catherine au Sinaï. Ces nouvelles pages sont les premiers textes a notre disposition pour lire cette langue. Voir l’article paru en 1997 par Jean-Pierre Mahé et Zaza Aleksidzé.

Le terme albanien a été donné par Georges Dumézil dans son article. Il traduisait le grec Ἀλβανοί. Jean-Pierre Mahé utilise aussi Arwangs, il date la création de l’alphabet albanien en 422. Voir l’article d’Anahid Samikyan.


Conférence de Bernard Outtier sur Georges Dumézil

Le 14 janvier 2010, Bernard Outtier a donné une conférence organisée par la Société des Etudes Arméniennes et intitulée « Georges Dumézil, les langues du Caucase, et l’arménien ». Bernard Outtier a bien connu Dumézil et il nous en a donné un portrait de première main.

Georges Dumézil a inventorié le monde indo-européen. Un de ses apports majeurs est d’avoir trouvé les trois fonctions qui sous-tendent l’idéologie indo-européenne primitive (prêtre, guerrier et producteur). Il est le créateur d’une nouvelle science : la mythologie comparée. Mais le savant a autant travaillé et publié dans les domaines de la linguistique et en particulier de la linguistique caucasienne et caucasique. Il a appris des dizaines de langues et les anecdotes sont nombreuses.

Bernard Outtier est directeur de recherche au CNRS. Il enseigne le géorgien à l’Institut Catholique de Paris et a enseigné la littérature arménienne à Genève.


La loi de Parkinson : du travail comme un gaz parfait

Dans un article paru dans The Economist en novembre 1955, Parkinson explique que le travail augmente de manière à combler le temps disponible pour son achèvement. Pour établir et prouver cette assertion, le professeur d’histoire de l’Université de Singapour a analysé des bureaucraties. Pour lui, toute augmentation de l’efficacité d’un employé est tout simplement consommée par l’augmentation de la complexité bureaucratique qui en découle. La loi peut s’énoncer comme ceci :

    Le travail s’étale pour occuper le temps disponible à son achèvement

La validité de cette loi repose essentiellement sur des preuves statistiques. Voici les deux facteurs qui sous-tendent la tendance générale à laquelle cette loi aboutie :

Facteur I. Tout employé préfère multiplier ses subordonnés, et non ses rivaux
Facteur II. Les employés se créent mutuellement du travail.

Pour aller plus loin, on peut lire aussi ceci .

Qui est Cyril Northcote Parkinson ?

Cyril Northcote Parkinson est né le 30 juillet 1909. Il a fait carrière dans l’armée et est avant tout connu comme historien de la marine britannique et auteur de quelque soixante livres, dont le plus célèbre est « Parkinson’s Law ». Il est mort le 9 mars 1993.


Atelier #oubli en live sur Twitter

Même si vous êtes à San Francisco, vous pouvez suivre en direct le débat passionnant qui a lieu en ce moment à l’Atelier et qui est repris en direct par une foule de journalistes improvisés : les participants eux-mêmes qui pianotent sur Twitter pour livrer leurs impressions, leurs commentaires, leurs notes … tout un matériel brut de fonderie qui est très intéressant à livre au fur et à mesure des mises à jour automatique du navigateur.

Le tag #oubli a été retenu le 5 nov. par un petit échange sur Twitter et hop, c’est fait, c’est adopté par NKM (@nk_m) et Christian Bensi (@christianbensi). A 8h13, premier twitt sur la conférence et depuis, c’est le déluge (presqu’un millier de twitts à la fin de la conf) !

Plusieurs thèmes sont abordés et les commentaires affluent aussitôt. Rapidement, on peut lire une inquiétude chez certains : twitter ne garde pas la trace très longtemps de ce qui se twitte. C’est même carrément angoissant. Vous avez peut-être remarqué qu’on ne peut pas revenir longtemps en arrière pour une recherche donnée. La limite, actuellement d’à peu près un mois, est dynamique et peut donc changer. Si le nombre de tweets par jour ne cesse d’augmenter, Twitter oubliera encore plus vite !

A la fin de la conférence, un des participants fait la remarque suivante en s’adressant à @nk_m « Dommage que le hashtag #oubli n’ait pas été diffusé sur un écran pendant l’atelier ! » Voilà un oubli fâcheux !!! Dans le salle, on n’est pas au courant … et à des milliers de kilomètre, on a suivi la conférence. Voilà de l’ubi cuitée ;-)

Pour ceux qui voudront suivre et revivre les échanges, une solution existe. Comme Twitter oublie, les développeurs de http://www.flotzam.com/ ont créé l’outil The archivist. Bref, même si semblait que Twitter puisse oublier, ce n’est déjà plus possible. Et ce n’est pas de Twitter que vient l’outil.

Moralité : même quand tu oublies de faire quelque chose, il y aura toujours quelqu’un dans le grand web qui le fera pour toi.


Twitter et livre, un grand écart ?

Entre Twitter, 140 caractères au plus pour s’exprimer, et le livre, 140 pages au moins pour s’exprimer, il y a un rapport que l’esprit saisit immédiatement : comme un grand écart !

Serge Roukine propose dans son blog une lecture en trait d’union avec un post qui s’intitule 50 auteurs de livres francophones à suivre sur Twitter.


iPhone, le retour des glyphes

Quand je regarde l’écran d’un iPhone, je ne peux m’empêcher d’y voir un retour aux glyphes, un abandon de la lettre, du mot, de la phrase. Sous la vitre lisse, les petits carrés se découpent sur un fond noir. Le tout est très esthétique certes, mais est-ce un progrès ? Si oui, de quelle nature ? Et au passage, où sont les déplacements ?

Chaque dessin évoque le service, ou bien l’application qui sera lancée dès que le doigt aura effleuré la surface. Fini le menu où quelques mots à lire permettaient d’atteindre le même but. Désormais, il n’est plus nécessaire de savoir lire. Au passage, pour peu que le dessin soit universel, il n’y a plus à se soucier des langues et des cultures.

L’interface est efficace et / mais terriblement minimaliste. Les mots assemblés en phrase, les textes à lire, les mots à écrire, tout cela a disparu. Avec l’iPhone, plus besoin d’appartenir à une culture, on est désormais dans l’universel. Plus besoin de lire ou d’écrire, il suffit de toucher. L’expérience de l’iPhone est plus simple encore que la croix que dessinait maladroitement celui qui ne savait pas écrire.

Que faut-il penser de tout cela ? Pour vous, est-ce un progrès ?


Politesse et réseaux sociaux, un facteur de succès ?

Dans la vraie vie, lorsque nous croisons un ami, un parent, nous nous saluons et cela a du sens, même si c’est convenu. L’aller / retour : « Comment vas-tu ? Ca va et toi » n’est pratiquement qu’un tic de langage, mais il existe. Sans cette politesse, nous serions certainement fâchés de voir que l’autre nous ignore.

Dans les transports en commun, ce sont des réseaux sociaux, on se salue à Bayonne mais pas à Paris. A Paris, on ne se regarde même presque plus. A la Défense, dans les grandes tours, les ascenseurs sont des réseaux sociaux où les personnes se saluent encore régulièrement. Il y a une proximité qui l’autorise.

Il y a plus de 40 ans, les premiers mails étaient échangés. Aujourd’hui chacun connait le bon usage de l’objet dans l’envoi d’un message : c’est une forme de politesse que de le respecter. De même, une pièce jointe légère est aussi une marque d’attention. Et bien entendu, le message commence et se termine par les formules de politesse classique.

Mais dans nos réseaux sociaux virtuels, ceux de la toile, où en est-on ? Nous pouvons constater que chaque réseau, en se développant, produit ses codes qu’il faut apprendre pour ne pas passer pour un plouc 2.0.

Les formes classiques disparaissent. On ne se salue presque plus d’un « bonjour » mais on peut encore trouver un « A+ » ou un « BR » chez les saxons. La politesse va se loger dans le respect des formes. Avec Twitter, si l’on cite quelqu’un, il faut le mention d’un RT. Dans Facebook, d’un clic on peut dire « j’aime ».

Je constate avec plaisir que les réseaux qui marchent bien ont des codes qui permettent cette attention à l’autre. Selon vous, est-ce une condition de succès des réseaux sociaux ? Je serais très intéressé de lire votre avis sur ce sujet.


Un signe diacritique pour l’arménien

Un signe diacritique est un signe graphique comme par exemple le point, l’accent, la cédille. Il est ajouté à un graphème simple de l’alphabet, il permet alors de transcrire un phonème différent. Ainsi on évite la confusion entre homographes.

On trouve des signes diacritiques dans de nombreux alphabets en français, en russe, en arabe, etc. En arménien, un signe diacritique marque l’emphase, c’est le շեշտ (shesht, ce mot signifie tout simplement ‘accent’). Il se présente comme un accent aigu placé sur la voyelle porteuse de l’emphase.

Voici un exemple sans signe diacritique ահաւասիկ et le même mot porteur d’un shesht ահա́ւասիկ.


  • Catégories

  • Calendrier

    novembre 2024
    L M M J V S D
    « Mai    
     123
    45678910
    11121314151617
    18192021222324
    252627282930  
  • Archives

  • Copyright © 1996-2010 Blogabriel. All rights reserved.
    iDream theme by Templates Next | Powered by WordPress