(article paru en 2000, http://xmlfr.org/documentations/articles/000321-0001, mise à jour en 2006)

Ce chapitre n’est pas une présentation de XML. Il évoque ce langage en tant qu’aboutissement du lent processus de maturation conceptuel qui nous aura conduit du document indissociable de la page sur laquelle il est imprimé au document intelligent (enfin presque) où contenu et présentation sont dissociés, manipulables et extensibles.

xml2.gif

1 – Les dates clef

1996 – Jon Bosac de Sun Microsystems recrute une équipe (lire The birth of XML
, un article de Jon Bosac)
1996 juillet – Les travaux du groupe débutent
1996 août – Les principes sont rédigés
1996 novembre – Un draft de 22 pages est publié, c’est la première version de XML
1997 décembre – La proposition de recommandation est disponible
1998 février – La recommandation XML v1.0 voit le jour !

2 – Les avantages de XML

XML bénéficie de la base installée de HTML, de HTTP et des navigateurs Internet
XML est simple et portable
XML peut décrire des documents de toute complexité
XML est plus qu’un simple langage de balise, c’est une vaste famille ! ( »XML family »)
XML est international

3 – Des champs d’application

A titre d’exemples, nous pouvons citer :Messagerie : XML en tant que format standard pour l’échange de données (par exemple : XML/EDI)
Traitement : déplacement du serveur vers le client (par exemple : Electronic Banking, Electronic Commerce)
Documentaire : XML permet d’exprimer toute l’intelligence du document dans le document, les applications documentaires peuvent se développer sans contrainte (par exemple : le format EIDE pour la GED)
Collaboratif : les Intranets bénéficieront largement des documents XML. Avec HTML, la même information était préparée pour tout le monde, maintenant le choix de la restitution peut revenir au client. L’auteur décide du contenu, le lecteur de la présentation.
Publication : présentation variable de l’information ; publication dans différents formats avec XSL ; publication automatisée (par exemple à partir des bases de données)
Recherche : Recherche intelligente d’information
Intégration de système : Echanges automatisés, EAI, etc.

4 – Convergence HTML et XML : XHTML

4.1 – XHTML = HTML + XML

Les deux avatars de SGML qui semblaient être voués à vivre des destinées séparées ont convergé pour former XHTML. Pourtant, rien ne semblait fait pour rapprocher ces deux langages.

xml1.gif

La solution de cette dissonance annoncée s’appelle XHTML (eXtensible HyperText Markup Language). Tout en restant très voisin de HTML, XHTML respecte les règles XML. Il peut être utilisé par les outils XML et reste visualisable par les versions récentes des navigateurs. Il est également plus extensible que HTML ; il est en effet possible de définir la structure et le contenu des documents.

4.2 – XHTML 1.0

Avec le nouveau millénaire, toute évolution HTML est déinitivement exclue. Le nouveau langage s’appelle désormais XHTML. La première spécification de XHTML porte le numéro de version 1.0. Elle est publiée le 26 janvier 2000. Il s’agit avant-tout d’une reformulation de HTML 4.01 basée sur XML au lieu de SGML.

La première version de XHTML est une simple reformulation de HTML 4.01 en XML 1.0. Fonctionnalité, il n’y a aucun changement. La nouveauté ne tient qu’au changement de syntaxe. Il s’agit de « muscler » syntaxiquement le vieil HTML que d’aucun juge trop laxiste. Tout l’intérêt de cette version inaugurale réside dans la conformité. La conversion d’un document en HTML 4.01 conforme en XHTML 1.0 peut être obtenue automatiquement, sans perte d’information. Par exemple, l’outil tidy réalise cette traduction.

L’apparition de XHTML a permis la production de pages correctes plus facile à intégrer avec les applications utilisant XML. Il a aussi été plus aisé de prendre en compte les nouveaux navigateurs … en fait, ce sont les nouveaux navigateurs qui se sont surtout conformés aux spécifications du W3C ! Les coûts de production des sites devrait avoir diminués.

4.3 – XHTML 1.1

Le W3C publie le 31 mai 2001 deux recommandations : XHTML 1.1 et l’annotation Ruby. La première spécifie un nouveau type de document s’appuyant sur les modules définis dans la recommandation de modularisation de XHTML. L’annotation Ruby apporte une dimension internationale en proposant un module XHTML pour la représentation de textes courts situés à côté ou au dessus des idéogrammes asiatiques (à la façon des info-bulles) pour indiquer la prononciation correspondante ou une simple annotation.

4.4 – XHTML 2.0, on attend toujours !

Huit versions draft se sont déjà succédées (5 août 2002 – 11 décembre 2002 – 18 décembre 2002 – 31 janvier 2003 – 6 mai 2003 – 22 juillet 2004 – 25 mai 2005 – 26 juillet 2006) … mais on attend toujours la version stabilisée.

Ce retard n’est pas sans rappeler celui de la version HTML 2.0 sortie 5 ans après HTML 1.0. L’histoire se répète t-elle ? Le propos de XHTML 2.0 serait-il trop ambitieux ? Pour connaître le détail de la roadmap, il faut consulter cette page : http://www.w3.org/MarkUp/xhtml-roadmap/.

Dans la version 2.0, on s’attend à ce que les fonctionnalités demeurent inchangées par rapport à la version XHTML 1.1 (ou bien à ce qu’un sur-ensemble soit définit). Cependant, le langage peut être modifié sémantiquement et syntaxiquement pour répondre aux exigences des normes relatives à XML (telles que XML base et XML schema). En effet, l’objectif de ces dernières modifications est de s’assurer que XHTML 2.0 pourra être aisément supporté par les navigateurs XML sans qu’ils aient besoin de connaissance préalable de la sémantique de XHTML telles que les liens (linking – HLinks), les hyperimages (image maps), les formes (forms – XForms), les frames (XFrames), les formulaires (XForms), les événements (XML Events), etc.

Le développement de XHTML 2.0 demandera probablement le développement de nouveaux modules ou des révisions des modules existants.

5 – En guise de conclusion

Lors de la parution de la première version de cet article en 2000, ce tableau résumait le paysage de l’époque.

xml4.gif