La terminologie des imprimeurs et des typographes a été percutée par celle de l’informatique il y a déjà un certain temps. Aujourd’hui, combien d’entre nous savent encore distinguer police, fonte, caractère, casse etc. ? Essayons d’y voir un peu plus clair … Cela nous permettra de mieux définir ce qu’est l’unicode à la fin de ce post.

  • Le caractère signifie le dessin d’une lettre. En imprimerie, c’est donc le morceau de métal qui forme une lettre ou un signe.
  • Le glyphe est la représentation visuelle d’un caractère. C’est ce que je vois formé de traits, de courbes, de points …
  • La casse est un casier où, dans chaque cassetin est rangé les plombs d’un même caractère. Une casse est homogène, elle contient une famille de caractères.
  • La fonte désigne l’ensemble des caractères présentant les mêmes caractéristiques de corps, graisse et italique dans une même police. Par exemple, la fonte Arial Gras Italique de corps 14.
  • La police de caractères est l’ensemble des fontes d’une même famille de fonte. Par exemple, la police Garamond.

Lorsqu’apparaît l’informatique, très vite se pose la question du codage des caractères :  » Comment représenter une lettre, un signe ?  » Au début, il s’agit d’avoir un code pour la lettre « A », sans se soucier de son impression. Puis, ça se complique et la question devient :  » Comment faire pour désigner un caractère ? « . Puis, l’informatique n’étant pas que l’affaire des écritures occidentales des pays les plus développés … on commence à se demander comment faire pour avoir des polices de caractères propres aux différents alphabets (romain, grec, arménien, cyrillique, coréen etc.).

C’est ainsi qu’est né un système d’encodage normalisé qui a reçu le nom d’unicode. Chaque caractère y est codé par une unique valeur numérique. Un code précis est destiné à garantir l’affichage et l’impression corrects sur tous les matériels, logiciels et dans toutes les langues du bon caractère. Lorsque la norme unicode sera entièrement définie (c’est probablement une utopie), elle couvrira la totalité des caractères employés dans toutes les langues du monde, toutes les ligatures, tous les signes de ponctuation et tous les symboles (et j’en oublie sûrement).

Quelques repères. La version 1.0 est publié en 1991. En 1998, la version 2.1 d’unicode contient 50 377 caractères, c’est la définition de la  police « Arial Unicode MS » livrée par Microsoft. En 2002, la version 3.2 classe 95 221 caractères, symboles et directives. En 2003, la version 4.0 code 96 447 caractères. Actuellement, nous en sommes à la version 5.1.0 avec plus de 100.000 caractères !

Il est important de comprendre que cette norme est universelle : il n’y a pas plusieurs normes unicode mais une seule. Elle s’applique à tous les ordinateurs, toutes les imprimantes, tous les logiciels … créés depuis la publication de la norme. Par exemple, au niveau des systèmes d’exploitation, l’unicode est supporté depuis Windows XP, MacOS 8.5, les UNIX et Linux récents …

Ainsi, si j’écris un texte en arménien en utilisant un logiciel qui utilise l’unicode, je suis certain que mon texte pourra être lu, imprimé, stocké partout sur terre et sans que celui me lira ait besoin de posséder les mêmes logiciels que moi. Les versions successives de l’unicode garantissent toujours les précédentes.

Alors, il n’y a pas à hésiter un seul instant. Il n’y a plus d’excuse à utiliser les bricolages d’un autre millénaire ;-)

Etes-vous unicodiste ? Avez-vous déjà utilisé l’unicode ? Mais peut-être avez-vous rencontré quelques difficultés ? Quelle est votre expérience ?