La disponibilité de la troisième version du Corpus National de l’Armenian Oriental (EANC) a été annoncée aujourd’hui.

Le Corpus national de l’arménien oriental est une base de données linguistique de textes annotés en arménien oriental standard.

L’EANC, c’est :

  • un vaste corpus d’environ 110 millions de tokens
  • un puissant moteur de recherche pour faire des requêtes lexicales et morphologiques complexes
  • un corpus d’élève comprenant des traductions en anglais pour les tokens fréquents
  • un corpus diachronique de textes portant sur les textes de la SEA depuis le milieu du 19e siècle jusqu’à nos jours
  • un corpus mixte composé de ceux du discours écrit et du discours oral
  • un corpus annoté avec un marquage morphologique et méta textuel
  • un corpus à accès ouvert
  • une bibliothèque électronique avec un plein accès à plus de 100 titres arméniens classiques

Pour en savoir plus sur l’EANC et explorer ses fonctionnalités, visitez www.eanc.net. Tous vos commentaires seront grandement appréciés.