Une petite note sur le système de numération de l’arménien classique

Toutes les lettres de l’alphabet de l’arménien classique participent au système de numération classique. Les 36 lettres divisées en 4 fois 9 lettres consécutives permettent de représenter les unités, les dizaines, les centaines et les milliers.

 

ա 1 | ժ 10 | ճ 100 | ռ 1000
բ 2 | ի 20 | մ 200 | ս 2000
գ 3 | լ 30 | յ 300 | վ 3000
դ 4 | խ 40 | ն 400 | տ 4000
ե 5 | ծ 50 | շ 500 | ր 5000
զ 6 | կ 60 | ո 600 | ց 6000
է 7 | հ 70 | չ 700 | ւ 7000
ը 8 | ձ 80 | պ 800 | փ 8000
թ 9 | ղ 90 | ջ 900 | ք 9000

 

Ce système de numération arménienne est à rapprocher de celui de l’hébreu. Les 27 lettres de l’alphabet sont divisées en 3 séries de 9 lettres consécutives représentant les unités, les dizaines et les centaines.

 

א 1 | י 10 | ק 100
ב 2 | כ 20 | ר 200
ג 3 | ל 30 | ש 300
ד 4 | מ 40 | ת 400
ה 5 | נ 50 | ך 500
ו 6 | ס 60 | ם 600
ז 7 | ע 70 | ן 700
ח 8 | פ 80 | ף 800
ט 9 | צ 90 | ץ 900

 

On note l’absence du zéro dans les deux systèmes.


Les nombres dix-sept à dix-neuf en arménien classique

En arménien classique, les déterminants numériques cardinaux se déclinent sans suivre de règle précise et uniforme.

Le grand grammairien comparatiste Antoine Meillet écrivait dans Altarmenisches Elementarbuch (Ed. Carl Winter, 1913, §77) : ” Les quatre premiers adjectifs cardinaux sont toujours déclinés, même lorsqu’ils sont placés devant un mot “. Un peu plus loin (§78), il précisait : ” Les nombres de ‘cinq’ à ‘dix’ restent toujours invariables au nom. acc. sg. հինգ ‘5’, վեց ‘6’, եւթն ‘7’, ութ ‘8’, ինն ‘9’, տասն ‘10’. Dans les autres cas, ils se déclinent en partie, presque uniquement lorsqu’ils sont placés après un substantif ; on a ainsi : gén. dat. abl. հնգից, վեցից, եւթանց, ութից, ըննից, տասանց, instr. հնգաւք, վեցիւք, եւթամբք, etc. Les autres nombres restent généralement invariables et se déclinent aux mêmes cas indiqués ci-dessus (donc pas au nom. acc.) “. Les nombres de onze à seize sont des mots composés մետասան, երկոտասան, երեքտասան, չորքտասան, հնգետասան, վեչտասան. Leur déclinaisons est partielle elle aussi : gén. dat. abl. մետասանից, երկոտասանից, etc. Meillet mentionne alors les nombres de dix-sept à dix-neuf en en donnant la forme en plusieurs mots mais il n’en dit pas plus : եւթն եւ տասն, ութ եւ տասն, ինն եւ տասն.

En 1936, lorsqu’il publie sa Grammaire comparée de l’arménien classique (Imp. des PP. Mkhitaristes, Vienne), dans sa description des noms de nombre (§70, p. 99-101), il ne dit rien des nombres de dix-sept à dix-neuf.

Il faut donc aller à la source des manuscrits pour savoir ce qu’il en est pour ces trois nombres. Le corpus que forme la Bible arménienne connue sous le nom de Zohrab (Venise, 1805) est le lieu idéal d’une investigation dont voici les résultats.

Dix-sept

  • En un seul mot
    • Accusatif pluriel – 2 Roi 7,1 : ամս եւթնուտասն (dix-sept ans)
  • En plusieurs mots
    • Accusatif pluriel – Gn 47,28 : եկաց յակոբ յերկրին եգիպտացւոց ամս եւթն եւ տասն (Jacob vécut dix-sept ans au pays d’Égypte)
    • Accusatif pluriel – Jr 32,9 : եւթն սիկղ եւ տասն արծաթոյ (dix-sept sicles d’argent)
  • Dérivé
    • Adjectif Gn 37,2 Յովսէփ եւթնուտասնամեայ էր (Joseph avait dix-sept ans)

Dix-huit

  • En un seul mot
    • Accusatif pluriel – Jg 3,14 ; Lc 13,11 : ամս ութուտասն (dix-huit ans)
    • Nominatif pluriel – Lc 13,4 : Կամ նոքա ութուտասանքն (ou eux, les dix-huit personnes)
    • Accusatif pluriel – Lc 13,16 : ութուտասն ամ
    • Génitif pluriel – 2 Roi 24,8 : Որդի ամաց ութուտասնից էր յովաքիմ (Joiakîn était un fils de dix-huit ans)
  • En plusieurs mots
    • 1 Roi 7,15 ութ եւ տասն կանգուն (dix-huit coudées)
  • Dérivé
    • Le dérivé ութուտասնամեայ (adj. de 18 ans) est mentionné par le NBHL, mais nous n’avons pas de témoin

Dix-neuf

  • En un seul mot
    • Nominatif singulier – Jr 52,12 : այն ամ իննուտասն էր (c’était en la dix-neuvième année)
  • En plusieurs mots
    • Nominatif pluriel – Jos 19,38 : քաղաքք ինն եւ տասն (dix-neuf villes)
    • Accusatif pluriel – 2 Sa 2,30 : ինն եւ տասն առն (dix-neuf hommes)
  • Dérivé
    • Le dérivé իննուտասնամեայ (adj. de 19 ans) est mentionné par le NBHL, mais nous n’avons pas de témoin

En conclusion

Il ressort que ces nombres sont soit formés d’un unique mot (ex. եւթնուտասն) soit de plusieurs (ex. եւթն եւ տասն), lesquels ne sont pas toujours contigus. Quand ils s’écrivent en plusieurs mots, seul le dernier, տասն, se décline. Certains dérivés du nom de ces nombres sont constitués d’un seul mot.

NBHL : Աւետիքեան, Սիւրմէլեան, Աւգերեան, Նոր բառգիրք հայկազեան լեզուի, (Gabriēl Awetikʻean, Khachʻatur Siwrmēlean, Mkrtichʻ Awgerean, Nor baṙgirk’ haykazean lezowi, nouveau dictionnaire de langue arménienne), Venise, 1836-1837. 2 vol., 1140 et 1067 p.

Le plus long verset de la Zohrab

La plupart du temps les versets sont constitués d’une unique phrase et ne dépassent guère trois lignes. Ils subdivisent les chapitres des livres. En les numérotant, les imprimeurs ont offert aux lecteurs des repères faciles.

Dans la Bible arménienne publiée en 1805 à Venise par le P. Zohrab, nous trouvons un verset particulièrement long. C’est le 5e verset du deuxième chapitre du livre de Judith.

ՅՈՒԴԻԹ – ԳԼ(ՈՒԽ) Բ՜.
(5) Եւ եղեւ իբրեւ կատարեաց զխորհուրդս զայս, կոչեաց նաբուքոդոնոսոր արքայ ասորեստանեայց զհողեփեռնէս զսպարապետ ա(մենայ)ն զօրաց իւրոց՝ եւ ասէ ցնա. Ա́յսպէս ասէ արքայ մեծ՝ տէ́ր՛ի վ(ե)ր(այ) ա(մենայ)ն երկրիս. ահաւասիկ դու ելանիցես առաջի երեսաց իմոց, եւ ընտրեսցես առցես դու ընդ քեզ որք յուսացեալ են ՛ի զօրու(թ)ի(ւն)ս իւրեանց, հետեւակս հազարս հարիւր քսան. եւ բազմութի(ւն) յոյժ հեծելոց բեւրս երկոտասան։ եւ ելցես դու ընդ կողմն արեւմտից. քանզի ապա́խտ արարին զբանիւք հրամանաց իմոց։ Եւ պատուիրեսցես ն(ո)ց(ա), զի պատրաստեսցեն զերկիրն եւ զջուրսն. զի ելանե́մ ես բարկութ(եամ)բ իմով ՛ի վ(ե)ր(այ) ն(ո)ց(ա), եւ ծածկե́մ զերեսս ա(մենայ)ն երկրի, եւ առնեմ կոխա́ն ոտից զօրու(թեամ)բ իմով, եւ մատնեցից զն(ո)ս(ա) ՛ի յափշտակութի(ւն) ա(մենայ)ն զօրաց իմոց. եւ վիրաւորք ն(ո)ց(ա) լցցեն զձորս եւ զծործորս իւրեանց, եւ գե́տք խաղասցեն յարենէ ն(ո)ց(ա). եւ ածի́ց ես զգերութի(ւն) ՛ի վերայ ն(ո)ց(ա) ՛ի ծագաց երկրէ։ Եւ դու ելանիցես պատիցե́ս պաշարիցե́ս ինձ զսահմանս ն(ո)ց(ա). եւ ապա մատնիցեն քեզ զանձինս իւրեանց. եւ պահիցես ինձ զն(ո)ս(ա) յաւուր նեղու(թ)ե(ան) եւ կշտամբանա́ց ն(ո)ց(ա)։

(http://titus.uni-frankfurt.de/texte/etcs/arm/zohrab/armat/armat458.htm)


Comment utiliser plusieurs triplestores dans Datalift

En standard Datalift utilise deux triplestores

Le premier est le triplestore interne, celui où sont publiées toutes les sources converties en RDF. C’est le 3e étage de l’ascenseur de données Datalift. La vocation de cet espace est d’être utilisé pour les travaux intermédiaires. Le second est le triplestore externe, c’est dans celui-ci que sont publiées les données finalisées et donc prêtes pour être exploitées par les destinataires d’un projet d’élévation de données.

Détaillons un peu. Si vous devez relier plusieurs sources Open Data, vous commencerez par les ajouter comme sources dans un projet Datalift. Puis vous convertirez chacune d’elle en RDF et les publierez dans le triple store interne. Lorsque vous les aurez interconnectées pour produire un unique jeu de données liées, du linked data ou du linked open data, vous publierez ce résultat dans le triple store externe.

Cette dernière opération est réalisée en utilisant le module “Publication vers le RDF store public”.

On trouve dans le répertoire C:\Users\{vous}\AppData\Roaming\Datalift\conf, le fichier de paramètres “datalift-application.properties” où sont placées les caractéristiques de ces deux triplestores. Leurs noms sont réservés : “data” pour le triplestore public , “internal” pour le triplestore interne (ou privé). Il vous est possible de leur donner le libellé de votre choix. Par exemple :

internal.repository.label = Triple Store interne

Datalift permet aussi d’utiliser plus de deux triplestores

Attention : ceci est possible à partir de la version 0.8.1j.

Abordons cet aspect dans le cas où vous utilisez un PC sous Windows et des triplestores gérés par le Workbench de Sesame. C’est le cas standard si vous avez téléchargé Datalift (www.datalift.org) et ne l’avez pas modifié.

Commencez par récupérer le fichier “openrdf-workbench.war”, il s’agit du war qui contient, comme son nom l’indique, le workbench de l’openRDF de Sesame. Dans le site http://rdf4j.org/ allez dans la section réservée au téléchargement de Sesame et prenez la version 2.7.3. Dans le fichier openrdf-sesame-2.7.3-sdk.zip obtenu, vous allez trouver, en le dézippant, le war recherché.

Maintenant, avant de lancer Datalift, placez le fichier “openrdf-workbench.war” dans le répertoire .\Datalift\webapps où se trouve déjà “datalift.war” et “openrdf-sesame.war”. Lancez maintenant Datalift.

Vous disposez ainsi de l’interface d’administration de Sesame et vous pourrez agir directement sur vos triplestores. Pour y accéder, l’URL locale est :

http://localhost:9091/openrdf-workbench/

Créer un nouveau triplestore

Vous allez maintenant pouvoir créer un nouveau triplestore.

  • Dans le navigateur, ouvrez la page http://localhost:9091/openrdf-workbench/
  • Cliquez “new repository”
  • Donnez le type “In Memory Store”
  • Cliquez sur Next
  • Donnez maintenant un nom au nouveau triplestore (par exemple “NewTS”) et un intitulé.
  • Laissez “Persist” à “Yes”
  • Donnez la valeur “1000” à “Sync Delay”
  • Cliquez sur Create

Paramétrer le nouveau triplestore

  • Allez dans le répertoire C:\Users\{vous}\AppData\Roaming\Datalift\conf
  • Ouvrez le fichier “datalift-application.properties”
  • Allez dans la section des repositories
  • A la ligne de la clef “datalift.rdf.repositories”, ajoutez le nom du nouveau triplestore après une virgule.

Par exemple :

datalift.rdf.repositories       = data, internal, newtriplestore

  • Puis ajouter la clef repository.url de ce nouveau triplestore en lui spécifiant le nom que vous lui avez donné dans le workbench sesame.

Par exemple, avec l’ID donné plus haut, c’était NewTS,

newtriplestore.repository.url       = \

http://localhost:${datalift.port}/openrdf-sesame/repositories/ NewTS

  • Si ce doit être un triple externe, spécifiez-le comme ceci

newtriplestore.repository.public     = true

  • Et donnez-lui pour finir un intitulé, celui qui apparaîtra dans le SPARQL Endpoint de Datalift. Par exemple :

newtriplestore.repository.label     = Mon Store

Relancer Datalift

  • Stoppez et relancez Datalift
  • Veillez, le cas échéant, à bien vider le cache de votre navigateur.

Utilisation des Triples Stores internes

Datalift ne peut publier que dans un seul TS interne. En revanche, si vous avez plusieurs TS interne, vous pouvez requêter dans celui de votre choix en l’indiquant dans le SPARQL endpoint. Si vous souhaitez publiez dans un autre TS interne, vous devez stopper Datalift, modifier le fichier de configuration et redémarrer Datalift.

Utilisation des Triples Stores externes

Lorsque vous publiez une source dans un triple store externe, s’il y en a plusieurs, Datalift attend que vous indiquiez lequel. Comme pour les TS internes, vous pouvez requêter dans le TS externe de votre choix en l’indiquant dans le SPARQL endpoint.

Pour en savoir plus, pourquoi ne pas devenir membre de l’association Datalift et suivre la user-list ?

 


Aide à la traduction de l’arménien classique avec DataLift (2)

Pour combler une partie des manques du premier dictionnaire utilisé, j’ai traduit et ajouté le glossaire qu’Antoine Meillet donnait en 1913 à la fin de son fameux Altarmenisches Elementachbuch. J’ai opté pour une structure très simple : le mot et sa définition.

Nous avons donc maintenant 4 jeux de données :

ahv : livre, chapitre, rang, mot
lemme : mot, lemme, analyse
dict : source, uri, mot, prononciation, traduction
meillet : mot, definition

Dans la requête suivante, la clause UNION permet de prendre en compte les deux dictionnaires, les BIND permet de ramener les résultats sur une même variable :

PREFIX P-TEXTE: <http://localhost:9091/project/armenien/source/ahv-csv-rdf-1#>
PREFIX P-LEMME: <http://localhost:9091/project/armenien/source/lemme-csv-rdf-1#>
PREFIX P-DICT: <http://localhost:9091/project/armenien/source/dict-hy-fr-csv-rdf-1#>
PREFIX P-MEILL: <http://localhost:9091/project/armenien/source/meillet-csv-rdf-1#>

SELECT ?rang ?mot ?traduction {
?s1 P-TEXTE:mot ?mot;
P-TEXTE:chapitre "ch1.2";
P-TEXTE:rang ?rang.

OPTIONAL {
?s2 P-LEMME:mot ?mot;
P-LEMME:lemme ?lemme;
P-LEMME:analyse ?analyse.

{ ?s3 P-DICT:mot ?lemme;
P-DICT:traduction ?trad1.
BIND (concat("C: ",?analyse," ",?trad1) as ?traduction)
} UNION
{ ?s4 P-MEILL:mot ?lemme;
P-MEILL:definition ?trad2.
BIND (concat("M: ",?trad2) as ?traduction)
} }

}
ORDER BY ?rang
LIMIT 35

Les 35 premiers résultats sont :

1,արդ,"C: adv. 1) or conj., 2) maintenant adv."
1,արդ,M: (§ 171); tout à l'heure; maintenant; or; donc.
1,արդ,M: -ոյ forme; ornement.
2,իւրով,M: (pass. § 72); sien ; le gén. pl. իւրանց permet de traduire ‘leur’ (§ 76) ; իւր est aussi le gén. du réflexif (§ 76).
3,արեամբն,C: noun.ins.sg.def. sang nm.
3,արեամբն,M: -եան sang; αἷμα.
4,փրկեցելոյ,
5,զմեզ,M: (pronom; § 75); nous.
6,տեառն,"C: noun.gen.dat.sg. maître, seigneur, propriétaire nm."
6,տեառն,M: տեառն instr. տերամբ; nom. pl. տեարք; § 59 h; seigneur; κύριος (habituellement abrévié ՟տր [ պատիւ; § 26; rem. 4]; lorsqu'il s'agit de Dieu – de տի-այր ; cf. տի-կին).
7,եւ,C: conj. et conj.
7,եւ,M: (§ 164); aussi; et; même.
8,տուեալ,"C: verb.pfv.nom.acc.sg. 1) belle-soeur nf. 2) donner, livrer, offrir vt."
9,զհոգին,"C: noun.nom.acc.sg. 1) esprit nm., âme nf., 2) personne nf."
9,զհոգին,M: -ւոյ; -ւով (§ 46); esprit; πνεῦμα (cf. ոգի; §27 C).
10,իւր,M: (pass. § 72); sien ; le gén. pl. իւրանց permet de traduire ‘leur’ (§ 76) ; իւր est aussi le gén. du réflexif (§ 76).
11,փոխանակ,C: noun.nom.acc.sg. au lieu de prép.
11,փոխանակ,M: adv. (avec gén.) à la place de; փլայ (§ 109); je m'écroule; je tombe en ruine (cf. փուլ).
11,փոխանակ,M: emprunt (cf. փոխեմ).
12,հոգւոյս,"C: noun.gen.dat.abl.sg.poss1. 1) esprit nm., âme nf., 2) personne nf."
12,հոգւոյս,M: -ւոյ; -ւով (§ 46); esprit; πνεῦμα (cf. ոգի; §27 C).
13,մերոյ,C: pron.adj.gen.sg. notre adj.
13,մերոյ,M: (adj. poss. § 72); notre.
14,եւ,C: conj. et conj.
14,եւ,M: (§ 164); aussi; et; même.
15,զմարմինն,C: noun.nom.acc.sg. corps nm.
15,զմարմինն,M: մարﬓոյ corps; chair; σῶμα.
16,իւր,M: (pass. § 72); sien ; le gén. pl. իւրանց permet de traduire ‘leur’ (§ 76) ; իւր est aussi le gén. du réflexif (§ 76).
17,փոխանակ,C: noun.nom.acc.sg. au lieu de prép.
17,փոխանակ,M: adv. (avec gén.) à la place de; փլայ (§ 109); je m'écroule; je tombe en ruine (cf. փուլ).
17,փոխանակ,M: emprunt (cf. փոխեմ).
18,մարմնոյս,C: noun.gen.dat.abl.sg.poss1. corps nm.
18,մարմնոյս,M: մարﬓոյ corps; chair; σῶμα.
19,մերոյ,C: pron.adj.gen.sg. notre adj.
19,մերոյ,M: (adj. poss. § 72); notre.


Aide à la traduction de l’arménien classique avec DataLift

Depuis mon dernier post relatif à l’analyse grammaticale automatique de l’arménien classique avec DataLift, j’ai ajouté quelques petits ingrédients pour faire de la traduction. Au final, ce sont donc trois jeux de données que j’injecte dans la plateforme : une tokennisation d’un texte (le début du livre V de la version arménienne de l’Adversus Haereses d’Irénée de Lyon), une base de lemmatisation et un dictionnaire. Les trois sont des aux formats CSV dont les structures sont :

ahv : livre, chapitre, rang, mot
lemme : mot, lemme, analyse
dict : source, uri, mot, prononciation, traduction

La liaison est évidemment faite sur le “mot”. Voici une requête destinée à la traduction des 20 premiers mots du chapitre 1.2 :

PREFIX P-TEXTE: <http://localhost:9091/project/armenien/source/ahv-csv-rdf-1#>
PREFIX P-LEMME: <http://localhost:9091/project/armenien/source/lemme-csv-rdf-1#>
PREFIX P-DICT: <http://localhost:9091/project/armenien/source/dict-hy-fr-csv-rdf-1#>

SELECT ?rang ?mot ?analyse ?traduction {
?s1 P-TEXTE:mot ?mot;
P-TEXTE:chapitre "ch1.2";
P-TEXTE:rang ?rang.

OPTIONAL {
?s2 P-LEMME:mot ?mot;
P-LEMME:lemme ?lemme;
P-LEMME:analyse ?analyse.

?s3 P-DICT:mot ?lemme;
P-DICT:traduction ?traduction.
} }
ORDER BY ?rang
LIMIT 20

Comme vous pouvez le voir, le résultat est une bonne aide :

1; արդ; adv.; "1) or conj.; 2) maintenant adv."
2; իւրով; ;
3; արեամբն; noun.ins.sg.def.; sang nm.
4; փրկեցելոյ; ;
5; զմեզ; ;
6; տեառն; noun.gen.dat.sg.; "maître; seigneur; propriétaire nm."
7; եւ; conj.; et conj.
8; տուեալ; verb.pfv.nom.acc.sg.; "1) belle-soeur nf. 2) donner; livrer; offrir vt."
9; զհոգին; noun.nom.acc.sg.; "1) esprit nm.; âme nf.; 2) personne nf."
10; իւր; ;
11; փոխանակ; noun.nom.acc.sg.; au lieu de prép.
12; հոգւոյս; noun.gen.dat.abl.sg.poss1.; "1) esprit nm.; âme nf.; 2) personne nf."
13; մերոյ; pron.adj.gen.sg.; notre adj.
14; եւ; conj.; et conj.
15; զմարմինն; noun.nom.acc.sg.; corps nm.
16; իւր; ;
17; փոխանակ; noun.nom.acc.sg.; au lieu de prép.
18; մարմնոյս; noun.gen.dat.abl.sg.poss1.; corps nm.
19; մերոյ; pron.adj.gen.sg.; notre adj.
20; եւ; conj.; et conj.

La base de lemmatisation est incomplète, l’utilisation de la clause OPTIONAL est donc bien utile pour faire tout de même apparaître les mots non traduits. Une traduction aboutie de ce passage est : “Donc, le Seigneur nous a sauvés par son propre sang, donnant sa propre Âme pour notre âme, sa propre chair pour notre chair, et”
A suivre…


Analyse grammaticale automatique de l’arménien classique avec DataLift

Je me suis demandé combien de temps cela me prendrait de faire une analyse grammaticale … Ca ne m’a pris que 10 minutes. Voici comment (et vous pourrez vous y essayer aussi).

  1. Installer Datalift, il suffit de télécharger Datalift ici et de le deziper
  2. Vous créez un projet, appelons-le “armenien”
  3. Vous ajoutez la première source, ce sera un texte arménien tokennisé (voir mon post précédent sur la tokennisation de l’arménien). Là j’ai choisi la préface du livre V de l’Adversus Haereses d’Irénée de Lyon (voir le post où je l’ai posté). Avec le tokenniseur, j’ai créé un CSV avec 3 colonnes (chapitre ; rang ; mot). Je l’ai appelé : preface.csv
  4. Vous ajoutez la deuxième source, là j’ai pris mon CSV de lemmisation. Il a 3 colonnes aussi (mot ; lemme ; analyse). Je l’ai appelé : lemmisation.csv
  5. Vous élevez les deux jeux de données pour en faire des sources RDF. Pour l’élévaton de preface.csv, j’ai demandé le changement de type de la colonne “rang” pour que son contenu soit des entiers. J’ai donc obtenu ainsi : preface-csv-rdf-1 et lemmisation-csv-rdf-1
  6. Il ne reste plus qu’à interconnecter. J’ai écrit la requête d’interconnexion suivante :
    PREFIX P-LEMME: <http://localhost:9091/project/armenien/source/lemmisation-csv-rdf-1#>
    PREFIX P-TEXTE: <http://localhost:9091/project/armenien/source/preface-csv-rdf-1#>

    SELECT ?rang ?mot ?lemme ?analyse WHERE {
    ?s P-TEXTE:mot ?mot;
    P-TEXTE:rang ?rang.
    ?s2 P-LEMME:mot ?mot;
    P-LEMME:lemme ?lemme;
    P-LEMME:analyse ?analyse.
    }
    ORDER BY ?rang

  7. J’ai opté pour une sortie en CSV. Je vous recopie les premières lignes

    rang,mot,lemme,analyse
    2,սիրելի,սիրել,verb.pot.nom.acc.loc.sg.
    3,ամենայն,ամենայն,pron.nom.acc.sg.
    5,ի,ի,prep.
    6,չորս,չորք,num.acc.loc.pl.
    7,գիրս,գիր,noun.acc.loc.pl./nom.acc.sg.poss1.
    8,յառաջ,յառաջ,adj.
    9,քան,քան,conj./prep.
    10,զայս,այս (սա),pron.acc.sg.
    11,քեզ,դու,pron.acc.dat.sg.
    12,առաքեալս,առաքել,verb.pfv.acc.loc.pl./nom.acc.loc.sg.poss1.
    13,ի,ի,prep.
    14,մէնջ,մեք,pron.abl.pl.
    15,եւ,եւ,conj.
    17,նոցա,նա,pron.gen.dat.abl.pl.
    18,յայտնի,յայտնի//յայտնել,adj.nom.acc.loc.sg.//verb.pres.3per.sg.pass.
    19,երեւեցելոց,երեւել,verb.pfv.gen.dat.abl.pl.
    20,եւ,եւ,conj.

Et voilà, le tour est joué ! Chaque ligne commence par le rang du mot analysé dans le texte de départ. Vous voyez ainsi que le premier mot n’est pas présent. Cela signifie tout simplement que cette forme du mot n’est pas renseigné dans mon lemmisateur. Le 16e est dans le même cas.

Voilà à quoi peut servir Datalift, dans le monde de la linguistique.

1 Comment more...

Tokenisation de l’arménien classique

Voici un petit programme que j’ai réalisé, il prend en entrée un texte écrit en caractères arméniens (en unicode) et en réalise la tokenisation (ou normalisation), voir mon article sur ce sujet.

Seuls les caractères arméniens sont conservés, c’est-à-dire toutes les lettres minuscules et majuscules ainsi que le paryok ՞ (le point d’interrogation arménien), le badiv ՟ (signe d’abréviation pour les nomina sacra) et les ligatures suivantes : ﬓ, ﬔ, ﬕ, ﬖ, ﬗ et և. Les caractères օ et ֆ apparus après la période de l’Âge d’Or sont aussi pris en compte. Le résultat est un fichier au format CSV dont chaque ligne est formée du nom du groupe de mots découpés, du rang du mot découpé, et du mot découpé. Les éléments d’une ligne sont séparés par le caractère de votre choix, par défaut un point-virgule. Le résultat est affiché, il ne vous reste plus qu’à en faire un fichier CSV. (C’est à vous de choisir le nom du groupe de mots découpés.)

Le fichier CSV peut être lu par le tableur de Libre office, d’Open Office, celui de Microsoft etc.

Lien pour l’outil de tokenisation de l’arménien.


La création de l’Ecole des langues orientales, le 10 germinal an 3

C’est en 1795 que le décret portant sur la création de l’Ecole des langues orientales est publié. Sa lecture mérite le détour.


Préface du livre V de l’Adversus Haereses d’Irénée de Lyon

Voici le texte dans sa version arménienne, tel que publié dans :

KARAPET TER-MEKERTTSCHIAN UND ERWAND TER-MINASSIANTZ,
IRENAEUS GEGEN DIE HÄRETIKER,
BUCH IV U. V, IN ARMENISCHER VERSION ENTDECKT,
LEIPZIG, 1910.

Յանդիմանեցելոց, սիրելի, ամենայն աղանդացն ի չորս գիրս յառաջ քան զայս քեզ առաքեալս ի մէնջ եւ վարդապետանոցացն նոցա յայտնի երեւեցելոց եւ խարխարեցելոց եւ եղծելոց այնոցիկ, որք զանաստուածսն եւ զամբարիշտսն սուտ գիւտս խրատուցն գտին, է ինչ, որ յիւրեանց իսկ յիւրաքանչիւր վարդապետութենէն նոցա, զոր յիւրեանցն թողաք ի մատեանս, եւ է ինչ, որ բանիւ ամենապատիկ ցուցիւք գնացելում եւ ճշմարտութեանն ցուցելոյ եւ երեւեցելոյ քարոզութեանն եկեղեցւոյ, զոր մարգարէքն քարոզեցին, որպէս ցուցաքն, եւ կատարեաց Քրիստոս, իսկ առաքեալքն աւանդեցին, յորոց եկեղեցի ընկալեալ ի բոլոր աշխարհ միայն բարւոք պահելով աւանդէ որդւոց իւրոց եւ խնդրոցն առ ամենեցուն [146 v.] քակտելոցն յաղանդացն մեզ առարկելոց, եւ առաքելոցն ուսման տարածեցելոյ եւ երեւելի եղելոց շատից, որ ինչ միանգամ ի Տեառնէ ի ձեռն առակացն ասացաւ եւ գործեցաւ, յայսմ ի գիրս ի հինգերորդում զբոլոր զիրացն գործ զՅանդիմանութեանն եւ զԵղծմանն Ստանուն Գիտութեանն, յայլոցն եւս մնացելոց վարդապետութենէն Տեառն մերոյ եւ յառաքելական թղթոցն փորձեսցուք զապացոյցն առնել, որպէս պահանջեցեր ի մէնջ, եւ մեք հրամանիդ քո արդանեկութիւն արարեալ վասն եւ ի պաշտաւն բանի դնիլ, եւ ամենաւրինակաբարն մատուցելոց ըստ մերում զաւրութեան քեզ յոլով եւ շատ թոշակ տալ առ հակաճառութիւնս այլաղանդացն եւ շրջել եւ հաւանեցուցանել զմոլորեալսն եւ դարձուցանել յեկեղեցին Աստուծոյ եւ զնորատնկոցն զբարս հաստատել, զի հաստատուն եւ անշարժ պահիցեն զհաւատն, զոր բարւոքն պահեցեալ յեկեղեցւոյ ընկալան, եւ ոչ ըստ միոյ իրաց մի շրջեալք պատրեսցին ի չարէն, ուսուցանել զնոսա եւ հանել ի ճշմարտութենէն փորձեցելոց։ Պէտք լիցին քեզ եւ ամենեցուն, որք պատահիցեն գրոյս այսմիկ, առատաբար շքով եւ երկովք հանդիպել ի մէնջս յառաջագոյն ասացելոցս, զի եւ զենթադրութիւնս զայս գիտասցես, առ [147 r.] որս հակաճառութիւնս առնեմք, քանզի այսպէս ապա եւ աւրինաւորագոյն ընդդէմ ասասցես նոցա եւ ի պատրաստէ առ ձեռն առնուլ ունիցիս զառ ամենեսինսն նոսա հակառակաբանութիւնսն եւ զնոցա զկարծիս հաստատութեան, ի ձեռն երկնային հաւատոցն, իբրու խոտան եւ անպիտան ի բաց մերժեալ, բայց միայնում հաստատնում եւ ճշմարիտ վարդապետին զհետ երթեալ Բանին Աստուծոյ Յիսուսի Քրիստոսի Տեառն մերոյ, վասն առաւել սիրոյն իւրոյ եղելում այս, որ ինչ եմք մեք, զի զմեզ գոլ հաստատեալ յարմարեսցէ զայն, որ ինչ է ինքն։


  • Catégories

  • Calendrier

    July 2015
    M T W T F S S
    « Dec    
     12345
    6789101112
    13141516171819
    20212223242526
    2728293031  
  • Archives

  • Copyright © 1996-2010 Blogabriel. All rights reserved.
    iDream theme by Templates Next | Powered by WordPress