linguistique « Blogabriel

16

Fév/19

զԱստուծոյսն = τὰ τοῦ ϑεοῦ

by gabriel under arménien, linguistique, patrisitque, théologie, traduction

Cette forme est présente trois fois dans le Nouveau Testament.

Matth. 16, 23

Եւ նա դարձեալ ի պետրոս ասէ. երթ յետս իմ սատանայ, գայթագղութիւն իմ ես. զի ոչ խորհիս դու զԱստուածսն, այլ զմարդկան։

Marc. 8, 33

Եւ նա՝ դարձաւ ետես զաշակերտսն, սաստեաց պետրոսի եւ ասէ. երթ յետս իմ սատանայ. զի ոչ խորհիս դու զԱստուծոյսն, այլ զմարդկանս։

Ces deux premières occurences sont synoptiques, il s’agit de la réprimande de Pierre. Jésus reprend Pierre. Dans la Bible de Jérusalem : « Mais lui, se retournant, dit à Pierre : » Passe derrière moi, Satan ! tu me fais obstacle, car tes pensées ne sont pas celles de Dieu, mais celles des hommes ! » » (Matth.) ou « Mais lui, se retournant et voyant ses disciples, admonesta Pierre et dit : » Passe derrière moi, Satan ! car tes pensées ne sont pas celles de Dieu, mais celles des hommes ! » » (Marc.). D’autres traductions de la Bible utilisent d’autres termes que pensées. Chez Second, Fillion ou Crampon, ce sera choses, dans la TOB vues.

Dans la Bible grecque, nous lisons simplement : τὰ τοῦ ϑεοῦ.

I Cor. 2, 11

զի ո՞ ոք ՛ի մարդկանէ գիտէ́ ինչ զմարդոյն, եթէ ոչ հոգի́ մարդոյն որ ՛ի նմա. նոյնպէս եւ ո́չ զա(ստուածո)յսն ոք գիտէ, եթէ ոչ հոգին ա(ստուածո)յ։

La BJ traduit : « Qui donc entre les hommes sait ce qui concerne l’homme, sinon l’esprit de l’homme qui est en lui ? De même, nul ne connaît ce qui concerne Dieu, sinon l’Esprit de Dieu. »

Crampon : « Car qui d’entre les hommes connaît ce qui se passe dans l’homme, si ce n’est l’esprit de l’homme qui est en lui ? De même personne ne connaît ce qui est en Dieu, si ce n’est l’Esprit de Dieu. »

TOB : « Qui donc parmi les hommes connaît ce qui est dans l’homme, sinon l’esprit de l’homme qui est en lui ? De même, ce qui est en Dieu, personne ne le connaît, sinon l’Esprit de Dieu. »

Dans la Bible grecque, nous lisons simplement : τὰ τοῦ ϑεοῦ.

Maintenant, si nous recherchons cette expression grecque ailleurs dans la Bible grecque, nous avons : « Rendez à César ce qui appartient à César, et à Dieu ce qui appartient à Dieu » = Τὰ Καίσαρος ἀπόδοτε Καίσαρι καὶ τὰ τοῦ θεοῦ τῷ θεῷ. (Marc. 12, 13-17; Matth. 22,21; Luc. 20, 25)

Marc. 12, 17 : Պատասխանի ետ Յիսուս՝ եւ ասէ ցնոսա. երթայք տուք՝ զկայսեր, կայսեր, եւ զԱստուծոյ՝ Աստուծոյ։ եւ զարմացան ընդ նա։

Matth. 22, 21 : ասեն՝ կայսեր։ Յայնժամ ասէ ցնոսա. երթայք՝ տուք զկայսեր՝ կայսեր, եւ զԱստուծոյ՝ Աստուծոյ։

Luc. 20, 25 : Եւ նա ասէ ցնոսա. արդ՝ երթայք տուք զկայսերն՝ կայսեր։ եւ զԱստուծոյն՝ Աստուծոյ։

1

Sep/18

Trouver des synonymes

by gabriel under langue, linguistique, ontologie, sémantique

Quand je cherche des synonymes, j’utilise les services de trois sites :

le Dictionnaire Électronique des Synonymes (DES) auquel est adossé un espace sémantique très intéressant (prendre celui qui est en test),
le site synonymo.fr qui donne aussi les antonymes,
le site synonymes.com qui offre aussi d’autres outils,
et le CNTRL qui offre le plus de services avec antonymes, morphologie, lexicographie, étymologie, proxémie et concordance.

Ces services sont très utiles lors du développement de taxonomies, thésaurus ou ontologies car ils permettent de foisonner, mais aussi d’éviter des ambiguïtés.

5

Oct/17

Manuel élémentaire d’arménien classique

by gabriel under arménien, langue, linguistique, traduction

Le Manuel élémentaire d’arménien classique d’Antoine Meillet est désormais disponible en français. Traduit de l’allemand par Gabriel Képéklian, avec une préface de Charles de Lamberterie, il a été publié par les Editions Lambert-Lucas.

Couverture

L’arménien est enseigné en France depuis la toute fin du XVIIIe siècle. Le décret du 10 germinal an III (30 mars 1795) « établi[t] dans l’enceinte de la Bibliothèque nationale une école publique, destinée à l’enseignement des langues orientales vivantes » dont « les professeurs composeront en français la grammaire des langues qu’ils enseigneront ». Jacques Chahan de Cirbied, premier titulaire de la chaire, publie en 1823 en français une grammaire arménienne qui n’a plus de nos jours qu’une valeur historique. En 1883, Auguste Carrière, quatrième titulaire de la chaire, traduit de l’allemand la grammaire de Max Lauer inspirée des grammaires traditionnelles arméniennes. Élève de Carrière dès 1887-1888, Antoine Meillet complète sa formation en 1888-1889 auprès de Heinrich Hübschmann et en 1890-1891 auprès des Pères Mékhitaristes de Vienne. Dans ce manuel paru en Allemagne et en allemand en 1913, il a décrit l’arménien
classique d’une façon restée inégalée.

Il n’existait jusqu’à ce jour de grammaire arménienne de référence qu’en arménien, en russe et en allemand. Un siècle après sa première édition, la traduction française de l’Altarmenisches Elementarbuch de Meillet met enfin la description de l’arménien classique à la portée des lecteurs francophones.

29

Juil/15

Une petite note sur le système de numération de l’arménien classique

by gabriel under arménien, linguistique

Toutes les lettres de l’alphabet de l’arménien classique participent au système de numération classique. Les 36 lettres divisées en 4 fois 9 lettres consécutives permettent de représenter les unités, les dizaines, les centaines et les milliers.

ա	1	\|	ժ	10	\|	ճ	100	\|	ռ	1000
բ	2	\|	ի	20	\|	մ	200	\|	ս	2000
գ	3	\|	լ	30	\|	յ	300	\|	վ	3000
դ	4	\|	խ	40	\|	ն	400	\|	տ	4000
ե	5	\|	ծ	50	\|	շ	500	\|	ր	5000
զ	6	\|	կ	60	\|	ո	600	\|	ց	6000
է	7	\|	հ	70	\|	չ	700	\|	ւ	7000
ը	8	\|	ձ	80	\|	պ	800	\|	փ	8000
թ	9	\|	ղ	90	\|	ջ	900	\|	ք	9000

Ce système de numération arménienne est à rapprocher de celui de l’hébreu. Les 27 lettres de l’alphabet sont divisées en 3 séries de 9 lettres consécutives représentant les unités, les dizaines et les centaines.

א	1	\|	י	10	\|	ק	100
ב	2	\|	כ	20	\|	ר	200
ג	3	\|	ל	30	\|	ש	300
ד	4	\|	מ	40	\|	ת	400
ה	5	\|	נ	50	\|	ך	500
ו	6	\|	ס	60	\|	ם	600
ז	7	\|	ע	70	\|	ן	700
ח	8	\|	פ	80	\|	ף	800
ט	9	\|	צ	90	\|	ץ	900

On note l’absence du zéro dans les deux systèmes.

26

Juil/15

Les nombres dix-sept à dix-neuf en arménien classique

by gabriel under arménien, linguistique

En arménien classique, les déterminants numériques cardinaux se déclinent sans suivre de règle précise et uniforme.

Le grand grammairien comparatiste Antoine Meillet écrivait dans Altarmenisches Elementarbuch (Ed. Carl Winter, 1913, §77) : « Les quatre premiers adjectifs cardinaux sont toujours déclinés, même lorsqu’ils sont placés devant un mot ». Un peu plus loin (§78), il précisait : « Les nombres de ‘cinq’ à ‘dix’ restent toujours invariables au nom. acc. sg. հինգ ‘5’, վեց ‘6’, եւթն ‘7’, ութ ‘8’, ինն ‘9’, տասն ‘10’. Dans les autres cas, ils se déclinent en partie, presque uniquement lorsqu’ils sont placés après un substantif ; on a ainsi : gén. dat. abl. հնգից, վեցից, եւթանց, ութից, ըննից, տասանց, instr. հնգաւք, վեցիւք, եւթամբք, etc. Les autres nombres restent généralement invariables et se déclinent aux mêmes cas indiqués ci-dessus (donc pas au nom. acc.) ». Les nombres de onze à seize sont des mots composés մետասան, երկոտասան, երեքտասան, չորքտասան, հնգետասան, վեչտասան. Leur déclinaisons est partielle elle aussi : gén. dat. abl. մետասանից, երկոտասանից, etc. Meillet mentionne alors les nombres de dix-sept à dix-neuf en en donnant la forme en plusieurs mots mais il n’en dit pas plus : եւթն եւ տասն, ութ եւ տասն, ինն եւ տասն.

En 1936, lorsqu’il publie sa Grammaire comparée de l’arménien classique (Imp. des PP. Mkhitaristes, Vienne), dans sa description des noms de nombre (§70, p. 99-101), il ne dit rien des nombres de dix-sept à dix-neuf.

Il faut donc aller à la source des manuscrits pour savoir ce qu’il en est pour ces trois nombres. Le corpus que forme la Bible arménienne connue sous le nom de Zohrab (Venise, 1805) est le lieu idéal d’une investigation dont voici les résultats.

Dix-sept

En un seul mot
- Accusatif pluriel – 2 Roi 7,1 : ամս եւթնուտասն (dix-sept ans)
En plusieurs mots
- Accusatif pluriel – Gn 47,28 : եկաց յակոբ յերկրին եգիպտացւոց ամս եւթն եւ տասն (Jacob vécut dix-sept ans au pays d’Égypte)
- Accusatif pluriel – Jr 32,9 : եւթն սիկղ եւ տասն արծաթոյ (dix-sept sicles d’argent)
Dérivé
- Adjectif Gn 37,2 Յովսէփ եւթնուտասնամեայ էր (Joseph avait dix-sept ans)

Dix-huit

En un seul mot
- Accusatif pluriel – Jg 3,14 ; Lc 13,11 : ամս ութուտասն (dix-huit ans)
- Nominatif pluriel – Lc 13,4 : Կամ նոքա ութուտասանքն (ou eux, les dix-huit personnes)
- Accusatif pluriel – Lc 13,16 : ութուտասն ամ
- Génitif pluriel – 2 Roi 24,8 : Որդի ամաց ութուտասնից էր յովաքիմ (Joiakîn était un fils de dix-huit ans)
En plusieurs mots
- 1 Roi 7,15 ութ եւ տասն կանգուն (dix-huit coudées)
Dérivé
- Le dérivé ութուտասնամեայ (adj. de 18 ans) est mentionné par le NBHL, mais nous n’avons pas de témoin

Dix-neuf

En un seul mot
- Nominatif singulier – Jr 52,12 : այն ամ իննուտասն էր (c’était en la dix-neuvième année)
En plusieurs mots
- Nominatif pluriel – Jos 19,38 : քաղաքք ինն եւ տասն (dix-neuf villes)
- Accusatif pluriel – 2 Sa 2,30 : ինն եւ տասն առն (dix-neuf hommes)
Dérivé
- Le dérivé իննուտասնամեայ (adj. de 19 ans) est mentionné par le NBHL, mais nous n’avons pas de témoin

En conclusion

Il ressort que ces nombres sont soit formés d’un unique mot (ex. եւթնուտասն) soit de plusieurs (ex. եւթն եւ տասն), lesquels ne sont pas toujours contigus. Quand ils s’écrivent en plusieurs mots, seul le dernier, տասն, se décline. Certains dérivés du nom de ces nombres sont constitués d’un seul mot.

NBHL : Աւետիքեան, Սիւրմէլեան, Աւգերեան, Նոր բառգիրք հայկազեան լեզուի, (Gabriēl Awetikʻean, Khachʻatur Siwrmēlean, Mkrtichʻ Awgerean, Nor baṙgirk’ haykazean lezowi, nouveau dictionnaire de langue arménienne), Venise, 1836-1837. 2 vol., 1140 et 1067 p.

9

Mar/14

Aide à la traduction de l’arménien classique avec DataLift (2)

by gabriel under arménien, langue, linguistique, linked data, outils, sémantique, web de données, web sémantique

Pour combler une partie des manques du premier dictionnaire utilisé, j’ai traduit et ajouté le glossaire qu’Antoine Meillet donnait en 1913 à la fin de son fameux Altarmenisches Elementachbuch. J’ai opté pour une structure très simple : le mot et sa définition.

Nous avons donc maintenant 4 jeux de données :

ahv : livre, chapitre, rang, mot
lemme : mot, lemme, analyse
dict : source, uri, mot, prononciation, traduction
meillet : mot, definition

Dans la requête suivante, la clause UNION permet de prendre en compte les deux dictionnaires, les BIND permet de ramener les résultats sur une même variable :

PREFIX P-TEXTE: <http://localhost:9091/project/armenien/source/ahv-csv-rdf-1#> PREFIX P-LEMME: <http://localhost:9091/project/armenien/source/lemme-csv-rdf-1#> PREFIX P-DICT: <http://localhost:9091/project/armenien/source/dict-hy-fr-csv-rdf-1#> PREFIX P-MEILL: <http://localhost:9091/project/armenien/source/meillet-csv-rdf-1#>


SELECT ?rang ?mot ?traduction {

?s1 P-TEXTE:mot ?mot;

P-TEXTE:chapitre "ch1.2";

P-TEXTE:rang ?rang.
OPTIONAL {

?s2 P-LEMME:mot ?mot;

P-LEMME:lemme ?lemme;

P-LEMME:analyse ?analyse.
{ ?s3 P-DICT:mot ?lemme;

P-DICT:traduction ?trad1.

BIND (concat("C: ",?analyse," ",?trad1) as ?traduction)

}  UNION

{ ?s4 P-MEILL:mot ?lemme;

P-MEILL:definition ?trad2.

BIND (concat("M: ",?trad2) as ?traduction)

} }

} ORDER BY ?rang LIMIT 35

Les 35 premiers résultats sont :

1,արդ,"C: adv. 1) or conj., 2) maintenant adv." 1,արդ,M: (§ 171); tout à l'heure; maintenant; or; donc. 1,արդ,M: -ոյ forme; ornement. 2,իւրով,M: (pass. § 72); sien ; le gén. pl. իւրանց permet de traduire ‘leur’ (§ 76) ; իւր est aussi le gén. du réflexif (§ 76). 3,արեամբն,C: noun.ins.sg.def. sang nm. 3,արեամբն,M: -եան sang; αἷμα. 4,փրկեցելոյ, 5,զմեզ,M: (pronom; § 75); nous. 6,տեառն,"C: noun.gen.dat.sg. maître, seigneur, propriétaire nm." 6,տեառն,M: տեառն instr. տերամբ; nom. pl. տեարք; § 59 h; seigneur; κύριος (habituellement abrévié ՟տր [ պատիւ; § 26; rem. 4]; lorsqu'il s'agit de Dieu – de տի-այր ; cf. տի-կին). 7,եւ,C: conj. et conj. 7,եւ,M: (§ 164); aussi; et; même. 8,տուեալ,"C: verb.pfv.nom.acc.sg. 1) belle-soeur nf. 2) donner, livrer, offrir vt." 9,զհոգին,"C: noun.nom.acc.sg. 1) esprit nm., âme nf., 2) personne nf." 9,զհոգին,M: -ւոյ; -ւով (§ 46); esprit; πνεῦμα (cf. ոգի; §27 C). 10,իւր,M: (pass. § 72); sien ; le gén. pl. իւրանց permet de traduire ‘leur’ (§ 76) ; իւր est aussi le gén. du réflexif (§ 76). 11,փոխանակ,C: noun.nom.acc.sg. au lieu de prép. 11,փոխանակ,M: adv. (avec gén.) à la place de; փլայ (§ 109); je m'écroule; je tombe en ruine (cf. փուլ). 11,փոխանակ,M: emprunt (cf. փոխեմ). 12,հոգւոյս,"C: noun.gen.dat.abl.sg.poss1. 1) esprit nm., âme nf., 2) personne nf." 12,հոգւոյս,M: -ւոյ; -ւով (§ 46); esprit; πνεῦμα (cf. ոգի; §27 C). 13,մերոյ,C: pron.adj.gen.sg. notre adj. 13,մերոյ,M: (adj. poss. § 72); notre. 14,եւ,C: conj. et conj. 14,եւ,M: (§ 164); aussi; et; même. 15,զմարմինն,C: noun.nom.acc.sg. corps nm. 15,զմարմինն,M: մարﬓոյ corps; chair; σῶμα. 16,իւր,M: (pass. § 72); sien ; le gén. pl. իւրանց permet de traduire ‘leur’ (§ 76) ; իւր est aussi le gén. du réflexif (§ 76). 17,փոխանակ,C: noun.nom.acc.sg. au lieu de prép. 17,փոխանակ,M: adv. (avec gén.) à la place de; փլայ (§ 109); je m'écroule; je tombe en ruine (cf. փուլ). 17,փոխանակ,M: emprunt (cf. փոխեմ). 18,մարմնոյս,C: noun.gen.dat.abl.sg.poss1. corps nm. 18,մարմնոյս,M: մարﬓոյ corps; chair; σῶμα. 19,մերոյ,C: pron.adj.gen.sg. notre adj. 19,մերոյ,M: (adj. poss. § 72); notre.

8

Mar/14

Aide à la traduction de l’arménien classique avec DataLift

by gabriel under arménien, langue, linguistique, outils, web de données, web sémantique

Depuis mon dernier post relatif à l’analyse grammaticale automatique de l’arménien classique avec DataLift, j’ai ajouté quelques petits ingrédients pour faire de la traduction. Au final, ce sont donc trois jeux de données que j’injecte dans la plateforme : une tokennisation d’un texte (le début du livre V de la version arménienne de l’Adversus Haereses d’Irénée de Lyon), une base de lemmatisation et un dictionnaire. Les trois sont des aux formats CSV dont les structures sont :

ahv : livre, chapitre, rang, mot lemme : mot, lemme, analyse dict : source, uri, mot, prononciation, traduction

La liaison est évidemment faite sur le « mot ». Voici une requête destinée à la traduction des 20 premiers mots du chapitre 1.2 :

PREFIX P-TEXTE: <http://localhost:9091/project/armenien/source/ahv-csv-rdf-1#> PREFIX P-LEMME: <http://localhost:9091/project/armenien/source/lemme-csv-rdf-1#> PREFIX P-DICT: <http://localhost:9091/project/armenien/source/dict-hy-fr-csv-rdf-1#>


SELECT ?rang ?mot ?analyse ?traduction {

  ?s1 P-TEXTE:mot ?mot;

      P-TEXTE:chapitre "ch1.2";

      P-TEXTE:rang ?rang.
  OPTIONAL {

  ?s2 P-LEMME:mot ?mot;

      P-LEMME:lemme ?lemme;

      P-LEMME:analyse ?analyse.

?s3 P-DICT:mot ?lemme; P-DICT:traduction ?traduction. } } ORDER BY ?rang LIMIT 20

Comme vous pouvez le voir, le résultat est une bonne aide :

1; արդ; adv.; "1) or conj.; 2) maintenant adv." 2; իւրով; ; 3; արեամբն; noun.ins.sg.def.; sang nm. 4; փրկեցելոյ; ; 5; զմեզ; ; 6; տեառն; noun.gen.dat.sg.; "maître; seigneur; propriétaire nm." 7; եւ; conj.; et conj. 8; տուեալ; verb.pfv.nom.acc.sg.; "1) belle-soeur nf. 2) donner; livrer; offrir vt." 9; զհոգին; noun.nom.acc.sg.; "1) esprit nm.; âme nf.; 2) personne nf." 10; իւր; ; 11; փոխանակ; noun.nom.acc.sg.; au lieu de prép. 12; հոգւոյս; noun.gen.dat.abl.sg.poss1.; "1) esprit nm.; âme nf.; 2) personne nf." 13; մերոյ; pron.adj.gen.sg.; notre adj. 14; եւ; conj.; et conj. 15; զմարմինն; noun.nom.acc.sg.; corps nm. 16; իւր; ; 17; փոխանակ; noun.nom.acc.sg.; au lieu de prép. 18; մարմնոյս; noun.gen.dat.abl.sg.poss1.; corps nm. 19; մերոյ; pron.adj.gen.sg.; notre adj. 20; եւ; conj.; et conj.

La base de lemmatisation est incomplète, l’utilisation de la clause OPTIONAL est donc bien utile pour faire tout de même apparaître les mots non traduits. Une traduction aboutie de ce passage est : « Donc, le Seigneur nous a sauvés par son propre sang, donnant sa propre Âme pour notre âme, sa propre chair pour notre chair, et »
A suivre…

27

Fév/14

Analyse grammaticale automatique de l’arménien classique avec DataLift

by gabriel under arménien, linguistique, linked data, méthode, outils, traduction, web de données, web sémantique

Je me suis demandé combien de temps cela me prendrait de faire une analyse grammaticale … Ca ne m’a pris que 10 minutes. Voici comment (et vous pourrez vous y essayer aussi).

Installer Datalift, il suffit de télécharger Datalift ici et de le deziper
Vous créez un projet, appelons-le « armenien »
Vous ajoutez la première source, ce sera un texte arménien tokennisé (voir mon post précédent sur la tokennisation de l’arménien). Là j’ai choisi la préface du livre V de l’Adversus Haereses d’Irénée de Lyon (voir le post où je l’ai posté). Avec le tokenniseur, j’ai créé un CSV avec 3 colonnes (chapitre ; rang ; mot). Je l’ai appelé : preface.csv
Vous ajoutez la deuxième source, là j’ai pris mon CSV de lemmisation. Il a 3 colonnes aussi (mot ; lemme ; analyse). Je l’ai appelé : lemmisation.csv
Vous élevez les deux jeux de données pour en faire des sources RDF. Pour l’élévaton de preface.csv, j’ai demandé le changement de type de la colonne « rang » pour que son contenu soit des entiers. J’ai donc obtenu ainsi : preface-csv-rdf-1 et lemmisation-csv-rdf-1
Il ne reste plus qu’à interconnecter. J’ai écrit la requête d’interconnexion suivante :
PREFIX P-LEMME: <http://localhost:9091/project/armenien/source/lemmisation-csv-rdf-1#> PREFIX P-TEXTE: <http://localhost:9091/project/armenien/source/preface-csv-rdf-1#>
SELECT ?rang ?mot ?lemme ?analyse WHERE { ?s P-TEXTE:mot ?mot; P-TEXTE:rang ?rang. ?s2 P-LEMME:mot ?mot; P-LEMME:lemme ?lemme; P-LEMME:analyse ?analyse. } ORDER BY ?rang
J’ai opté pour une sortie en CSV. Je vous recopie les premières lignes
rang,mot,lemme,analyse 2,սիրելի,սիրել,verb.pot.nom.acc.loc.sg. 3,ամենայն,ամենայն,pron.nom.acc.sg. 5,ի,ի,prep. 6,չորս,չորք,num.acc.loc.pl. 7,գիրս,գիր,noun.acc.loc.pl./nom.acc.sg.poss1. 8,յառաջ,յառաջ,adj. 9,քան,քան,conj./prep. 10,զայս,այս (սա),pron.acc.sg. 11,քեզ,դու,pron.acc.dat.sg. 12,առաքեալս,առաքել,verb.pfv.acc.loc.pl./nom.acc.loc.sg.poss1. 13,ի,ի,prep. 14,մէնջ,մեք,pron.abl.pl. 15,եւ,եւ,conj. 17,նոցա,նա,pron.gen.dat.abl.pl. 18,յայտնի,յայտնի//յայտնել,adj.nom.acc.loc.sg.//verb.pres.3per.sg.pass. 19,երեւեցելոց,երեւել,verb.pfv.gen.dat.abl.pl. 20,եւ,եւ,conj.

Et voilà, le tour est joué ! Chaque ligne commence par le rang du mot analysé dans le texte de départ. Vous voyez ainsi que le premier mot n’est pas présent. Cela signifie tout simplement que cette forme du mot n’est pas renseigné dans mon lemmisateur. Le 16e est dans le même cas.

Voilà à quoi peut servir Datalift, dans le monde de la linguistique.

26

Jan/14

Tokenisation de l’arménien classique

by gabriel under arménien, language, langue, linguistique, outils, sémantique, unicode

Voici un petit programme que j’ai réalisé, il prend en entrée un texte écrit en caractères arméniens (en unicode) et en réalise la tokenisation (ou normalisation), voir mon article sur ce sujet.

Seuls les caractères arméniens sont conservés, c’est-à-dire toutes les lettres minuscules et majuscules ainsi que le paryok ՞ (le point d’interrogation arménien), le badiv ՟ (signe d’abréviation pour les nomina sacra) et les ligatures suivantes : ﬓ, ﬔ, ﬕ, ﬖ, ﬗ et և. Les caractères օ et ֆ apparus après la période de l’Âge d’Or sont aussi pris en compte. Le résultat est un fichier au format CSV dont chaque ligne est formée du nom du groupe de mots découpés, du rang du mot découpé, et du mot découpé. Les éléments d’une ligne sont séparés par le caractère de votre choix, par défaut un point-virgule. Le résultat est affiché, il ne vous reste plus qu’à en faire un fichier CSV. (C’est à vous de choisir le nom du groupe de mots découpés.)

Le fichier CSV peut être lu par le tableur de Libre office, d’Open Office, celui de Microsoft etc.

Lien pour l’outil de tokenisation de l’arménien.

11

Jan/14

La création de l’Ecole des langues orientales, le 10 germinal an 3

by gabriel under histoire, langue, linguistique

C’est en 1795 que le décret portant sur la création de l’Ecole des langues orientales est publié. Sa lecture mérite le détour.

Blogabriel

Le blog de Gabriel, innovation, recherche et développement … et arménien classique

linguistique

զԱստուծոյսն = τὰ τοῦ ϑεοῦ

Trouver des synonymes

Manuel élémentaire d’arménien classique

Une petite note sur le système de numération de l’arménien classique

Les nombres dix-sept à dix-neuf en arménien classique

Aide à la traduction de l’arménien classique avec DataLift (2)

Aide à la traduction de l’arménien classique avec DataLift

Analyse grammaticale automatique de l’arménien classique avec DataLift

Tokenisation de l’arménien classique

La création de l’Ecole des langues orientales, le 10 germinal an 3

Méta

Catégories

Calendrier

Archives

Recent Posts

Archives

Tags

א	1	\|	י	10	\|	ק	100
ב	2	\|	כ	20	\|	ר	200
ג	3	\|	ל	30	\|	ש	300
ד	4	\|	מ	40	\|	ת	400
ה	5	\|	נ	50	\|	ך	500
ו	6	\|	ס	60	\|	ם	600
ז	7	\|	ע	70	\|	ן	700
ח	8	\|	פ	80	\|	ף	800
ט	9	\|	צ	90	\|	ץ	900

mai 2026
L	M	M	J	V	S	D
« Mai
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31

א	1	\|	י	10	\|	ק	100
ב	2	\|	כ	20	\|	ר	200
ג	3	\|	ל	30	\|	ש	300
ד	4	\|	מ	40	\|	ת	400
ה	5	\|	נ	50	\|	ך	500
ו	6	\|	ס	60	\|	ם	600
ז	7	\|	ע	70	\|	ן	700
ח	8	\|	פ	80	\|	ף	800
ט	9	\|	צ	90	\|	ץ	900

א	1	\|	י	10	\|	ק	100
ב	2	\|	כ	20	\|	ר	200
ג	3	\|	ל	30	\|	ש	300
ד	4	\|	מ	40	\|	ת	400
ה	5	\|	נ	50	\|	ך	500
ו	6	\|	ס	60	\|	ם	600
ז	7	\|	ע	70	\|	ן	700
ח	8	\|	פ	80	\|	ף	800
ט	9	\|	צ	90	\|	ץ	900