Génération de dictionnaire DELA à partir d'une liste de substantifs et d'adjectifs Ce programme prend en entrée un texte écrit en caractères arméniens (codage unicode). Chaque ligne doit comprendre 5 champs séparés par un caractère séparateur, ce caractère doit être indiqué dans la zone de saisie qui lui est dédiée. Les 5 champs sont : le lemme du mot ; le lemme avec alternance vocalique (au cas où cela a du sens) ; l'étiquette morphosyntaxique du mot ; le type de déclinaison ; le commentaire de génération. Par exemple : սիրտ;սրտ;N+Com;2;GK,2015/01/21 signifie que le lemme est սիրտ, que ce même lemme avec alternance vocalique est սրտ, que c'est un nom commun (N+Com) et que sa déclinaison est la 2e dans le générateur. Si une ligne commence par # elle ne sera pas analysée. Le texte CSV peut être préparé par un tableur ou avec un bloc-note. Le fichier exemple génère 3200 lignes. Ce fichier étant codé en UNICODE (UFT-8), utilisez par exemple Notepad++, Sublime Text ou Open Office pour l'ouvrir. | |||
Séparateur du texte CSV | Version 1.1 (27.02.2015) | ||
Agglutination(s) : ի զ ց | Article(s) : ս դ ն | Générer au format DELA (sinon CSV) |