L'alignement des documents médiévaux

Autor: Olivier Collet, Hatem Ghorbel, Giovanni Coray
Rok vydání: 2003
Předmět:
Zdroj: Document numérique. 7:27-45
ISSN: 1279-5127
DOI: 10.3166/dn.7.3-4.27-45
Popis: Le but de l’alignement des textes est la mise en correspondance des sous-parties similaires de deux ou plusieurs traductions ou versions d’un meme ecrit. La plupart des methodes utilisees dans la technique d’alignement reposent sur l’analyse statistique des frequences de mots ou de caracteres, ou sur la cooccurrence des chaines que ceux-ci constituent. Afin d’en ameliorer l’efficacite, d’autres approches incluent certaines proprietes linguistiques (morpho-syntaxiques et lexico-semantiques) et structurelles (marques de chapitres, de sections, etc.) des documents. Cet article expose les resultats d’une adaptation de la technique d’alignement aux etats paralleles des anciens textes a partir d’une approche multicritere qui tient compte de la similitude au niveau lexical, morpho-syntaxique et lexico-semantique du francais de la periode medievale.
Databáze: OpenAIRE