Approches quantitatives de l'analyse des prédictions en traduction automatique neuronale (TAN)

Autor: Zimina-Poirot, Maria, Ballier, Nicolas, Yunès, Jean-Baptiste
Přispěvatelé: Centre de Linguistique Inter-langues, de Lexicologie, de Linguistique Anglaise et de Corpus (CLILLAC-ARP (URP_3967)), Université de Paris (UP), Institut de Recherche en Informatique Fondamentale (IRIF (UMR_8243)), Centre National de la Recherche Scientifique (CNRS)-Université de Paris (UP), Université de Toulouse
Jazyk: francouzština
Rok vydání: 2020
Předmět:
Zdroj: JADT 2020 : 15èmes Journées Internationales d'Analyse statistique des Données Textuelles
JADT 2020 : 15èmes Journées Internationales d'Analyse statistique des Données Textuelles, Université de Toulouse, Jun 2020, Toulouse, France
Popis: As part of a larger project on optimal learning conditions in neural machine translation, we investigate characteristic training phases of translation engines. All our experiments are carried out using OpenNMT-Py: the pre-processing step is implemented using the Europarl training corpus and the INTERSECT corpus is used for validation. Longitudinal analyses of training phases suggest that the progression of translations is not always linear. Following the results of textometric explorations, we identify the importance of the phenomena related to chronological progression, in order to map different processes at work in neural machine translation (NMT).
Comment: in French. JADT 2020 : 15{\`e}mes Journ{\'e}es Internationales d'Analyse statistique des Donn{\'e}es Textuelles, Universit{\'e} de Toulouse, Jun 2020, Toulouse, France
Databáze: OpenAIRE