Apprentissage discriminant de modèles neuronaux pour la traduction automatique
Autor: | Do, Quoc Khanh, Allauzen, Alexandre, Yvon, François |
---|---|
Přispěvatelé: | Laboratoire d'Informatique pour la Mécanique et les Sciences de l'Ingénieur (LIMSI), Université Paris Saclay (COmUE)-Centre National de la Recherche Scientifique (CNRS)-Sorbonne Université - UFR d'Ingénierie (UFR 919), Sorbonne Université (SU)-Sorbonne Université (SU)-Université Paris-Saclay-Université Paris-Sud - Paris 11 (UP11), European Project: 645452,H2020,H2020-ICT-2014-1,QT21(2015), Publications, Limsi, QT21: Quality Translation 21 - QT21 - - H20202015-02-01 - 2018-01-31 - 645452 - VALID, Université Paris-Sud - Paris 11 (UP11)-Sorbonne Université - UFR d'Ingénierie (UFR 919), Sorbonne Université (SU)-Sorbonne Université (SU)-Université Paris-Saclay-Centre National de la Recherche Scientifique (CNRS)-Université Paris Saclay (COmUE) |
Jazyk: | francouzština |
Rok vydání: | 2016 |
Předmět: |
modèles neuronaux
apprentissage discrimi- nant traduction automatique statistique [INFO.INFO-CL] Computer Science [cs]/Computation and Language [cs.CL] discriminative training [INFO]Computer Science [cs] [INFO] Computer Science [cs] statistical machine translation neural networks [INFO.INFO-CL]Computer Science [cs]/Computation and Language [cs.CL] |
Zdroj: | Revue TAL Revue TAL, ATALA (Association pour le Traitement Automatique des Langues), 2016, 57, pp.111-135 Revue TAL, 2016, 57, pp.111-135 |
ISSN: | 1248-9433 1965-0906 |
Popis: | International audience; Les méthodes utilisées pour entraîner des réseaux de neuronesen traitement des langues reposent, pour la plupart, surl'optimisation de critères qui sont décorrélés de l'applicationfinale. Nous proposons un nouveau cadre d'apprentissage discriminant pour l'estimation desmodèles neuronaux en traduction automatique. Ce cadre s'appuiesur la définition d'un critère d'apprentissage qui prenden compte, d'une part, la métrique utilisée pour l'évaluationautomatique de la traduction et, d'autre part, le processus d'intégration de cesmodèles au sein des systèmes de traduction automatique. Cetteméthode est comparée aux critères d'apprentissage usuels que sontle maximum de vraisemblance et l'estimation contrastive bruitée.Les expériences menées sur les tâches de traduction des séminairesTedtalks et de textes médicaux, depuis l'anglais vers lefrançais, montrent la pertinence d'un cadre d'apprentissagediscriminant et l'importance d'une initialisation judicieuse, enparticulier dans une perspective d'adaptation au domaine. |
Databáze: | OpenAIRE |
Externí odkaz: |