Un cadre d'apprentissage intégralement discriminant pour la traduction statistique

Autor: Lavergne, Thomas, Allauzen, Alexandre, Yvon, François
Přispěvatelé: Laboratoire d'Informatique pour la Mécanique et les Sciences de l'Ingénieur (LIMSI), Université Paris Saclay (COmUE)-Centre National de la Recherche Scientifique (CNRS)-Sorbonne Université - UFR d'Ingénierie (UFR 919), Sorbonne Université (SU)-Sorbonne Université (SU)-Université Paris-Saclay-Université Paris-Sud - Paris 11 (UP11)
Jazyk: francouzština
Rok vydání: 2013
Předmět:
Zdroj: Conférence sur le Traitement Automatique des Langues Naturelles
Conférence sur le Traitement Automatique des Langues Naturelles, Jun 2013, Batz-les-bains, France
Popis: Une faiblesse des systèmes de traduction statistiques est le caractère ad hoc du processusd'apprentissage, qui repose sur un empilement d'heuristiques et conduit à apprendre des paramètresdont la valeur est sous-optimale. Dans ce travail, nous reformulons la traduction automatique sousla forme familière de l'apprentissage d'un modèle probabiliste structuré utilisant uneparamérisation log-linéaire. Cette entreprise est rendue possible par le développement d'uneimplantation efficace qui permet en particulier de prendre en compte la présence de variableslatentes dans le modèle. Notre approche est comparée, avec succès, avec une approche de l'état del'art sur la tâche de traduction de données du BTEC pour le couple Français-Anglais.
Databáze: OpenAIRE