Interactive post-editing in machine translation

Autor: Domingo Ballester, Miguel
Jazyk: angličtina
Rok vydání: 2016
Předmět:
Zdroj: RiuNet. Repositorio Institucional de la Universitat Politécnica de Valéncia
instname
Popis: [EN] The current state of the art in Machine Translation (MT) is far from being good enough, with a post-process carried out by a human agent being necessary in many cases in order to correct translations. Statistical post-editing of a MT system has been used in the past to improve the translation quality of that system. Additionally, research on interactive translation prediction has been done with the aim of reducing the human post-editing effort. In this thesis, a new methodology that combines both techniques is proposed in order to, given a MT system, increase the translation quality of that system and reduce the effort that the human agent needs to make in order to correct the translation of that system. This methodology is tested on different scenarios (to connect with the output of a rulebased machine translation system, and as a method to adapt an statistical MT system from one domain to another) with different corpora, obtaining very encouraging results
[ES] El estado actual del arte en traducción automática (Machine Translation, MT) todavía no es lo suficientemente bueno, siendo en muchos casos necesario un post-proceso llevado a cabo por un agente humano a fin de corregir las traducciones. La post-edición estadística de un sistema de MT se ha utilizado en el pasado para mejorar la calidad de traducción de dicho sistema. Además, se han llevado a cabo investigaciones en traducción mediante predicción interactiva con el objetivo de reducir el esfuerzo humano de post-edición. En esta tesis se propone una nueva metodología que combina ambas técnicas a fin de, dado un sistema de MT, incrementar la calidad de traducción de dicho sistema y reducir el esfuerzo que el agente humano ha de hacer a la hora de corregir las traducciones de dicho sistema. Esta metodología ha sido probada en diferentes escenarios (para conectar la salida de un sistema de traducción basado en reglas, y como método para adaptar un sistema de MT estadístico de un dominio a otro) con diferentes córpora, obteniendo resultados muy esperanzadores.
Databáze: OpenAIRE