Entrenamiento y comparación de motores de TAE especializados en la localización de aplicaciones móviles

Autor: Fernández Ruiz, María Esperanza
Přispěvatelé: Sánchez Gijón, María Pilar
Jazyk: Spanish; Castilian
Rok vydání: 2019
Předmět:
Zdroj: RECERCAT (Dipòsit de la Recerca de Catalunya)
Recercat. Dipósit de la Recerca de Catalunya
instname
Popis: En aquest treball s'entrenen, mitjançant la plataforma MTradumàtica, tres motors de traducció automàtica estadística amb corpus d'aplicacions mòbils de diferent composició per la combinació lingüística anglès-espanyol. Els motors creats són els següents: un motor especialitzat en aplicacions, un altre especialitzat en aplicacions de la categoria «comunicació» i un altre especialitzat en aplicacions amb un corpus monolingüe general per entrenar el model de llengua. D'aquesta manera, s'exposen les qüestions teòriques considerades rellevants per a l'estudi com són la localització d'aplicacions mòbils, l'entrenament de motors de traducció automàtiques mitjançant corpus, la posedición i l'avaluació de la qualitat de la traducció automàtica. Així mateix, s'explica detalladament el procés que s'ha dut a terme durant l'entrenament dels tres motors. Un cop fet això, es posen a prova els motors per avaluar els resultats: d'una banda, es presta atenció a una sèrie d'aspectes problemàtics específics de la localització d'aplicacions mòbils i es comparen els resultats amb els d'un altre motor existent; i, d'altra banda, es comparen entre si els tres motors per establir quina composició de corpus seria la més adequada. En este trabajo se entrenan, mediante la plataforma MTradumàtica, tres motores de traducción automática estadística con corpus de aplicaciones móviles de distinta composición para la combinación lingüística inglés-español. Los motores creados son los siguientes: uno especializado en aplicaciones, otro especializado en aplicaciones de la categoría «comunicación» y otro especializado en aplicaciones con un corpus monolingüe general para entrenar el modelo de lengua. De este modo, se exponen las cuestiones teóricas consideradas relevantes para el estudio como son la localización de aplicaciones móviles, el entrenamiento de motores de traducción automática mediante corpus, la posedición y la evaluación de la calidad de la traducción automática. Asimismo, se explica detalladamente el proceso que se ha llevado a cabo durante el entrenamiento de los tres motores. Una vez hecho esto, se ponen a prueba los motores para evaluar los resultados: por un lado, se presta atención a una serie de aspectos problemáticos específicos de la localización de aplicaciones móviles y se comparan los resultados con los de otro motor existente; y, por otro lado, se comparan entre sí los tres motores para establecer qué composición de corpus sería la más adecuada. In this dissertation, three statistical machine translation engines with corpus of mobile applications of different compositions are trained for the English-Spanish language pair using the MTradumàtica platform. The engines created are the following: one engine specialized in all apps, another specialized in “communication” apps, and another one specialized in all apps with a general monolingual corpus in order to train the language model. Therefore, the theoretical bases considered relevant for this research are presented: the localization of mobile applications, the training process of corpus-based machine translation engines, post-editing and the quality evaluation of machine translation. In addition, the process that has been carried out during the training of these three engines is explained in detail. Following this, the engines are tested to evaluate their results: on the one hand, attention is paid to a series of problematic aspects specific to mobile apps localisation and the results are compared with those of an existing engine; and, on the other hand, the three engines are compared in order to establish which corpus composition would be the most appropriate.
Databáze: OpenAIRE