Google Translate vs. DeepL: analysing neural machine translation performance under the challenge of phraseological variation
Autor: | Carlos Manuel Hidalgo-Ternero |
---|---|
Jazyk: | angličtina |
Rok vydání: | 2020 |
Předmět: |
Linguistics and Language
variación fraseológica Machine translation Traducción e Interpretación discontinuidad discontinuity computer.software_genre Language and Linguistics neural machine translation Education computer Humanities somatismos phraseological variation somatisms Mathematics traducción automática neuronal |
Zdroj: | RUA. Repositorio Institucional de la Universidad de Alicante Universidad de Alicante (UA) |
Popis: | The present research analyses the performance of two free open-source neural machine translation (NMT) systems —Google Translate and DeepL— in the (ES>EN) translation of somatisms such as tomar el pelo and meter la pata, their nominal variants (tomadura/tomada de pelo and metedura/metida de pata), and other lower-frequency variants such as meter la pata hasta el corvejón, meter la gamba and metedura/metida de gamba. The machine translation outcomes will be contrasted and classified depending on whether these idioms are presented in their continuous or discontinuous form (Anastasiou 2010), i.e., whether different n-grams split the idiomatic sequence (or not), which may pose some difficulties for their automatic detection and translation. Overall, the insights gained from this study will prove useful in determining for which of the different scenarios either Google Translate or DeepL delivers a better performance under the challenge of phraseological variation and discontinuity. La presente investigación tiene por objetivo analizar el rendimiento de dos sistemas de traducción automática neuronal (TAN) —Google Translate y DeepL— en la traducción (ES>EN) de somatismos tales como tomar el pelo y meter la pata, sus variantes nominales (tomadura/tomada de pelo y metedura/metida de pata) y otras variantes con menor frecuencia de aparición tales como meter la pata hasta el corvejón, meter la gamba y metedura/metida de gamba. Los resultados de ambos sistemas se contrastarán y clasificarán según los diferentes somatismos se presenten en su forma continua o discontinua (Anastasiou 2010), es decir, dependiendo de si distintos n-gramas dividen la secuencia idiomática (o no), lo que puede presentar serias dificultades para su detección y traducción automáticas. En general, los resultados obtenidos permitirán dilucidar en cuál de los diferentes escenarios Google Translate o DeepL ofrece un mejor rendimiento ante el desafío de la variación y discontinuidad fraseológica. This research has been funded by a FPU (Formación de Profesorado Universitario) contract, ref. FPU16/02032, awarded to Carlos Manuel Hidalgo Ternero by the Ministerio de Educación, Ciencia y Deporte (Spanish Ministry of Education, Science and Sport). Furthermore, this publication has been carried out within the framework of the thematic network TRAJUTEC and the teaching network “TACTRAD: aplicación de nuevas herramientas TAC para la enseñanza-aprendizaje de la traducción especializada” (ref. 719/2018) coordinated by the University of Malaga, as well as the research projects Interpreta 2.0 (PIE 17-015, type B), VIP (FFI2016-75831-P) and TERMITUR (HUM2754). |
Databáze: | OpenAIRE |
Externí odkaz: |