Personvārdu transliterācija izmantojot neironu tīklus

Autor: Striževskis, Dmitrijs
Přispěvatelé: Paikens, Pēteris, Latvijas Universitāte. Datorikas fakultāte
Jazyk: lotyšština
Rok vydání: 2019
Předmět:
Popis: Personvārdu transliterācija ar neironu tīkliem paliek lielā mērā neizpētīts temats, neskatoties uz tās vairākiem potenciāliem pielietojumiem, tai skaitā: mašīntulkošana, informāciju apkopošanas sistēmas, interneta meklēšanas sistēmas un citi. Tas ietver virkņu modelēšanas neironu arhitektūru izmantošanu, lai atveidotu cilvēka vārdu citā valodā, ievērojot tās pareizrakstības kanonus. Šās disertācijas mērķis ir izprast šo pieeju, uzmanīgi izanalizējot dažādu priekšapstrādes procedūru un modeļu arhitektūru ietekmi uz gala rezultātu. Autors eksperimentāli pārbauda dažādus paņēmienus un piedāvā rekomendācijas, lai veicinātu “state-of-the-art” modeļa izstrādi. Procesā, autors izveido modeļus, kas pārspēj iepriekšējus mēģinājumus personvārda transliterācijai ar neironu tīkliem.
Personal name transliteration with neural networks remains a largely unexplored topic despite many potential applications, such as machine translation, information aggregation systems, internet search and more. It involves utilising sequence-to-sequence modelling neural architectures to render a person’s name in a different language, adhering to its spelling canons. This dissertation aims to shed light on this approach by carefully analysing the effect that different data pre-processing procedures and model architectures have on the end-result. The author experimentally verifies various techniques and proposes a set of recommendations to foster a creation of the state-of-the-art solution. In doing so, the author builds models that outperform some previous attempts at the task.
Databáze: OpenAIRE