Zgoščena predstavitev slovarjev izgovarjav s končnimi super pretvorniki
Autor: | Jerneja Gros, Simon Dobrišek, Boštjan Vesnicer, Žiga Golob, Mario Žganec |
---|---|
Rok vydání: | 2017 |
Předmět: |
Linguistics and Language
sinteza govora Computer science Speech recognition Speech synthesis Finite state transducer Pronunciation končni pretvorniki Lexicon computer.software_genre Language and Linguistics Allophone lcsh:Philology. Linguistics Transducer lcsh:P1-1091 Transcription (linguistics) slovar izgovarjav Minification computer |
Zdroj: | Slovenščina 2.0: Empirične, aplikativne in interdisciplinarne raziskave, Vol 4, Iss 1 (2017) |
ISSN: | 2335-2736 |
DOI: | 10.4312/slo2.0.2016.1.79-96 |
Popis: | Računalniški modeli končnih pretvornikov omogočajo zgoščeno predstavitev slovarjev izgovarjav, ki jih uporabljajo tako sintetizatorji govora kot tudi razpoznavalniki govora. V članku je predstavljen nov tip končnih pretvornikov, t. i. končni super pretvorniki, s katerimi lahko slovarje izgovarjav predstavimo z manjšim številom stanj in prehodov kot z uporabo običajnih minimalnih determinističnih končnih pretvornikov. Predstavljen je učinkovit postopek gradnje končnih super pretvornikov, ki ohranjajo svojo determinističnost, poleg besed iz danega slovarja izgovarjav pa lahko sprejmejo in pretvorijo tudi nekatere druge besede, ki niso bile zastopane v izvirnem slovarju. Oddani izhodni fonetični prepisi za določene sprejete izvenslovarske besede so sicer lahko napačni, vendar se izkaže, da je napaka pri pretvorbi primerljiva z napakami, ki jih dosegajo trenutno najboljše metode za samodejno grafemsko-fonemsko pretvorbo besed za slovenski jezik. Za preizkus in preverjanje predlaganega postopka gradnje končnih super pretvornikov je bil uporabljen slovar izgovarjav SI-PRON za slovenski jezik, ki vsebuje več kot milijon različnih slovarskih vnosov. Rezultati poskusov so med drugim podali presenetljivo ugotovitev, da se velikost končnih pretvornikov z naraščanjem obsega slovarja prek določenega števila besed prične zmanjševati, kar pripisujemo predvsem velikemu številu pregibnih oblik besed v slovenščini. |
Databáze: | OpenAIRE |
Externí odkaz: |