Lithuanian speech recognition in iOS devices

Autor: Sabaliauskas, Darius
Přispěvatelé: Maskeliūnas, Rytis, Rudžionis, Vytautas, Dzemyda, Gintautas, Maciulevičius, Stasys, Barauskas, Rimantas, Damaševičius, Robertas, Misevičius, Alfonsas, Palubeckis, Gintaras, Plėštys, Rimantas, Ostreika, Armantas, Kaunas University of Technology
Jazyk: litevština
Rok vydání: 2014
Předmět:
Popis: Šiuolaikiniame pasaulyje vis daugiau žmonių naudoja išmaniuosius telefonus, kurie perima vis daugiau su kompiuterio atliekamo darbo (el. pašto tikrinimas, apsipirkimas internetu ir t.t.). Šiuose įrenginiuose vis daugiau funkcijų galima atlikti balsu (atidaryti programėles ir kt.), tačiau kol kas tik anglų ir keletu kitų kalbų. Todėl šiame darbe bus nagrinėjamas lietuvių kalbos atpažinimo uždavinys iOS platformai (viena iš pagrindinių išmaniųjų telefonų ir planšetinių kompiuterių platformų), kuri yra naudojama mobiliuose Apple įrenginiuose. Šiame darbe nagrinėjamas CMU Sphinx ir Julius bibliotekų panaudojimas iOS įrenginiuose atpažįstant lietuvių kalbą. Tyrimui buvo sukurtas LSR karkasas paslepiantis CMU Sphinx ir Julius bibliotekų realizacijos ypatumus po Objective-C kalbos sąsaja. Tyrimui buvo naudojamas skaičių nuo 0 iki 9 garsynas ir analizuota, koks atpažinimo tikslumas ir greitaveika yra su tokiu nedideliu 10 žodžių žodynu atpažįstant pavienius skaičius.
Nowadays more and more people use smartphones which replaces more word done with personal computer (e-mail checking, e-shopping, etc.). In these devices more and more functions could be done with voice (open apps and other), but still only in english and some other languages. Therefore, in out work we will investigate Lithuanian speech recognition task in iOS (one of the major smartphones and tablets platforms), which runs in Apple's mobile devices. In this work we investigate CMU Sphinx and Julius libraries use in iOS devices for Lithuanian speech recognition. For this task LSR framework was created which encapsulated CMU Sphinx and Julius realisation nuances under Objective-C interfaces. Experiments were performed with numbers from 0 to 9 corpus and recognition accuracy and speed were investigated.
Databáze: OpenAIRE