Hybrid recognition technology for Lithuanian voice commands
Autor: | Žekienė, Gintarė |
---|---|
Přispěvatelé: | Ratkevičius, Kastytis |
Jazyk: | angličtina |
Rok vydání: | 2021 |
Předmět: | |
Popis: | It is well known that speech recognition-based interfaces could have great value in many applications. In recent years, speech recognition technologies have been widely applied throughout information technologies. Therefore, the application of speech recognition in information technologies is an extensively explored area. Systems for the recognition of the spoken language are applied in various areas. The goal of this thesis is to create a hybrid recognition technology for Lithuanian voice commands that connects two or more speech recognizers. It is expected that, as a result of connecting different recognizers, if one recognizer makes a mistake then another/others will make the correct decision. The results of this research could be applied and used in the development of ASR systems for applications involving the recognition of disease names according to their codes (using ICD-10-CM), consisting of one letter and several digits. Examples of codes containing only digits that could be recognized include PIN, personal identification codes, etc. Another potential application is the recognition of codes containing only digits through the telephone. Šnekamoji kalba yra kasdienio bendravimo priemonė. Sparčiai tobulėjant technologijoms ir joms užimant vis svarbesnę vietą kasdienėje žmonių veikloje, tampa labai aktualu pritaikyti technologijas taip, kad būtų įmanoma jas valdyti žmonėms pačiu priimtiniausiu būdu – balsu. Todėl pagrindinis automatinio šnekos atpažinimo sistemų kūrėjų ir tobulintojų tikslas yra sukurti technologijas, kurios galėtų girdėti, suprasti ir veikti pagal balsu gautą informaciją. Pastaruoju metu šnekos atpažinimo technologijos yra plačiai taikomos informacinėse technologijose. Todėl šnekos atpažinimo priemonių ir metodų pritaikymas informacinėse technologijose yra viena labiausiai tyrinėjamų sričių. Disertacijos tikslas – sukurti hibridinę lietuviškų balso komandų atpažinimo technologiją sujungiant du ar daugiau šnekos atpažintuvų. Tikimasi, jog tuo atveju, kai vienas iš sujungtų atpažintuvų suklys, kitas ar kiti priims teisingą sprendimą. Pasirinktas hibridinio atpažintuvo taikymas – iš raidžių ir skaitmenų sudarytų kodų atpažinimas per mikrofoną, taip pat skaitmenų kodo atpažinimas per telefoną. Disertacijos tyrimų rezultatai galėtų būti naudojami kuriant lietuvių kalbos automatinio šnekos atpažinimo sistemas, paremtas kodų atpažinimu. Kodai, sudaryti iš raidžių ir skaitmenų, galėtų būti panaudoti ligų pavadinimams (TLK-10-AM), prekių kodams, PIN kodams ir kt. atpažinti per mikrofoną. Taip pat taikytinas iš skaičių sudarytų kodų atpažinimas per telefoną ir mikrofoną. |
Databáze: | OpenAIRE |
Externí odkaz: |