Skaičių garsyno atpažinimo su Kaldi paketu sistemos sukūrimas ir tyrimas

Autor: Sinkevičius, Giedrius
Přispěvatelé: Ratkevičius, Kastytis
Jazyk: litevština
Rok vydání: 2019
Předmět:
Popis: Darbo tikslas - išnagrinėti Kaldi paketo pritaikymo ir funkcijų galimybes automatinio kalbos atpažinimo sistemose. Eksperimentams buvo pasirinktas plačiausiai naudojamas garso įrašų rinkinys SKAIC30 – 30 diktorių balso įrašai su lietuviškų skaičių nuo 0 iki 9 komandų ištarimais, kuris buvo išplėstas iki 100 diktorių balso įrašų su 5dB foniniu triukšmu. Baigiamajame darbe pateikiamas palyginimas su HTK programinio paketo gaunamais rezultatais, naudojant 30 diktorių balso įrašus. Tolimesniems tyrimams naudojamas 100 diktorių garsynas su foniniu 5dB triukšmu, nagrinėjama, kuriuo kalbos atpažinimo metodu – monofoninu, trifoniniu, LDA+MLLT, LDA+MLLT+SAT, SGMM, DNN - gaunama mažiausia atpažinimo paklaida.
Purpose of this project is to analyze Kaldi toolkit possibilities in automatic speech recognition researches. The most widely audio collection was used, named SKAIC30 - 30 speakers voice recordings with Lithuanian numbers from 0 to 9, which was expanded to 100 speakers voice recordings with 5dB background noise. The final work presents a comparison with the results of the HTK software package using 30 voice recorders. For further research, a 100 speakers voice recordings with 5dB background noise was used, in order to check which method of the following: monophone, triphone, LDA+MLLT, LDA+MLLT+SAT, SGMM, DNN provides the most accurate results for automatic speech recognition system.
Databáze: OpenAIRE