Modelos da lingua para o portugues do Brasil aplicados ao reconhecimento de fala continua

Autor: Pessoa, Luis Augusto de Sa
Přispěvatelé: Violaro, Fábio, 1950, Barbosa, Plinio Almeida, 1966, Universidade Estadual de Campinas. Faculdade de Engenharia Elétrica e de Computação, Programa de Pós-Graduação em Engenharia Elétrica, UNIVERSIDADE ESTADUAL DE CAMPINAS
Rok vydání: 2021
Předmět:
Zdroj: Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
Universidade Estadual de Campinas (UNICAMP)
instacron:UNICAMP
DOI: 10.47749/t/unicamp.1999.173861
Popis: Orientador: Fabio Violaro, Plinio A. Barbosa Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de Computação Resumo: o reconhecimento de fala contínua baseado somente em informações acústicas não proporciona bons resultados [Lippmann97]. Modelos da Língua podem ser usados para caracterizar, capturar e explorar as regularidades da língua natural, melhorando o desempenho do sistema de reconhecimento. Esta Tese apresenta o estudo e a implementação de Modelos da Língua para o português do Brasil. São propostos dois modelos bigram de classes de palavras (modelos lineares) e um modelo baseado em gramática independente de contexto (modelo hierárquico). Um dos modelos bigram emprega classificação manual de palavras (classes gramaticais) e o outro emprega classificação automática através do algoritmo Simulated Annealing. O modelo baseado em gramática foi desenvolvido com base em uma teoria de Gramática Gerativa [Chomsky65] e utiliza a Sintaxe Xbarra [Jackendoff77]. Os Modelos da Língua foram avaliados através de um sistema de reconhecimento de fala contínua dependente do locutor desenvolvido por Morais [Morais97]. Este trabalho também apresenta um algoritmo de decodificação, baseado no algoritmo LeveI Building [Rabiner*85], que leva em conta as restrições do Modelo da Língua durante o procedimento de busca Abstract: : Continuous speech recognition based only on acoustic information does not provide good results [Lippmann97]. Language Models can be used to characterize, capture and exploit the language regularities, improving the recognition system performance. This Thesis presents the study and implementation of Language Models for Brazilian Portuguese. Two word class bigram language models (linear models) and one model based on context-free grammar (hierarchical model) are proposed. One bigram model uses manual classification of words (grammatical classes) and the other one uses automatic classification performed by the Simulated Annealing algorithm. The grammar-based model is implemented employing a theory of Generative Grammar [Chomsky65] and uses the X-bar Syntax [Jackendoft77]. The Language Models are evaluated using a speaker dependent continuous speech recognition system developed by Morais [Morais97]. This work also presents a decoding algorithm, based on Level Building algorithm [Rabiner*85], which considers the Language Model constraints during the search procedure Mestrado Mestre em Engenharia Elétrica
Databáze: OpenAIRE