Speech signal analysis for emotion recognition using semantic representation

Autor: Silva, Victor Gabriell Ribeiro da
Přispěvatelé: Montalvão Filho, Jugurta Rosa
Jazyk: portugalština
Rok vydání: 2022
Předmět:
Zdroj: Repositório Institucional da UFS
Universidade Federal de Sergipe (UFS)
instacron:UFS
Popis: Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES The interest in automatically analyzing human emotions has grown in recent years, mainly due to its possible applications in society. Over the last 20 years, several works were proposed in order to extract features in speech signals capable of representing emotions. Most works use features associated to prosody and the spectrum of the speech signal. In this work, speech analysis methodologies are presented, exploring mainly pre-processing, feature extraction and classification techniques. Furthermore, a methodology based on semantic representation is used in order to obtain a non-linear mapping of the feature space. Then, it is possible to use the semantic representation to add complementary information and, consequently, increase the discrimination between the classes. The results obtained show that semantic representation is able to significantly increase the accuracy in the task of speech emotion recognition. O interesse em analisar automaticamente as emoções humanas tem crescido nos últimos anos, principalmente devido as suas possíveis aplicações na sociedade. Ao longo dos últimos 20 anos, diversos trabalhos foram propostos a fim de determinar características nos sinais de voz capazes de representar as emoções. A maior parte dos trabalhos utiliza atributos associados à prosódia e ao espectro do sinal de voz. Neste trabalho, são apresentadas metodologias de análise do sinal de voz, explorando principalmente as técnicas de pré-processamento, extração de características e classificação. Além disso, é utilizada uma metodologia baseada na representação semântica, a fim de obter um mapeamento não-linear do espaço de características que seja útil para acrescentar informações complementares, consequentemente, aumentando a discriminação entre as classes. Os resultados obtidos apontam que, quando ajustada adequadamente, a representação semântica é capaz de aumentar significativamente a acurácia da classificação de emoções expressadas em sinais de voz. São Cristóvão
Databáze: OpenAIRE