Voice spoofing characterization for speaker verification purposes based on wavelet transform and paraconsistent feature analysis

Autor: Furlan, André
Přispěvatelé: Universidade Estadual Paulista (Unesp), Guido, Rodrigo Capobianco [UNESP]
Jazyk: portugalština
Rok vydání: 2021
Předmět:
Zdroj: Repositório Institucional da UNESP
Universidade Estadual Paulista (UNESP)
instacron:UNESP
Popis: Submitted by André Furlan (andre.furlan@unesp.br) on 2021-09-13T04:11:07Z No. of bitstreams: 1 monografia.pdf: 3274652 bytes, checksum: ec8019ff69dcfb4f3403678fa86ee2dd (MD5) Rejected by Elza Mitiko Sato null (elzasato@ibilce.unesp.br), reason: Solicitamos que realize correções na submissão seguindo as orientações abaixo: 01 - Solicitamos corrigir a formatação da CAPA conforme o template. Sugerimos que siga as orientações do template para as correções, na página da Biblioteca, link: https://www.ibilce.unesp.br/#!/biblioteca/servicos-oferecidos/normalizacao/estrutura-do-trabalho-academico/ Não é necessário colocar Instituto de Biociências, Letras e Ciências Exatas da Universidade Estadual Paulista ”Júlio de Mesquita Filho”, Campus de São José do Rio Preto na CAPA. 02 – No rodapé da CAPA E FOLHA DE ROSTO colocar (sem o –SP): São José do Rio Preto 2021 03 – Na FOLHA DE ROSTO não é necessário colocar Instituto de Biociências, Letras e Ciências Exatas da Universidade Estadual Paulista ”Júlio de Mesquita Filho”, Campus de São José do Rio Preto, pois já consta na Natureza da Pesquisa. 04 – Solicitamos que você corrija a formatação da FOLHA DE APROVAÇÃO conforme o template: nome por extenso, titulação dos componentes da banca examinadora e instituições a que pertencem, e devem constar apenas os membros titulares. Ex: Comissão examinadora Prof. Dr. Rodrigo Capobianco Guido UNESP – Câmpus de São José do Rio Preto Orientador Prof. Dr. Aleardo Manacero Jr UNESP – Câmpus de São José do Rio Preto Prof. Dr. Henrique Dezani FATEC – São José do Rio Preto Obs: Não há necessidade de colocar “Trabalho: Aprovado” 05 – No rodapé da FOLHA DE APROVAÇÃO colocar : São José do Rio Preto 25 de agosto de 2021 06 - Segundo a norma ABNT NBR 10520, a epígrafe é uma citação e deve ser referenciada. 07 - Resumos: a correta grafia é Keywords, iniciar cada palavra-chave (português e inglês) com maiúscula e separa-las com ponto. 08 - Observamos que na ficha catalográfica você selecionou a formatação em páginas? Caso seja em páginas observar a margem, as margens devem ser: para o anverso, esquerda e superior de 3 cm e direita e inferior de 2 cm; para o verso, direita e superior de 3 cm e esquerda e inferior de 2 cm. Agora caso a impressão seja em folhas apenas corrija na ficha (f). 09 – No seu trabalho as indicações da figuras na Lista de ilustrações e também o Sumário estão escritos na cor azul, é realmente necessário que seja destacado ? Pois conforme a ABNT 14724: 5 Regras gerais A apresentação de trabalhos acadêmicos deve ser elaborada conforme 5.1 a 5.9. 5.1 Formato Os textos devem ser digitados ou datilografados em cor preta, podendo utilizar outras cores somente para as ilustrações. 10 - Ilustrações e tabelas: a norma orienta que devem ter a descrição da fonte abaixo delas, mesmo que seja produção do autor. (ABNT NBR 14724). 11 – Falta colocar o título na figura 6 da folha 51. Sugerimos que siga as orientações do template para as correções, na página da Biblioteca, link: https://www.ibilce.unesp.br/#!/biblioteca/servicos-oferecidos/normalizacao/estrutura-do-trabalho-academico/ Lembramos que o arquivo depositado no Repositório deve ser igual ao impresso, o rigor com o padrão da Universidade se deve ao fato de que o seu trabalho passará a ser visível mundialmente. Agradecemos a compreensão. on 2021-09-13T20:46:20Z (GMT) Submitted by André Furlan (andre.furlan@unesp.br) on 2021-09-15T15:54:35Z No. of bitstreams: 1 monografia.pdf: 3269943 bytes, checksum: 5f89679ca1d82152239be803a0e88484 (MD5) Approved for entry into archive by Elza Mitiko Sato null (elzasato@ibilce.unesp.br) on 2021-09-16T12:47:23Z (GMT) No. of bitstreams: 1 furlan_a_me_sjrp.pdf: 3269943 bytes, checksum: 5f89679ca1d82152239be803a0e88484 (MD5) Made available in DSpace on 2021-09-16T12:47:23Z (GMT). No. of bitstreams: 1 furlan_a_me_sjrp.pdf: 3269943 bytes, checksum: 5f89679ca1d82152239be803a0e88484 (MD5) Previous issue date: 2021-08-25 Voice spoofing é uma estratégia genérica utilizada para burlar sistemas de autenticação biométrica baseados em identificação por voz. Dentre as diversas possibilidades específicas, os ataques do tipo playback speech são os que têm recebido considerável atenção da comunidade científica. Assim, por meio da decomposição dos sinais de voz com wavelets e posterior análise das respectivas sub-bandas espectrais BARK e MEL, este trabalho dedica-se a determinar qual a melhor combinação BARK/MEL-wavelet para que se obtenha uma separação máxima entre duas classes: Locuções genuínas e falseadas. Após a apuração da melhor combinação de descritores, realizada por meio da Análise Paraconsistente, os vetores de características oriundos dos sinais de voz são submetidos a ensaios de classificação, variando-se o tamanho do conjunto de treinamento e testes. Utilizando as distâncias Euclidiana e Manhattan, além de Máquinas de Vetores de Suporte (SVM), a acurácia máxima obtida foi de 99,7561% para uma base com 820 sinais, a qual considera-se como um resultado promissor frente àqueles existentes na literatura. Voice spoofing is a generic strategy designed to circumvent biometric systems based on voice identification. Among a diversity of specific possibilities, playback speech attacks have received considerable attention from the scientific community. Thus, based on speech signals decomposition with wavelets for subsequent BARK and MEL scales spectral analysis, this dissertation aims at determining the best filters and scales to optimally separate between two classes: Genuine and spoofed speech. Once the best combination of descriptors is obtained, based on Paraconsistent Engineering, the feature vectors are subjected to classification, varying the randomly chosen training and test sets in size. Euclidean and Manhattan distances, as well as Support Vector Machine (SVM), were used as classifiers, where the highest value of accuracy was 99.7561% for a dataset with 820 signals. This is a promising result, considering the state-of-the-art in the field.
Databáze: OpenAIRE