Perceptual encoding of audio through atomic decompositions in complex exponential
Autor: | Nogueira Junior, Valmir dos Santos |
---|---|
Přispěvatelé: | Tcheou, Michel Pompeu, ávila, Flávio Rainho, Haddad, Diego Barreto, Souza Filho, Joao Baptista de Oliveira e |
Jazyk: | portugalština |
Rok vydání: | 2018 |
Předmět: | |
Zdroj: | Biblioteca Digital de Teses e Dissertações da UERJ Universidade do Estado do Rio de Janeiro (UERJ) instacron:UERJ |
Popis: | Submitted by Boris Flegr (boris@uerj.br) on 2021-01-06T19:19:59Z No. of bitstreams: 1 Valmir dos Santos Nogueira Junior_ok.pdf: 2762981 bytes, checksum: cb869d3d8c86793912950cd8dd637d81 (MD5) Made available in DSpace on 2021-01-06T19:19:59Z (GMT). No. of bitstreams: 1 Valmir dos Santos Nogueira Junior_ok.pdf: 2762981 bytes, checksum: cb869d3d8c86793912950cd8dd637d81 (MD5) Previous issue date: 2018-08-16 The atomic decomposition of signals by algorithms of the class "Matching Pursuit" (MP) has been applied in audio compression. According to the literature, the use of psychoacoustic criteria allows a more compact representation of the signal, with minimal loss of perceived quality. This work describes a scheme of analysis by synthesis of audio signals using MP with direct use of the global psychoacoustic masking threshold, inspired by the MPEG layer I, in addition to Dictionaries of Complex Exponentials (DEC). For signal compression, we use the optimization rate-distortion via operating curves by adjusting the Lagrange multiplier. Its performance of representation is evaluated by an objective measure standardized by the ITU, the PEAQ, and by tests in terms of the number of coefficients needed for representation of signals with high-fidelity. A decomposição atômica de sinais por algoritmo da classe Matching Pursuit (MP) vem sendo aplicada à compressão de áudio. De acordo com a literatura, identificamos que se pode utilizar critérios psicoacústicos, o que possibilitaria uma representação mais compacta do sinal, sem perda de qualidade percebida. Este trabalho descreve uma implementação de um esquema de análise por síntese de sinais de áudio utilizando MP associado ao uso de limiar de mascaramento global psicoacústico, inspirado na camada I do MPEG, além de Dicionários de Exponenciais Complexas (DEC). Para a compressão do sinal utiliza-se a otimização taxa-distorção por curvas operacionais ajustando-se o multiplicador de Lagrange. O desempenho da representação para diversas famílias de sinais é avaliado por uma medida objetiva padronizada pelo ITU, o PEAQ, e através de testes em termos do número de coeficientes necessários para representação do sinal com fidelidade. |
Databáze: | OpenAIRE |
Externí odkaz: |