Uso de una red de segmentación para la separación de fuentes sonoras desde un procesador Linux embedido
Autor: | Andreu Pujol, Carles |
---|---|
Přispěvatelé: | Universitat Politècnica de Catalunya. Departament d'Enginyeria Electrònica, Gago Barrio, Javier, López Palma, Manuel |
Jazyk: | Spanish; Castilian |
Rok vydání: | 2022 |
Předmět: |
Signal processing
Tensorflow Aprendizaje Profundo Noise control Enginyeria de la telecomunicació::Processament del senyal::Processament de la parla i del senyal acústic [Àrees temàtiques de la UPC] Procesamiento Digital de Audio Segmentación Soroll--Control Separación de Fuentes Tractament del senyal Filtrado de Señal Aprenentatge profund |
Popis: | Un dels majors problemes en la creació de contingut audiovisual es el soroll, però existeixen noves tecnologies amb la capacitat d'aprendre i adaptar-se per eliminar-lo. Així doncs, en aquest projecte es valora l'ús d'una arquitectura U-Net (Deep Learning), dissenyada per la segmentació d'imatges, com a solució a un problema de neteja de soroll dins l'àmbit audiovisual, generant una xarxa capaç d'aprendre amb dades pròpies les característiques d'una font. Analitzant exemples preexistents, es detallen les funcions i característiques que fan que una xarxa neuronal sigui capaç de reconèixer una font i aïllar-la d'una mescla o senyal sorollosa. D'aquesta manera, es pot analitzar la seva funcionalitat i possibles aplicacions en produccions en viu. Uno de los problemas más grandes de la generación de contenido audiovisual es el ruido, pero existen nuevas tecnologías capaces de aprender y adaptarse para eliminarlo. Así pues, en este proyecto se valora el uso de una arquitectura U-Net (Deep Learning), diseñada para la segmentación de imágenes, como solución a un problema de limpieza de ruido en el ámbito audiovisual, generando una red capaz de aprender con datos propios las características de una fuente. Analizando ejemplos preexistentes, se detallan las funciones y características que hacen que una red neuronal sea capaz de reconocer una fuente y aislarla de una mezcla o señal ruidosa. De esta manera se puede analizar su funcionalidad y posibles aplicaciones en producciones en vivo. One of the greatest problems faced in audiovisual productions is the existence of noise, but there are new technologies able to learn and adapt to delete it. Therefore, this project evaluates the use of a U-Net architecture (Deep Learning), created as an image segmentation tool, as a solution to clean noise from a signal on audiovisual applications, creating a network able to learn from a user-created database the characteristics of a source. Analyzing previous examples, this project explains the functions and characteristics which make a neural network able to recognize a source and separate it from a mix or noisy signal. This way, being able to analyze its functionality and possible applications in live productions. |
Databáze: | OpenAIRE |
Externí odkaz: |