Equalization Parameter Estimation Using : Convolutional Neural Networks

Autor: van Dyck, Tim
Jazyk: angličtina
Rok vydání: 2023
Předmět:
Popis: Die Equalization ist ein essentieller Bestandteil der Musikproduktion und der Tontechnik und ermöglicht die Anpassung der Frequenzverteilung von Audiosignalen, um einen gewünschten Klang zu erzielen. Jedoch ist die Meisterung dieser mit viel Aufwand verbunden. In dieser Arbeit präsentieren wir eine Methode zur Approximierung von Equalizer-Parametern mithilfe von Convolutional Neural Networks (CNNs) am Beispiel des Equalizer FabFilter Pro-Q 3. Ein Datensatz von Paaren bestehend aus equalisierten und un-equalisierten Audiosignalen wird erstellt und verwendet, um mehrere CNN-Modelle mit verschiedenen Arten von Input Features zu trainieren. Die Leistung der Modelle wird anschließend anhand von spektralen LossMetriken evaluiert. Unsere Ergebnisse zeigen, dass die Verwendung von normalisierten Log. Amplituden Spektrogrammen und Mel-Spektrogrammen als Input Features zu sehr genauen Approximationen von Equalizer-Parametern führen, wobei nur kaum hörbare Unterschiede auftreten. Mögliche zukünftige Anwendungen dieser Methode könnten in komplexeren SoundMatching-Aufgaben liegen, wie zum Beispiel in der Schätzung von Synthesizer-Parametern aus einem Audiosignal. Künstliche Intelligenz basierte Sound-Matching-Techniken könnten sich als geeignetes Werkzeuge zur Vereinfachung des Musikproduktionsprozesses erweisen und damit die Musikproduktion noch zugänglicher machen. Equalization is an essential component of music production and sound engineering, allowing for the adjustment of the frequency balance in an audio signal to achieve a desired sound. The process of mastering equalization tools, however, can be time-consuming and requires a significant investment of effort. In this thesis, we present a method for estimating equalization parameters using Convolutional Neural Networks (CNNs), specifically focusing on the FabFilter Pro-Q 3 equalizer. A data-set of pairs of equalized and un-equalized audio signals was created and used to train multiple CNN models using different types of input features. The performance of the models was then evaluated using spectral loss metrics. Our results show that the use of normalized log amplitude spectrograms and Mel spectrograms as input features resulted in highly accurate predictions of equalization parameters, with only barely audible errors. Possible future applications of this method could lie in more complex sound matching tasks, such as the estimation of synthesizer parameters form an audio signal. AI based sound matching techniques could prove to be viable tools in streamlining the music production process and thus making the creation of music even more accessible.
Databáze: OpenAIRE