Modeli strojnog učenja za klasifikaciju glazbenih žanrova na skupu podataka AudioSet
Autor: | Polanec, Maja |
---|---|
Přispěvatelé: | Bagić Babac, Marina |
Jazyk: | angličtina |
Rok vydání: | 2023 |
Předmět: |
music genre
AudioSet logistic regression time domain TEHNIČKE ZNANOSTI. Računarstvo glazbeni žanr frequency domain stablo odluke AudioSet [strojno učenje] vremenska domena audio features machine learning logistička regresija slučajna šuma frekvencijska domena TECHNICAL SCIENCES. Computing decision tree naïve Bayes podržani vektori support vector machine naivan Bayes zvučne značajke random forest XGBoost |
Popis: | Ova teza se bavi problemom klasifikacije glazbenih žanrova pomoću nadziranog strojnog učenja. Klasificirani žanrovi su pop, rock, hip-hop, vokal, reggae, R&B i techno. Za obuku i testiranje modela koristi se skup podataka AudioSet. Audio značajke iz vremenske i frekvencijske domene su inženjerski oblikovane i proslijeđene 6 različitim modelima: logistička regresija, stablo odlučivanja, slučajne šume, podržani vektori, XGBoost i naivni Bayes. Performanse modela se evaluiraju koristeći različite metrike evaluacije: točnost, matrica konfuzije, F1-ocjena i ROC-krivulja. This thesis deals with the problem of classifying music genres using supervised machine learning. Genres classified are pop, rock, hip-hop, vocal, reggae, R&B and techno. AudioSet dataset is used for training and testing models. Audio features from both time and frequency domain are engineered and fed to 6 different models: logistic regression, decision tree, random forests, support vector machine, XGBoost and naïve Bayes. Model performances are evaluated using different evaluation metrics: accuracy, confusion matrix, F1-score and ROC-curve. |
Databáze: | OpenAIRE |
Externí odkaz: |