Modeli strojnog učenja za klasifikaciju glazbenih žanrova na skupu podataka AudioSet

Autor: Polanec, Maja
Přispěvatelé: Bagić Babac, Marina
Jazyk: angličtina
Rok vydání: 2023
Předmět:
Popis: Ova teza se bavi problemom klasifikacije glazbenih žanrova pomoću nadziranog strojnog učenja. Klasificirani žanrovi su pop, rock, hip-hop, vokal, reggae, R&B i techno. Za obuku i testiranje modela koristi se skup podataka AudioSet. Audio značajke iz vremenske i frekvencijske domene su inženjerski oblikovane i proslijeđene 6 različitim modelima: logistička regresija, stablo odlučivanja, slučajne šume, podržani vektori, XGBoost i naivni Bayes. Performanse modela se evaluiraju koristeći različite metrike evaluacije: točnost, matrica konfuzije, F1-ocjena i ROC-krivulja. This thesis deals with the problem of classifying music genres using supervised machine learning. Genres classified are pop, rock, hip-hop, vocal, reggae, R&B and techno. AudioSet dataset is used for training and testing models. Audio features from both time and frequency domain are engineered and fed to 6 different models: logistic regression, decision tree, random forests, support vector machine, XGBoost and naïve Bayes. Model performances are evaluated using different evaluation metrics: accuracy, confusion matrix, F1-score and ROC-curve.
Databáze: OpenAIRE