Natural language processing for music information retrieval : deep analysis of lyrics structure and content
Autor: | Fell, Michael |
---|---|
Přispěvatelé: | Web-Instrumented Man-Machine Interactions, Communities and Semantics (WIMMICS), Inria Sophia Antipolis - Méditerranée (CRISAM), Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria)-Scalable and Pervasive softwARe and Knowledge Systems (Laboratoire I3S - SPARKS), Laboratoire d'Informatique, Signaux, et Systèmes de Sophia Antipolis (I3S), Université Nice Sophia Antipolis (... - 2019) (UNS), COMUE Université Côte d'Azur (2015-2019) (COMUE UCA)-COMUE Université Côte d'Azur (2015-2019) (COMUE UCA)-Centre National de la Recherche Scientifique (CNRS)-Université Côte d'Azur (UCA)-Université Nice Sophia Antipolis (... - 2019) (UNS), COMUE Université Côte d'Azur (2015-2019) (COMUE UCA)-COMUE Université Côte d'Azur (2015-2019) (COMUE UCA)-Centre National de la Recherche Scientifique (CNRS)-Université Côte d'Azur (UCA)-Laboratoire d'Informatique, Signaux, et Systèmes de Sophia Antipolis (I3S), COMUE Université Côte d'Azur (2015-2019) (COMUE UCA)-COMUE Université Côte d'Azur (2015-2019) (COMUE UCA)-Centre National de la Recherche Scientifique (CNRS)-Université Côte d'Azur (UCA), Université Côte d'Azur, Elena Cabrio, Fabien Gandon, Université Nice Sophia Antipolis (1965 - 2019) (UNS), COMUE Université Côte d'Azur (2015-2019) (COMUE UCA)-COMUE Université Côte d'Azur (2015-2019) (COMUE UCA)-Centre National de la Recherche Scientifique (CNRS)-Université Côte d'Azur (UCA)-Université Nice Sophia Antipolis (1965 - 2019) (UNS), COMUE Université Côte d'Azur (2015 - 2019) (COMUE UCA)-COMUE Université Côte d'Azur (2015 - 2019) (COMUE UCA)-Centre National de la Recherche Scientifique (CNRS)-Université Côte d'Azur (UCA)-Université Nice Sophia Antipolis (... - 2019) (UNS), COMUE Université Côte d'Azur (2015 - 2019) (COMUE UCA)-COMUE Université Côte d'Azur (2015 - 2019) (COMUE UCA)-Centre National de la Recherche Scientifique (CNRS)-Université Côte d'Azur (UCA)-Laboratoire d'Informatique, Signaux, et Systèmes de Sophia Antipolis (I3S), COMUE Université Côte d'Azur (2015 - 2019) (COMUE UCA)-COMUE Université Côte d'Azur (2015 - 2019) (COMUE UCA)-Centre National de la Recherche Scientifique (CNRS)-Université Côte d'Azur (UCA), Université Côte D’Azur |
Jazyk: | angličtina |
Rok vydání: | 2020 |
Předmět: |
Reconnaissance des Emotions
Traitement Automatique des Langues Résumé du Texte [INFO.INFO-CL]Computer Science [cs]/Computation and Language [cs.CL] Segmentation de Texte Multimodalité [INFO.INFO-TT]Computer Science [cs]/Document and Text Processing Emotion Recognition Text Summarization Text Segmentation Lyrics Corpus Corpus des Paroles Classification de Texte Text Classification Multimodality Natural Language Processing |
Zdroj: | Document and Text Processing. Université Côte d'Azur, 2020. English. ⟨NNT : 2020COAZ4017⟩ Computation and Language [cs.CL]. Université Côte D’Azur, 2020. English |
Popis: | Applications in Music Information Retrieval and Computational Musicology have traditionally relied on features extracted from the music content in the form of audio, but mostly ignored the song lyrics. More recently, improvements in fields such as music recommendation have been made by taking into account external metadata related to the song. In this thesis, we argue that extracting knowledge from the song lyrics is the next step to improve the user’s experience when interacting with music. To extract knowledge from vast amounts of song lyrics, we show for different textual aspects (their structure, content and perception) how Natural Language Processing methods can be adapted and successfully applied to lyrics. For the structural aspect of lyrics, we derive a structural description of it by introducing a model that efficiently segments the lyrics into its characteristic parts (e.g. intro, verse, chorus). In a second stage, we represent the content of lyrics by means of summarizing the lyrics in a way that respects the characteristic lyrics structure. Finally, on the perception of lyrics we investigate the problem of detecting explicit content in a song text. This task proves to be very hard and we show that the difficulty partially arises from the subjective nature of perceiving lyrics in one way or another depending on the context. Furthermore, we touch on another problem of lyrics perception by presenting our preliminary results on Emotion Recognition. As a result, during the course of this thesis we have created the annotated WASABI Song Corpus, a dataset of two million songs with NLP lyrics annotations on various levels.; Les applications en Recherche d’Information Musicale et en musicologie computationnelle reposent traditionnellement sur des fonctionnalités extraites du contenu musical sous forme audio, mais ignorent la plupart du temps les paroles des chansons. Plus récemment, des améliorationsdans des domaines tels que la recommandation de musique ont été apportées en tenant compte des métadonnées externes liées à la chanson. Dans cette thèse, nous soutenons que l’extraction des connaissances à partir des paroles des chansons est la prochaine étape pour améliorerl’expérience de l’utilisateur lors de l’interaction avec la musique. Pour extraire des connaissances de vastes quantités de paroles de chansons, nous montrons pour différents aspects textuels (leur structure, leur contenu et leur perception) comment les méthodes de Traitement Automatique des Langues peuvent être adaptées et appliquées avec succès aux paroles. Pour l’aspect structurel des paroles, nous en dérivons une description structurelle en introduisant un modèle qui segmente efficacement les paroles en leurs parties caractéristiques (par exemple, intro, couplet, refrain).Puis, nous représentons le contenu des paroles en résumant les paroles d’une manière qui respecte la structure caractéristique des paroles. Enfin, sur la perception des paroles, nous étudions le problème de la détection de contenu explicite dans un texte de chanson. Cette tâche s’est avèreetrès difficile et nous montrons que la difficulté provient en partie de la nature subjective de la perception des paroles d’une manière ou d’une autre selon le contexte. De plus, nous abordons un autre problème de perception des paroles en présentant nos résultats préliminaires sur la reconnaissance des émotions. L’un des résultats de cette thèse a été de créer un corpus annoté, le WASABI Song Corpus, un ensemble de données de deux millions de chansons avec des annotations de paroles TAL à différents niveaux. |
Databáze: | OpenAIRE |
Externí odkaz: |