Přispěvatelé: |
MEthodes et ingénierie des Langues, des Ontologies et du DIscours (IRIT-MELODI), Institut de recherche en informatique de Toulouse (IRIT), Université Toulouse 1 Capitole (UT1), Université Fédérale Toulouse Midi-Pyrénées-Université Fédérale Toulouse Midi-Pyrénées-Université Toulouse - Jean Jaurès (UT2J)-Université Toulouse III - Paul Sabatier (UT3), Université Fédérale Toulouse Midi-Pyrénées-Centre National de la Recherche Scientifique (CNRS)-Institut National Polytechnique (Toulouse) (Toulouse INP), Université Fédérale Toulouse Midi-Pyrénées-Université Toulouse 1 Capitole (UT1), Université Fédérale Toulouse Midi-Pyrénées, Université Toulouse III - Paul Sabatier (UT3), Laboratoire d'Informatique pour la Mécanique et les Sciences de l'Ingénieur (LIMSI), Université Paris Saclay (COmUE)-Centre National de la Recherche Scientifique (CNRS)-Sorbonne Université - UFR d'Ingénierie (UFR 919), Sorbonne Université (SU)-Sorbonne Université (SU)-Université Paris-Saclay-Université Paris-Sud - Paris 11 (UP11), Université Paris-Saclay, Multimedia, InfoRmation systems and Advanced Computing Laboratory (MIRACL), Faculté des Sciences Economiques et de Gestion de Sfax (FSEG Sfax), Université de Sfax - University of Sfax-Université de Sfax - University of Sfax, Université de Versailles Saint-Quentin-en-Yvelines (UVSQ), Farah Benamara, IRIT, Université de Toulouse, Cyril Grouin, LIMSI, CNRS, Université Paris-Saclay, Jihen Karoui, IRIT, Université de Toulouse, Véronique Moriceau, LIMSI, CNRS, Univ. Paris-Sud, Université Paris-Saclay, Isabelle Robba, LIMSI, CNRS, UVSQ, Université Paris-Saclay, Benamara, Farah, Cyril Grouin, Jihen Karoui, Véronique Moriceau, IsabelleRobba, Grélaud, Françoise, Université Paris-Sud - Paris 11 (UP11)-Sorbonne Université - UFR d'Ingénierie (UFR 919), Sorbonne Université (SU)-Sorbonne Université (SU)-Université Paris-Saclay-Centre National de la Recherche Scientifique (CNRS)-Université Paris Saclay (COmUE) |
Popis: |
International audience; Préface : L’analyse des sentiments est un domaine de recherche extrêmement actif en traitement automatique des langues. En effet, ces dernières années ont vu se multiplier les sources de données textuelles porteuses d’opinion disponibles sur le web. Devant cette abondance de données et de sources, l’automatisation de la synthèse des multiples avis devient cruciale pour obtenir efficacement une vue d’ensemble des opinions sur un sujet donné. Globalement, les systèmes actuels ont obtenu de bons résultats sur la classification automatique du caractère subjectif ou objectif d’un document (Liu, 2015) En revanche, les résultats sur la tâche d’analyse de polarité restent encore peu concluants. La raison principale de cet échec est l’incapacité des algorithmes actuels à comprendre toutes les subtilités du langage humain. Parmi ces subtilités, nous nous focalisons sur le langage figuratif. Contrairement au langage littéral, le langage figuratif détourne le sens propre pour lui conférer un sens dit figuré ou imagé, comme l’ironie, le sarcasme, l’humour, la métaphore ou encore les jeux de mots. La détection automatique du langage figuratif est un sujet de recherche extrêmement actif principalement en raison de son importance pour améliorer les performances des systèmes d’analyse d’opinions (Maynard and Greenwood 2014 ; Ghosh et al. 2015, Benamara et al, 2017). Pour ce défi,nous nous intéressons en particulier à l’ironie, au sarcasme et à l’humour.L’ironie est un phénomène complexe largement étudié en philosophie et en linguistique (Grice 1975 ; Sperber and Wilson 1981 ; Utsumi 1996). Globalement, l’ironie est définie comme une figure de rhétorique par laquelle on dit le contraire de ce qu’on veut faire comprendre. Par exemple, pour exprimer une opinion négative envers son téléphone portable, on peut utiliser une forme littérale ("Ce téléphone est un désastre") ou alors une forme imagée ("Quel super téléphone !"). En linguistique computationnelle, l’ironie est un terme générique employé pour désigner un ensemble de phénomènes figuratifs incluant le sarcasme, même si ce dernier s’exprime avec plus d’aigreur et d’agressivité (Clift 1999). La détection du langage figuratif et son rôle dans l’analyse de sentiment a fait l’objet de plusieurs campagnes d’évaluation ces dernières années. Citons notamment la campagne SemEval 2015 Task11 (Ghosh et al. 2015) sur des tweets anglais et les campagnes SENTIPOLC@Evalita dans leurs éditions de 2014 et 2016 sur des tweets italiens (Basile et al., 2014 ; Barbieri et al., 2016). Grâce à cette édition de DEFT, nous mettons en place une 1ère campagne d’évaluation autour de ces thèmes pour le français. La tâche est ouverte aux équipes de recherche académiques et industrielles. |