Intérêt des modèles de caractères pour la détection d'événements

Autor:	Emanuela Boros, Romaric Besançon, Olivier Ferret, Brigitte Grau
Přispěvatelé:	Université de La Rochelle (ULR), Laboratoire d'Intégration des Systèmes et des Technologies (LIST), Direction de Recherche Technologique (CEA) (DRT (CEA)), Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA), LIMSI, CNRS, ENSIIE, Université Paris-Saclay, Denis, Pascal, Grabar, Natalia, Fraisse, Amel, Cardon, Rémi, Jacquemin, Bernard, Kergosien, Eric, Balvet, Antonio, La Rochelle Université (ULR), Laboratoire d'Intégration des Systèmes et des Technologies (LIST (CEA)), Laboratoire d'Informatique pour la Mécanique et les Sciences de l'Ingénieur (LIMSI), Université Paris-Saclay-Centre National de la Recherche Scientifique (CNRS), Parmentier, Yannick
Jazyk:	francouzština
Rok vydání:	2021
Předmět:	[INFO.INFO-CL] Computer Science [cs]/Computation and Language [cs.CL] plongements lexicaux Extraction d’information événements [INFO.INFO-CL]Computer Science [cs]/Computation and Language [cs.CL]
Zdroj:	Actes de la 28e Conférence sur le Traitement Automatique des Langues Naturelles. Volume 1 : conférence principale Traitement Automatique des Langues Naturelles Traitement Automatique des Langues Naturelles, 2021, Lille, France. pp.179-188 HAL
Popis:	French: Cet article aborde la tâche de détection d’événements, visant à identifier et catégoriser les mentions d’événements dans les textes. Une des difficultés de cette tâche est le problème des mentions d’événements correspondant à des mots mal orthographiés, très spécifiques ou hors vocabulaire. Pour analyser l’impact de leur prise en compte par le biais de modèles de caractères, nous proposons d’intégrer des plongements de caractères, qui peuvent capturer des informations morphologiques et de forme sur les mots, à un modèle convolutif pour la détection d’événements. Plus précisément, nous évaluons deux stratégies pour réaliser une telle intégration et montrons qu’une approche de fusion tardive surpasse à la fois une approche de fusion précoce et des modèles intégrant des informations sur les caractères ou les sous-mots tels que ELMo ou BERT. English: This paper tackles the task of event detection that aims at identifying and categorizing event mentions in texts. One of the difficulties of this task is the problem of event mentions corresponding to misspelled, custom, or out-of-vocabulary words. To analyze the impact of character-level features, we propose to integrate character embeddings, which can capture morphological and shape information about words, to a convolutional model for event detection. More precisely, we evaluate two strategies for performing such integration and show that a late fusion approach outperforms both an early fusion approach and models integrating character or subword information such as ELMo or BERT.
Databáze:	OpenAIRE
Externí odkaz:	https://explore.openaire.eu/search/publication?articleId=doi_dedup___::62ca00de1aa97273eab986d6ff04adaa https://hal.archives-ouvertes.fr/hal-03265875/document Zobrazit plný text záznamu