Annotation de la temporalité en corpus : contribution à l'amélioration de la norme TimeML

Autor: Lefeuvre, Anaïs, Antoine, Jean-Yves, Savary, Agata, Schang, Emmanuel, Abouda, Lotfi, Maurel, Denis, Eshkol, Iris
Přispěvatelé: Bases de données et traitement des langues naturelles (BDTLN), Laboratoire d'Informatique Fondamentale et Appliquée de Tours (LIFAT), Centre National de la Recherche Scientifique (CNRS)-Université de Tours-Institut National des Sciences Appliquées - Centre Val de Loire (INSA CVL), Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Centre National de la Recherche Scientifique (CNRS)-Université de Tours-Institut National des Sciences Appliquées - Centre Val de Loire (INSA CVL), Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA), Laboratoire Ligérien de Linguistique (LLL), Bibliothèque nationale de France (BnF)-Université d'Orléans (UO)-Université de Tours-Centre National de la Recherche Scientifique (CNRS), Université d'Orléans (UO)-Université de Tours, MSH Val de Loire, ATALA, TEMPORAL, Antoine, Jean-Yves, Université de Tours (UT)-Institut National des Sciences Appliquées - Centre Val de Loire (INSA CVL), Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Centre National de la Recherche Scientifique (CNRS)-Université de Tours (UT)-Institut National des Sciences Appliquées - Centre Val de Loire (INSA CVL), Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Centre National de la Recherche Scientifique (CNRS), Université d'Orléans (UO)-Université de Tours (UT)
Jazyk: francouzština
Rok vydání: 2014
Předmět:
Zdroj: Actes de TALN-RECITAL 2014
21ème Conférence Traitement Automatique du Langage Naturel (TALN 2014 )
21ème Conférence Traitement Automatique du Langage Naturel (TALN 2014 ), Jul 2014, Marseille, France. pp.O-L1.3
Conférence TALN'2014
TALN'2014
TALN'2014, Jul 2014, Marseille, France. pp.F14-2029
Popis: This paper reports a critical analysis of the TimeML standard, in the light of a temporal annotation that was conducted on spoken French. It shows that the norm suffers from weaknesses that must be corrected to fit the needs of NLP and corpus linguistics. These limitations concern mainly 1) the separation of different levels of linguistic annotation, 2) the delimitation in the text of the events, and 3) the absence of a bridging temporal relation in the norm.
Cet article propose une analyse critique de la norme TimeML à la lumière de l'expérience d'annotation temporelle d'un corpus de français parlé. Il montre que certaines adaptations de la norme seraient conseillées pour répondre aux besoins du TAL et des sciences du langage. Sont étudiées ici les questions de séparation des niveaux d'annotation, de délimitation des éventualités dans le texte et de l'ajout d'une relation temporelle de type associative.
Databáze: OpenAIRE