Approches formelles de l'analyse du discours

Autor: Bernard, Timothée
Přispěvatelé: Semantic Analysis of Natural Language (SEMAGRAMME), Inria Nancy - Grand Est, Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria)-Department of Natural Language Processing & Knowledge Discovery (LORIA - NLPKD), Laboratoire Lorrain de Recherche en Informatique et ses Applications (LORIA), Centre National de la Recherche Scientifique (CNRS)-Université de Lorraine (UL)-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS)-Université de Lorraine (UL)-Institut National de Recherche en Informatique et en Automatique (Inria)-Laboratoire Lorrain de Recherche en Informatique et ses Applications (LORIA), Centre National de la Recherche Scientifique (CNRS)-Université de Lorraine (UL)-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS)-Université de Lorraine (UL), Laboratoire de Linguistique Formelle (LLF UMR7110), Université Paris Diderot - Paris 7 (UPD7)-Centre National de la Recherche Scientifique (CNRS), Université Sorbonne Paris Cité, Laurence Danlos, Philippe de Groote, Institut National de Recherche en Informatique et en Automatique (Inria)-Université de Lorraine (UL)-Centre National de la Recherche Scientifique (CNRS)-Institut National de Recherche en Informatique et en Automatique (Inria)-Université de Lorraine (UL)-Centre National de la Recherche Scientifique (CNRS)-Laboratoire Lorrain de Recherche en Informatique et ses Applications (LORIA), Institut National de Recherche en Informatique et en Automatique (Inria)-Université de Lorraine (UL)-Centre National de la Recherche Scientifique (CNRS)-Université de Lorraine (UL)-Centre National de la Recherche Scientifique (CNRS), Centre National de la Recherche Scientifique (CNRS)-Université Paris Diderot - Paris 7 (UPD7)
Jazyk: francouzština
Rok vydání: 2019
Předmět:
Zdroj: Informatique et langage [cs.CL]. Université Sorbonne Paris Cité, 2019. Français
Informatique et langage [cs.CL]. Université Sorbonne Paris Cité, 2019. Français. ⟨NNT : ⟩
Popis: This thesis focuses on the formalisms that make it possible to mathematically represent not only the meaning of independent sentences, but also whole texts, including the meaning relations that link sentences together. These links — the discourse relations — include temporal, causal and contrastive relations. Not only are we interested in meaning and its representation, but also on the algorithmic process of how this representation is computed using the sequence of words that constitute the text. We thus find ourselves at a point where three disciplines intersect: discourse analysis, formal semantics and computational linguistics.Most formal work on discourse pays little attention to reporting verbs (say, tell, etc.) and attitude verbs (think, believe, etc.). These verbs, henceforth ‘AVs’, all express the attitude or stance of one person on a given proposition. They are used frequently and introduce many subtleties that are not addressed in current theories. The main objective of this thesis is to shed light on the principles of a formal grammar that is compatible with discourse analysis that takes AVs into account. We therefore start by presenting a set of linguistic data illustrating the interactions between AVs and discourse relations.Adverbial connectives (then, for example, etc.) are usually considered anaphoric. One might wonder, however, whether, in practice, a computational linguistic system cannot deal with this particular category of anaphora as a kind of structural dependency, meaning that syntax is somehow extended above the sentence level. This is what we try to achieve using the D-STAG formalism. While it has properties that are relevant for automatic discourse analysis, such an approach imposes quite the burden on syntax. We therefore discuss the difficulties that this approach poses.Consequently, we develop an anaphor based approach, in which the arguments of discourse relations are not determined solely by the grammatical structures of the utterances. We use the same conceptual tools to account for the anaphoricity of adverbial connectives, the shape of non-tree discourse structures (observed for all type of connectives) but also the evidential use of AVs.If, however, we look at the notion of anaphora, our aim is to explicitly integrate it into our grammatical formalism. In particular, we set out to specify when anaphora resolution is performed and on which input. This is made possible by continuation semantics, which we use in conjunction with event semantics. Events have often been appealed to in order to describe the semantics of causal and temporal relations. Nevertheless, events raise a number of questions related to the possibility of some inference patterns that are observed, in addition to the presence of negation in the arguments of discourse relations. We suggest a number of potential answers and study the case of negation in more detail.We therefore review the issues facing event semantics when dealing with negation. Such issues concern both the syntax-semantics interface and the purely semantics level. We argue that these difficulties originate from the standard analysis of negation, which interprets positive and negative sentences is an essentially different fashion. Rejecting this view, we propose a novel formalisation of negative events that is relevant to the analysis of various linguistic phenomena.; Cette thèse s’intéresse aux formalismes qui permettent de représenter mathématiquement non seulement le sens de phrases indépendantes mais aussi de textes entiers, en incluant les liens de sens que les différentes phrases qui les composent entretiennent les unes avec les autres. Ces liens de sens — les relations discursives — sont divers ; nous trouvons notamment des relations temporelles, causales et contrastives. Nous ne nous posons pas seulement la question du sens et de sa représentation, mais aussi celle de la détermination algorithmique de cette représentation à partir des séquences de mots qui composent les énoncés. Nous nous situons donc à l’interface de trois traditions : l’analyse discursive, la sémantique formelle et la linguistique computationnelle.La plupart de travaux formels portant sur le discours ne prêtent que peu d’attention aux verbes de dire (affirmer, dire, etc.) et d’attitude propositionnelle (penser, croire, etc.). Tous ces verbes, que nous regroupons sous l’abréviation « VAP », ont en commun d’exprimer l’attitude ou la position d’une personne sur une proposition donnée. Ils sont utilisés fréquemment et introduisent de nombreuses subtilités échappant de fait auxthéories actuelles. Cette thèse a pour objectif principal de mettre à jour les principes d’une grammaire formelle compatible avec l’analyse du discours et prenant en compte les VAP. Nous commençons donc par présenter de nombreuses données linguistiques illustrant les interactions entre VAP et relations discursives.Il est souvent considéré que les connecteurs adverbiaux (ensuite, par exemple, etc.) sont anaphoriques. Cependant, nous pouvons nous demander si, en pratique, un système de linguistique computationnelle ne peut pas gérer cette catégorie particulière d’anaphore comme s’il s’agissait d’un type de dépendance structurelle, étendant d’une certaine manière la syntaxe au-delà de la phrase. C’est ce que nous nous proposons de faire à l’aide du formalisme D-STAG. Une telle approche, bien qu’ayant un certain nombre de propriétés intéressantes dans le cadre de l’analyse automatique du discours, fait peser un poids important sur la syntaxe, et nous discutons alors les difficultés qu’elle soulève.Cela nous amène à développer une approche anaphorique, c’est-à-dire dans laquelle les arguments des relations discursives ne sont plus déterminés uniquement par la structure grammaticale des énoncés. Ce sont les mêmes outils conceptuels que nous utilisons pour rendre compte de l’anaphoricité des connecteurs adverbiaux, des structures discursives non arborées (observées avec tout type de connecteurs), mais ausside l’usage évidentiel des VAP.Cependant, si nous employons la notion d’anaphore, nous voulons l’intégrer explicitement dans le formalisme grammatical, en spécifiant quand sont exécutées les résolutions d’anaphore et avec quelles informations en entrée. Cela est possible avec la sémantique par continuation, que nous utilisons en combinaison à la sémantique événementielle. Les événements sont souvent invoqués pour exprimer la sémantique des relations notamment causales ou temporelles, mais posent aussi un certain nombre de questions, liées aux schémas logiques d’inférence qu’autorisent les énoncés linguistiques ainsi qu’à la présence de la négation pour exprimer les arguments des relations discursives. Nous avançons plusieurs pistes pour y répondre et étudions plus en détail le cas de la négation.Nous revenons ainsi sur les difficultés que pose la négation linguistique pour une analyse sémantique événementielle, qui concernent autant l’interface syntaxe-sémantique que le niveau purement sémantique. Nous montrons que ces difficultés ont pour origine l’analyse standard de la négation, qui traite phrases positives et phrases négatives de manière fondamentalement différente. Rejetant cette vue, nous présentons une formalisation nouvelle de la notion d’événement négatif, adaptée à l’analyse de divers phénomènes linguistiques.
Databáze: OpenAIRE