Mais et associés

Autor: Dargnat, Mathilde, Jayez, Jacques
Přispěvatelé: Analyse et Traitement Informatique de la Langue Française (ATILF), Université de Lorraine (UL)-Centre National de la Recherche Scientifique (CNRS), Semantic Analysis of Natural Language (SEMAGRAMME), Inria Nancy - Grand Est, Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria)-Department of Natural Language Processing & Knowledge Discovery (LORIA - NLPKD), Laboratoire Lorrain de Recherche en Informatique et ses Applications (LORIA), Institut National de Recherche en Informatique et en Automatique (Inria)-Université de Lorraine (UL)-Centre National de la Recherche Scientifique (CNRS)-Institut National de Recherche en Informatique et en Automatique (Inria)-Université de Lorraine (UL)-Centre National de la Recherche Scientifique (CNRS)-Laboratoire Lorrain de Recherche en Informatique et ses Applications (LORIA), Institut National de Recherche en Informatique et en Automatique (Inria)-Université de Lorraine (UL)-Centre National de la Recherche Scientifique (CNRS)-Université de Lorraine (UL)-Centre National de la Recherche Scientifique (CNRS), École normale supérieure de Lyon (ENS de Lyon)
Jazyk: angličtina
Rok vydání: 2021
Předmět:
Zdroj: Lexique
Lexique, 2021, 29, pp.211-228
ISSN: 0756-7138
2804-7397
Popis: International audience; This paper focuses on the distribution of discourse marker sequences immediately on the left or right of mais (≈ but) in French, such as oui non mais (≈ yes no but), mais quand même (≈ but still) or mais bon (≈ but well). The goal is to determine what sequences are the most frequent and how they fit (or not) with the meaning of mais. Exploiting five spoken French corpora, we use two association measures to extract the most plausible candidate patterns. Following the literature on association measures, we explore the two complementary dimensions of frequency (MI 3 measure) and predictability (DeltaP measure). This procedure reveals that i) there are indeed discourse marker patterns around bon, ii) most clusters or associates smoothly combine with the basic 'argumentative' value of mais and iii) within this semantically coherent set, comparing and crossing the results of the two measures on the left and the right of mais helps to identify subsets of discourse markers with specific discourse functions.; Dans cet article, nous étudions la distribution des séquences de marqueurs de discours dans l’environnement immédiat de mais, à droite ou à gauche, par exemple oui non mais, mais quand même ou mais bon. Notre objectif est d’identifier les séquences les plus fréquentes et de déterminer si elles sont compatibles avec le sens de mais. Nous utilisons cinq corpus de français parlé et deux mesures d’association pour extraire les motifs récurrents les plus plausibles. Nous appliquons une distinction, familière dans la littérature sur ces mesures, en explorant deux dimensions complémentaires : celle de la fréquence (mesure MI3) et celle de la prédictibilité (mesure DeltaP). Cette méthode montre que :(i) il y a effectivement des motifs récurrents de marqueurs de discours autour de mais, (ii) la plupart de ces agrégats ou associés se combinent naturellement avec la valeur « argumentative » fondamentale de mais et (iii) à l’intérieur de cet ensemble sémantique homogène, la comparaison et le croisement des deux mesures sur la droite et sur la gauche de mais contribuent à l’identification de sous-ensembles exerçant des fonctions de discours spécifiques.
Databáze: OpenAIRE