Enjeux méthodologiques, linguistiques et informatiques pour le traitement du français écrit des sourds
Autor: | Vanrullen, Tristan, Boutora, Leila, Dagron, Jean |
---|---|
Přispěvatelé: | Laboratoire Parole et Langage (LPL), Aix Marseille Université (AMU)-Centre National de la Recherche Scientifique (CNRS) |
Jazyk: | francouzština |
Rok vydání: | 2012 |
Předmět: |
Français Langue Etrangère
syntaxe corpus linguistics Français écrit des sourds methodology méthodologie NLP [INFO.INFO-CL]Computer Science [cs]/Computation and Language [cs.CL] French as a foreign language linguistique de corpus TAL Written French of deaf people lexicon lexique [SHS.LANGUE]Humanities and Social Sciences/Linguistics syntax |
Zdroj: | TALN Actes de la conférence conjointe JEP-TALN-RECITAL Actes de la conférence conjointe JEP-TALN-RECITAL, Jul 2012, Grenoble, France. pp.559-566 |
Popis: | International audience; Methodological, linguistic and computational challenges for processing written French of deaf peopleWith the setup of a national emergency call-center for deaf people in France (CNRAU), some questions arise in linguistics and natural language processing about the written expression of deaf people. It is practiced by an heterogeneous population and shows morpho-syntactic, lexical and syntactic specificities which increase the difficulty, over the emergency situation, to successfully communicate between the deaf callers and the call-center operators. A first corpus (FAX-ESSU) of written French of deaf people was built with emergency conditions in order to provide linguistic and NLP solutions to the call center operators. On this corpus, we present a first study realized with the help of a natural language processing toolbox, in order to validation linguistic phenomenons described in the scientific literature and to enrich the knowledge of written French of deaf people.; L’ouverture du Centre National de Réception des Appels d’Urgence (CNRAU) accessible aux sourds et malentendants fait émerger des questions linguistiques qui portent sur le français écrit des sourds, et des questions informatiques dans le domaine du traitement automatique du langage naturel. Le français écrit des sourds, pratiqué par une population hétérogène, comporte des spécificités morpho-syntaxiques et morpho- lexicales qui peuvent rendre problématique la communication écrite entre les personnes sourdes appelantes et les agents du CNRAU. Un premier corpus de français écrit sourd élicité avec mise en situation d’urgence (FAX-ESSU) a été recueilli dans la perspective de proposer des solutions TAL et linguistiques aux agents du CNRAU dans le cadre de ces échanges écrits. Nous présentons une première étude lexicale, morphosyntaxique et syntaxique de ce corpus reposant en partie sur une chaîne de traitement automatique, afin de valider les phénomènes linguistiques décrits dans la littérature et d'enrichir la connaissance du français écrit des sourds. |
Databáze: | OpenAIRE |
Externí odkaz: |