Le Traitement automatisé des verbes dans les corpus d'écrits scolaires

Autor: Koulibali, Yelle
Přispěvatelé: École, mutations, apprentissages (EMA), CY Cergy Paris Université (CY), de Lavenne, Vincent
Jazyk: francouzština
Rok vydání: 2019
Předmět:
Zdroj: Rencontres des Jeunes Chercheurs en Sciences du Langage 2019
Rencontres des Jeunes Chercheurs en Sciences du Langage 2019, 2019, Paris, France
Popis: International audience; Un inventaire des travaux sur l’écriture scolaire montre l’insuffisance des méthodes d’analyse quantitative pour l’étude des corpus d’écrits scolaires. Plusieurs corpus ont été constitués, donnant lieu à des exploitations avec différents outils d’analyse, mais toujours limitées par la difficulté de pratiquer des traitements automatisés. Cette difficulté est liée à la présence de nombreuses variations dans ces corpus non normés. Ce sont ces variations touchant la graphie, l’orthographe, le lexique et la morphologie selon les genres scolaires, qui rendent ce type de corpus réfractaire à la numérisation, à l’étiquetage et même à l’analyse en traitement automatique du langage. (Elalouf & Boré, 2007). À partir de l’étude morphologique et lexicale des verbes dans deux corpus de CM2 et de 3e, nous montrons comment aborder la variation à l’intérieur des corpus d’écrits scolaires et comment la traiter. Ce type de données nécessite des prétraitements avec des règles particulières de transcriptions des manuscrits des élèves que nous allons exposer afin d’aboutir à l’analyse de nos données proprement dites.
Databáze: OpenAIRE