Le Traitement automatisé des verbes dans les corpus d'écrits scolaires
Autor: | Koulibali, Yelle |
---|---|
Přispěvatelé: | École, mutations, apprentissages (EMA), CY Cergy Paris Université (CY), de Lavenne, Vincent |
Jazyk: | francouzština |
Rok vydání: | 2019 |
Předmět: | |
Zdroj: | Rencontres des Jeunes Chercheurs en Sciences du Langage 2019 Rencontres des Jeunes Chercheurs en Sciences du Langage 2019, 2019, Paris, France |
Popis: | International audience; Un inventaire des travaux sur l’écriture scolaire montre l’insuffisance des méthodes d’analyse quantitative pour l’étude des corpus d’écrits scolaires. Plusieurs corpus ont été constitués, donnant lieu à des exploitations avec différents outils d’analyse, mais toujours limitées par la difficulté de pratiquer des traitements automatisés. Cette difficulté est liée à la présence de nombreuses variations dans ces corpus non normés. Ce sont ces variations touchant la graphie, l’orthographe, le lexique et la morphologie selon les genres scolaires, qui rendent ce type de corpus réfractaire à la numérisation, à l’étiquetage et même à l’analyse en traitement automatique du langage. (Elalouf & Boré, 2007). À partir de l’étude morphologique et lexicale des verbes dans deux corpus de CM2 et de 3e, nous montrons comment aborder la variation à l’intérieur des corpus d’écrits scolaires et comment la traiter. Ce type de données nécessite des prétraitements avec des règles particulières de transcriptions des manuscrits des élèves que nous allons exposer afin d’aboutir à l’analyse de nos données proprement dites. |
Databáze: | OpenAIRE |
Externí odkaz: |