A Corpus-Based Assessment of French CEFR Lexical Content

Autor: Deryle Lonsdale, Françoise Kusseling
Rok vydání: 2013
Předmět:
Zdroj: The Canadian Modern Language Review. 69:436-461
ISSN: 1710-1131
0008-4506
DOI: 10.3138/cmlr.1726.436
Popis: The French CEFR vocabulary profiles as presented in the R eferentiels – while a valuable resource for a wide range of applications focused on lexical content – result from introspection, intuition-based judgements, and unquantifiable experience. The result is a specification of vocabulary that has been largely untested from a corpus-based, empirical perspective. In contrast, the English profiles were corpus-derived using current computational practices by English Profile, an ongoing project. In this article we summarize our evaluation of the French profiles by comparing their content with two sizable contemporary corpora and derived artifacts. We quantify the vocabulary overlap and uniqueness across all three of these resources. This leads us to make recommendations about possible ways of refining French CEFR vocabulary content by retaining, adding, and removing vocabulary items. Resume: Les listes de vocabulaire pour la langue francaise elaborees suite a la parution du CECRL et contenues dans les Referentiels – une ressource tres utile pour un grand nombre d’applications centrees sur le contenu lexical – resultent de l’introspection, de jugements bases sur l’intuition et d’une experience non quantifiable. Il s’en suit une specification de vocabulaire qui n’a, en grande partie, pas ete verifiee empiriquement dans le cadre d’etudes de corpus. Ceci contraste avec les listes de vocabulaire pour la langue anglaise, issues d’etudes de corpus, qui ont recours a des pratiques computationnelles actuelles et se trouvent sur « English Profile », un projet en cours sur le web. Dans cet article, nous resumons notreevaluation des R eferentiels en comparant leur contenu avec deux corpus contemporains appreciables et les artefacts qui en derivent. Nous quantifions le chevauchement et l’unicite du vocabulaire sur les trois ressources. Cette demarche nous mene a formuler des recommandations sur les facons possibles d’affiner le contenu lexical des Referentiels en conservant, ajoutant et enlevant des elements de vocabulaire.
Databáze: OpenAIRE