Deux dictionnaires informatisés de Jean Dubois et Françoise Dubois-Charlier, leurs ultimes travaux

Autor: Denis Le Pesant, Guy Lapalme
Jazyk: francouzština
Rok vydání: 2020
Předmět:
Popis: Notre article décrit la structure des ressources lexicales Les Verbes Français (LVF) et le Dictionnaire Électronique des Mots (DEM) élaborées pendant plusieurs années par Jean Dubois et Françoise Dubois-Charlier. Nous suggérons ensuite des utilisations possibles de ces ressources pour le traitement automatique de la langue (TAL). Compte-tenu du fait que LVF a déjà fait l'objet de plusieurs travaux au cours des dernières décennies, nous insistons sur le DEM, une ressource linguistique particulièrement mal connue qui peut être considérée comme la synthèse des travaux lexicographiques de Dubois et Dubois-Charlier. Le DEM souffre d’être resté inachevé, mais son extension peu commune (près de 150 000 entrées) et surtout ses corrélations avec LVF en font une source de données lexicales de premier ordre pour la linguistique du français et pour le TAL. Nous présentons de nouvelles versions du LVF et du DEM au format JSON avec une nouvelle interface de consultation de ces dictionnaires. Nous espérons de la sorte favoriser la diffusion de ces ressources lexicales auprès de la communauté des chercheurs en lexicologie, en lexicographie et en TAL. This paper presents the structure of two French lexical resources, Les Verbes Français (LVF) and Dictionnaire Électronique des Mots (DEM), created over many years by Jean Dubois and Françoise Dubois-Charlier. Applications of these resources for Natural Language Processing (NLP) are then sketched. Given the fact that LVF has already been studied quite extensively over the last decades, DEM is described in details as it can be considered as the synthesis of the lexicographic works of Dubois and Dubois-Charlier. DEM was unfortunately left as a work in progress, but its extension (almost 150 000 entries) and especially its links with LVF constitute an important French lexical resource for NLP applications. A new JSON based format of LVF and DEM is also presented with an integrated query interface. This should promote the use of these resources by researchers in lexicology, lexicography and NLP.
Databáze: OpenAIRE