LeBenchmark, un référentiel d'évaluation pour le français oral

Autor:	Hang Le, Sina Alisamir, Marco Dinarelli, Fabien Ringeval, Solène Evain, Ha Nguyen, Marcely Zanon Boito, Salima Mdhaffar, Ziyi Tong, Natalia Tomashenko, Titouan Parcollet, Alexandre Allauzen, Yannick Estève, Benjamin Lecouteux, François Portet, Solange Rossato, Didier Schwab, Laurent Besacier
Přispěvatelé:	mdhaffar, salima, MIAI @ Grenoble Alpes - - MIAI2019 - ANR-19-P3IA-0003 - P3IA - VALID, Schwab, Didier
Jazyk:	francouzština
Rok vydání:	2022
Předmět:	[INFO.INFO-AI] Computer Science [cs]/Artificial Intelligence [cs.AI] Speech Translation Reconnaissance Automatique Evaluation [INFO.INFO-TS] Computer Science [cs]/Signal and Image Processing Modèles Autosupervisés Reconnaissance Automatique Evaluation Framework [INFO.INFO-NE] Computer Science [cs]/Neural and Evolutionary Computing [cs.NE] [INFO.INFO-TT] Computer Science [cs]/Document and Text Processing Automatic Speech Recognition Speech Language Understanding Référentiel d'évaluation Automatic Emotion Recognition Self-Supervised Learning [INFO.EIAH] Computer Science [cs]/Technology for Human Learning [INFO.INFO-IR] Computer Science [cs]/Information Retrieval [cs.IR]
Zdroj:	HAL
Popis:	L'apprentissage autosupervisé a apporté des améliorations remarquables dans de nombreux domaines tels que la vision par ordinateur ou le traitement de la langue et de la parole, en exploitant de grandes quantités de données non étiquetées. Dans le contexte spécifique de la parole, cependant, et malgré des résultats prometteurs, il existe un manque évident de normalisation dans les processus d'évaluation permettant des comparaisons précises de ces modèles, en particulier pour les autres langues que l'anglais. Nous présentons ici à la communauté francophone LeBenchmark, un cadre de référence en sources ouvertes et reproductible pour évaluer des modèles autosupervisés à partir de corpus de parole en français. Il est composé de quatre tâches : reconnaissance automatique de la parole, compréhension du langage parlé, traduction automatique de la parole et reconnaissance automatique d'émotions. Nous encourageons la communauté francophone à utiliser ce référentiel dans ses futures expérimentations, notamment pour l'évaluation de modèles autosupervisés.
Databáze:	OpenAIRE
Externí odkaz:	https://explore.openaire.eu/search/publication?articleId=doi_dedup___::5b45625171543c36fa01b1db28207288 https://hal.archives-ouvertes.fr/hal-03706952 Zobrazit plný text záznamu