Analyse d'erreurs de transcriptions phonémiques automatiques d'une langue « rare » : le na (mosuo)
Autor: | Michaud, Alexis, Adams, Oliver, Guillaume, Séverine, Wisniewski, Guillaume |
---|---|
Přispěvatelé: | Langues et civilisations à tradition orale (LACITO), Université Sorbonne Nouvelle - Paris 3-Institut National des Langues et Civilisations Orientales (Inalco)-Centre National de la Recherche Scientifique (CNRS), Miner & Kasch, Laboratoire de Linguistique Formelle (LLF UMR7110), Centre National de la Recherche Scientifique (CNRS)-Université de Paris (UP), Benzitoun, Christophe and Braud, Chloé and Huber, Laurine and Langlois, David and Ouni, Slim and Pogodalla, Sylvain and Schneider, Stéphane, ANR-19-CE38-0015,CLD2025,La documentation computationnelle des langues à l'horizon 2025(2019), ANR-10-LABX-0083,EFL,Empirical Foundations of Linguistics : data, methods, models(2010) |
Jazyk: | francouzština |
Rok vydání: | 2020 |
Předmět: |
interdisciplinarité
Traitement Automatique des Langues Naturelles reconnaissance de la parole Computational Language Documentation speech recognition [SCCO.LING]Cognitive science/Linguistics [INFO.INFO-AI]Computer Science [cs]/Artificial Intelligence [cs.AI] phonological transcription interdisciplinarity machine learning analyse d'erreurs transcription phonologique [INFO.INFO-SD]Computer Science [cs]/Sound [cs.SD] apprentissage machine [SHS.LANGUE]Humanities and Social Sciences/Linguistics documentation linguistique assistée par ordinateur error analysis |
Zdroj: | 6e conférence conjointe Journées d'Études sur la Parole (JEP, 33e édition), Traitement Automatique des Langues Naturelles (TALN, 27e édition), Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RÉCITAL, 22e édition). Volume 1 : Journées d'Études sur la Parole 6e conférence conjointe Journées d'Études sur la Parole (JEP, 33e édition), Traitement Automatique des Langues Naturelles (TALN, 27e édition), Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RÉCITAL, 22e édition). Volume 1 : Journées d'Études sur la Parole, Jun 2020, Nancy, France. pp.451-462 |
Popis: | International audience; Automatic phonemic transcription tools now reach high levels of accuracy on a single speaker with relatively small amounts of training data: on the order two to three hours of transcribed speech. Beyond its practical usefulness for language documentation, use of automatic transcription also yields some insights for phoneticians/phonologists. Acoustic models are built on the basis of the linguist’s transcriptions, and thus encapsulate linguistic hypotheses and assumptions. To what extent can the acoustic model be examined by the linguist? The present report explores this topic by going into qualitative error analysis on Yongning Na (Sino-Tibetan). Among other benefits, error analysis allows for a renewed exploration of phonetic detail: examining the output of phonemic transcription software compared with spectrographic and aural evidence.; Les systèmes de reconnaissance automatique de la parole atteignent désormais des degrés de précision élevés sur la base d'un corpus d'entraînement limité à deux ou trois heures d'enregistrements transcrits (pour un système mono-locuteur). Au-delà de l'intérêt pratique que présentent ces avancées technologiques pour les tâches de documentation de langues rares et en danger, se pose la question de leur apport pour la réflexion du phonéticien/phonologue. En effet, le modèle acoustique prend en entrée des transcriptions qui reposent sur un ensemble d'hypothèses plus ou moins explicites. Le modèle acoustique, décalqué (par des méthodes statistiques) de l'écrit du linguiste, peut-il être interrogé par ce dernier, en un jeu de miroir ? Notre étude s'appuie sur des exemples d'une langue « rare » de la famille sino-tibétaine, le na (mosuo), pour illustrer la façon dont l'analyse d'erreurs permet une confrontation renouvelée avec le signal acoustique. |
Databáze: | OpenAIRE |
Externí odkaz: |