Identification de profil clinique du patient: Une approche de classification de séquences utilisant des modèles de langage français contextualisés
Autor: | Mannion, Aidan, Chevalier, Thierry, Schwab, Didier, Goeuriot, Lorraine |
---|---|
Přispěvatelé: | Laboratoire d'Informatique de Grenoble (LIG), Centre National de la Recherche Scientifique (CNRS)-Université Grenoble Alpes (UGA)-Institut polytechnique de Grenoble - Grenoble Institute of Technology (Grenoble INP ), Université Grenoble Alpes (UGA), Groupe d’Étude en Traduction Automatique/Traitement Automatisé des Langues et de la Parole (GETALP), Université Grenoble Alpes (UGA)-Centre National de la Recherche Scientifique (CNRS)-Université Grenoble Alpes (UGA)-Institut polytechnique de Grenoble - Grenoble Institute of Technology (Grenoble INP ), Modélisation et Recherche d’Information Multimédia [Grenoble] (MRIM ), Université Grenoble Alpes - UFR Médecine (UGA UFRM), Denis, Pascal, Grabar, Natalia, Fraisse, Amel, Cardon, Rémi, Jacquemin, Bernard, Kergosien, Eric, Balvet, Antonio |
Jazyk: | francouzština |
Rok vydání: | 2021 |
Předmět: | |
Zdroj: | Actes de la 28e Conférence sur le Traitement Automatique des Langues Naturelles. Atelier DÉfi Fouille de Textes (DEFT) Traitement Automatique des Langues Naturelles Traitement Automatique des Langues Naturelles, 2021, Lille, France. pp.54-62 |
Popis: | International audience; Cet article présente un résumé de notre soumission pour Tâche 1 de DEFT 2021. Cette tâche consiste à identifier le profil clinique d’un patient à partir d’une description textuelle de son cas clinique en identifiant les types de pathologie mentionnés dans le texte. Ce travail étudie des approches de classification de texte utilisant des plongements de mots contextualisés en français. À partir d’une base de référence d’un modèle constitué pour la compréhension générale de la langue française, nous utilisons des modèles pré-entraînés avec masked language modelling et affinés à la tâche d’identification, en utilisant un corpus externe de textes cliniques fourni par SOS Médecins, pour développer des ensembles de classifieurs binaires associant les textes cliniques à des catégories de pathologies. |
Databáze: | OpenAIRE |
Externí odkaz: |