Développement d'un classifieur hybride pour le domaine des « Ressources Humaines »
Autor: | Gafsi, Myriam |
---|---|
Přispěvatelé: | Université Grenoble Alpes - UFR Langage, lettres et arts du spectacle, information et communication - Dpt Sciences du langage et français langue étrangère (UGA UFR LLASIC SLFLE), Université Grenoble Alpes (UGA), Eloquant, 5 Allée de Palestine, 38610 Gières, Thomas Lebarbé, Emmanuelle Dusserre |
Jazyk: | francouzština |
Rok vydání: | 2020 |
Předmět: |
Méthode statistique
Enrichissement sémantique Apprentissage automatique Symbolic statistical and hybrid methods [SHS]Humanities and Social Sciences Semantic enrichment Méthode hybride Categorization Human resources Machine learning Méthodes symbolique Ressources humaines Semi-automatic taxonomy Taxonomie semi-automatique Catégorisation |
Zdroj: | Sciences de l'Homme et Société. 2020 |
Popis: | In this work, we present an application of an automatic text classification system. In order to do so, we developed a product for a company that will be applied to a customer case : an automatic classifier for human resources survey responses, based on a hybrid system (machine learning on annotated data, coupled with expert rules and lexicons). The first approach is based on statistical techniques. It consists on performing multi-categorical annotation to train the model in order to classify the text. The second approach is symbolic. A taxonomy of the humain ressources domain has been developed for the establishment of semantic annotation on texts. We, then, developed a hybrid classification system. At the end, we present the results of evaluation measures to determine the performance of the classifier on our corpus.; Dans ce travail, nous avons cherché à présenter une application d’un système de classification automatique de textes. Pour cela, nous avons développé un produit pour une entreprise à des fins applicatives pour un client : un classifieur automatique pour des réponse d’enquêtes deressources humaines, fondé sur une méthode hybride (apprentissage automatique sur des données annotées, couplé avec des règles expertes et des lexiques). La première approche est basée sur des techniques statistiques. Elle consiste à effectuer une annotation multi-catégoriel permettant d’entraîner le modèle afin de classer le texte. La deuxième approche est symbolique. Une taxonomie du domaine a été élaborée dans un but d'annotation lexicale sémantique des textes. Par la suite, nous avons développé un système de classification hybride. Nous avons présenté à la fin les résultats des mesures d'évaluation pour déterminer les performances du classifieur sur nos corpus. |
Databáze: | OpenAIRE |
Externí odkaz: |