Combinaisons d'automates et de boules de mots pour la classification de séquences

Autor: Alain Terlutte, Fabien Torre, Frédéric Tantini
Přispěvatelé: Laboratoire Hubert Curien [Saint Etienne] (LHC), Institut d'Optique Graduate School (IOGS)-Université Jean Monnet [Saint-Étienne] (UJM)-Centre National de la Recherche Scientifique (CNRS), Analysis, perception and recognition of speech (PAROLE), INRIA Lorraine, Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria)-Laboratoire Lorrain de Recherche en Informatique et ses Applications (LORIA), Institut National de Recherche en Informatique et en Automatique (Inria)-Université Henri Poincaré - Nancy 1 (UHP)-Université Nancy 2-Institut National Polytechnique de Lorraine (INPL)-Centre National de la Recherche Scientifique (CNRS)-Université Henri Poincaré - Nancy 1 (UHP)-Université Nancy 2-Institut National Polytechnique de Lorraine (INPL)-Centre National de la Recherche Scientifique (CNRS), Laboratoire d'Informatique Fondamentale de Lille (LIFL), Université de Lille, Sciences et Technologies-Institut National de Recherche en Informatique et en Automatique (Inria)-Université de Lille, Sciences Humaines et Sociales-Centre National de la Recherche Scientifique (CNRS), Modeling Tree Structures, Machine Learning, and Information Extraction (MOSTRARE), Université de Lille, Sciences et Technologies-Institut National de Recherche en Informatique et en Automatique (Inria)-Université de Lille, Sciences Humaines et Sociales-Centre National de la Recherche Scientifique (CNRS)-Université de Lille, Sciences et Technologies-Institut National de Recherche en Informatique et en Automatique (Inria)-Université de Lille, Sciences Humaines et Sociales-Centre National de la Recherche Scientifique (CNRS)-Inria Lille - Nord Europe, Institut National de Recherche en Informatique et en Automatique (Inria), Laboratoire Hubert Curien (LHC), Institut d'Optique Graduate School (IOGS)-Université Jean Monnet - Saint-Étienne (UJM)-Centre National de la Recherche Scientifique (CNRS)
Jazyk: francouzština
Rok vydání: 2011
Předmět:
Zdroj: Revue des Sciences et Technologies de l'Information-Série RIA : Revue d'Intelligence Artificielle
Revue des Sciences et Technologies de l'Information-Série RIA : Revue d'Intelligence Artificielle, Lavoisier, 2011, Apprentissage artificiel, 25 (3), pp.411-434. ⟨10.3166/ria.25.411-434⟩
Revue des Sciences et Technologies de l'Information-Série RIA : Revue d'Intelligence Artificielle, 2011, Apprentissage artificiel, 25 (3), pp.411-434. ⟨10.3166/ria.25.411-434⟩
ISSN: 0992-499X
1958-5748
DOI: 10.3166/ria.25.411-434⟩
Popis: National audience; In this paper, we present a general framework for supervised classification. This framework only needs the definition of a generalisation operator and provides ensemble methods. For sequence classification tasks, we show that grammatical inference has already defined such learners for automata classes like reversible automata or k-TSS automata. Then we propose a generalisation operator for the class of balls of words. Finally, we show through experiments that our method efficiently resolves sequence classification tasks.; Dans cet article, nous présentons un cadre d'apprentissage général pour la classification supervisée. Ce cadre ne nécessite que la définition d'un opérateur de généralisation et fournit en particulier des méthodes d'ensemble. Pour les tâches de classification de séquences, nous montrons que l'inférence grammaticale, avec des objectifs différents, a déjà défini de tels apprenants pour certaines familles d'automates comme les réversibles ou les k-TSS. Nous proposons ensuite un opérateur de généralisation original pour la famille des boules de mots. Enfin, nous montrons au travers de différentes expérimentations que notre approche permet effectivement de résoudre des tâches de classification de séquences.
Databáze: OpenAIRE