Découverte d'un sous-groupe optimal dans des données purement numériques

Autor: MILLOT, Alexandre, Cazabet, Rémy, Boulicaut, Jean-François
Přispěvatelé: MILLOT, Alexandre, Data Mining and Machine Learning (DM2L), Laboratoire d'InfoRmatique en Image et Systèmes d'information (LIRIS), Institut National des Sciences Appliquées de Lyon (INSA Lyon), Université de Lyon-Institut National des Sciences Appliquées (INSA)-Université de Lyon-Institut National des Sciences Appliquées (INSA)-Centre National de la Recherche Scientifique (CNRS)-Université Claude Bernard Lyon 1 (UCBL), Université de Lyon-École Centrale de Lyon (ECL), Université de Lyon-Université Lumière - Lyon 2 (UL2)-Institut National des Sciences Appliquées de Lyon (INSA Lyon), Université de Lyon-Université Lumière - Lyon 2 (UL2)
Jazyk: francouzština
Rok vydání: 2020
Předmět:
Zdroj: Extraction et Gestion des Connaissances (EGC)
Extraction et Gestion des Connaissances (EGC), Jan 2020, Bruxelles, Belgique. pp.25-36
Popis: National audience; La découverte de sous-groupes dans des données étiquetées consiste à calculer des motifs dans un espace de description des objets pour faire émerger des ensembles d'objets qui ont une répartition particulière du point de vue des étiquettes, par exemple la surreprésentation d'une valeur. Découvrir des sous-groupes intéressants dans des données purement numériques-attributs et éti-quette cible-a été peu traité. Généralement, on exploite des discrétisations qui engendrent une perte d'information et des résultats sous-optimaux. Nous trai-tons le problème du calcul d'un sous-groupe optimal au regard d'une mesure de qualité dans des données purement numériques. Nous exploitons des concepts de fermetures sur des motifs d'intervalles et des techniques d'élagage sophisti-quées. Nous validons empiriquement la pertinence de notre algorithme et décri-vons succinctement un cas d'application à l'optimisation de la pousse de végé-taux en environnement contrôlé.
Databáze: OpenAIRE