Les méthodes « clusterwise » : principes et applications
Autor: | Gilbert Saporta, Stéphanie Bougeard, Ndeye Niang-Keita |
---|---|
Přispěvatelé: | CEDRIC. Méthodes statistiques de data-mining et apprentissage (CEDRIC - MSDMA), Centre d'études et de recherche en informatique et communications (CEDRIC), Ecole Nationale Supérieure d'Informatique pour l'Industrie et l'Entreprise (ENSIIE)-Conservatoire National des Arts et Métiers [CNAM] (CNAM)-Ecole Nationale Supérieure d'Informatique pour l'Industrie et l'Entreprise (ENSIIE)-Conservatoire National des Arts et Métiers [CNAM] (CNAM), Agence nationale de sécurité sanitaire de l'alimentation, de l'environnement et du travail (ANSES), Saporta, Gilbert |
Jazyk: | francouzština |
Rok vydání: | 2015 |
Předmět: | |
Zdroj: | XXII èmes rencontres de la Société Francophone de Classification XXII èmes rencontres de la Société Francophone de Classification, Sep 2015, Nantes, France HAL |
Popis: | International audience; Les méthodes « clusterwise » autrefois appelées « typologiques » consistent à optimiser simultanément une partition des unités statistiques et des modèles locaux. La régression clusterwise en est le cas le plus connu : dans chaque classe on ajuste un modèle de régression et l’affectation aux classes se fait selon le meilleur modèle. Les méthodes clusterwise permettent de tenir compte d’une hétérogénéité non directement observable et sont particulièrement utiles pour les grands ensembles de données où la pertinence d’un modèle simple et global est contestable. Les algorithmes classiques de type k-means optimisent de façon alternée appartenance aux classes et modèles. On peut également utiliser des modèles de mélange ou de classes latentes. Une extension consiste à utiliser pour chaque classe (région de compétence) le modèle le plus adapté parmi différentes classes de modèles au lieu d’estimer classe par classe des modèles semblables. Les méthodes clusterwise fournissent évidemment de meilleures prévisions en apprentissage, mais leur complexité doit être maitrisée pour être appliquée à de nouvelles données. On présentera des exemples d’application en régression et classification supervisée pour des données standard, des données fonctionnelles et des données où les variables sont structurées en blocs. |
Databáze: | OpenAIRE |
Externí odkaz: |