Extraction de motifs ensemblistes dans des contextes bruités

Autor: Mouhoubi, Karima, Létocart, Lucas, Rouveirol, Céline
Přispěvatelé: Laboratoire d'Informatique de Paris-Nord (LIPN), Université Sorbonne Paris Cité (USPC)-Institut Galilée-Université Paris 13 (UP13)-Centre National de la Recherche Scientifique (CNRS), Létocart, Lucas
Jazyk: francouzština
Rok vydání: 2011
Předmět:
Zdroj: CAP 2011
CAP 2011: Conférence francophone d'apprentissage
CAP 2011: Conférence francophone d'apprentissage, May 2011, Chambéry, France. 16 p
Popis: National audience; La recherche de motifs ensemblistes dans des matrices de données booléennes est une problématique importante dans un processus d'extraction de connaissances. Elle consiste à rechercher tous les rectangles de 1 dans une matrice de données à valeurs dans {0,1}. Plusieurs algorithmes ont été développés pour répondre à ce problème, mais s'adaptent difficilement à des données réelles susceptibles de contenir du bruit. Un des effets du bruit est de pulvériser un motif pertinent en un ensemble de sous-motifs recouvrants et peu pertinents, entraînant une explosion du nombre de motifs résultats. Dans le cadre de ce travail, nous proposons une nouvelle approche heuristique basée sur les algorithmes de graphes pour la recherche de motifs ensemblistes dans des contextes binaires bruités. Cette méthode est fondée sur les algorithmes de flot maximal/coupe minimale pour rechercher des sous graphes denses dans un graphe associé à la matrice des données. Pour évaluer notre approche, différents tests ont été réalisés sur des données synthétiques puis sur des données réelles issues d'applications bioinformatiques, à savoir des données d'expression de gènes.
Databáze: OpenAIRE