Mining association rules using the couple support-MGK : Implicatives graphs and Applications in mathematics education
Autor: | Bemarisika, Parfait |
---|---|
Přispěvatelé: | Bemarisika, Parfait, Laboratoire d'Informatique et de Mathématiques (LIM), Université de La Réunion (UR), Université d'Antananarivo, Pr. André TOTOHASINA et Pr. Jean DIATTA, Totohasina André, Diatta Jean |
Jazyk: | francouzština |
Rok vydání: | 2016 |
Předmět: |
support-MGK
CHIC-MGK règles d'association positives et négatives [INFO]Computer Science [cs] didactique des mathématiques positive and negative association rules data mining [MATH] Mathematics [math] [MATH]Mathematics [math] implicatives graphs [INFO] Computer Science [cs] graphes implicatifs fouille de données |
Zdroj: | Informatique [cs]. Université d'Antananarivo, 2016. Français |
Popis: | In this work, we investigate the problem of mining positive and negative association rules and its applications in mathematics education. The extraction of this knowlege type is divided into two phases that are mining frequent patterns and generation of association rules from the set frequent patterns. Very often, the cost of mining frequent patterns in large and dense contexts is exponential, and the number of association rules generated could be excessively high, most of being not interesting. We propose a new model for mining frequent patterns, and a new model for generating the interesting association rules, using a new couple support-MGK. In the elaboration of implicatives graphs, most of existing methods use one quality measure, implication intensity, based on a gaussian approximation, which is not sef of lossing information. To resolve this defect, we proposed a new method using another quality measure, MGK. We propose a new algorithm of this implicatives graphs. The experiments conducted in data reference, show that our models reduce the costs of inputs/outputs and memory space. The application of these approach in mathematics education has highlighted the pratical value of our approach. We propose a new tool CHIC-MGK to serve as support for the educational searching activity. The effectiveness of this tool has been shown a real problem of education statistic, involving difficulties of our students in L1 level through proposed exercise solution. Dans.ce mémoire, nous nous intéressons au problème de l'extraction de règles d'association positives et négatives valides, et ses applications en didactique des mathématiques. L'extraction de telles règles d'association est décomposée en deux étapes qui sont l'extraction des motifs fréquents et la génération de règles d'association pertinentes à partir de ces motifs fréquents. La complexité de chacune de ces deux étapes est très souvent exponentielle : le nombre d'itemsets fréquents est potentiel, et le nombre de règles d'association générées peut être excessivement élevé dû en partie aux mesures de qualité utilisées. En effet, l'immense majorité des approches existantes se limitent à l'utilisation du couple classique support-confiance, alors que ce couple n'est pas efficace en présence de données fortement corrélées et/ou des seuils de support faibles. La découverte de règles d'association potentiellement pertinentes est donc d'autant plus délicate que de nombreuses règles s'avèrent inintéressantes ou redondantes. Pour y faire face, nous proposons deux nouveaux modèles permettant respectivement l'extraction optimisée des motifs fréquents, et l'optimisation de la génération de règles d'association valides potentielles en utilisant le nouveau couple support-MGK. Dans le cadre des graphes implicatifs, la plupart des travaux existants se limitent à l'utilisation de l'approche de Gras, reposant sur la mesure, intensité d'implication, basée sur une approximation gaussienne. L'évaluation de cette approche est toutefois assez critiquable dans le sens où ladite mesure de qualité utilisée a tendance à ne plus être discriminante en présence de données denses, à cause de cette approximation encourue, ce qui n'est donc pas à l'abri de perte d'information. De plus, seules les règles d'association classiques dites positives sont considérées, les règles négatives qui peuvent se révéler une source d'information importante pour l'utilisateur sont ignorées, ce qui pose aussi un réel problème pour qualifier les résultats obtenus. A cela, nous proposons une nouvelle approche de construction de ces graphes implicatifs à l'aide d'une autre mesure plus sélective, MGK, en intégrant à la fois les règles positives et les règles négatives. Nous y avons défini un nouvel algorithme afin d'automatiser la construction. Également, nous avons élaboré un nouvel outil, CHIC-MGK, permettant entre autres de servir d'appui à la recherche en didactique des mathématiques. Les expérimentations menées sur quelques bases de données de référence et des réels problèmes de didactique de la statistique à Madagascar, montrent la faisabilité notable de nos modèles. |
Databáze: | OpenAIRE |
Externí odkaz: |