A new adaptive sampling approach for Genetic Programming

Autor:	Sana Ben Hamida, Hmida Hmida, Marta Rukoz, Amel Borgi
Přispěvatelé:	Laboratoire d'Informatique, Programmation, Algorithmique et Heuristique (LIPAH), Faculté des Sciences Mathématiques, Physiques et Naturelles de Tunis (FST), Université de Tunis El Manar (UTM)-Université de Tunis El Manar (UTM), Laboratoire d'analyse et modélisation de systèmes pour l'aide à la décision (LAMSADE), Université Paris Dauphine-PSL, Université Paris sciences et lettres (PSL)-Université Paris sciences et lettres (PSL)-Centre National de la Recherche Scientifique (CNRS), Université Paris Nanterre (UPN), Université de Tunis El Manar (UTM)
Jazyk:	angličtina
Rok vydání:	2019
Předmět:	Adaptive sampling Computer science Computation Index Terms-Genetic Programming Genetic Programming Genetic programming Sample (statistics) adaptive sampling Intrusion detection system Machine learning computer.software_genre [INFO.INFO-AI]Computer Science [cs]/Artificial Intelligence [cs.AI] Machine Learning symbols.namesake [INFO.INFO-LG]Computer Science [cs]/Machine Learning [cs.LG] sampling frequency control [INFO]Computer Science [cs] KDD intrusion detection business.industry Sampling (statistics) symbols Training set Sampling Artificial intelligence business computer Gibbs sampling
Zdroj:	2019 Third International Conference on Intelligent Computing in Data Sciences (ICDS) 2019 Third International Conference on Intelligent Computing in Data Sciences (ICDS), Oct 2019, Marrakech, Morocco. pp.1-8, ⟨10.1109/ICDS47004.2019.8942353⟩ 2019 Third International Conference on Intelligent Computing in Data Sciences (ICDS), Oct 2019, Marrakech, France. pp.1-8, ⟨10.1109/ICDS47004.2019.8942353⟩
DOI:	10.1109/ICDS47004.2019.8942353⟩
Popis:	Genetic Programming (GP) is afflicted by an excessive computation time that is more exacerbated with data intensive problems. This issue has been addressed with different approaches such as sampling techniques or distributed implementations.In this paper we focus on dynamic sampling algorithms that mostly give to GP learner a new sample each generation. In so doing, individuals do not have enough time to extract the hidden knowledge. We propose adaptive sampling, which is half-way between static and dynamic methods. It is a flexible approach applicable to any dynamic sampling. We implemented some variants based on controlling re-sampling frequency, which we experimented to solve KDD intrusion detection problem with GP. The experimental study demonstrates how it preserves the power of dynamic sampling with possible improvements in learning time and quality for some sampling algorithms. This work opens many new relevant extension paths.; La programmation génétique (GP) est affectée par un temps de calcul excessif qui est plus exacerbé par des problèmes de données intensives. Cette question a été abordée avec différentes approches telles que les techniques d'échantillonnage ou les implémentations distribuées.Dans cet article, nous nous concentrons sur les algorithmes d'échantillonnage dynamique qui donnent principalement à l'apprenant GP un nouvel échantillon à chaque génération. En faisant cela, les individus n'ont pas assez de temps pour extraire les connaissances cachées. Nous proposons l'échantillonnage adaptatif, qui est à mi-chemin entre les méthodes statiques et dynamiques. Il s'agit d'une approche flexible applicable à tout échantillonnage dynamique. Nous avons mis en œuvre certaines variantes basées sur le contrôle de la fréquence de ré-échantillonnage, que nous avons expérimenté pour résoudre le problème de détection d'intrusion KDD avec GP. L'étude expérimentale démontre comment elle préserve la puissance de l'échantillonnage dynamique avec des améliorations possibles du temps d'apprentissage et de la qualité de certains algorithmes d'échantillonnage. Ce travail ouvre de nombreuses nouvelles voies d'extension pertinentes.
Databáze:	OpenAIRE
Externí odkaz:	https://explore.openaire.eu/search/publication?articleId=doi_dedup___::7a0ea9db3b2897487163a4a250bcf1ca https://hal.archives-ouvertes.fr/hal-02457780 Zobrazit plný text záznamu