Contribution à la découverte de sous-groupes corrélés : Application à l’analyse des systèmes territoriaux et des réseaux alimentaires
Autor: | Hammal, Mohamed Ali |
---|---|
Přispěvatelé: | Laboratoire d'InfoRmatique en Image et Systèmes d'information (LIRIS), Institut National des Sciences Appliquées de Lyon (INSA Lyon), Université de Lyon-Institut National des Sciences Appliquées (INSA)-Université de Lyon-Institut National des Sciences Appliquées (INSA)-Centre National de la Recherche Scientifique (CNRS)-Université Claude Bernard Lyon 1 (UCBL), Université de Lyon-École Centrale de Lyon (ECL), Université de Lyon-Université Lumière - Lyon 2 (UL2), Data Mining and Machine Learning (DM2L), Université de Lyon-Université Lumière - Lyon 2 (UL2)-Institut National des Sciences Appliquées de Lyon (INSA Lyon), Université de Lyon, Céline Robardet |
Jazyk: | francouzština |
Rok vydání: | 2020 |
Předmět: |
Geographical area
Découverte de connaissances Food resource Informatique Fouille de données Sous-Groupes Fouille de motifs [INFO.INFO-LG]Computer Science [cs]/Machine Learning [cs.LG] Pattern mining Pattern recognition Echantillonnage de motifs Subgroups discovery Correlated subgroups Zone géographique Socio-Economic factor Desert Ressource alimentaire Information Technology Data mining Facteur socio-Économique |
Zdroj: | Apprentissage [cs.LG]. Université de Lyon, 2020. Français. ⟨NNT : 2020LYSEI024⟩ |
Popis: | Better feeding cities in quantity and quality, especially large cities, is a major challenge, whose resolution requires a better understanding of the relationships between urban populations and their food. On the scale of urban food systems, we need to understand the availability of food resources crossed with the socio-economic profiles of the territories. But we lack tools and methods to systematically understand the relationships between consumption basins, supply and eating habits. The objective of this thesis is to contribute to the development of new IT tools to process temporal, heterogeneous and multi-sources data in order to identify and characterize behaviors specific to a geographic area. For this, we rely on the joint exploration of gradual patterns, to discover rank correlations, and subgroups in order to find contexts for which the correlations described by the gradual patterns are exceptionally strong compared to the remaining of the data. We propose an enumeration algorithm based on pruning properties with upper bounds, as well as another algorithm which samples the patterns according to the quality measure. These approaches are validated not only on benchmark datasets, but also through an empirical study of the formation of food deserts in the Lyon urban area.; Mieux nourrir les villes en quantité et en qualité, notamment les grandes agglomérations, constitue un défi majeur dont la résolution passe par une meilleure compréhension des relations entre les populations urbaines et leur alimentation. A l’échelle des systèmes alimentaires urbains, on a besoin de diagnostics ciblant la disponibilité des ressources alimentaires croisée avec les profils socio-économiques des territoires et l’on manque d’outils et de méthodes pour appréhender de façon systématique les relations entre les bassins de consommation, l’offre et les comportements alimentaires. L’objectif de cette thèse est de contribuer à l’élaboration de nouveaux outils informatiques pour traiter des données temporelles, hétérogènes et multi-sources afin d’identifier et de caractériser des comportements propres à une zone géographique. Pour cela, nous nous appuyons sur l’exploration conjointe de motifs graduels, identifiant des corrélations de rang, et de sous-groupes afin de découvrir des contextes pour lesquels les corrélations décrites par les motifs graduels sont exceptionnellement fortes par rapport au reste des données. Nous proposons un algorithme d’énumération s’appuyant sur des propriétés d’élagage avec des bornes supérieures, ainsi qu’un autre algorithme qui échantillonne les motifs selon la mesure de qualité. Ces approches sont validées non seulement sur des jeux de données de référence, mais aussi à travers une étude empirique de laformation des déserts alimentaires sur l’agglomération lyonnaise. |
Databáze: | OpenAIRE |
Externí odkaz: |