Intégration et analyse de données hétérogènes massives pour une observation intelligente du territoire

Autor: Kafando, Rodrique
Přispěvatelé: Territoires, Environnement, Télédétection et Information Spatiale (UMR TETIS), Centre de Coopération Internationale en Recherche Agronomique pour le Développement (Cirad)-AgroParisTech-Centre National de la Recherche Scientifique (CNRS)-Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement (INRAE), Université Montpellier, Maguelonne Teisseire
Jazyk: francouzština
Rok vydání: 2021
Předmět:
Zdroj: Environnement et Société. Université Montpellier, 2021. Français. ⟨NNT : 2021MONTS062⟩
Popis: The advent of new communication and information technologies (NICT) accelerates the growth of data produced by services that smart cities offer to their population in various fields. Among these data, we can notice: textual data (available on the Web), satellite images (surveillance data), data from sensors, etc. These data are essentially derived from the services offered by the cities to meet the daily needs of the inhabitants such as mobility, communication, health, as well as services for the management of various resources such as water, agricultural and urban operations, energy, etc. This significant growth of data is challenging the completeness and efficiency of the methods and techniques traditionally used in data mining for knowledge discovery. The difficulties encountered are mainly related to the volume of the data, but also to their complexity such as the high heterogeneity. Our research topic is part of the EcoCity initiative of the Montpellier Mediterranean Metropolis (3M), and aims to develop an intelligent observation approach of the territory from the massive data available.In this thesis, we are interested in the mutual enrichment between highly heterogeneous data for the monitoring of territories. We limit our study to three themes which are urbanization, agriculture and hydrology on the territory of the metropolis of Montpellier. To do this, we decline in this study, a chain of treatment which gathers approaches allowing: 1) to collect time series of textual data for the constitution of thematic corpora with a spatial anchoring and to analyze them, 2) to store these massive and heterogeneous data in order to make them accessible and analyzable by all, without deteriorating them, 3) to extract indicators allowing to put in relation the data of the different thematics, as well on the spatial, temporal and thematic level, and 4) to extract knowledge from these data, in order to show the impact of these thematics on the evolution of the territory in a global way. From these different approaches, we highlight the importance of linking data that have been managed in silo until now, by bringing out knowledge that can be used as a decision support system.The set of methodological approaches that we propose in this study constitutes a complete processing chain, from the collection of heterogeneous data to their linking and analysis for the extraction of knowledge for the description of territorial events on the spatio-temporal level.; L’avènement des nouvelles technologies de la communication et de l’information (NTIC) accélère la croissance des données produites par les services qu’offrent les grandes villes à leur population dans divers domaines. Parmi ces données, nous pouvons citer : les données textuelles (disponibles sur le Web), les images satellites (données de surveillance), les données issues de capteurs, etc. Ces données sont essentiellement issues des services proposés pour répondre aux besoins quotidiens des habitants comme la mobilité, la communication, la santé, ainsi que les services de gestion des différentes ressources comme l’eau, les exploitations agricoles et urbaines, l’énergie, etc. Cette forte croissance remet en question la complétude et l'efficacité des méthodes et techniques classiquement utilisées en fouille de données. Les difficultés rencontrées sont principalement liées à la volumétrie des données, mais aussi à leur complexité telle que la forte hétérogénéité. Notre sujet de recherche s’inscrit dans le cadre de la démarche ÉcoCité de la Métropole de Montpellier Méditerranée (3M), et vise à développer une démarche d’observation intelligente du territoire à partir des masses de données dont-elle dispose.Dans cette thèse, nous nous intéressons à l'enrichissement mutuelle entre des données fortement hétérogènes pour le suivi des territoires. Nous limitons notre étude à trois thématiques qui sont, l’urbanisation, l’agriculture et l’hydrologie sur le territoire de la métropole de Montpellier. Pour ce faire, nous déclinons dans cette étude, une chaîne de traitement qui regroupe des approches permettant : 1) de collecter des séries temporelles de données textuelles pour la constitution de corpus thématiques avec un ancrage sur le plan spatial et de les analyser, 2) de stocker ces données massives et hétérogènes afin de les rendre accessibles et analysables par tous, sans pour autant les détériorer, 3) d’extraire des indicateurs permettant de mettre en relation les données des différentes thématiques, tant sur le plan spatial, temporel que thématique, et 4) d’extraire des connaissances à partir de ces données, afin de montrer l’impact de ces thématiques sur l’évolution du territoire de façon globale. À partir de ces différentes approches, nous mettons en évidence l'importance de la mise en relation de données gérées jusqu'ici en silo, en faisant ressortir des connaissances pouvant servir de système d’aide à la décision.L'ensemble des approches méthodologiques que nous proposons dans cette étude, constitue une chaîne de traitement complète, allant de la collecte des données hétérogènes à leur mise en relation et analyse pour l'extraction des connaissances pour la description d’événements territoriaux sur le plan spatio-temporel.
Databáze: OpenAIRE