Management and Exploitation of Sensor Data : an Approach Based on Data Reduction

Autor: Boulanouar, Khedidja
Přispěvatelé: Laboratoire d'Informatique et d'Automatique pour les Systèmes (LIAS), Université de Poitiers-ENSMA, ISAE-ENSMA Ecole Nationale Supérieure de Mécanique et d'Aérotechique - Poitiers, Université Saad Dahlab de Blida (Algérie), Allel Hadjali, Mohand Lagha, STAR, ABES
Jazyk: francouzština
Rok vydání: 2021
Předmět:
Zdroj: Autre [cs.OH]. ISAE-ENSMA Ecole Nationale Supérieure de Mécanique et d'Aérotechique-Poitiers; Université Saad Dahlab de Blida (Algérie), 2021. Français. ⟨NNT : 2021ESMA0011⟩
Popis: In many modern applications (stemming from scientific fields, transport, energy, environment, etc.),data represent a raw material and a product with high added value for decision-making. The deluge of data generated by these applications makes some classic processing paradigms no longer completely relevant way to some decision-making situations. Thus, a renewed interest (of researchers) for some data processing approaches is observed. Recently, the approach using the principle of data reduction has aroused a real enthusiasm. The principle of this approach is to reduce the amount of data in imput of the processing process. This approach allows a less expensive data exploitation (in terms of calculation and time) and to obtain approximate answers or just some trends of the target data. This is particularly desirable in contexts where an approximate answer is rather desirable andprovides enough information to be acceptable.There are many techniques for reducing data volume, of which data summary structures (or synopsis)are part of these techniques. As part of this thesis, we are interested in a family of summary structures borrowed from the field of computational intelligence. These structures (such as non-classical mathematical quantifiers, typicity, labels / linguistic patterns, etc.) have two interesting features : (i) the intelligibility of the summaries constructed and ; (ii) the generation of summaries that describe the data at different levels of abstraction. The target data are real data coming from multi-sensors in (i) aircraft flights collected within the framework of the ADSB project and (ii) Smart Cities within the context of the neOCampus project. As first contribution of the thesis, we proposed a method for summary extracting using (i) nonclassical quantifiers and (ii) the notion of typicity. Measures to characterize the properties of the constructed summaries (veracity, representativeness, imprecision, etc.) are also defined knowing that these properties evolve in a contradictory way. Then, we analyzed the different ways to use each of the summaries for the decision-making purpose. Secondly, we were interested in the study of certain characteristics of data trends (in sensor data or time series) such as dynamic change, duration and variability. This study allowed us to select the best summary among the summaries constructed using the non-classical quantifiers. This selection is formalized as a multi-objective optimization problem. The proposed resolution approach uses a genetic algorithm suitably chosen. Finally, a set of experiments were carried out on real data to validate and compare all our proposal.
Dans de nombreuses applications modernes (issues des domaines scientifiques, du transport, de l'énergie, de l'environnement, etc.), les données représentent une matière première et des produits à forte valeur ajoutée pour la prise de décision. Les déluges des données générées par ces applications font que certains paradigmes classiques de traitement ne répondent plus, d’une manière complètement pertinente, à certaines situations de prise de décision. Ainsi, un regain d’intérêt (des chercheurs) pour certaines approches de traitement de données est observé. Récemment, l'approche utilisant le principe de réduction de données a suscité un réel engouement. Le principe de cette approche est de réduire le volume de données en entrée du processus de traitement. Cette approche permet, notamment, de garantir une exploitation de données moins coûteuse (en termes de calcul et de temps) et d’obtenir des réponses approximatives ou juste certaines tendances des données. Ce qui est, particulièrement, désirable dans des contextes où une réponse approximative est plutôt souhaitable et apporte suffisamment d’informations pour être acceptable.Il existe de nombreuses techniques de réduction du volume des données, dont les structures de résumé de données (ou synopsis) font partie. Dans le cadre de cette thèse, nous nous sommes intéressés à une famille de structures de résumé issues du domaine de l'intelligence computationnelle. Ces structures (comme les quantificateurs mathématiques non classiques, la typicité, les labels/motifs linguistiques, etc.) se distinguent par deux particularités : (i) l'intelligibilité des résumés construits et ; (ii) la génération des résumés qui décrivent les données à des niveaux d’abstraction différents. Les données cibles sont des données réelles provenant de multi-capteurs concernant (i) des vols d’aéronefs collectées dans le cadre du projet ADSB et (ii) des Smart Cities dans le contexte du projet neOCampus. Dans la première contribution de la thèse, nous avons proposé une méthode d’extraction de résumé de données en utilisant (i) les quantificateurs non classiques et (ii) la notion de typicité. Des mesures pour caractériser les propriétés des résumés construits (véracité, représentativité, imprécision, etc.) sont également définies sachant que ces propriétés évoluent d’une manière contradictoire. Puis, nous avons analysé les différentes manières d’exploiter chacun des résumés à des fins de prise de décision. Dans un second temps, nous nous sommes intéressés à l’étude de certaines caractéristiques des tendances des données (issues de capteurs ou de séries temporelles) comme le changement dynamique, la durée et la variabilité. Cette étude nous a permis de sélectionner le meilleur résumé parmi les résumés construits sur la base des quantificateurs non classiques. Cette sélection est formalisé sous forme d’un problème d’optimisation multi-objectif. L’approche de résolution proposée utilise un algorithme génétique convenablement choisi. Enfin, une série d’expérimentations ont été menées, sur des données réelles, pour valider et comparer toutes nos propositions.
Databáze: OpenAIRE