Ολοκληρωμένο περιβάλλον προσομοίωσης πειραμάτων ομοσπονδιακής μηχανικής μάθησης
Přispěvatelé: | Κυριαζής, Δημοσθένης, Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών. Τμήμα Ψηφιακών Συστημάτων, Πληροφοριακά Συστήματα και Υπηρεσίες |
---|---|
Jazyk: | Greek, Modern (1453-)<br />Greek |
Rok vydání: | 2023 |
Předmět: | |
Popis: | Η ραγδαία εξέλιξη του Διαδικτύου των Πραγμάτων (Internet of Things – IoT) έχει οδηγήσει στην εξαιρετικά αυξημένη παραγωγή δεδομένων. Οι ποσότητες των δεδομένων που παράγονται είναι γιγαντιαίες και ο ρυθμός με τον οποίο παράγονται αυξάνεται εκθετικά, οδηγώντας στην εποχή των Μεγάλων Δεδομένων. Πλέον, υπάρχει πληθώρα συσκευών οι οποίες παράγουν τα δικά τους δεδομένα και τα οποία, δυνητικά, μπορούν να αξιοποιηθούν για την εξόρυξη χρήσιμης πληροφορίας και γνώσης. Ωστόσο, ο όγκος των δεδομένων, σε συνδυασμό με άλλους περιορισμούς που πρέπει να λαμβάνονται υπόψη, κυριότερος εξ αυτών είναι η διασφάλιση της ιδιωτικότητας στα δεδομένα, έχουν οδηγήσει στην εύρεση εναλλακτικών μεθόδων για την ανάλυση των δεδομένων και γενικά, για την εφαρμογή τεχνικών Μηχανικής Μάθησης σε αυτά. Η πιο πρόσφατη προσέγγιση που έχει προταθεί για να αντιμετωπίσει τις προαναφερθείσες προκλήσεις είναι η Ομοσπονδιακή Μάθηση. Η Ομοσπονδιακή Μάθηση βασίζεται στην ιδέα της κατανεμημένης επεξεργασίας και ανάλυσης δεδομένων και την δημιουργία μοντέλων Μηχανικής Μάθησης τοπικά στην εκάστοτε συσκευή παραγωγής δεδομένων. Τα προαναφερθέντα επιμέρους μοντέλα, εν συνεχεία, συνδυάζονται σε ένα ενιαίο μοντέλο, χωρίς τη μεταφορά των δεδομένων από τα οποία προέκυψαν τα αντίστοιχα μοντέλα. Με αυτό τον τρόπο η Ομοσπονδιακή Μάθηση διασφαλίζει την ασφάλεια και την αξιοπιστία των δεδομένων, χωρίς να επηρεάζει αρνητικά την αποδοτικότητα και την αποτελεσματικότητα τον αλγορίθμων Μηχανικής Μάθησης, συγκριτικά με αντίστοιχες συμβατικές μεθόδους. Φυσικά, η επιλογή της Ομοσπονδιακής Μάθησης έναντι μιας συμβατικής μεθόδου, θα πρέπει να πραγματοποιείται βάσει διαφορετικών παραγόντων, όπως του εκάστοτε σεναρίου χρήσης και των διαθέσιμων δεδομένων και υπολογιστικών πόρων. Προς αυτή τη κατεύθυνση, η παρούσα διπλωματική εργασία παρέχει, αρχικά, μία αναλυτική ανασκόπηση βιβλιογραφίας αναφορικά με την Ομοσπονδιακή Μάθηση. Εν συνεχεία, προτείνει ένα ολοκληρωμένο περιβάλλον, το οποίο παρέχει στους χρήστες την δυνατότητα εκτέλεσης πειραμάτων με τους αλγορίθμους, τις παραμέτρους και τα σύνολα δεδομένων της αρεσκείας τους και το οποίο οπτικοποιεί τα αποτελέσματα των αντίστοιχων πειραμάτων με κατανοητό τρόπο. Στόχος του συγκεκριμένου περιβάλλοντος είναι, όχι μόνο να λειτουργήσει ως οδηγός για την υιοθέτηση του ομοσπονδιακού τρόπου μάθησης, αλλά και για να συνδράμει στην επιλογή των πιο αποδοτικών αλγορίθμων και των παραμέτρων τους ανάλογα με τα σενάρια χρήσης που ενδιαφέρουν τους εκάστοτε χρήστες. The rapid development of the Internet of Things (IoT) has led to an exponential increase in data production. The volume of generated data is gigantic; at the same time, the rate at which they are being generated is increasing dramatically, thus leading to the Big Data era. Nowadays, there is a plethora of devices that generate their own data, which can potentially be utilized for useful information and knowledge extraction. However, the volume of data, combined with other limitations that must be taken into consideration, such as the assurance of data privacy, have led to the exploitation of alternative methods for data analysis and, in general, for the application of Machine Learning techniques. The most recent approach that has been proposed to address the aforementioned challenges is Federated Learning. Federated Learning is based on the idea of distributed data processing and analysis and the creation of Machine Learning models locally on the data source. The aforementioned individual models are then combined into a single, unified model, without transferring the data from which the respective models were derived. As a result, Federated Learning ensures the safety and reliability of data, without negatively affecting the efficiency and effectiveness of Machine Learning algorithms, compared to corresponding conventional methods. However, the choice of Federated Learning over a conventional method should be made based on different factors, such as the specific use case scenario and corresponding data, as well as the available computing resources. Taking everything mentioned above into consideration, this thesis initially provides an analytical literature review regarding Federated Learning. It then proposes an integrated framework, which provides users with the ability to run experiments with the algorithms, parameters and datasets of their liking and, finally, visualizes the results of the respective experiments in an understandable way. The objective of this specific framework is not only to act as a guide for the adoption of the Federated Learning paradigm, but also to assist in the selection of the most efficient algorithms and their parameters for a specific use case scenario. |
Databáze: | OpenAIRE |
Externí odkaz: |