Μελέτη Αλγορίθμων Οπτικής Αναγνώρισης Περιοχών σε Διάφορες Χωρικές Κλίμακες και Ποικίλα Εσωτερικά Περιβάλλοντα
Jazyk: | Greek, Modern (1453-)<br />Greek |
---|---|
Rok vydání: | 2023 |
Předmět: | |
DOI: | 10.26262/heal.auth.ir.347164 |
Popis: | Στην παρούσα μεταπτυχιακή διπλωματική εργασία παρουσιάζεται μία ολοκληρωμένη μελέτη τριών ευρέως χρησιμοποιούμενων αλγορίθμων για οπτική αναγνώριση περιοχών σε πραγματικά και ποικίλα εσωτερικά περιβάλλοντα. Η απόδοση των αλγορίθμων αξιολογείται με βάση την ακρίβεια, την υπολογιστική απόδοση και την ευρωστία. Οι πειραματικές αξιολογήσεις διεξάγονται σε σύνολα δεδομένων πραγματικών εσωτερικών χώρων, που παρουσιάζουν διάφορες δυσκολίες όπως επαναλαμβανόμενες υφές, κινούμενα αντικείμενα, αποκρύψεις, διακυμάνσεις στο φωτισμό και στην οπτική γωνίας θέασης. Αυτά τα σύνολα δεδομένων αντιπροσωπεύουν ένα ολοκληρωμένο και ποικίλο φάσμα εσωτερικών χώρων. Επιπλέον, κρίνεται σκόπιμο να επισημανθεί ότι η μελέτη εξετάζει την οπτική αναγνώριση περιοχών για διάφορες χωρικές κλίμακες, ώστε να διασφαλιστεί μια ενδελεχής αξιολόγηση των αλγορίθμων. Η παρούσα μελέτη αξιολογεί τρεις αλγορίθμους για την οπτική αναγνώριση περιοχών, η οποία επικεντρώνονται σε εφαρμογές εντοπισμού θέσης σε εσωτερικούς χώρους σε πραγματικό χρόνο. Ο πρώτος αλγόριθμος χρησιμοποιεί τα τοπικά διανύσματα περιγργαφής ORB και μια ιεραρχική αναπαράσταση bag of words, ο δεύτερος αλγόριθμος, ο οποίος ονομάζεται NetVlad, βασίζεται στη βαθιά μάθηση και χρησιμοποιεί ένα διάνυσμα συνολικής περιγραφής και ο τρίτος αλγόριθμος, είναι ένα βαθύ νευρωνικό δίκτυο βασισμένο σε γράφημα (SuperGlue) που ταιριάζει εικόνες βάση των τοπικών διανυσμάτων περιγραφής (Supepoint), τα οποία εξάγονται με τεχνικές βαθιάς μηχανικής μάθησης. Τα αποτελέσματα των πειραμάτων παρέχουν μια εκτενή εξέταση της αποτελεσματικότητας κάθε αλγορίθμου και αποκαλύπτουν τα αντίστοιχα πλεονεκτήματα και τους περιορισμούς τους. Τα αποτελέσματα της μελέτης προσφέρουν μια ολοκληρωμένη αξιολόγηση της βιωσιμότητας και της αξιοπιστίας των οπτικών πληροφοριών στον εντοπισμό θέσης σε εσωτερικούς χώρους. Η εξέταση υπογραμμίζει τους περιορισμούς και τις δυσκολίες που αντιμετωπίζουν οι τρέχουσες προσεγγίσεις οπτικής αναγνώρισης περιοχών και παρέχει συστάσεις για περαιτέρω πρόοδο. Επιπλέον, τα ευρήματα παρέχουν κατευθύνσεις για τη σύλληψη και την εκτέλεση συστημάτων εντοπισμού θέσεις σε εσωτερικούς χώρους σε πραγματικό χρόνο που εξαρτώνται από οπτικές πληροφορίες. This master's thesis presents a comprehensive assessment of three commonly utilized algorithms for visual place recognition in real-world and diverse indoor environments. The performance of algorithms is quantified using three key metrics, accuracy, computational efficiency, and robustness. These evaluations are conducted on real-world indoor datasets that contain various difficulties, including repetitive textures, moving objects, fluctuations in lighting, occlusions and variations in perspective viewpoint. These datasets represent a comprehensive and diverse range of indoor scenarios. The study considers inference for various spatial scales to ensure a thorough evaluation of the algorithms. This study evaluates three algorithms for visual place recognition, focused on real-time indoor localization applications. The first algorithm employs ORB features and a hierarchical bag of words representation, the second algorithm is based on deep learning and utilizes a global descriptor, namely NetVLAD, and the third algorithm is a graph-based deep neural network (SuperGlue) that matches deep learned local descriptors (Superpoint). The results of the experiments provide a thorough examination of the effectiveness of each algorithm and reveal their respective advantages and limitations. The conclusion of this master's thesis presents significant ramifications for the progression of real-time indoor localization systems that exclusively utilize visual information. The outcomes of the study offer a comprehensive evaluation of the viability and dependability of visual information in real-time indoor localization systems. The examination underscores the limitations and difficulties faced by the current visual place recognition approaches and provides recommendations for further advancement. Furthermore, the findings furnish direction for the conceptualization and execution of real-time indoor localization systems that depend on visual information. Σε συνεργασία με: Λογιστικής και Χρηματοοικονομικής (Πανεπιστήμιο Μακεδονίας) |
Databáze: | OpenAIRE |
Externí odkaz: |