Efficient Mining of Significant Insights from Data Cubes
Jazyk: | angličtina |
---|---|
Rok vydání: | 2023 |
Předmět: | |
DOI: | 10.26262/heal.auth.ir.348170 |
Popis: | Data is a valuable asset that can provide organizations with insights and knowledge to make informed decisions, gain a competitive advantage, and drive innovation. Extracting knowledge from data is essential for success in today’s business environment. However this procedure can be proven challenging due to the complexity and volume of data, noisy or irrelevant information, and the need for advanced analytical techniques and domain expertise. This dissertation proposes a solution to the challenges of extracting insights from multidimensional data by offering a user-friendly interface for automating exploratory data analysis, even for non-expert users. The main rationale of this work is to provide a concrete and practical implementation of Microsoft Research’s state-of-theart proposal in their paper "MetaInsight: Automatic Discovery of Structured Knowledge for Exploratory Data Analysis", while also extending and improving upon their proposal which consists of three basic steps. The first step is to extract data patterns from the raw data, which have a clearly defined structure. The second step involves categorizing these patterns into Homogeneous Data Patterns, where each pattern is either grouped based on a commonness set or considered an exception. The third and final step involves identifying insights by combining the common sets and exceptions, which are then scored and ranked based on usefulness and importance. Τα δεδομένα αποτελούν σημαντικό στοιχείο στoυς οργανισμούς για να τους εφοδιάσουν με συμπεράσματα και γνώση για να προβούν σε καλύτερες αποφάσεις, να κερδίσουν ανταγωνιστικό πλεονέκτημα και να οδεύσουν προς την πρωτοπορία. Η εξαγωγή γνώσης από δεδομένα είναι απαραίτητη για επιτυχία στην σημερινή εποχή των επιχειρήσεων. Ωστόσο, αυτή η διαδικασία μπορεί να φανεί πρόκληση λόγω της πολυπλοκότητας και του όγκου των δεδομένων, των θορυβώδων ή άσχετων πληροφοριών και της ανάγκης για προηγμένες αναλυτικές τεχνικές και ειδίκευση στον τομέα. Αυτή η διπλωματική προτείνει μια λύση στις δυσκολίες της εξαγωγής συμπερασμάτων από πολυδιάστατα δεδομένα παρέχοντας μια φιλική προς τον χρήστη διεπαφή για την αυτόματη εξερευνητικής ανάλυσης δεδομένων, ακόμα και για χρήστες χωρίς ιδιαίτερη ειδικότητα στον τομέα. Ο κύριος σκοπός αυτής της εργασίας είναι να παρέχει μια συγκεκριμένη και πρακτική υλοποίηση από το άρθρο της Microsoft Research με όνομα "MetaInsight: Automatic Discovery of Structured Knowledge for Exploratory Data Analysis". Παράλληλα, η εργασία αυτή επεκτείνει και βελτιώνει την πρόταση τους που αποτελείται από τρία βασικά βήματα. Το πρώτο βήμα είναι να εξαχθούν μοτίβα από τα ακατέργαστα δεδομένα, τα οποία έχουν μια καλά ορισμένη δομή. Το δεύτερο βήμα περιλαμβάνει την κατηγοριοποίηση των μοτίβων σε ομογενή μοτίβα, όπου κάθε μοτίβο ομαδοποιείται σε ένα σετ κανόνων ή εξαιρέσεων. Το τρίτο και τελευταίο βήμα αναγνωρίζει τα συμπεράσματα με τον συνδυασμό κανόνων και εξαιρέσεων όπου μετά υπολογίζεται μια τιμή σκορ ώστε να ταξινομηθεί σύμφωνα με την σημαντικότητά και την χρησιμότητά του. |
Databáze: | OpenAIRE |
Externí odkaz: |