Visualisierung hochdimensionaler Daten mit hierarchischer Gruppierung von Teilmengen

Autor: Pfahler, David
Jazyk: angličtina
Rok vydání: 2019
Předmět:
DOI: 10.34726/hss.2019.44082
Popis: Die Anzahl der installierten Sensoren zur Erfassung von Daten, z. B. Stromz��hler in Smart Grids, nimmt rasant zu. Diese riesige Menge an gesammelten Daten muss von den ��bertragungsnetzbetreibern analysiert und ��berwacht werden. Diese Aufgabe wird durch Visual Analytics Techniken unterst��tzt, aber traditionelle multidimensionale Datenvisualisierungstechniken skalieren nicht sehr gut f��r hochdimensionale Daten. Der Hauptbeitrag dieser Arbeit ist ein Rahmenwerk, um solche hochdimensionalen Daten effizient zu inspizieren und zu vergleichen. Die zentrale Idee ist es, die Daten durch die Semantik der zugrundeliegenden Datendimensionen in Gruppen zu zerteilen. Fach-Experten kennen die Metainformationen der Daten und k��nnen diese Gruppen in eine Hierarchie strukturieren. Das System berechnet aus den Gruppen statistische Eigenschaften, welche dann visualisiert werden. Diese visuellen Repr��sentationen k��nnen verwendet werden, um die analytischen Aufgaben des Benutzers zu unterst��tzen.
The number of installed sensors to acquire data, for example electricity meters in smart grids, is increasing rapidly. The huge amount of collected data needs to be analyzed and monitored by transmission-system operators. This task is supported by visual analytics techniques, but traditional multi-dimensional data visualization techniques do not scale very well for high-dimensional data. The main contribution of this thesis is a framework to efficiently examine and compare such high-dimensional data. The key idea is to divide the data by the semantics of the underlying dimensions into groups. Domain experts are familiar with the meta-information of the data and are able to structure these groups into a hierarchy. Various statistical properties are calculated from the subdivided data. These are then visualized by the proposed system using appropriate means. The hierarchy and the visualizations of the calculated statistical values are displayed in a tabular layout. The rows contain the subdivided data and the columns visualize their statistics. Flexible interaction possibilities with the visual representation help the experts to fulfill their analysis tasks. The tasks include searching for structures, sorting by statistical properties, identifying correlations of the subdivided data, and interactively subdivide or combine the data. A usage scenario evaluates the design of the framework with a data set of the target domain in the energy sector.
Databáze: OpenAIRE