Ein Glossar zur Datenqualität

Autor: Mohammed, Sedir, Brandner, Lou, Hallensleben, Sebastian, Harmouch, Hazar, Hauschke, Andreas, Heesen, Jessica, Hildebrandt, Stefanie, Hirsbrunner, Simon David, Keselj, Julia, Mahlow, Philipp, Naumann, Felix, Rostalski, Frauke, Wilken, Anna, Wölke, Annika
Jazyk: němčina
Rok vydání: 2023
DOI: 10.5281/zenodo.7585906
Popis: Gemeinhin wird Datenqualität definiert als die Eignung von Daten für einen bestimmten Anwendungszweck (fitness for use). Diese allgemeine Definition wird üblicherweise in eine Menge an Datenqualitätsdimensionen oder -kriterien aufgetrennt. Diese Dimensionen sind teils subjektiv, teils objektiv. Teils können sie automatisch gemessen werden, teils sind sie überprüfbar und teils können sie nur durch Expert*innen bewertet werden. Das Glossar zur Datenqualität listet alle relevanten Datenqualitätsdimensionen mit einer knappen allgemeinen Definition. Der Fokus liegt auf der Nutzung von Daten für Anwendungen der Künstliche Intelligenz. Die Dimensionen sind nicht orthogonal – ihre Bewertungen können voneinander abhängen; dennoch wirft jede Dimension einen etwas anderen Blick auf die Qualität von Daten. Sofern die Dimensionen oder wortgleiche Begriffe bereits in Gesetzen aufgegriffen wurden, enthält das Glossar einen entsprechenden Hinweis.* Einige klassische Dimensionen aus der Datenqualitätsliteratur (bspw. Objektivität, Compliance) werden hier näher ausdifferenziert oder in mehrere Elemente aufgespalten. In künftigen Ausgaben des Glossars planen wir, systematisch Beispiele hinzuzufügen sowie passende Literatur zu verknüpfen. Hinweise und Fragen zu den Begriffen und deren Definitionen nehmen wir gerne entgegen: felix.naumann@hpi.de * Es ist zu beachten, dass der hier angeführte KI-Verordnungsentwurf der Kommission sich noch in einem laufenden Gesetzgebungsverfahren befindet. Ob das Gesetz tatsächlich in Kraft tritt, ist dementsprechend nicht gesichert. In jedem Fall wird in der finalen Version mit Änderungen gegenüber dem Entwurf zu rechnen sein.
Die Forschung für diesen Artikel wurde gefördert durch das deutsche Bundesministerium für Arbeit und Soziales (BMAS) / The research for this article has been funded by the Federal Ministry of Labour and Social Affairs (in Germany).
Databáze: OpenAIRE