Aligning ontologies describing computer science for patents and scientific papers

Autor: Marcher, Hannes
Jazyk: angličtina
Rok vydání: 2023
Předmět:
DOI: 10.34726/hss.2023.102208
Popis: Ontologien stellen den Grundstein des Semantic Web dar und ermöglichen die explizite Spezifikation von Konzeptualisierungen. An der Erstellung und Wartung von Ontologien sind eine Vielzahl unterschiedlicher Organisationen beteiligt. Da jede Organisation einen anderen Blickwinkel hat, sind selbst Ontologien über ähnliche Bereiche recht heterogen. Dadurch entsteht eine semantische Lücke zwischen verschiedenen Ontologien, die durch die Erstellung sogenannter Ontology Alignments geschlossen werden kann. In der Regel werden solche Alignments zwischen Ontologien mithilfe automatisierter Ontology Alignment Systeme generiert. Das Hauptziel dieser Masterarbeit ist zweigeteilt. Zum einen werden in dieser Arbeit Ontology Alignment Systeme aus der Literatur auf ihre Anwendbarkeit zur Erstellung eines Alignments zwischen der Patentontologie CPC und den beiden Informatikontologien CCS und CSO geprüft. Zum anderen wurden zwei Alignments erstellt, ein Alignment zwischen CPC und CCS und ein weiteres Alignment zwischen CPC und CSO unter der Verwendung zweier geeigneter Ontology Alignment Systeme. In einem ersten Schritt führt diese Arbeit eine Literaturrecherche durch, um vielversprechende Systeme zu ermitteln. Das Ergebnis besteht aus einer Reihe an Ontology Alignment Systemen, welche alle Voraussetzungen erfüllen, um Alignments zwischen den oben genannten Ontologien zu erstellen. In einem weiteren Schritt wird die Leistung jedes Ansatzes auf einem manuell erstellten Referenzdatensatz sowie auf dem Anatomie-Anwendungsfall der Ontology Alignment Evaluation Initiative ermittelt. Die Leistung wird hierbei in Form von Precision, Recall sowie F1-Score gemessen. Final werden dann die endgültigen Alignments, welche mit den vielversprechendsten Ansätzen erzeugt wurden, vorgestellt. Das Ergebnis dieses Schrittes besteht aus einer Bewertung der beiden Alignments unter Verwendung von approximierten Precision, Recall und F1-Score Maßen. Die Hauptergebnisse dieser Arbeit sind: (a) Die State-of-the-Art Systeme LogMap und AML sind am besten geeignet, um Alignments zwischen CPC und CCS bzw. CPC und CSO zu erstellen. (b) Die generierten Alignments stellen einen nützlichen ersten Schritt dar. Sie reichen jedoch nicht aus, um die semantische Lücke zwischen diesen Ontologien zu schließen.
Ontologies are the core of the Semantic Web and enable the explicit specification of conceptualizations. A large variety of different communities are involved in the generation and maintenance of ontologies. Because each community has a different perspective, even ontologies about similar domains are quite heterogeneous. This imposes a semantic gap between different ontologies which can be addressed through the creation of ontology alignments. Typically, alignments between ontologies are generated through ontology alignment systems - automated tools to generate such alignments. The major aim of this master thesis is two folded. First, this work compares ontology alignment systems from the literature towards their applicability to align the patent ontology CPC with the two computer science ontologies CCS and CSO. Second, two alignments were created, one between CPC and CCS and one between CPC and CSO using two suitable ontology alignment systems. As the initial step, this thesis conducts a literature review to elicit promising ontology alignment systems. The outcome is a set of ontology alignment systems that fit the characteristics of the use case of this thesis. Next, this thesis presents the performance of each approach on a manually created ground truth as well as on the Anatomy test case of the Ontology Alignment Evaluation Initiative. The outcome comprises a comparison using precision, recall, and f1-score. Third, the characteristics of the final alignments that have been generated using the most promising approaches are presented. The result of this step consists of an evaluation of the two alignments, i.e. one alignment between CPC and CCS and one alignment between CPC and CSO, using estimated precision, recall, and f1-score measures. The major results of this thesis are: (a) The State-of-the-Art matchers LogMap and AML are most suited to align CPC with CCS and CPC with CSO, respectively. (b) The alignments represent a useful first building block in aligning the patent ontology CPC with the computer science ontologies CCS and CSO, but they are not sufficient to bridge the semantic gap between these ontologies.
Databáze: OpenAIRE