Vocabulário de domínio para o projeto IViSSEM

Autor: Guimarães, João Pedro Pereira
Přispěvatelé: Baptista, Ana Alice, Andrade, Morgana Carneiro de, Universidade do Minho
Jazyk: portugalština
Rok vydání: 2022
Předmět:
Popis: Dissertação de mestrado integrado em Engenharia e Gestão de Sistemas de Informação
A Web Semântica é definida como uma extensão da web atual, na qual a informação recebe um significado compreendido pela máquina e por humanos, permitindo uma melhor cooperação entre eles. Neste contexto, as ontologias emergem como um meio para a implementação da Web Semântica. Contudo, a heterogeneidade entre diferentes ontologias, associada a fatores como a ambiguidade e a redundância semântica, tornam a interoperabilidade entre elas um desafio. Para superar tais desafios, é essencial a existência de métodos e algoritmos para integrar diferentes ontologias com o objetivo de misturar, alinhar e fundir estas. Assim, com esta dissertação, através do estudo do estado da arte sobre os métodos/algoritmos de alinhamento de ontologias, bem como a seleção e implementação de alguns destes métodos/algoritmos pretende-se criar um vocabulário controlado resultante do alinhamento e fusão de vocabulários de domínio pré-existentes e focado no domínio Ciências da Computação para ser usado no âmbito do projeto IViSSEM. Para tal, uma vez que os vocabulário controlados são formas particulares de ontologias, foi realizada uma pesquisa bibliográfica na base Scopus sobre o alinhamento de ontologias, que resultou em cerca de 3.658 estudos. Destes estudos foram analisados os 2.000 mais relevantes de acordo com o critério adotado pela base de dados. Constatada a proeminência da Ontology Alignment Evaluation Initiative (OAEI) neste contexto, procedeu-se à análise dos 25 sistemas de alinhamento de ontologias e suas variantes que tinham participado em pelo menos uma track da competição no período de 2018 e/ou 2019. Consequentemente, foram considerados apenas sistemas de alinhamento de ontologias com métodos recentes e devidamente testados sob condições controladas. Da análise dos sistemas e das suas performances na competição resultou a seleção de dois sistemas para implementação do projeto: o AgreementMaker Light (AML) e o LogMap. Assim, utilizando estes dois sistemas, procedeu-se ao alinhamento de três vocabulários controlados (Domínios Científicos e Áreas Científicas da Fundação para a Ciência e Tecnologia, EuroSciVoc e Unesco Nomenclature for Fields of Science and Technology), fazendo um recorte para a área da Ciência da Computação. Para a avaliação dos alinhamentos, foi elaborado um estudo Delphi através de um questionário focado na opinião de especialistas em Ciência da Computação e da Ciência da Informação. Desta avaliação concluiu-se que o sistema Agreement Maker Light apresentou uma melhor performance. Por fim, a partir dos índices de avaliação obtidos pelo alinhamento, fornecidos pelos dois sistemas, fundiu-se os diferentes vocabulários num único vocabulário a ser adotado pelo projeto IViSSEM.
The Semantic Web is defined as an extension of the current web, in which information receives a meaning understood by machine and humans, allowing a better cooperation between them. In this context, ontologies emerge as a means to implement the Semantic Web. However, the heterogeneity between different ontologies, associated with factors such as semantic ambiguity and semantic redundancy, make interoperability between them a challenge. To overcome such challenges, it is essential to have methods and algorithms to integrate different ontologies with the aim of mixing, aligning and merging them. Therefore, with this dissertation, through the study of the state of the art on ontology alignment methods/algorithms, as well as the selection and implementation of some of these methods/algorithms, it is intended to create a controlled vocabulary resulting from the alignment and fusion of pre-existing domain vocabularies and focused on the Computer Science domain to be used within the IViSSEM project. For this, since controlled vocabularies are particular forms of ontologies, a bibliographic search on the Scopus database on the alignment of ontologies was performed, which resulted in about 3,658 studies. Of these studies, the 2,000 most relevant were analysed according to the criteria adopted by the database. Having noted the prominence of the Ontology Alignment Evaluation Initiative (OAEI) in this context, an analysis of the 25 ontology alignment systems and their variants that had participated in at least one track of the competition in the period 2018 and/or 2019 was carried out. Consequently, only ontology alignment systems with recent and properly tested methods under controlled conditions were considered. From the analysis of the systems and their performances in the competition resulted the selection of two of the systems for implementation of the project: AgreementMaker Light (AML) and LogMap. Using these two systems, three controlled vocabularies were aligned (Scientific Domains and Scientific Areas of the Foundation for Science and Technology, EuroSciVoc and Unesco Nomenclature for Fields of Science and Technology), focusing on the area of Computer Science. To evaluate the alignments, a one-round Delphi study was carried out using a questionnaire focused on the opinion of experts in Computer Science and Information Science. From this evaluation it was concluded that the Agreement Maker Light system presented a better performance. Finally, from the evaluation indexes obtained by the alignment provided by the two systems, the different vocabularies were merged into a single vocabulary to be adopted by the IViSSEM project.
Databáze: OpenAIRE