Popis: |
Las ontologías conforman un recurso crucial para modelar una gran cantidad de información que se maneja actualmente en la web, permitiendo relacionar un enorme número de entidades de distintas fuentes en un único conjunto de datos procesable. Debido a la naturaleza heterogénea de los datos que forman parte de ellas, es común encontrar situaciones en las que dos usuarios quieren compartir información perteneciente a una misma área de conocimiento, pero las ligeras variaciones en la definición de sus modelos impiden que esta sea una tarea inmediata: estos no hablan el mismo idioma. Los algoritmos de ontology matching buscan solucionar este problema, generando un conjunto de equivalencias (una nueva ontología) entre las entidades similares pertenecientes a ambos usuarios, que pueda ser utilizada para consultar los datos del otro utilizando el modelo generado que ambos conocen, a pesar de que se estructuren según un modelo distinto. No obstante, estas técnicas están limitadas a una única ejecución aislada, y hasta donde se ha investigado no hay formas inmediatas de modificarlos o mejorarlos mediante procesos automatizados. Así, en este proyecto se presenta un protocolo, potencialmente aplicable a clientes web. En él se implementa un proceso que, combinando dos conjuntos de equivalencias generados por algoritmos de ontology matching, crea un tercero que resulta de la combinación de ambos, utilizando para ello múltiples estrategias (algoritmos) diferentes. De esta forma, se podrá repetir el protocolo múltiples veces, con el fin de ir mejorando iterativamente el conjunto de equivalencias que posee cada cliente que use el protocolo. ABSTRACT Ontologies are a crucial resource for modeling a large amount of information that is currently handled on the web, allowing a huge number of entities from different sources to be related in a single computable data set. Due to the heterogeneous nature of the data that conforms these ontologies, it is common to find situations in which two users want to share information belonging to the same area of knowledge, but the slight variations in the definition of their models prevent this from being a task immediate: both data do not speak the same language. The ontology matching algorithms seek to solve this problem, generating a set of equivalences (a new ontology) between the entities belonging to both users, which can be used to query the data of the other using the already generated model, despite the fact that they are structured according to a different model. However, these techniques are limited to a single isolated run, and, to the best of our research, there are no immediate ways to modify or improve them through automated processes. Thus, in this project a protocol is presented, potentially applicable to web clients. It implements a process that, by combining two sets of equivalences generated by ontology matching algorithms, creates a third that results from the combination of both, using multiple different strategies (algorithms). In this way, the protocol can be executed multiple times, in order to iteratively improve the set of equivalences that each client user has. |