Extracción automática de relaciones qualia para la ontología OntoETAP

Autor: Cárdenas Montalbán, Vicente Sixto
Přispěvatelé: Boguslavskiy Margolin, Igor
Jazyk: Spanish; Castilian
Rok vydání: 2022
Předmět:
Zdroj: Archivo Digital UPM
Universidad Politécnica de Madrid
Popis: Los sistemas modernos que tratan con lenguaje natural buscan igualar la capacidad de “comunicación” y “entendimiento” de un ser humano. Sin embargo, el ser humano es capaz de entender los mensajes gracias al conocimiento del entorno que los rodea. El sistema de traducción ETAP-3 usa una ontología OntoETAP para guardar la información sobre las palabras. Este trabajo consiste en la extracción automática de información, en concreto, relaciones qualia, para su implementación sobre OntoETAP. La teoría del Lexicón Generativo define una estructura de qualia tal que cada concepto tiene cuatro roles qualia: formal, constitutivo, télico y agentivo. Estos definen la taxonomía del concepto, sus partes constituyentes, su papel u objetivo como entidad y la razón que le dió origen. Además, se analizan los distintos recursos ontológicos existentes y se escoge la ontología SUMO para extraer información de esta. Se explica el lenguaje SUOKIF usado en SUMO y los distintos métodos que permiten hallar las relaciones qualia a extraer. Posteriormente, se diseña en Python la aplicación que, mediante web scraping, extrae las relaciones objetivo haciendo uso de las librerías Scrapy y RegEx. La aplicación también traduce la información extraída a reglas para la ontología OntoETAP usando el lenguaje Etalog. Por último, se analizan los resultados obtenidos y su precisión, concluyendo los posibles beneficios y mejoras.---ABSTRACT---Modern systems that process natural language seek to match human abilities of “communicating” and “understanding”. However, the human being is able to understand messages thanks to their knowledge over surrounding enviroment. The ETAP-3 translation system uses the OntoETAP ontology in order to store information related to the word. This project consists in automatically extracting information, in particular, qualia relations, for the OntoETAP ontology. The Generative Lexicon theory defines the qualia structure so every concept has four roles: formal, constitutive, telic and agentive. These denote the concept’s taxonomy , its constitutive parts, their role or objective as an entity and the reason why it exists. Furthermore, the many ontological resources are analyzed and SUMO ontology is chosen as the ontology to extract information from. The SUO-KIF language used in SUMO and its existing relations, from which qualia relations are extracted, are explained. Afterwards, an application is designed in Python which, via web scraping methods, it extracts the desired relations making use of the Scrapy and RegEx libraries. The application also translates the extracted información into rules for the OntoETAP ontology in Etalog language. Finally, the results obtained and the precision of these results are analysed, to conclude the possible benefits and improvements of the application.
Databáze: OpenAIRE