Inducción de los esquemas narrativos de eventos

Autor: García Fernández, Víctor
Přispěvatelé: Boguslavskiy Margolin, Igor
Jazyk: Spanish; Castilian
Rok vydání: 2021
Předmět:
Zdroj: Archivo Digital UPM
Universidad Politécnica de Madrid
Popis: En 2008, Nathanael Chambers y Dan Jurafsky, dos profesores de Lingüística computacional de la Universidad de Stanford, publicaron un paper titulado «Unsupervised Learning of Narrative Event Chains». En dicho paper, describieron el desarrollo de un nuevo algoritmo computacional para la extracción de información de textos escritos en lenguaje natural y probaron su eficacia realizando dos pruebas de concepto. El presente trabajo consiste en la adaptación de dicho trabajo al lenguaje español y la realización de las dos pruebas de concepto. Estas pruebas se enmarcan dentro de lo que se conoce como PLN o Procesamiento de Lenguaje Natural y tienen como objetivo el desarrollo de un programa capaz de procesar textos escritos en lenguaje humano y generar un script en el que se plasman los eventos acaecidos en el texto en forma de cadena. El trabajo también incluye, claro está, el análisis de los resultados obtenidos de estos experimentos, esto es, se analiza con qué fiabilidad capturan estas cadenas la información expresada en el texto. Para la realización de este trabajo ha sido necesaria la utilización de un software de código abierto llamado Freeling. Este software se encarga del análisis morfológico y sintáctico de los textos, así como de la resolución de correferencias, tras lo cual se procede a la generación de las cadenas de eventos y su posterior análisis. La relevancia de estos experimentos consiste en la posibilidad de desarrollar un programa capaz de analizar textos humanos y extraer automáticamente la información que compone la cadena de eventos, así como la identificación del ente o personaje principal que participa en dicha cadena de sucesos, al que se denominará el «Protagonista».---ABSTRACT---In 2008, Nathanael Chambers and Dan Jurafsky, two professors of Linguistics and Computer Science at Stanford University, published a paper entitled “Unsupervised Learning of Narrative Event Chains”. In this paper, they described the development of a novel computational algorithm for information extraction from texts written in natural language, and they tested its efficiency by conducting two proofs of concept. The present work consists of the adaptation of the aforementioned work to the Spanish language and the execution of those proofs of concept. This work fits within what is known as NLP or Natural Language Processing and its goal is the development of an application able to process texts written in human language and generate a script expressing the events taking place in the text as an event chain. The work also includes the analysis of the results obtained from these tests, that is, analysing how reliably capture these chains the information expressed in the text. Carrying out this work required the usage of an open-source toolkit called Freeling. This software handles the morphological and syntactical analysis of the texts, as well as the coreference resolutions, after which the author of this work must proceed to the generation of the event chains and its subsequent analysis. The relevance of these experiments lies in the possibility to develop a program able to analyse human texts and automatically extract the information that makes up the chain event, as well as the identification of the entity or main character of this event chain, who will be called the “Protagonist”.
Databáze: OpenAIRE