Extracción y análisis de intervenciones parlamentarias mediante algoritmos basados en entidades nombradas

Autor: Bosch Canals, Antoni
Přispěvatelé: Universitat Politècnica de Catalunya. Departament d'Estadística i Investigació Operativa, Polit-X, Grima Cintas, Pedro
Jazyk: Spanish; Castilian
Rok vydání: 2023
Předmět:
Popis: Este Trabajo de Fin de Grado presenta el desarrollo e implementación de un algoritmo de procesamiento de lenguaje natural (NLP) que utiliza expresiones regulares para la identificación y extracción de intervenciones políticas en documentos oficiales del parlamento alemán. El estudio se centra en comparar y mejorar el rendimiento del algoritmo que se propone en este trabajo respecto al algoritmo preexistente. Además, se hace una revisión del estado del arte y de las técnicas utilizadas por el algoritmo, como el reconocimiento de entidades nombradas (NER). Se lleva a cabo una evaluación de los resultados obtenidos mediante la comparación con un modelo de referencia y un análisis de los documentos de los últimos años. El algoritmo resultante tiene un incremento de rendimiento de un 25% en comparación con el algoritmo anterior, con menos de un 2% de margen de error, cumpliendo con los objetivos establecidos Aquest Treball de Fi de Grau presenta el desenvolupament i implementació d'un algorisme de processament de llenguatge natural (NLP) que utilitza expressions regulars per a la identificació i extracció d'intervencions polítiques en documents oficials del parlament alemany. L'estudi se centra principalment a comparar i millorar el rendiment de l'algorisme que es proposa en aquest treball respecte a l'algorisme preexistent. A més, es fa una revisió de l'estat de l'art i de les tècniques utilitzades per l'algorisme, com el reconeixement d'entitats nomenades (NER). Es duu a terme una avaluació dels resultats obtinguts mitjançant la comparació amb un model de referència i una anàlisi dels documents dels últims anys. L'algorisme resultant té un increment de rendiment d'un 25% en comparació amb l'algorisme anterior, amb menys d'un 2% de marge d'error, complint amb els objectius establerts This Bachelor’s thesis presents the development and implementation of a natural language processing (NLP) algorithm using regular expressions for the identification and extraction of political interventions in official documents of the German parliament. The study mainly focuses on comparing and improving the performance of the algorithm proposed in this work with respect to the pre-existing algorithm. In addition, a review of the state of the art and techniques used by the algorithm, such as named entity recognition (NER), is made. An evaluation of the results obtained is carried out by comparison with a gold standard and an analysis of papers from recent years. The resulting algorithm has a 25% performance increase compared to the previous algorithm, with less than 2% margin of error, meeting the established objectives
Databáze: OpenAIRE