Problem tree classification for the formulation of social projects
Autor: | Prada Quintero, Andrea, Diaz Pardo, Juan Pablo |
---|---|
Přispěvatelé: | Pajaro Hernandez, Juan Pablo, Mora Lopez, Juan Pablo, Mora López, Juan Pablo |
Jazyk: | Spanish; Castilian |
Rok vydání: | 2022 |
Předmět: |
Lenguaje natural (Informática)
Lógica computacional Natural language processing Análisis de datos Problem trees Semántica Metodología del marco lógico Departamento Nacional de Planeación Department of national planning Similitud semántica Named entity recognition Clasificación de oraciones Semantic similarity Reconocimiento de entidades nombradas Procesamiento de lenguaje natural Transformers Transformadores Text classification Árbol de problemas Logical framework approach Maestría en analítica para la inteligencia de negocios - Tesis y disertaciones académicas |
Zdroj: | Repositorio Universidad Javeriana Pontificia Universidad Javeriana instacron:Pontificia Universidad Javeriana |
Popis: | El proyecto tiene como objetivo desarrollar una prueba de concepto para realizar la validación de árboles de problemas formulados bajo la Metodología del Marco Lógico a través de técnicas basadas en el Procesamiento de Lenguaje Natural. Esta tarea es relevante dentro del marco del diseño de políticas públicas, pues el proceso de validación es difícil y costoso, dados los elementos transdisciplinarios y sistémicos que involucran a profesionales de múltiples disciplinas, así como intereses particulares. Para lograr este objetivo, se utilizó un repositorio de árboles de problemas correspondiente a proyectos de inversión reales y aprobados por el Departamento Nacional de Planeación, los cuales estaban etiquetados como causa, problema, efecto u otro. A partir de este conjunto de datos, se realizó un proceso de minería de datos con el fin de realizar las siguientes tareas: clasificación de oraciones (causa, problema, efecto u otra), reconocimiento de entidades nombradas y similitud semántica (problema - causa/efecto). Como principal hallazgo la prueba de concepto arroja la pertinencia de modelos de lenguaje basados en transformadores en español (BETO) para las tareas de clasificación de oraciones y similitud semántica. Mientras que para el reconocimiento de entidades nombradas se recomienda el uso de un modelo sobre ajustado FLERT. Finalmente, se realizó un modelo de aceptación tecnológica junto a un panel de expertos, con el fin de corroborar la idoneidad de la solución analítica propuesta para la formulación de proyectos sociales. The project is a proof of concept for the validation of problem trees formulated under the Logical Framework Approach based on Natural Language Processing techniques. This task is relevant within public policy design, since the validation process is cumbersome and expensive, given the transdisciplinary and systemic elements that involve professionals from multiple disciplines, as well as particular interests. To achieve this objective, a repository of problem trees corresponding to real investment projects approved by the National Planning Department was used, each labeled as cause, problem, effect or other. From this data set, a data mining process was carried out for the following tasks: text classification (cause, problem, effect or other), named entity recognition and semantic similarity (problem - cause / effects).The main findings for this proof of concept show the relevance of language based models on Spanish i.e. transformers (BETO) for the tasks of text classification and semantic similarity. While for the recognition of named entities, the use of a fine tuned FLERT model is recommended. Finally, a model of technological acceptance was carried out alongside a panel of experts, in order to assess the suitability of the analytical solution proposed for the formulation of social projects. Magíster en Analítica para la Inteligencia de Negocios Maestría |
Databáze: | OpenAIRE |
Externí odkaz: |