Mapa de la situación académica colombiana a través del análisis de las bases de datos del ICFES

Autor: Sánchez Pérez, Andrea Paola
Přispěvatelé: Calderón Benavides, Maritza Liliana
Jazyk: Spanish; Castilian
Rok vydání: 2020
Předmět:
Zdroj: Repositorio UNAB
Universidad Autónoma de Bucaramanga-UNAB
instacron:Universidad Autónoma de Bucaramanga-UNAB
ISSN: 2015-2019
Popis: Este trabajo presenta el resultado de un estudio de la situación académica colombiana basado en el análisis de los resultados de las pruebas estandarizadas SABER 11. A partir de la revisión de la información obtenida de las bases de datos del ICFES, donde se encuentran publicados los resultados históricos de las pruebas que se han aplicado a los estudiantes colombianos de último grado de formación media en el período 2015-2019; se realiza un análisis descriptivo de los resultados por medio de la aplicación de técnicas de minería de datos y de la metodología CRISP-DM (Cross Industry Standard Process for Data Mining), realizando la preparación, comprensión, selección y modelado de datos; permitiendo de esta manera, identificar tendencias, variables personales, académicas, socioeconómicas y familiares que influyen directamente en el desempeño académico de los estudiantes; adicionalmente, con el modelamiento realizado se identifican cuatro clústeres o grupos basados en características similares encontradas. Se desarrolla una herramienta de visualización que incluye mapas interactivos de Colombia, que presentan la información analizada de forma dinámica y permiten la comprensión geográfica de la misma a nivel regional, departamental y municipal; tanto del total de la población de estudio como de la población de evaluados perteneciente a grupos étnicos. INTRODUCCIÓN ................................................................................................. 16 1. FORMULACIÓN DE LA INVESTIGACIÓN ............................................................ 17 1.1. PLANTEAMIENTO DEL PROBLEMA ................................................................... 17 1.2. JUSTIFICACIÓN....................................................................................................... 19 1.3. PREGUNTA DE INVESTIGACIÓN ....................................................................... 20 1.4. OBJETIVOS .............................................................................................................. 20 1.4.1. Objetivo general ................................................................................................... 20 1.4.2. Objetivos específicos .......................................................................................... 20 2. REVISIÓN BIBLIOGRÁFICA Y MARCO TEÓRICO ............................................. 21 2.1. ESTADO DEL ARTE ................................................................................................ 21 2.1.1. Análisis de la situación académica en el mundo ............................................ 21 2.1.2. Análisis de la situación académica en Colombia............................................ 22 2.2. MARCO TEÓRICO................................................................................................... 26 2.2.1. ICFES y evaluación de la educación ................................................................ 26 2.2.2. Minería de datos .................................................................................................. 28 2.2.3. Metodología CRISP-DM ..................................................................................... 30 2.2.4. Mapas interactivos ............................................................................................... 32 2.3. MARCO TECNOLÓGICO ....................................................................................... 33 2.3.1. Procesamiento y modelado de datos: KNIME ................................................ 33 2.3.2. Herramienta de visualización: Tableau ............................................................ 34 3. DISEÑO METODOLÓGICO...................................................................................... 36 7 4. PROPUESTA Y ANÁLISIS DE RESULTADOS ..................................................... 38 4.1. COMPRENSIÓN DEL NEGOCIO ........................................................................... 38 4.2. ENTENDIMIENTO DE LOS DATOS ..................................................................... 41 4.2.1. Recolección de datos.......................................................................................... 41 4.2.2. Descripción del conjunto de datos .................................................................... 42 4.2.3. Descripción de atributos ..................................................................................... 48 4.2.4. Exploración de datos .......................................................................................... 55 4.2.5. Verificación de la calidad de los datos ............................................................. 60 4.2.6. Selección de datos .............................................................................................. 61 4.2.7. Limpieza de datos ............................................................................................... 62 4.3. SELECCIÓN DE TÉCNICA DE MODELADO ....................................................... 63 4.4. MODELAMIENTO Y EVALUACIÓN ....................................................................... 63 4.5. DESARROLLO DE LA HERRAMIENTA DE VISUALIZACIÓN .......................... 76 4.5.1. Visualización de mapa población general ....................................................... 76 4.5.2. Visualización de mapa por etnias ..................................................................... 82 4.5.3. Visualización de estadísticas ............................................................................. 84 4.6. ANÁLISIS DE LA SITUACIÓN ACADÉMICA COLOMBIANA ............................ 85 4.6.1. Población nacional .............................................................................................. 85 4.6.2. Población perteneciente a grupos étnicos ...................................................... 92 4.7. IMPACTO DEL PROYECTO .................................................................................... 96 5. CONCLUSIONES ....................................................................................................... 98 6. RECOMENDACIONES Y TRABAJOS FUTUROS ............................................... 99 REFERENCIAS BIBLIOGRÁFICAS ............................................................................. 100 Maestría This work presents the result of a study of the Colombian academic situation based on the analysis of the results of the SABER 11 standardized tests. Beginning with a review of the information obtained from ICFES databases, where test historical results applied to Colombian students of last year of high school between 2015 and 2019 are published; a descriptive analysis was carried out through the application of data mining techniques and the methodology for data analysis: CRISP-DM (Cross Industry Standard Process for Data Mining), which includes data preparation, data understanding, data selection and data modeling; allowing this way to identify trends in results; personal, academic, socioeconomic and family variables that influence the academic performance of students; in addition, with the perform of data modeling a cluster analysis was carried out based on attributes similarities which permitted to identify four different clusters that characterize the study population. With this work, it was also developed a visualization tool that includes Colombian interactive maps and statistics that present the analyzed information in a dynamic way and allow the user to get a geographic understanding of the results at national, regional and city level for both the general population and population belonging to ethnic groups.
Databáze: OpenAIRE