Mapa de la situación académica colombiana a través del análisis de las bases de datos del ICFES
Autor: | Sánchez Pérez, Andrea Paola |
---|---|
Přispěvatelé: | Calderón Benavides, Maritza Liliana |
Jazyk: | Spanish; Castilian |
Rok vydání: | 2020 |
Předmět: |
Interactive map
Saber 11 Desarrollo de software Rendimiento académico Software development Situación académica colombiana Academic assessment Academic performance Ingeniería de sistemas Minería de datos Systems engineer Evaluación académica Colombian academic situation Base de datos Icfes Database administration Administración de base de datos Mapa interactivo Icfes databases Data mining |
Zdroj: | Repositorio UNAB Universidad Autónoma de Bucaramanga-UNAB instacron:Universidad Autónoma de Bucaramanga-UNAB |
ISSN: | 2015-2019 |
Popis: | Este trabajo presenta el resultado de un estudio de la situación académica colombiana basado en el análisis de los resultados de las pruebas estandarizadas SABER 11. A partir de la revisión de la información obtenida de las bases de datos del ICFES, donde se encuentran publicados los resultados históricos de las pruebas que se han aplicado a los estudiantes colombianos de último grado de formación media en el período 2015-2019; se realiza un análisis descriptivo de los resultados por medio de la aplicación de técnicas de minería de datos y de la metodología CRISP-DM (Cross Industry Standard Process for Data Mining), realizando la preparación, comprensión, selección y modelado de datos; permitiendo de esta manera, identificar tendencias, variables personales, académicas, socioeconómicas y familiares que influyen directamente en el desempeño académico de los estudiantes; adicionalmente, con el modelamiento realizado se identifican cuatro clústeres o grupos basados en características similares encontradas. Se desarrolla una herramienta de visualización que incluye mapas interactivos de Colombia, que presentan la información analizada de forma dinámica y permiten la comprensión geográfica de la misma a nivel regional, departamental y municipal; tanto del total de la población de estudio como de la población de evaluados perteneciente a grupos étnicos. INTRODUCCIÓN ................................................................................................. 16 1. FORMULACIÓN DE LA INVESTIGACIÓN ............................................................ 17 1.1. PLANTEAMIENTO DEL PROBLEMA ................................................................... 17 1.2. JUSTIFICACIÓN....................................................................................................... 19 1.3. PREGUNTA DE INVESTIGACIÓN ....................................................................... 20 1.4. OBJETIVOS .............................................................................................................. 20 1.4.1. Objetivo general ................................................................................................... 20 1.4.2. Objetivos específicos .......................................................................................... 20 2. REVISIÓN BIBLIOGRÁFICA Y MARCO TEÓRICO ............................................. 21 2.1. ESTADO DEL ARTE ................................................................................................ 21 2.1.1. Análisis de la situación académica en el mundo ............................................ 21 2.1.2. Análisis de la situación académica en Colombia............................................ 22 2.2. MARCO TEÓRICO................................................................................................... 26 2.2.1. ICFES y evaluación de la educación ................................................................ 26 2.2.2. Minería de datos .................................................................................................. 28 2.2.3. Metodología CRISP-DM ..................................................................................... 30 2.2.4. Mapas interactivos ............................................................................................... 32 2.3. MARCO TECNOLÓGICO ....................................................................................... 33 2.3.1. Procesamiento y modelado de datos: KNIME ................................................ 33 2.3.2. Herramienta de visualización: Tableau ............................................................ 34 3. DISEÑO METODOLÓGICO...................................................................................... 36 7 4. PROPUESTA Y ANÁLISIS DE RESULTADOS ..................................................... 38 4.1. COMPRENSIÓN DEL NEGOCIO ........................................................................... 38 4.2. ENTENDIMIENTO DE LOS DATOS ..................................................................... 41 4.2.1. Recolección de datos.......................................................................................... 41 4.2.2. Descripción del conjunto de datos .................................................................... 42 4.2.3. Descripción de atributos ..................................................................................... 48 4.2.4. Exploración de datos .......................................................................................... 55 4.2.5. Verificación de la calidad de los datos ............................................................. 60 4.2.6. Selección de datos .............................................................................................. 61 4.2.7. Limpieza de datos ............................................................................................... 62 4.3. SELECCIÓN DE TÉCNICA DE MODELADO ....................................................... 63 4.4. MODELAMIENTO Y EVALUACIÓN ....................................................................... 63 4.5. DESARROLLO DE LA HERRAMIENTA DE VISUALIZACIÓN .......................... 76 4.5.1. Visualización de mapa población general ....................................................... 76 4.5.2. Visualización de mapa por etnias ..................................................................... 82 4.5.3. Visualización de estadísticas ............................................................................. 84 4.6. ANÁLISIS DE LA SITUACIÓN ACADÉMICA COLOMBIANA ............................ 85 4.6.1. Población nacional .............................................................................................. 85 4.6.2. Población perteneciente a grupos étnicos ...................................................... 92 4.7. IMPACTO DEL PROYECTO .................................................................................... 96 5. CONCLUSIONES ....................................................................................................... 98 6. RECOMENDACIONES Y TRABAJOS FUTUROS ............................................... 99 REFERENCIAS BIBLIOGRÁFICAS ............................................................................. 100 Maestría This work presents the result of a study of the Colombian academic situation based on the analysis of the results of the SABER 11 standardized tests. Beginning with a review of the information obtained from ICFES databases, where test historical results applied to Colombian students of last year of high school between 2015 and 2019 are published; a descriptive analysis was carried out through the application of data mining techniques and the methodology for data analysis: CRISP-DM (Cross Industry Standard Process for Data Mining), which includes data preparation, data understanding, data selection and data modeling; allowing this way to identify trends in results; personal, academic, socioeconomic and family variables that influence the academic performance of students; in addition, with the perform of data modeling a cluster analysis was carried out based on attributes similarities which permitted to identify four different clusters that characterize the study population. With this work, it was also developed a visualization tool that includes Colombian interactive maps and statistics that present the analyzed information in a dynamic way and allow the user to get a geographic understanding of the results at national, regional and city level for both the general population and population belonging to ethnic groups. |
Databáze: | OpenAIRE |
Externí odkaz: |