Técnicas de minería de datos para el análisis de pruebas SABER
Autor: | Ahumada Riaño, Diana Paola |
---|---|
Přispěvatelé: | Correa Morales, Juan Carlos |
Jazyk: | Spanish; Castilian |
Rok vydání: | 2023 |
Předmět: |
Clúster
Educational quality Pruebas estandarizadas Standardized tests Pruebas Saber 11 Calidad educativa Nivel educativo Minería de datos Calidad de la educación Educational level 370 - Educación Cluster 519 - Probabilidades y matemáticas aplicadas [510 - Matemáticas] Mediciones y pruebas educativas - Colombia Análisis cluster |
Popis: | Ilustraciones En los últimos años, el concepto de ‘calidad en educación’ ha adquirido relevancia, en particular, se le ha dado bastante atención a los resultados de los exámenes estandarizados, como las pruebas Saber 11 y las pruebas PISA, y, así mismo, se han utilizado como herramientas para evaluar una parte de la calidad educativa. Por esta razón, es necesario realizar análisis estadísticos que permitan tener una mejor comprensión de los factores que influyen en los resultados de este tipo de pruebas, los cuales pueden estar relacionados con las condiciones socioeconómicas de los estudiantes, la infraestructura escolar, entre otros aspectos. Es así que, en función de obtener una visión más precisa y completa de la situación educativa en el departamento de Antioquia. En este trabajo se analizarán las variables socioeconómicas proporcionadas en los datos del Icfes con el propósito de ofrecer un panorama de las posibles causas de los resultados de las pruebas Saber 11 en cada una de las subregiones que la componen. El objetivo de esta investigación es, entonces, realizar un diagnóstico del nivel educativo en el departamento de Antioquia contrastando el desempeño en las pruebas Saber 11 de cada una de las subregiones del departamento, el puntaje global y la información socioeconómica de los estudiantes que presentaron la prueba durante el periodo 2017-2019. Para alcanzar este objetivo, se llevó a cabo una revisión de la literatura sobre los métodos y modelos que se utilizan para analizar pruebas estandarizadas en educación. Consecuentemente, se decidió emplear el proceso de clúster con K-Means para clasificar a los grupos de estudiantes según sus características socioeconómicas, utilizando los programas RStudio y Python. Así pues, se clasificó la población en 10 grupos mediante el proceso de clusterización teniendo en cuenta las variables socioeconómicas presentadas en las bases de datos con el fin de describir algunos de los comportamientos de las variables según la subregión. Finalmente, se llevó a cabo una prueba de homogeneidad para examinar las variables que podrían influir en los resultados de las pruebas Saber 11 en el departamento de Antioquia, considerando las características socioeconómicas de los estudiantes. (Texto tomado de la fuente) The concept of ‘quality in education’ has gained greater relevance in recent years, placing a significant importance on the results of standardized exams such as the Saber 11 and PISA tests, using them as tools to evaluate a part of the educational quality. For this reason, it is necessary to conduct statistical analyses that allow a better understanding of the factors that influence the results of these types of standardized tests, which may be related to socioeconomic conditions, school infrastructure, among other aspects. In this way, a more complete and accurate view of the educational situation in the department of Antioquia can be obtained. In this work only the socioeconomic variables provided by the Icfes data will be analyzed to give an insight into the possible causes of the Saber test results in each of the subregions of Antioquia. The objective of this work is, then, to diagnose the educational level in the department of Antioquia through the performance in the Saber 11 tests of each of the department’s subregions, contrasting the overall score and the socioeconomic information of the students who took the test during the period 2017-2019. To achieve this objective, a literature review on the methods and models that can be used to analyze standardized tests in education was carried out. Consequently the K-Means clustering process was decided to be employed to classify groups of students according to their socioeconomic characteristics, using RStudio and Python programs. Thus the population was classified into 10 groups through the clustering process, taking into account the socioeconomic variables presented in the databases, in order to describe some behaviors of the variables according to the subregion. Finally, a homogeneity test was conducted to examine the variables that could influence the results of the Saber 11 tests in the department of Antioquia, considering the socioeconomic characteristics. Maestría Magíster en Ciencias - Estadística Área Curricular Estadística |
Databáze: | OpenAIRE |
Externí odkaz: |