Quantitative analysis of students' performance in the Brazilian high school exam

Autor: Fioriolli, Carla
Přispěvatelé: Fogliatto, Flavio Sanson
Jazyk: angličtina
Rok vydání: 2019
Předmět:
Zdroj: Biblioteca Digital de Teses e Dissertações da UFRGS
Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
Popis: Esta dissertação apresenta uma análise quantitativa do desempenho dos estudantes no Exame Nacional do Ensino Médio (ENEM) em relação a variáveis sociodemográficas. O objetivo deste trabalho é a análise do impacto das variáveis sociodemográficas no desempenho dos estudantes através da modelagem deste desempenho nas 5 áreas de conhecimento avaliadas no ENEM como função das variáveis que caracterizam esses estudantes. Para a realização da análise, utilizou-se uma versão adaptada do método CRISP-DM (Cross-Industry Standard Process for Data Mining) implementado em cinco fases: (i) compreensão dos dados/ambiente, (ii) preparação dos dados, (iii) modelagem, (iv) avaliação/análise e (v) discussão. Em todos os modelos gerados, a variável que melhor explica a variação no desempenho dos estudantes é a variável dummy associada ao tipo de escola frequentada pelo aluno; aqueles que frequentavam apenas escolas privadas sem bolsa de estudos tiveram vantagem nos escores. A variável dummy relacionada à raça também foi mantida em todos os modelos: os estudantes auto declarados brancos tiveram vantagem nos escores. O efeito relacionado ao gênero variou dependendo da área de conhecimento analisada. O efeito mais positivo para o sexo masculino ocorreu na área de conhecimento de matemática, enquanto o efeito mais negativo ocorreu na redação. Outras variáveis, como o nível de escolaridade dos pais e mães dos estudantes, a ocupação dos pais e a posse de um computador foram incluídas em todos os modelos. A modelagem desenvolvida nesta dissertação explica, em média, 17,90% da variância do desempenho dos estudantes no ENEM, o que é consistente com os resultados obtidos em estudos de mesma natureza. Esta condição sugere que o método utilizado é adequado à realização deste tipo de análise. This dissertation presents an analysis of the relationship between sociodemographic attributes and students’ performance in the Brazilian High School Exam (ENEM). The main objective is to analyze the impact of sociodemographic variables on students’ performance by modeling their score in the five knowledge areas evaluated in ENEM as a function of variables that characterize these students. The method adopted to perform the analysis was an adaptation of the CRISP-DM (Cross-Industry Standard Process for Data Mining) method, which is implemented in five phases: (i) data/environment understanding, (ii) data preparation, (iii) modeling, (iv) evaluation/analysis, and (v) discussion. In all models obtained, the variable that most explained the variance in students’ performance was a dummy variable associated with the type of school attended by the student: those who attended only private schools without a scholarship had an advantage in test scores. A dummy variable related to race was also retained in all models: auto declared white students had an advantage in scores. The sex-related effect varied depending on the area of knowledge analyzed. The most positive effect for males occurred in the mathematics knowledge area, while the most negative effect occurred in the essay. Other variables such as students’ fathers’ and mothers’ level of education, fathers’ occupation, and the ownership of a computer were included in all models. Models obtained yielded an average variance explained of 17.90%, which is consistent to what is observed in other studies of the same nature, and suggests that the method employed is suitable for this type of analysis.
Databáze: OpenAIRE