Análisis de los patrones de movilidad residencial en España mediante árboles de clasificación
Autor: | Khakpour, Matin |
---|---|
Přispěvatelé: | Matorras Weinig, Francisco, Cos Guerra, Olga de, Universidad de Cantabria |
Rok vydání: | 2021 |
Předmět: | |
Zdroj: | UCrea Repositorio Abierto de la Universidad de Cantabria instname |
Popis: | RESUMEN: Este trabajo estudia una fuente demográfica principal en España, las Estadísticas de Variaciones Residenciales (EVR); un informe anual del Instituto Nacional de Estadística (INE) que abarca todos los cambios residenciales comunicados por los individuos cuando hay modificación en su municipio de residencia. Usando las herramientas de Ciencia de Datos se realiza un análisis descriptivo de esta fuente. Después se procede a enlazarlo con más de 70 variables censales, padronales y territoriales. Aplicando una serie de técnicas de Machine Learning, en concreto los árboles de decisión, como un método de aprendizaje supervisado, se intenta detectar los patrones más influyentes a los flujos migratorios entre los municipios españoles. Se intenta aumentar el poder predictivo mediante diferentes modelos, muestreos y categorizaciones. Al final se detectan un par de variables con relativa importancia sobre el patrón de cambios hacia municipios grandes y pequeños. ABSTRACT: This paper studies a principal demographic resource in Spain, the Residential Variation Statistics (EVR in Spanish); an annual report compiled by the National Institute of Statistics (INE) which covers all residential changes reported by individuals when there is a change in their municipality of residence. Using Data Science tools, a descriptive analysis of this source is carried out. Then proceeds to its aggregation with more than 70 demographic and territorial variables gathered from census and municipal registers. Applying a series of Machine Learning techniques, specifically Decision Trees, as a supervised learning method, an attempt is made to detect the most influential patterns of migration flows between Spanish municipalities. We try to increase the predictive power through different models, sampling, and categorizations. Finally, a couple of variables with relative importance on the pattern of changes toward big and small municipalities are introduced. Máster en Ciencia de Datos |
Databáze: | OpenAIRE |
Externí odkaz: |