Comparación empírica de la eficiencia de algunas técnicas de tratamiento de datos faltantes aplicadas al análisis de regresión lineal múltiple
Autor: | Polo Yepes, Claudia J., Behar Gutiérrez, Roberto |
---|---|
Jazyk: | Spanish; Castilian |
Rok vydání: | 2013 |
Předmět: | |
Zdroj: | Repositorio Digital Univalle Universidad del Valle instacron:Universidad del Valle |
Popis: | En este trabajo se caracterizan algunas de las más comunes técnicas estadísticas de tratamiento de datos faltantes y se comparan empíricamente a través de una simulación para determinar cuál es la más eficiente en la estimación de los coeficientes de regresión y de determinación de un modelo lineal de regresión múltiple con dos variables explicativas y un patrón univariado de datos faltantes sobre una de las variables. Se midieron la eficiencia relativa a través del error cuadrático medio y con base en las estimaciones por intervalos de confianza de los coeficientes de regresión a través de su cubierta y amplitud. Los resultados sugieren que análisis de casos completos, debe ser usado cuando el porcentaje de faltantes es pequeño y bajo mecanismos completamente al azar. En general, para todas las técnicas cuando el porcentaje aumenta, las estimaciones de los coeficientes de determinación y regresión se vuelven ineficientes alterando la cubierta y amplitud de los intervalos de confianza de los coeficientes de regresión. El análisis de casos disponibles y la imputación de la media no condicional y condicional no son recomendables porque producen en muchos casos estimaciones ineficientes de los coeficientes de determinación y de regresión. El algoritmo EM es una técnica eficiente y menos sensible a mecanismos que no son completamente al azar. |
Databáze: | OpenAIRE |
Externí odkaz: |