Model-based estimation methods in the presence of missing data
Autor: | Taís Roberta Ribeiro |
---|---|
Přispěvatelé: | Zuanetti, Daiane Aparecida, Daiane Aparecida Zuanetti, Teresa Cristina Martins Dias, Luis Aparecido Milan, Lia Hanna Martins Morita, Erlandson Ferreira Saraiva |
Jazyk: | portugalština |
Rok vydání: | 2022 |
Předmět: |
PROBABILIDADE E ESTATISTICA::ESTATISTICA::REGRESSAO E CORRELACAO [CIENCIAS EXATAS E DA TERRA]
Data imputation Numerical integration PROBABILIDADE E ESTATISTICA::ESTATISTICA::ANALISE DE DADOS [CIENCIAS EXATAS E DA TERRA] Integração numérica Linear and nonlinear regression models CIENCIAS EXATAS E DA TERRA EM algorithm Modelos lineares e não lineares de regressão Imputação de dados Algoritmo EM PROBABILIDADE E ESTATISTICA [CIENCIAS EXATAS E DA TERRA] |
Zdroj: | Repositório Institucional da UFSCAR Universidade Federal de São Carlos (UFSCAR) instacron:UFSCAR Biblioteca Digital de Teses e Dissertações da USP Universidade de São Paulo (USP) instacron:USP |
Popis: | Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) The missing data are observations that should have been made, but were not for some reason, thus reducing the ability to understand the nature of the phenomenon, in addition to making it difficult to extract information from the analyzed data, since the impact on the results of the studies is not always known. As a considerable part of the statistical techniques were developed to analyze complete data, the missing data usually need to be treated in such a way that the resulting dataset can be analyzed by such established methods. The most used methods to deal with missing data are divided, mainly, between methods of data removal and imputation, being both configurations, in most cases, disadvantageous in terms of the analysis of the final result, either by making the results biased or because we have to work with the uncertainty associated with the imputation of unknown values. In this work, then, we propose some model-based methods for solving the problem of missing data for regression analysis, without having to resort to imputation or removal of information. We verified the performance of the proposed methodologies on simulated data under different scenarios and compared it with the performance of other traditional techniques of imputation and data removal. Os dados faltantes são observações que deveriam ter sido feitas, mas não foram por algum motivo, reduzindo, assim, a capacidade de entender a natureza do fenômeno, além de dificultar a extração de informações através dos dados analisados, já que o impacto nos resultados dos estudos nem sempre são conhecidos. Como uma considerável parte das técnicas estatísticas foram desenvolvidas para analisar dados completos, os dados faltantes geralmente precisam ser tratados de maneira que o conjunto de dados resultante possa ser analisado por tais métodos já consolidados. Os métodos mais utilizados para lidar com dados faltantes se dividem, principalmente, entre métodos de remoção e de imputação de dados, sendo ambas as configurações, na maioria das vezes, desvantajosas em termos da análise do resultado final, seja por tornar os resultados viesados ou por termos que trabalhar com a incerteza associada à imputação de valores desconhecidos. Nesse trabalho, então, propomos alguns métodos baseados em modelos para a resolução do problema de dados ausentes para análise de regressão, sem que seja necessário recorrer à imputação ou à remoção de informações. Verificamos o desempenho das metodologias propostas em dados simulados sob diferentes cenários e comparamos com o desempenho de outras técnicas tradicionais de imputação e remoção de dados. 001, Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - Brasil (CAPES) |
Databáze: | OpenAIRE |
Externí odkaz: |