Imputação múltipla e análise de casos completos no contexto da saúde pública: uma avaliação prática do impacto das perdas nas análises

Autor: Vitor Passos Camargos
Jazyk: portugalština
Rok vydání: 2011
Zdroj: Biblioteca Digital de Teses e Dissertações da UFMGUniversidade Federal de Minas GeraisUFMG.
Druh dokumentu: masterThesis
Popis: Researchers in the health field often deal with the problem of incomplete databases. Complete Case Analysis (CCA), which restricts the analysis to subjects with complete data, reduces the sample size and may result in biased estimates. Based on statistical grounds, the Multiple Imputation (MI) method uses all collected data and is recommended as an alternative to CCA. Data from the study Saúde em Beagá, attended by 4048 adults from two of nine health districts in the city of Belo Horizonte in 2008-2009, were used to evaluate CCA and different MI approaches in the context of logistic models with incomplete covariates. The Body Mass Index (BMI), an indicator of high public health relevance, was obtained through self-reported measures, and subsequently by direct measurements of height and weight of participants. The self-reported measures showed high percentage of missing data, which have spread to BMI based on them. However the minimum losses in direct measurements allowed BMI calculation for virtually entire sample. Given this peculiarity of the study, a hypothetical situation in which the missing data for BMI based on self-reported measures are recovered could be approached by a simple procedure. The methods of ACC and different approaches to IM were applied in a context where the BMI, with missing data, is one of the covariates in a logistic regression. The results of these methods were then compared with the results after the missing data recovery. It was found that even the more simplistic MI approach performed better than CCA since it was closer to the post-recovery results.
Pesquisadores da área da saúde lidam frequentemente com o problema das bases de dados incompletas. A Análise de Casos Completos (ACC), que restringe as análises aos indivíduos com dados completos, reduz o tamanho da amostra e pode produzir estimativas viciadas. Baseado em fundamentos estatísticos, o método de Imputação Múltipla (IM) utiliza todos os dados coletados e é recomendado como alternativa a ACC. Dados do estudo Saúde em Beagá, inquérito domiciliar em que participaram 4048 adultos de dois dos nove distritos sanitários da cidade de Belo Horizonte no biênio 2008-2009, foram utilizados para avaliar a ACC e diferentes abordagens de IM no contexto de modelos logísticos com covariáveis incompletas. O Índice de Massa Corporal (IMC), um indicador de grande relevância na saúde pública, foi obtido por meio de medidas auto-referidas e posteriormente também por aferições diretas do peso e altura dos participantes. As medidas auto-referidas apresentaram um elevado percentual de perdas, que se propagaram para o IMC baseado nas mesmas. No entanto, perdas mínimas nas medidas aferidas permitiram o calculo do IMC para praticamente toda a amostra. Dada essa particularidade do estudo, a situação hipotética em que os dados ausentes do IMC, baseado nas medidas auto-referidas, são recuperados pôde ser aproximada por um procedimento simples. Os métodos de ACC e diferentes abordagens de IM foram aplicados no contexto em que o IMC, ainda com perdas, é uma das covariáveis de uma regressão logística. Os resultados desses métodos foram então comparados com os resultados posteriores à recuperação dos dados ausentes. Verificou-se que mesmo a abordagem mais simplista de IM obteve melhor desempenho que a ACC, já que se aproximou mais aos resultados pós-recuperação.
Databáze: Networked Digital Library of Theses & Dissertations