Regressão lasso robusta para modelos lineares de efeitos mistos com análise de diagnóstico

Autor: Rafael Rocha de Oliveira Garcia
Přispěvatelé: Cibele Maria Russo Novelli, Juvêncio Santos Nobre, Camila Borelli Zeller
Jazyk: angličtina
Rok vydání: 2021
Zdroj: Biblioteca Digital de Teses e Dissertações da USP
Universidade de São Paulo (USP)
instacron:USP
Popis: Variable selection has been a topic of great interest for statisticians and researchers alike. The choice of the best subset of predictors may be carried out with the objective of improving prediction or for easier interpretation of results. However, such methods are not always straightforward, mainly in the context of linear mixed-effects models. Variable selection for such models must be carried out for both fixed and random effects, the first being related to the global mean of data and the second to subject-level variance. There are two possible approaches when selecting variables for mixed-effects models: joint or two-stage procedures. In existing literature on the topic of variable selection for linear mixed-effects model, there is a method of joint selection via lasso for linear mixed-effects models under a normal distribution. Another topic of remarkable importance, is diagnostics and residual analysis. While residual analyses are carried out to assess issues with the fitted model and identification of atypical observations, diagnostic analyses are carried out assuming the model as correct and, assessing its conclusions robustness to small disturbances in the data and/or the model. There are many possible ways to deal with such observations. One is using robust models, which are said to be robust to disturbances in the data. That is, models that are better fit to data sets that possess observations considered to be as outliers and/or leverage. This work aims to use the robust method for variable selection in linear mixed-effects model and compare it with the normal method using diagnostic analysis. Seleção de variáveis é um tópico de elevada importância para o processo de modelagem. A escolha do melhor conjunto de variáveis explicativas pode ser feita com o intuito de melhorar uma previsão ou facilitar a interpretação dos resultados. Contudo, os métodos para seleção de variáveis nem sempre são triviais, principalmente no contexto de modelos lineares de efeitos mistos. A seleção para esses modelos deve ser feita para os efeitos fixos, que estão relacionados a uma média global, e para os efeitos aleatórios, relacionados à variância a nível individual nesse contexto. São dois os tipos de abordagens para a seleção de variáveis em modelos de efeitos mistos: conjunta ou em dois estágios, havendo na literatura existente o processo de seleção conjunta via lasso para modelos lineares de efeitos-mistos normais. Outro tópico de elevada importância, é a análise de diagnóstico e resíduos. Enquanto as análises de resíduos são feitas para investigar problemas com o modelo ajustado e identificação de observações atípicas, uma análise de diagnóstico é feita assumindo o modelo como correto, e investigando a robustez das conclusões a pequenas perturbações dos dados e/ou no modelo. Para lidar com essas observações, são várias as alternativas. Uma delas, é a utilização de modelos robustos, os quais seriam ditos robustos a perturbações nos dados. Isto é, modelos que melhor se ajustam a conjuntos de dados que possuem pontos considerados como sendo outliers e/ou alavanca. Este trabalho tem como objetivo utilizar o método robusto para seleção de variáveis em modelos lineares de efeitos mistos e compará-lo com o método normal através de análise de diagnóstico.
Databáze: OpenAIRE