Modal beta regression

Autor: Silva, Erika Rayanne Fernandes da
Přispěvatelé: Valença, Dione Maria, Leão, Jeremias da Silva, Pereira, Marcelo Bourguignon, Medeiros, Francisco Moisés Cândido de
Jazyk: portugalština
Rok vydání: 2020
Předmět:
Zdroj: Repositório Institucional da UFRN
Universidade Federal do Rio Grande do Norte (UFRN)
instacron:UFRN
Popis: A classe de modelos de regressão beta é usada para modelar variáveis respostas no intervalo (0, 1), como taxas e proporções. Ferrari e Cribari-Neto (2004) propuseram um modelo de regressão beta que incorpora covariáveis na média da distribuição utilizando uma função de ligação genérica. Entretanto, para estudos cuja variável resposta apresenta assimetria e/ou valores discrepantes, esse modelo pode não ser o mais adequado. Uma medida de tendência central mais apropriada neste tipo de situação é a moda da distribuição, devido a sua robustez com relação a valores discrepantes e sua fácil interpretação também em casos assimétricos. Zhou e Huang (2019) propuseram uma reparametrização para a distribuição beta em termos da moda e de um parâmetro de precisão. Assumindo essa distribuição para a variável resposta, Zhou e Huang (2019) propuseram um modelo de regressão para dados contínuos no intervalo unitário, visando ser mais robusto a outliers. Neste trabalho, realizamos um estudo mais aprofundado das propriedades e do desempenho desse modelo, bem como a comparação deste com o modelo proposto por Ferrari e Cribari-Neto (2004). Realizamos estudos de simulação para avaliar as estimativas de máxima verossimilhança em casos simétricos e assimétricos e a sensibilidade à outliers das estimativas quando são impostos alguns padrões de perturbação. Além disso, fizemos a proposição e a avaliação de três resíduos para esta classe de modelos. Nossos estudos de simulação sugerem que o modelo de regressão beta que considera a moda apresenta bom desempenho em dados simétricos e assimétricos e que, na maioria dos cenários, apresenta melhor desempenho na presença de outliers do que o modelo de regressão beta que considera a média. Por fim, apresentamos duas aplicações a conjuntos de dados reais, um retirado do censo 2010 e outro proveniente do ENEM 2017, comparando o ajuste dos modelos de regressão beta para a média e para a moda. The beta regression model is a class of models used for continuous response variables restricted to the interval (0,1), such as rates and proportions. Ferrari and Cribari-Neto (2004) proposed a beta regression model that incorporates covariates in the mean of the distribution using a generic link function. However, for studies which response variable has asymmetry and / or discrepant values, this model may not be the most appropriated. A more appropriated measure of central tendency in this kind of situation is the mode of distribution because of its robustness to outliers and its easy interpretation in cases of asymmetry. Zhou and Huang (2019) proposed a parameterization for the beta distribution in terms of the mode and a precision parameter. Assuming that the response variable follows this distribution, Zhou and Huang (2019) proposed a regression model for continuous data in the interval (0,1), in order to be more robust to outliers. In this work, we present a more complete study of this model properties and performance as well as a comparison between this model and the model proposed by Ferrari and Cribari-Neto (2004). We developed simulation studies to evaluate the maximum likelihood estimates in cases of asymmetry and the sensitivity to outliers when come perturbation patterns are imposed. Furthermore, we proposed and evaluated three residuals to this class of models. Our simulation studies suggest that the model developed to the mode has a good performance on symmetrical and asymmetrical data and in most scenarios it performs better in the presence of outliers than the beta regression model that considers the mean. In addition, we present two applications to real dataset and a t comparison of the models that consider the mean and the mode.
Databáze: OpenAIRE