Modeling survival data based on a reparameterized weighted Lindley distribution
Autor: | Alex Leal Mota |
---|---|
Přispěvatelé: | Neto, Francisco Louzada, Tomazella, Vera Lucia Damasceno, Francisco Louzada Neto, Vera Lucia Damasceno Tomazella, Jeremias da Silva Leão, Eder Angelo Milani, Lia Hanna Martins Morita, Manoel Ferreira dos Santos Neto |
Jazyk: | angličtina |
Rok vydání: | 2022 |
Předmět: |
Frailty model
Cure fraction Generalized time-dependent logistic model Riscos não proporcionais Maximum likelihood method Modelo logístico generalizado dependente do tempo Distribuição Lindley ponderada reparametrizada Máxima verossimilhança Modelo de fragilidade Fração de cura Non-proportional hazards Reparameterized weighted Lindley distribution PROBABILIDADE E ESTATISTICA [CIENCIAS EXATAS E DA TERRA] |
Zdroj: | Repositório Institucional da UFSCAR Universidade Federal de São Carlos (UFSCAR) instacron:UFSCAR Biblioteca Digital de Teses e Dissertações da USP Universidade de São Paulo (USP) instacron:USP |
Popis: | Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) In this work, we propose different statistical modeling for survival data based on a reparameterized weighted Lindley distribution. Initially, we present this distribution and study its mathematical properties, maximum likelihood estimation, and numerical simulations. Then, we propose a novel frailty model by using the reparameterized weighted Lindley distribution for modeling unobserved heterogeneity in univariate survival data. The frailty is introduced multiplicatively on the baseline hazard function. We obtain unconditional survival and hazard functions through the Laplace transform function of the frailty distribution. We assume hazard functions of the Weibull and Gompertz distributions as the baseline hazard functions and use the maximum likelihood method for estimating the resulting model parameters. Simulation studies are further performed to verify the behavior of maximum likelihood estimators under different proportions of right-censoring and to assess the performance of the likelihood ratio test to detect unobserved heterogeneity in different sample sizes. Also, we propose a frailty long-term model where the frailties are described by reparameterized weighted Lindley distribution. An advantage of the proposed model is to jointly model the heterogeneity among patients by their frailties and the presence of a cured fraction of them. We assume that the unknown number of competing causes that can influence the survival time follows a negative binomial distribution and that the time for the $k$-th competing cause to produce the event of interest follows the reparameterized weighted Lindley frailty model with Weibull baseline distribution. Some special cases of the model are presented. The cure fraction is modeled by using the logit link function. Again, we use the maximum likelihood method under random right-censoring to estimate the proposed model parameters. Further, we present a Monte Carlo simulation study to verify the maximum likelihood estimators' behavior assuming different sample sizes and censoring proportions. Finally, we extend the non-proportional generalized time-dependent logistic regression model by incorporating reparameterized weighted Lindley frailties. This proposed modeling has several important characteristics, such as non-proportional hazards, identifies the presence of long-term survivors without the addition of new parameters, captures the unobserved heterogeneity, allows the intersection of survival curves, and allows decreasing or unimodal hazard function. Again, parameter estimation is performed using the maximum likelihood method. Monte Carlo simulation studies are conducted to evaluate the asymptotic properties of the estimators as well as some properties of the model. The potentiality of all the proposed models is analyzed by employing real datasets and model comparisons are performed. Neste trabalho, propomos diferentes modelagens estatísticas para dados de sobrevivência baseadas em uma distribuição de Lindley ponderada reparametrizada. Inicialmente, apresentamos esta distribuição e estudamos suas propriedades matemáticas, estimação de máxima verossimilhança e simulações numéricas. Em seguida, propomos um novo modelo de fragilidade usando a distribuição de Lindley ponderada reparametrizada para modelar a heterogeneidade não observada em dados de sobrevivência univariados. A fragilidade é introduzida multiplicativamente na função de risco de base. Obtemos as funções de sobrevivência e risco não condicionais através da função transformada de Laplace da distribuição de fragilidade. Assumimos as funções de risco das distribuições Weibull e Gompertz como as funções de risco de base e usamos o método de máxima verossimilhança para estimar os parâmetros dos modelos resultantes. Estudos de simulação são realizados para verificar o comportamento dos estimadores propostos sob diferentes proporções de censura à direita e para avaliar o desempenho do teste da razão de verossimilhança para detectar heterogeneidade não observada em diferentes tamanhos amostrais. Além disso, propomos um modelo de longa duração com fragilidade Lindley ponderada reparametrizada. Uma vantagem do modelo proposto é modelar conjuntamente a heterogeneidade entre os pacientes por suas fragilidades e a presença de uma fração curada. Assumimos que o número desconhecido de causas competitivas que podem influenciar o tempo de sobrevivência segue uma distribuição binomial negativa e que o tempo para a $k$-ésima causa competitiva produzir o evento de interesse segue o modelo de fragilidade de Lindley ponderado reparametrizado com distribuição de base de Weibull. Alguns casos especiais do modelo são apresentados e a fração de cura é modelada usando a função de ligação logit. Novamente, usamos o método de máxima verossimilhança sob censura aleatória à direita para estimar os parâmetros do modelo proposto. Além disso, apresentamos estudos de simulação de Monte Carlo para verificar o comportamento dos estimadores de máxima verossimilhança assumindo diferentes tamanhos de amostra e proporções de censura. Finalmente, estendemos o modelo de regressão logística generalizado dependente do tempo incorporando fragilidades de Lindley ponderadas reparametrizadas. Essa modelagem proposta possui várias características importantes, tais como riscos não proporcionais, identifica a presença de sobreviventes de longa duração sem a adição de novos parâmetros, captura a heterogeneidade não observada, permite a interseção de curvas de sobrevivência e permite função de risco decrescente ou unimodal. Novamente, a estimação de parâmetros é realizada usando o método de máxima verossimilhança. Estudos de simulação de Monte Carlo são conduzidos para avaliar as propriedades assintóticas dos estimadores, bem como algumas propriedades do modelo. A potencialidade de todos os modelos propostos é analisada empregando conjuntos de dados reais e comparações de modelos são realizadas. CAPES: código de financiamento - 001 |
Databáze: | OpenAIRE |
Externí odkaz: |