Aplicações de cópulas em modelos de riscos múltiplos dependentes e em modelos de misturas de distribuições

Autor: Tsai, Rodrigo, 1974
Přispěvatelé: Hotta, Luiz Koodi, 1952, Pinheiro, Hildete Prisco, Andrade Filho, Mario de Castro, Louzada Neto, Francisco, Lima, Antonio Carlos Pedroso de, Universidade Estadual de Campinas. Instituto de Matemática, Estatística e Computação Científica, Programa de Pós-Graduação em Estatística, UNIVERSIDADE ESTADUAL DE CAMPINAS
Rok vydání: 2021
Předmět:
Zdroj: Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
Universidade Estadual de Campinas (UNICAMP)
instacron:UNICAMP
DOI: 10.47749/t/unicamp.2012.887906
Popis: Orientador: Luiz Koodi Hotta Tese (doutorado) - Universidade Estadual de Campinas, Instituto de Matematica, Estatistica e Computação Cientifica Resumo: Nesse trabalho discutimos aplicações de cópulas a modelos de riscos múltiplos com dependência e modelos de misturas de distribuições. Numa primeira parte analisamos a inclusão de dependência entre os fatores de risco do modelo de riscos múltiplos. Os modelos de riscos múltiplos são uma família de modelos flexíveis para representar dados de tempos de vida. Suas maiores vantagens sobre os modelos de risco simples incluem a habilidade de representar funções de taxa de falha com formas não usuais e a facilidade de incluir covariáveis. O objetivo principal dessa parte é modelar a dependência existente entre as causas latentes de falha do modelo de riscos múltiplos por meio de funções de cópulas. A escolha da função de cópulas bem como das funções de distribuição dos tempos latentes de falha resultam numa classe flexível de distribuições de sobrevivência que é capaz de representar funções de taxa de falha de formas multimodais, forma de banheira e contendo efeitos locais dados pela concorrência dos riscos. A identificação e estimação do modelo proposto também são discutidas. Ao eliminar a restrição de suporte positivo para as variáveis latentes, o método pode ser utilizado para gerar uma família rica de distribuições univariadas contendo assimetrias e múltiplas modas. Na segunda parte propomos um modelo de mistura de distribuições generalizado utilizando cópulas. O parâmetro da cópula é útil para definir formas de assimetria e ponderar com maior ou menor peso determinadas regiões do suporte das distribuições componentes para compor a mistura. pesos das distribuições componentes variam no suporte da distribuição e não são restritos à soma unitária. A modelagem resultante acrescenta uma maior flexibilidade aos modelos de misturas na representação de dados com densidades de várias formas multimodais e assimétricas. O modelo tem como casos particulares o modelo de mistura tradicional, o modelo de riscos múltiplos e o modelo de fração de cura. Os modelos são aplicados a dados simulados e reais da literatura. Foram utilizados os métodos de estimação de máxima verossimilhança e os critérios de ajuste de Akaike e Bayesiano para a seleção dos modelos. Os modelos representaram bem os conjuntos de dados analisados em comparação com metodologias propostas na literatura Abstract: In this work, we discuss the application of copula to polyhazard and mixture models. First we analyse the inclusion of dependence among failure causes in the polyhazard models. The polyhazard models constitute a family of flexible models to represent lifetime data. Their main advantages over single hazard models include the ability to represent hazard rate functions with unusual shapes and the ease of including covariates. The main purpose in this first part is to model the dependence that exists among the latent causes of failure in the polyhazard model by copula functions. The choice of the copula function as well as the latent failure distributions produces a flexible class of survival distributions that is able to model hazard functions with unusual shapes such as bathtub or multimodal curves, while also modelling local effects given by the competing risks. The model identification and estimation are also discussed. Dropping the restriction of positive support for the latent variables, the method can be used to generate a rich family of univariate distributions with asymmetries and multiple modes. In the second part a generalized mixture model using copula functions is proposed. To assemble the mixture model, the parameter of the copula function is used to define asymmetry shapes and to attribute more or less weight to chosen regions of the component distributions. The weights of the component distributions vary on the support of the distribution and are not restricted to the unitary sum. The resulting model increases the flexibility of the mixture models to represent data with densities with several multimodal and asymmetric shapes. Special cases of the model are the traditional mixture models, the polyhazard model, and the cure fraction model. Simulated and empirical data from the literature are analysed by the proposed models. The estimation was done by maximum likelihood methods and the selection of the models used the Akaike and Bayesian criteria. The proposed models exhibited very good fit to the data sets in comparison to other methodologies presented in the literature Doutorado Estatística Doutor em Estatística
Databáze: OpenAIRE
Popis
Abstrakt:Orientador: Luiz Koodi Hotta Tese (doutorado) - Universidade Estadual de Campinas, Instituto de Matematica, Estatistica e Computação Cientifica Resumo: Nesse trabalho discutimos aplicações de cópulas a modelos de riscos múltiplos com dependência e modelos de misturas de distribuições. Numa primeira parte analisamos a inclusão de dependência entre os fatores de risco do modelo de riscos múltiplos. Os modelos de riscos múltiplos são uma família de modelos flexíveis para representar dados de tempos de vida. Suas maiores vantagens sobre os modelos de risco simples incluem a habilidade de representar funções de taxa de falha com formas não usuais e a facilidade de incluir covariáveis. O objetivo principal dessa parte é modelar a dependência existente entre as causas latentes de falha do modelo de riscos múltiplos por meio de funções de cópulas. A escolha da função de cópulas bem como das funções de distribuição dos tempos latentes de falha resultam numa classe flexível de distribuições de sobrevivência que é capaz de representar funções de taxa de falha de formas multimodais, forma de banheira e contendo efeitos locais dados pela concorrência dos riscos. A identificação e estimação do modelo proposto também são discutidas. Ao eliminar a restrição de suporte positivo para as variáveis latentes, o método pode ser utilizado para gerar uma família rica de distribuições univariadas contendo assimetrias e múltiplas modas. Na segunda parte propomos um modelo de mistura de distribuições generalizado utilizando cópulas. O parâmetro da cópula é útil para definir formas de assimetria e ponderar com maior ou menor peso determinadas regiões do suporte das distribuições componentes para compor a mistura. pesos das distribuições componentes variam no suporte da distribuição e não são restritos à soma unitária. A modelagem resultante acrescenta uma maior flexibilidade aos modelos de misturas na representação de dados com densidades de várias formas multimodais e assimétricas. O modelo tem como casos particulares o modelo de mistura tradicional, o modelo de riscos múltiplos e o modelo de fração de cura. Os modelos são aplicados a dados simulados e reais da literatura. Foram utilizados os métodos de estimação de máxima verossimilhança e os critérios de ajuste de Akaike e Bayesiano para a seleção dos modelos. Os modelos representaram bem os conjuntos de dados analisados em comparação com metodologias propostas na literatura Abstract: In this work, we discuss the application of copula to polyhazard and mixture models. First we analyse the inclusion of dependence among failure causes in the polyhazard models. The polyhazard models constitute a family of flexible models to represent lifetime data. Their main advantages over single hazard models include the ability to represent hazard rate functions with unusual shapes and the ease of including covariates. The main purpose in this first part is to model the dependence that exists among the latent causes of failure in the polyhazard model by copula functions. The choice of the copula function as well as the latent failure distributions produces a flexible class of survival distributions that is able to model hazard functions with unusual shapes such as bathtub or multimodal curves, while also modelling local effects given by the competing risks. The model identification and estimation are also discussed. Dropping the restriction of positive support for the latent variables, the method can be used to generate a rich family of univariate distributions with asymmetries and multiple modes. In the second part a generalized mixture model using copula functions is proposed. To assemble the mixture model, the parameter of the copula function is used to define asymmetry shapes and to attribute more or less weight to chosen regions of the component distributions. The weights of the component distributions vary on the support of the distribution and are not restricted to the unitary sum. The resulting model increases the flexibility of the mixture models to represent data with densities with several multimodal and asymmetric shapes. Special cases of the model are the traditional mixture models, the polyhazard model, and the cure fraction model. Simulated and empirical data from the literature are analysed by the proposed models. The estimation was done by maximum likelihood methods and the selection of the models used the Akaike and Bayesian criteria. The proposed models exhibited very good fit to the data sets in comparison to other methodologies presented in the literature Doutorado Estatística Doutor em Estatística
DOI:10.47749/t/unicamp.2012.887906