Inferência em modelos paramétricos com muitos L-momentos

Autor: Luís Antonio Fantozzi Alvarez
Přispěvatelé: Pedro Alberto Morettin, Chang Chiann, Marcelo Fernandes, Silvia Lopes de Paula Ferrari, Ricardo Pereira Masini, Cristine Campos de Xavier Pinto
Jazyk: angličtina
Rok vydání: 2022
Zdroj: Biblioteca Digital de Teses e Dissertações da USP
Universidade de São Paulo (USP)
instacron:USP
Popis: L-moments are expected values of linear combinations of order statistics that provide robust alternatives to traditional moments. The estimation of parametric models by matching sample L-moments -- a procedure known as \"method of L-moments\'\' -- has been shown to outperform maximum likelihood estimation in small samples from popular distributions. The choice of the number of L-moments to be used in estimation remains ad-hoc, though: researchers typically set the number of L-moments equal to the number of parameters, as to achieve an order condition for identification. In this thesis, we show that, by properly choosing the number of L-moments and weighting these accordingly, we are able to construct an estimator that outperforms both MLE and the traditional L-moment approach in finite samples, and yet does not suffer from efficiency losses asymptotically. We do so by considering a \"generalised\'\' method of L-moments estimator and deriving its asymptotic properties in a framework where the number of L-moments varies with sample size. We then propose methods to automatically select the number of L-moments in a given sample. As an extension, we show that a modification of our approach can be be used in the estimation of semiparametric models of treatment effects in randomised controlled trials (RCTs). This extension produces an efficient estimator with attractive computational properties. We illustrate the usefulness of our approach by applying it to data on an RCT conducted in São Paulo, Brazil. With such extension, we hope more generally to introduce L-moment-based estimation as an attractive procedure in settings where semi- and nonparametric maximum likelihood estimation is computationally complicated. L-momentos são valores esperados de combinações lineares de estatísticas de ordem que proveem alternativas robustas aos momentos tradicionais. A estimação de modelos paramétricos por meio da minimização da distância entre L-momentos amostrais e teóricos -- um procedimento conhecido na literatura como \"método dos L-momentos\'\' -- produz estimadores de menor erro quadrático médio que aqueles de máxima verossimilhança em pequenas amostras de diversas distribuições conhecidas. Não obstante, a escolha do número de L-momentos usados na estimação é tipicamente ad-hoc: pesquisadores costumeiramente usam o mesmo número de L-momentos que parâmetros, de modo a satisfazer uma condição de ordem para identificação do modelo. Nesta tese, mostra-se que, ao escolher o número de L-momentos apropriadamente e ponderando-os corretamente, é possível construir um estimador que se mostra de menor risco que a abordagem tradicional de L-momentos e que máxima verossimilhança em amostras finitas, e ainda assim se mantém assintoticamente eficiente. Esse resultado é obtido propondo-se um estimador de método \"generalizado\'\' de L-momentos e derivando suas propriedades estatísticas num ambiente em que o número de L-momentos varia com o tamanho amostral. Em seguida, propõem-se métodos para selecionar automaticamente o número ótimo de L-momentos em uma dada amostra. Como extensão, mostra-se que uma modificação da abordagem proposta pode ser usada na estimação de modelos semiparamétricos de efeitos de tratamento em experimentos aleatorizados controlados. Essa extensão produz um estimador eficiente e com propriedades computacionais atraentes. Os ganhos associados a essa nova abordagem são ilustrados aplicando a metodologia proposta no contexto de um experimento aleatório conduzido em São Paulo, Brasil. De maneira mais geral, com essa extensão, espera-se introduzir a abordagem baseada em L-momentos como um procedimento atrativo em ambientes em que estimadores de máxima verossimilhança semi/não paramétricos são computacionalmente complicados.
Databáze: OpenAIRE