Estimación presuavizada de las funciones de densidad y distribución con datos censurados

Autor: Jácome Pumar, María Amalia
Přispěvatelé: Cao Abad, Ricardo, Universidade da Coruña. Departamento de Matemáticas
Jazyk: Spanish; Castilian
Rok vydání: 2005
Předmět:
Zdroj: RUC. Repositorio da Universidade da Coruña
instname
Popis: [Resumen] En el estudio de tiempos de vida, son frecuentes los datos censurados por la derecha, individuos a los que no se les puede registrar el instante de “fallo”. El estimador clásico de la función de distribución es el estimador de Kaplan-Meier (1958). En esta memoria se presenta un nuevo método de estimación basado en la estimación previa no paramétrica de la función probabilidad condicional de no censura. Este paso preliminar, presuavización, usa de forma más eficiente la información. Se estudian las propiedades asintóticas de los estimadores presuavizados de la distribución y densidad, y se muestra su eficiencia. Además, para el estimador de la densidad se obtiene una representación asintótica del MISE y de las ventanas óptimas que lo minimizan. Se propone un selector de tipo plug-in y se prueba su consistencia en probabilidad. Su comportamiento, junto con el de otros selectores basados en remuestreos bootstrap, se analiza en un estudio de simulación. Se estudia, asímismo, el efecto en la presuavización del uso de dos estimadores diferentes de la probabilidad condicional de no censura. En concreto, se comparan los estimadores de Nadaraya-Watson y local lineal. Por último, se ilustra el comportamiento de ambos estimadores presuavizados con una aplicación a datos reales.
[Resumo] No estudio de tempos de vida, son frecuentes os datos censurados pola dereita, individuos ós que non se lles pode rexistrar o instante de “fallo”. O estimador clásico da función de distribución é o estimador de Kaplan-Meier (1958). Nesta memoria preséntase un novo método de estimación baseado na estimación previa non paramétrica da función probabilidade condicional de non censura. Este paso preliminar, presuavización, fai uso de forma máis eficiente da información. Estúdianse as propiedades asintóticas dos estimadores presuavizados da distribución e densidade, e amósase a súa eficiencia. Ademáis, para o estimador da densidade obtense unha representación asintótica do MISE e das ventás óptimas que o minimizan. Proponse un selector de tipo plug-in e próbase a súa consistencia en probabilidade. O comportamento deste, xunto co de outros selectores baseados en remostraxes bootstrap, analízase nun estudio de simulación. Asimesmo, estúdiase o efecto na presuavización do uso de dous estimadores diferentes da probabilidade condicional de non censura. En concreto, compáranse os estimadores de Nadaraya-Watson e local lineal. Por último, ilústrase o comportamiento de ámbolos dous estimadores presuavizados cunha aplicación a datos reais.
[Summary] In survival analysis, right random censored data may arise, that is, individuals whose failure time cannot be registered. The Kaplan-Meier (1958) estimator is the classical estimator of the distribution function in this context. In this work, a new method based on the previous estimation of the conditional probability of uncensoring is presented. This preliminary step, called presmoothing, uses the information in a more efficient way. The asymptotic properties of the presmoothed estimators of the distribution and density functions are studied, together with their efficiency. Besides, an asymptotic representation of the MISE and the bandwidths minimizing it is obtained. A plug-in bandwidth selector is proposed, and its consistency in probability is proved. Its behavior, together with that of other bandwidth selectors based on boostrap resampling are analyzed in a simulation study. The effect of presmoothing when using two different estimators of the condicional probability of uncensoring is studied. In particular, the Nadaraya-Watson and the local linear smoother are compared. Finally, we illustrate the performance of the presmoothed estimators of the distribution and density functions in a real data example.
Databáze: OpenAIRE