Methodological Contributions in Semiparametric Regression Models for Functional Data

Autor: Novo Díaz, Silvia
Přispěvatelé: Aneiros, Germán, Vieu, Philippe
Jazyk: angličtina
Rok vydání: 2021
Předmět:
Zdroj: RUC. Repositorio da Universidade da Coruña
instname
Popis: Programa Oficial de Doutoramento en Estatística e Investigación Operativa. 555V01 [Abstract] This doctoral thesis is dedicated to functional regression for scalar response. In particular, we focus on functional semiparametric models, which combine the practical advantages of parametric and nonparametric approaches, surpassing both methodologies. Accordingly, several semiparametric models involving a functional singleindex component were studied from a theoretical and practical perspective. First, for the functional single-index model (FSIM) and the semi-functional partial linear single-index model (SFPLSIM), we provide uniform consistency results (over all parameters involved) for kernel- and k-Nearest-Neighbours-based statistics related to the estimation of the semiparametric component. Second, for the sparse semifunctional partial linear single-index model (SSFPLSIM), we develop a variable selection procedure in the linear component based on penalized least squares (PLS). The good behaviour of this method is theoretically assured (rates of convergence of the estimators are obtained, as well as asymptotic behaviour of the variable selection procedure). Third, the SSFPLSIM is adapted to the case in which covariates with linear e ect come from the discretization of a curve. For this new model, the multi-functional partial linear single-index model (MFPLSIM), the variable selection problem was also studied. Consequently, two new algorithms were proposed (providing theoretical results that ensure their good performance) to solve the ine ciency of the PLS method when it is directly applied to the MFPLSIM. For all the models and procedures mentioned above, theoretical results are accompanied by both simulation studies and real data applications which illustrate the good performance of the proposed methodology in practice. [Resumo] Esta tese está adicada ao estudo da regresión funcional con variable resposta escalar. En particular, centrámonos en modelos funcionais semi-paramétricos, os cales combinan as vantaxes prácticas dos enfoques paramétrico e non-paramétrico, superando a ambas metodoloxías. Desta maneira, estudáronse, tanto dende o punto de vista te orico como dende a perspectiva pr actica, varios modelos semi-param etricos que involucran unha compoñente funcional single-index. En primeiro lugar, para o functional single-index model (FSIM) e para o semi-functional partial linear single-index model (SFPLSIM) establecemos resultados de consistencia uniforme (sobre todos os parámetros involucrados) para os estatísticos de tipo núcleo e tipo k-veciños-máis-próximos relacionados coa estimación da compoñente semi-paramétrica do modelo. En segundo lugar, para o sparse semi-functional partial linear single-index model (SSFPLSIM) desenvolvemos un procedemento de selección de variables na compoñente linear baseado en mínimos cadrados penalizados (PLS, iniciais de penalized least squares). O bo comportamento deste método asegurouse dende o punto de vista teórico (obtendo taxas de converxencia dos estimadores, así como o comportamento asintótico do procedemento de selección de variables). En terceiro lugar, o SSFPLSIM adaptouse ao escenario no cal as covariables con efecto linear proveñen da discretización dunha curva. Para este novo modelo, o multi-functional partial linear single-index model (MFPLSIM), estudouse tamén o problema da selección de variables e propuxéronse dous novos algoritmos (dos que aseguramos teoricamente o seu bo comportamento) para resolver a inefi cacia do método PLS cando se aplica directamente ao MFPLSIM. Para todos os modelos e procedementos citados, os resultados teóricos acompañáronse de estudos de simulación e aplicacións a datos reais que ilustran o bo comportamento na práctica da metodoloxía presentada. [Resumen] Esta tesis está dedicada al estudio de la regresión funcional con variable respuesta escalar. En particular, nos centramos en modelos funcionales semi-paramétricos, los cuales combinan las ventajas prácticas de los enfoques paramétrico y no-paramétrico, superando a ambas metodologías. De esta forma, se estudiaron, tanto desde el punto de vista teórico como desde la perspectiva práctica, varios modelos semi-paramétricos que involucran una componente funcional single-index. En primer lugar, para el functional single-index model (FSIM) y para el semi-functional partial linear single-index model (SFPLSIM) establecemos resultados de consistencia uniforme (sobre todos los parámetros involucrados) para los estadísticos de tipo núcleo y de tipo k-vecinos-más-próximos relacionados con la estimación de la componente semi-paramétrica del modelo. En segundo lugar, para el sparse semi-functional partial linear single-index model (SSFPLSIM) desarrollamos un procedimiento de selección de variables en la componente linear basado en mínimos cuadrados penalizados (PLS, iniciales de penalized least squares). El buen comportamiento de este método se ha asegurado desde el punto de vista teórico (obteniendo tasas de convergencia de los estimadores, así como el comportamiento asintótico del procedimiento de selección de variables). En tercer lugar, el SSFPLSIM se ha adaptado al escenario en el cual las covariables con efecto linear provienen de la discretización de una curva. Para este nuevo modelo, el multi-functional partial linear single-index model (MFPLSIM), se ha estudiado también el problema de selección de variables y se propusieron dos nuevos algoritmos (de los que aseguramos teóricamente su buen comportamiento) para resolver la ine ficiencia del método PLS cuando se aplica directamente al MFPLSIM. Para todos los modelos y procedimientos citados, los resultados teóricos se acompañaron de estudios de simulación y aplicaciones a datos reales que ilustran el buen comportamiento en la práctica de la metodología presentada. Xunta de Galicia; ED481A-2018/191 Xunta de Galicia; ED431G/01 2016-2019 Xunta de Galicia; ED431G2019/01 Xunta de Galicia; ED431C 2016-015 Xunta de Galicia; ED431C2020-014 This research has been partially supported by the Spanish Ministerio de Economía y Competitividad (MINECO) under Grants MTM2014-52876-R and MTM2017-82724-R, by the Spanish Ministerio de Ciencia e Innovación (MICINN) under Grant PID2020-113578RB-I00, by the Xunta de Galicia through Centro Singular de Investigación de Galicia accreditation under Grants ED431G/01 2016-2019 and ED431G 2019/01 and through the Grupos de Referencia Competitiva under Grants ED431C 2016-015 and ED431C2020-014 and in part by the European Union (European Regional Development Fund-ERDF). The author particularly thanks the contracts financed by the research group MODES (from May 1, 2017 to August 31, 2017) and by the CITIC (from September 1, 2017 to May 30, 2018) and the PhD contract financed by the Xunta de Galicia and the European Union (European Social Fund-ESF), the reference of which is ED481A-2018/191 (from May 31, 2018). Some results of this thesis have been obtained during a stay of the author at the Universit ́e Paul Sabatier, Toulouse (from March 13, 2019 to June 12, 2019), financed by the Xunta de Galicia, with reference ED481A-2018/191
Databáze: OpenAIRE