Model selection by penalization in mixture of experts models with a non-asymptotic approach

Autor: Nguyen, Trungtin, Chamroukhi, Faicel, Nguyen, Hien Duy, Forbes, Florence
Přispěvatelé: Modèles statistiques bayésiens et des valeurs extrêmes pour données structurées et de grande dimension (STATIFY), Inria Grenoble - Rhône-Alpes, Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria)-Laboratoire Jean Kuntzmann (LJK), Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS)-Université Grenoble Alpes (UGA)-Institut polytechnique de Grenoble - Grenoble Institute of Technology (Grenoble INP ), Université Grenoble Alpes (UGA)-Centre National de la Recherche Scientifique (CNRS)-Université Grenoble Alpes (UGA)-Institut polytechnique de Grenoble - Grenoble Institute of Technology (Grenoble INP ), Université Grenoble Alpes (UGA), Laboratoire de Mathématiques Nicolas Oresme (LMNO), Université de Caen Normandie (UNICAEN), Normandie Université (NU)-Normandie Université (NU)-Centre National de la Recherche Scientifique (CNRS), School of Mathematics and Physics [Brisbane], University of Queensland [Brisbane]
Jazyk: angličtina
Rok vydání: 2022
Předmět:
Zdroj: JDS 2022-53èmes Journées de Statistique de la Société Française de Statistique (SFdS)
JDS 2022-53èmes Journées de Statistique de la Société Française de Statistique (SFdS), Jun 2022, Lyon, France. pp.1-6
Popis: International audience; This study is devoted to the problem of model selection among a collection of Gaussian-gated localized mixtures of experts models characterized by the number of mixture components, and the complexity of Gaussian mean experts, in a penalized maximum likelihood estimation framework. In particular, we establish non-asymptotic risk bounds that take the form of weak oracle inequalities, provided that lower bounds of the penalties hold. Their good empirical behavior is then demonstrated on synthetic and real datasets.; Cette étude est consacrée au problème de la sélection de modèles parmi une collection de modèles de mélanges d'experts avec experts gaussiens et fonctions d'activations gaussiennes normalisées, caractérisés par le nombre de composantes du mélange et la complexité des experts moyens, dans un cadre d'estimation par maximum de vraisemblance pénalisée. En particulier, nous établissons des limites de risque non asymptotiques qui prennent la forme d'inégalités oracles faibles, sous une condition de limite inférieure pour la pénalité. Leur bon comportement empirique est ensuite démontré en simulation et sur des données réelles. Mots-clés. sélection de modèle, maximum de vraisemblance pénalisée.
Databáze: OpenAIRE