Indices de sensibilité, sélection de paramètres et erreur quadratique de prédiction : des liaisons dangereuses ?

Autor: Lamboni, Matieyendou, Makowski, David, Monod, Herve
Přispěvatelé: Agronomie, AgroParisTech-Institut National de la Recherche Agronomique (INRA), Unité de recherche Mathématiques et Informatique Appliquées (MIA), Institut National de la Recherche Agronomique (INRA), Institut National de la Recherche Agronomique (INRA)-AgroParisTech, ProdInra, Archive Ouverte
Jazyk: francouzština
Rok vydání: 2011
Předmět:
Zdroj: Journal de la SFdS
Journal de la SFdS, 2011, 152 (1), pp.26-48
Journal de la Société Française de Statistique
Journal de la Société Française de Statistique, Société Française de Statistique et Société Mathématique de France, 2011, 152 (1), pp.26-48
ISSN: 1962-5197
2102-6238
Popis: Lorsqu'un modèle contient un grand nombre de paramètres, l'analyse de sensibilité globale est souvent utilisée pour sélectionner les paramètres à estimer parmi ceux identifiés comme les plus influents. Une telle procédure de sélection est basée sur des données simulées et se distingue de la procédure de validation du modèle qui est basée sur des données réelles. Néanmoins, ces deux procédures sont liées dans leurs objectifs et il est intéressant d'évaluer les bénéfices de la sélection par analyse de sensibilité à l'aide des critères EQMP (Erreur Quadratique Moyenne de Prédiction) et EQM (Erreur Quadratique Moyenne). Dans cet article, nous formalisons d'abord la démarche consistant à sélectionner les paramètres à estimer par analyse de sensibilité et à fixer les autres paramètres à leur valeur nominale. Dans le cadre du modèle linéaire, nous explicitons ensuite, de façon exacte, les liens formels qui existent entre les indices de sensibilité des paramètres et la qualité de prédiction mesurée par les critères d'évaluation EQM et EQMP. Nous complétons ces résultats par des simulations pour étudier l'impact sur la qualité prédictive du modèle, d'une part du plan d'expériences (variables d'entrées du modèle), d'autre part du point où l'analyse de sensibilité est effectuée. Dans ces simulations, l'approche de sélection de paramètres par analyse de sensibilité est comparée à la méthode LASSO qui sert de référence pour sélectionner des modèles creux. Les résultats montrent qu'estimer les paramètres les plus influents contribue à la réduction de l'EQM et de l'EQMP mais que cette réduction n'est pas systématique. En effet, la relation entre l'EQMP et les indices de sensibilité est complexe et elle dépend fortement du plan d'expériences. Par exemple, seul un plan d'expériences orthogonal garantit une réduction systématique de l'EQMP. De plus, les résultats dépendent des points supports de l'analyse de sensibilité. La performance de la sélection des paramètres par l'analyse de sensibilité est équivalente à celle de LASSO en termes de l'EQMP si nous disposons a priori des connaissances pertinentes sur le degré d'incertitudes des différents paramètres pour conduire l'analyse de sensibilité. Les conséquences pratiques des résultats font l'objet d'une discussion en fin d'article.
Databáze: OpenAIRE