Sensibilité de la Valeur Espérée du Risque Empirique Induit par l’Algorithme de Gibbs dans le Problème d’Apprentissage Supervisé
Autor: | Perlaza, Samir, Esnaola, Iñaki, Vincent Poor, H |
---|---|
Přispěvatelé: | Network Engineering and Operations (NEO ), Inria Sophia Antipolis - Méditerranée (CRISAM), Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria), Laboratoire de Géométrie Algébrique et Applications à la Théorie de l'Information (GAATI), Université de la Polynésie Française (UPF), Department of Electrical and Computer Engineering [Princeton] (ECE), Princeton University, Department of Automatic Control and Systems Engineering [ Sheffield] (ACSE), University of Sheffield [Sheffield], Inria, This work was developed in the context of the Inria Exploratory Action 'Information and Decision Making' (IDEM) |
Jazyk: | angličtina |
Rok vydání: | 2022 |
Předmět: |
En- tropie Relative
Relative Entropy Regular- ization et Apprentissage Bayésien [MATH.MATH-IT]Mathematics [math]/Information Theory [math.IT] [STAT.TH]Statistics [stat]/Statistics Theory [stat.TH] Gibbs Algorithm [INFO.INFO-AI]Computer Science [cs]/Artificial Intelligence [cs.AI] Principe d’Entropie Maxi- male Minimisation du Risque Empirique [STAT.ML]Statistics [stat]/Machine Learning [stat.ML] [INFO.INFO-LG]Computer Science [cs]/Machine Learning [cs.LG] PAC-Learning Apprentissage PAC Régularisation Maximum Entropy Principle Empirical Risk Minimization Supervised Learning and Bayesian Learning Apprentissage Supervisé |
Zdroj: | [Research Report] RR-9474, Inria. 2022, pp.22 |
Popis: | An explicit expression for the sensitivity of the expected empirical risk (EER) induced by the Gibbs algorithm (GA) is presented in the context of supervised machine learning. The sensitivity is defined as the difference between the EER induced by the GA and the EER induced by an alternative probability measure on the models. When several datasets are available, the sensitivity plays a central role to determine whether or not a lower EER might be observed by aggregating several datasets. Necessary and sufficient conditions for decreasing the EER by dataset aggregation are presented. Such conditions, which are on the GA parameters and the referencemeasures assumed for each constituent dataset, boils down to the evaluation of the sign of the sum of some relative entropy terms. From this perspective, sensitivity appears as (a) an alternative metric to evaluate the generalization capabilities of the Gibbs algorithm; and (b) a theoretical ground to study the use of several datasets describing the same phenomenon, yet subject to different data acquisition systems, i.e., datasets with different statistical properties.; Une expression explicite de la sensibilité du risque empirique espéré (REE) induit par l’algorithme de Gibbs (AG) dans le problème de l’apprentissage automatique supervisé est présentée. La sensibilité est définie comme la différence entre l’REE induit par l’AG et l’REE induit par une mesure de probabilité alternative sur les modèles. Lorsque plusieurs ensembles de données sont disponibles, la sensibilité joue un rôle central pour déterminer si un REE plus petit peut-être observé comme résultat de l’agrégation de plusieurs ensembles de données. Les conditions nécessaires et suffisantes pour observer une diminution de l’EER due à l’agrégation des données sont présentées. De telles conditions,qui sont sur les paramètres de l’AG et les mesures de référence supposées pour chaque ensemble de données, se résument à l’évaluation du signe d’une somme de certains termes d’entropie relative. À la lumière de ces résultats, la sensibilité apparaît comme (a) une métrique alternative pour évaluer les capacités de généralisation de l’algorithme de Gibbs; et (b) un cadre théorique pour étudier l’impact de l’utilisation de plusieurs ensembles de données décrivant le même phénomène mais soumis à différents systèmes d’acquisition de données, ce qui implique par exemple, différentes propriétés statistiques pour chaque ensemble de données. |
Databáze: | OpenAIRE |
Externí odkaz: |