Identifier la structure des problèmes d'apprentissage en ligne et collaboratif
Autor: | Asadi, Mahsa |
---|---|
Přispěvatelé: | Machine Learning in Information Networks (MAGNET), Inria Lille - Nord Europe, Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre de Recherche en Informatique, Signal et Automatique de Lille - UMR 9189 (CRIStAL), Centrale Lille-Université de Lille-Centre National de la Recherche Scientifique (CNRS)-Centrale Lille-Université de Lille-Centre National de la Recherche Scientifique (CNRS), Université de Lille, Marc Tommasi, Aurélien Bellet, Lille University, Aurelien Bellet |
Jazyk: | angličtina |
Rok vydání: | 2022 |
Předmět: |
Mean estimation
Reinforcement learning RL Decentralized learning Bandit manchot (mathématiques) Collaborative Learning Apprentissage automatique en ligne Estimation moyenne Reinforcement Learning Graph [INFO.INFO-AI]Computer Science [cs]/Artificial Intelligence [cs.AI] Réseaux de graphes Apprentissage par renforcement Online Learning [INFO.INFO-LG]Computer Science [cs]/Machine Learning [cs.LG] Machine learning ML apprentissage automatique Graph networks [INFO]Computer Science [cs] online machine learning Bandits Apprentissage automatique collaboratif |
Zdroj: | Artificial Intelligence [cs.AI]. Université de Lille, 2022. English. ⟨NNT : 2022ULILB031⟩ Computer Science [cs]. Lille University, 2022. English. ⟨NNT : ⟩ |
Popis: | Nowadays it is commonplace to deal with large scale problems and should we take problem structure into account, it could assist us toward improving learning performance. In this work, we have proposed approaches that take into account the structure in two settings: (i) model-based reinforcement learning problems where we have reduced the regret (ii) online personalized mean estimation problems where we have reduced the sample complexity for mean estimation.; De nos jours, il est courant de traiter des problèmes à grande échelle et si nous prenons en compte la structure du problème, cela pourrait nous aider à améliorer les performances d'apprentissage. Dans ce travail, nous avons proposé des approches qui tiennent compte de la structure dans deux contextes: (i) les problèmes d'apprentissage par renforcement basés sur des modèles où nous avons réduit le regret (ii) les problèmes d'estimation de moyenne personnalisée en ligne où nous avons réduit la complexité de l'échantillon pour l'estimation moyenne. |
Databáze: | OpenAIRE |
Externí odkaz: |