Zobrazeno 1 - 10
of 160
pro vyhledávání: '"Ghavamzadeh M"'
Autor:
Abdar, M. (Moloud), Pourpanah, F. (Farhad), Hussain, S. (Sadiq), Rezazadegan, D. (Dana), Liu, L. (Li), Ghavamzadeh, M. (Mohammad), Fieguth, P. (Paul), Cao, X. (Xiaochun), Khosravi, A. (Abbas), Acharya, U. R. (U. Rajendra), Makarenkov, V. (Vladimir), Nahavandi, S. (Saeid)
Uncertainty quantification (UQ) methods play a pivotal role in reducing the impact of uncertainties during both optimization and decision making processes. They have been applied to solve a variety of real-world problems in science and engineering. B
Externí odkaz:
https://explore.openaire.eu/search/publication?articleId=od______2423::9617ee124ea733924dc3b09fd6b341d8
http://urn.fi/urn:nbn:fi-fe2021090645179
http://urn.fi/urn:nbn:fi-fe2021090645179
Publikováno v:
Scopus-Elsevier
State-of-the-art efficient model-based Reinforcement Learning (RL) algorithms typically act by iteratively solving empirical models, i.e., by performing \emph{full-planning} on Markov Decision Processes (MDPs) built by the gathered experience. In thi
Externí odkaz:
https://explore.openaire.eu/search/publication?articleId=doi_dedup___::627bca031bf58846b299d5d3e7367f93
Publikováno v:
Proceedings of the 19th International Conference on Artificial Intelligence (AISTATS)
Proceedings of the 19th International Conference on Artificial Intelligence (AISTATS), May 2016, Cadiz, Spain
Scopus-Elsevier
Proceedings of the 19th International Conference on Artificial Intelligence (AISTATS), May 2016, Cadiz, Spain
Scopus-Elsevier
International audience; We study the problem of combinatorial pure exploration in the stochastic multi-armed bandit problem. We first construct a new measure of complexity that provably characterizes the learning performance of the algorithms we prop
Externí odkaz:
https://explore.openaire.eu/search/publication?articleId=dedup_wf_001::370e02224efffe93bdbcfb0c94e98015
https://inria.hal.science/hal-01322198/document
https://inria.hal.science/hal-01322198/document
Publikováno v:
International Joint Conference on Artificial Intelligence
International Joint Conference on Artificial Intelligence, Jul 2015, Bueons Aires, Argentina
Scopus-Elsevier
International Joint Conference on Artificial Intelligence, Jul 2015, Bueons Aires, Argentina
Scopus-Elsevier
International audience; A popular approach to apprenticeship learning (AL) is to formulate itas an inverse reinforcement learning (IRL) problem. The MaxEnt-IRL algorithm successfully integrates the maximum entropy principleinto IRL and unlike its pre
Externí odkaz:
https://explore.openaire.eu/search/publication?articleId=dedup_wf_001::84432c7a4a3b5879ff395320481d2c18
https://inria.hal.science/hal-01146187
https://inria.hal.science/hal-01146187
Publikováno v:
Scopus-Elsevier
Several authors have recently developed risk-sensitive policy gradient methods that augment the standard expected cost minimization problem with a measure of variability in cost. These studies have focused on specific risk-measures, such as the varia
Externí odkaz:
https://explore.openaire.eu/search/publication?articleId=doi_dedup___::6f5f6a30d160f225eeaf60209fb78daa
http://arxiv.org/abs/1502.03919
http://arxiv.org/abs/1502.03919
Autor:
Prashanth L.A., Ghavamzadeh, M.
Publikováno v:
[Technical Report] 2013
Scopus-Elsevier
Scopus-Elsevier
In many sequential decision-making problems we may want to manage risk by minimizing some measure of variability in rewards in addition to maximizing a standard criterion. Variance-related risk measures are among the most common risk-sensitive criter
Externí odkaz:
https://explore.openaire.eu/search/publication?articleId=dedup_wf_001::5e1bac6f54063d6f1d1ccb12b713bf04
https://inria.hal.science/hal-00794721v2/document
https://inria.hal.science/hal-00794721v2/document
Conference
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Conference
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Conference
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.