Zobrazeno 1 - 10
of 61
pro vyhledávání: '"Prashanth, L.A."'
In several applications such as clinical trials and financial portfolio optimization, the expected value (or the average reward) does not satisfactorily capture the merits of a drug or a portfolio. In such applications, risk plays a crucial role, and
Externí odkaz:
https://explore.openaire.eu/search/publication?articleId=doi_dedup___::3b8c23da7ff9dd97cfd04d64a7c16a2b
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Publikováno v:
Scopus-Elsevier
Motivated by models of human decision making proposed to explain commonly observed deviations from conventional expected value preferences, we formulate two stochastic multi-armed bandit problems with distorted probabilities on the cost distributions
Externí odkaz:
https://explore.openaire.eu/search/publication?articleId=doi_dedup___::e0f6956c2e6df98c7b88b5c01e483349
Publikováno v:
Scopus-Elsevier
Cumulative prospect theory (CPT) is known to model human decisions well, with substantial empirical evidence supporting this claim. CPT works by distorting probabilities and is more general than the classic expected utility and coherent risk measures
Externí odkaz:
https://explore.openaire.eu/search/publication?articleId=doi_dedup___::21855451a1cda85ce1d5abc7ec6b9115
http://arxiv.org/abs/1506.02632
http://arxiv.org/abs/1506.02632
Autor:
Korda, N., Prashanth L.A.
Publikováno v:
Scopus-Elsevier
We provide non-asymptotic bounds for the well-known temporal difference learning algorithm TD(0) with linear function approximators. These include high-probability bounds as well as bounds in expectation. Our analysis suggests that a step-size invers
Externí odkaz:
https://explore.openaire.eu/search/publication?articleId=doi_dedup___::89003d9ef54f17e13b75368ca6114a64
http://arxiv.org/abs/1411.3224
http://arxiv.org/abs/1411.3224
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Autor:
Prashanth L.A., Ghavamzadeh, M.
Publikováno v:
[Technical Report] 2013
Scopus-Elsevier
Scopus-Elsevier
In many sequential decision-making problems we may want to manage risk by minimizing some measure of variability in rewards in addition to maximizing a standard criterion. Variance-related risk measures are among the most common risk-sensitive criter
Externí odkaz:
https://explore.openaire.eu/search/publication?articleId=dedup_wf_001::5e1bac6f54063d6f1d1ccb12b713bf04
https://inria.hal.science/hal-00794721v2/document
https://inria.hal.science/hal-00794721v2/document
Publikováno v:
2016 IEEE 55th Conference on Decision & Control (CDC); 2016, p3682-3687, 6p