Výsledky vyhledávání

Report

Stationary Policies are Optimal in Risk-averse Total-reward MDPs with EVaR

Autor: Su, Xihong, Petrik, Marek, Grand-Clément, Julien

Optimizing risk-averse objectives in discounted MDPs is challenging because most models do not admit direct dynamic programming equations and require complex history-dependent policies. In this paper, we show that the risk-averse {\em total reward cr

Externí odkaz: http://arxiv.org/abs/2408.17286

Zobrazit plný text záznamu

Report

Solving Multi-Model MDPs by Coordinate Ascent and Dynamic Programming

Autor: Su, Xihong, Petrik, Marek

Multi-model Markov decision process (MMDP) is a promising framework for computing policies that are robust to parameter uncertainty in MDPs. MMDPs aim to find a policy that maximizes the expected return over a distribution of MDP models. Because MMDP

Externí odkaz: http://arxiv.org/abs/2407.06329

Zobrazit plný text záznamu

Akademický článek

Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.

Akademický článek

SA based software deployment reliability estimation considering component dependence.

Autor: Su, Xihong, Liu, Hongwei, Wu, Zhibo, Yang, Xiaozong, Zuo, Decheng

Publikováno v: Journal of Electronics; Jan2011, Vol. 28 Issue 1, p118-125, 8p

Zobrazit plný text záznamu

Vyhledávací nástroje:

Upřesnit hledání