Zobrazeno 1 - 2
of 2
pro vyhledávání: '"Hwang, Ukjo"'
Autor:
Hwang, Ukjo, Hong, Songnam
Robust reinforcement learning (RRL) aims at seeking a robust policy to optimize the worst case performance over an uncertainty set of Markov decision processes (MDPs). This set contains some perturbed MDPs from a nominal MDP (N-MDP) that generate sam
Externí odkaz:
http://arxiv.org/abs/2305.06657
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.