Zobrazeno 1 - 10
of 65
pro vyhledávání: '"Šiška, D."'
Publikováno v:
SIAM J. Control Optim., 58(3), 1314-1340, 2020
Optimal control problems are inherently hard to solve as the optimization must be performed simultaneously with updating the underlying system. Starting from an initial guess, Howard's policy improvement algorithm separates the step of updating the t
Externí odkaz:
http://arxiv.org/abs/1812.07846
Publikováno v:
Applied Mathematics & Optimization. Dec2021, Vol. 84 Issue 3, p3417-3436. 20p.
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
We study the global convergence of policy gradient for infinite-horizon, continuous state and action space, entropy-regularized Markov decision processes (MDPs). We consider a softmax policy with (one-hidden layer) neural network approximation in a m
Externí odkaz:
https://explore.openaire.eu/search/publication?articleId=od______1032::200af7025765cc874a7bb1afc16a9b67
http://hdl.handle.net/10044/1/95337
http://hdl.handle.net/10044/1/95337
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Publikováno v:
Surgical Review / Rozhledy v Chirurgii; 2020, Vol. 99 Issue 5, p226-231, 6p
Publikováno v:
Surgical Review / Rozhledy v Chirurgii; 2020, Vol. 99 Issue 5, p200-206, 7p
Publikováno v:
Surgical Review / Rozhledy v Chirurgii; 2020, Vol. 99 Issue 4, p189-193, 5p
Publikováno v:
Surgical Review / Rozhledy v Chirurgii; 2019, Vol. 98 Issue 5, p223-226, 4p