Zobrazeno 1 - 2
of 2
pro vyhledávání: '"Nkhumise, Reabetswe M."'
The rising successes of RL are propelled by combining smart algorithmic strategies and deep architectures to optimize the distribution of returns and visitations over the state-action space. A quantitative framework to compare the learning processes
Externí odkaz:
http://arxiv.org/abs/2402.09113
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.