Zobrazeno 1 - 3
of 3
pro vyhledávání: '"Mance E. Harmon"'
Publikováno v:
Adaptive Behavior. 4:3-28
An application of reinforcement learning to a linear-quadratic, differential game is presented. The reinforcement learning system uses a recently developed algorithm, the residual-gradient form of advantage updating. The game is a Markov decision pro
Autor:
Mance E. Harmon, Stephanie S. Harmon
The purpose of this tutorial is to provide an introduction to reinforcement learning (RL) at a level easily understood by students and researchers in a wide range of disciplines. The intent is not to present a rigorous mathematical discussion that re
Externí odkaz:
https://explore.openaire.eu/search/publication?articleId=doi_________::c2450cd4864e279c15f999cd3d844f0e
https://doi.org/10.21236/ada323194
https://doi.org/10.21236/ada323194
Conference
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.