Zobrazeno 1 - 3
of 3
pro vyhledávání: '"Micro-Data Policy Search"'
Les robots opèrent dans le monde réel, dans lequel essayer quelque chose prend beaucoup de temps. Pourtant, les methodes d’apprentissage par renforcement actuels (par exemple, deep reinforcement learning) nécessitent de longues périodes d
Externí odkaz:
http://www.theses.fr/2018LORR0276/document
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Autor:
Konstantinos Chatzilygeroudis, Vassilis Vassiliades, Freek Stulp, Sylvain Calinon, Jean-Baptiste Mouret
Publikováno v:
IEEE Transactions on Robotics
IEEE Transactions on Robotics, IEEE, 2020, 36 (2), pp.328-347. ⟨10.1109/TRO.2019.2958211⟩
IEEE Transactions on Robotics, IEEE, In press, ⟨10.1109/TRO.2019.2958211⟩
IEEE Transactions on Robotics, 2020, 36 (2), pp.328-347. ⟨10.1109/TRO.2019.2958211⟩
IEEE Transactions on Robotics, IEEE, 2020, 36 (2), pp.328-347. ⟨10.1109/TRO.2019.2958211⟩
IEEE Transactions on Robotics, IEEE, In press, ⟨10.1109/TRO.2019.2958211⟩
IEEE Transactions on Robotics, 2020, 36 (2), pp.328-347. ⟨10.1109/TRO.2019.2958211⟩
Most policy search algorithms require thousands of training episodes to find an effective policy, which is often infeasible with a physical robot. This survey article focuses on the extreme other end of the spectrum: how can a robot adapt with only a