Výsledky vyhledávání - "Furuyama, Ryoma"

Report

Extrinsicaly Rewarded Soft Q Imitation Learning with Discriminator

Autor: Furuyama, Ryoma, Kuyoshi, Daiki, Yamane, Satoshi

Imitation learning is often used in addition to reinforcement learning in environments where reward design is difficult or where the reward is sparse, but it is difficult to be able to imitate well in unknown states from a small amount of expert data

Externí odkaz: http://arxiv.org/abs/2401.16772

Zobrazit plný text záznamu

Vyhledávací nástroje:

Upřesnit hledání