用于连续时间中策略梯度算法的 动作稳定更新算法.

Autor: 宋江帆1, 李金龙1 jlli@ustc.edu.cn
Zdroj: Application Research of Computers / Jisuanji Yingyong Yanjiu. Oct2023, Vol. 40 Issue 10, p2928-2944. 6p.
Databáze: Academic Search Ultimate