Zobrazeno 1 - 3
of 3
pro vyhledávání: '"穆朝絮"'
Publikováno v:
智能科学与技术学报, Vol 2, Iss 4, Pp 314-326 (2020)
深度强化学习主要被用来处理感知-决策问题,已经成为人工智能领域重要的研究分支。概述了基于值函数和策略梯度的两类深度强化学习算法,详细阐述了深度Q网络、深度策略梯度及相关
Externí odkaz:
https://doaj.org/article/b1e27ad3ac674c4fb3fa276c913ba61b
Publikováno v:
Infrared and Laser Engineering. 51:20220194
Publikováno v:
Acta Automatica Sinica; Mar2017, Vol. 43 Issue 3, p366-375, 10p