基于 Stackelberg 策略的多 Agent 强化学习警力巡逻路径规划.

Autor: 解易, 顾益军
Předmět:
Zdroj: Transactions of Beijing Institute of Technology; jan2017, Vol. 37 Issue 1, p93-99, 7p
Databáze: Supplemental Index