Výsledky vyhledávání - "Ma, Jason Yecheng"

Report

Uniformly Conservative Exploration in Reinforcement Learning

Autor: Xu, Wanqiao, Ma, Jason Yecheng, Xu, Kan, Bastani, Hamsa, Bastani, Osbert

A key challenge to deploying reinforcement learning in practice is avoiding excessive (harmful) exploration in individual episodes. We propose a natural constraint on exploration -- \textit{uniformly} outperforming a conservative policy (adaptively e

Externí odkaz: http://arxiv.org/abs/2110.13060

Zobrazit plný text záznamu

Vyhledávací nástroje:

Upřesnit hledání