Výsledky vyhledávání - "Cai, Yaobang"

Report

Q-value Regularized Decision ConvFormer for Offline Reinforcement Learning

Autor: Yan, Teng, Ruan, Zhendong, Cai, Yaobang, Han, Yu, Li, Wenxian, Zhang, Yang

As a data-driven paradigm, offline reinforcement learning (Offline RL) has been formulated as sequence modeling, where the Decision Transformer (DT) has demonstrated exceptional capabilities. Unlike previous reinforcement learning methods that fit va

Externí odkaz: http://arxiv.org/abs/2409.08062

Zobrazit plný text záznamu

Vyhledávací nástroje:

Upřesnit hledání