Výsledky vyhledávání

Report

Sample Dropout: A Simple yet Effective Variance Reduction Technique in Deep Policy Optimization

Autor: Lin, Zichuan, Wu, Xiapeng, Sun, Mingfei, Ye, Deheng, Fu, Qiang, Yang, Wei, Liu, Wei

Recent success in Deep Reinforcement Learning (DRL) methods has shown that policy optimization with respect to an off-policy distribution via importance sampling is effective for sample reuse. In this paper, we show that the use of importance samplin

Externí odkaz: http://arxiv.org/abs/2302.02299

Zobrazit plný text záznamu

Akademický článek

Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.

Vyhledávací nástroje:

Upřesnit hledání