Zobrazeno 1 - 10
of 16
pro vyhledávání: '"Gao, Chengqian"'
Evolution Strategies (ES) have emerged as a competitive alternative for model-free reinforcement learning, showcasing exemplary performance in tasks like Mujoco and Atari. Notably, they shine in scenarios with imperfect reward functions, making them
Externí odkaz:
http://arxiv.org/abs/2405.01615
A promising paradigm for offline reinforcement learning (RL) is to constrain the learned policy to stay close to the dataset behaviors, known as policy constraint offline RL. However, existing works heavily rely on the purity of the data, exhibiting
Externí odkaz:
http://arxiv.org/abs/2210.10469
Scaling reinforcement learning (RL) to recommender systems (RS) is promising since maximizing the expected cumulative rewards for RL agents meets the objective of RS, i.e., improving customers' long-term satisfaction. A key approach to this goal is o
Externí odkaz:
http://arxiv.org/abs/2110.07923
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Publikováno v:
International Journal of Energy Research; 3/25/2021, Vol. 45 Issue 4, p5263-5271, 9p
Autor:
Jani VP; Department of Biomedical Engineering, The Johns Hopkins School of Medicine, Baltimore, MD 21205, USA.; Division of Cardiology, Department of Medicine, Johns Hopkins University School of Medicine, Baltimore, MD 21205, USA., Song T; Division of Cardiovascular Health and Disease, Department of Internal Medicine, University of Cincinnati, Cincinnati, OH 45229, USA., Gao C; College of Basic Medical Sciences, Dalian Medical University, Dalian, Liaoning 116044, China., Gong H; Department of Biology, Illinois Institute of Technology, Chicago, IL 60616, USA., Sadayappan S; Division of Cardiovascular Health and Disease, Department of Internal Medicine, University of Cincinnati, Cincinnati, OH 45229, USA., Kass DA; Department of Biomedical Engineering, The Johns Hopkins School of Medicine, Baltimore, MD 21205, USA.; Division of Cardiology, Department of Medicine, Johns Hopkins University School of Medicine, Baltimore, MD 21205, USA., Irving TC; Department of Biology, Illinois Institute of Technology, Chicago, IL 60616, USA.; Center for Synchrotron Radiation Research and Instrumentation, Illinois Institute of Technology, Chicago, IL 60616, USA., Ma W; Department of Biology, Illinois Institute of Technology, Chicago, IL 60616, USA.; Center for Synchrotron Radiation Research and Instrumentation, Illinois Institute of Technology, Chicago, IL 60616, USA.
Publikováno v:
PNAS nexus [PNAS Nexus] 2024 Jan 30; Vol. 3 (2), pp. pgae039. Date of Electronic Publication: 2024 Jan 30 (Print Publication: 2024).