Zobrazeno 1 - 10
of 79
pro vyhledávání: '"Chiang, Po Han"'
The concept of utilizing multi-step returns for updating value functions has been adopted in deep reinforcement learning (DRL) for a number of years. Updating value functions with different backup lengths provides advantages in different aspects, inc
Externí odkaz:
http://arxiv.org/abs/2007.08229
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Publikováno v:
Proceedings of the Twenty-Ninth International Joint Conference on Artificial Intelligence Main track. Pages 2065-2072
In this paper, we focus on a prediction-based novelty estimation strategy upon the deep reinforcement learning (DRL) framework, and present a flow-based intrinsic curiosity module (FICM) to exploit the prediction errors from optical flow estimation a
Externí odkaz:
http://arxiv.org/abs/1905.10071
Exploration bonus derived from the novelty of the states in an environment has become a popular approach to motivate exploration for deep reinforcement learning agents in the past few years. Recent methods such as curiosity-driven exploration usually
Externí odkaz:
http://arxiv.org/abs/1901.08486
Autor:
De Huang, Yau, Morata, Oscar, Koch, Patrick Michel, Kemper, Ciska, Hwang, Yuh-Jing, Chiong, Chau-Ching, Ho, Paul, Chu, You-Hua, Huang, Chi-Den, Liu, Ching-Tang, Hsieh, Fang-Chia, Tseng, Yen-Hsiang, Weng, Shou-Hsien, Ho, Chin-Ting, Chiang, Po-Han, Wu, Hsiao-Ling, Chang, Chih-Cheng, Jian, Shou-Ting, Lee, Chien-Feng, Lee, Yi-Wei, Iguchi, Satoru, Asayama, Shin'ichiro, Iono, Daisuke, Gonzalez, Alvaro, Effland, John, Saini, Kamaljeet, Pospieszalski, Marian, Henke, Doug, Yeung, Keith, Finger, Ricardo, Tapia, Valeria, Reyes, Nicolas
The Atacama Large Millimeter/submillimeter Array(ALMA) Band 1 receiver covers the 35-50 GHz frequency band. Development of prototype receivers, including the key components and subsystems has been completed and two sets of prototype receivers were fu
Externí odkaz:
http://arxiv.org/abs/1612.00893
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.