Zobrazeno 1 - 8
of 8
pro vyhledávání: '"Ponnambalam, C.T."'
Autor:
Ponnambalam, C.T.
Reinforcement learning (RL) models the learning process of humans, but as exciting advances are made that use increasingly deep neural networks, some of the fundamental strengths of human learning are still underutilized by RL agents. One of the most
Externí odkaz:
https://explore.openaire.eu/search/publication?articleId=doi_dedup___::49729d2149eed82ac9c04d6838b5ff3e
http://resolver.tudelft.nl/uuid:0071a2f9-c56f-4f75-b6eb-63ebadadc918
http://resolver.tudelft.nl/uuid:0071a2f9-c56f-4f75-b6eb-63ebadadc918
Publikováno v:
Adaptive Learning Agents Workshop at the 21st International Conference on Autonomous Agents and Multiagent Systems
Externí odkaz:
https://explore.openaire.eu/search/publication?articleId=narcis______::db4d8af40767b73018112ca4e594b5cf
http://resolver.tudelft.nl/uuid:ef84ea9b-67aa-4b96-9c13-1bb3d04836da
http://resolver.tudelft.nl/uuid:ef84ea9b-67aa-4b96-9c13-1bb3d04836da
Publikováno v:
Robust and Reliable Autonomy in the Wild Workshop at the 30th International Joint Conference of Artificial Intelligence
Offline reinforcement learning (RL), or learning from a fixed data set, is an attractive alternative to online RL. Offline RL promises to address the cost and safety implications of tak- ing numerous random or bad actions online, a crucial aspect of
Externí odkaz:
https://explore.openaire.eu/search/publication?articleId=narcis______::53b519b8130b06db6c31af4e829aafe6
http://resolver.tudelft.nl/uuid:2053b579-a663-4def-ad25-4bedad0169be
http://resolver.tudelft.nl/uuid:2053b579-a663-4def-ad25-4bedad0169be
Publikováno v:
Adaptive and Learning Agents Workshop
Reinforcement learning requires exploration, leading to repeated execution of sub-optimal actions. Naive exploration techniques address this problem by changing gradually from exploration to exploitation. This approach employs a wide search resulting
Externí odkaz:
https://explore.openaire.eu/search/publication?articleId=narcis______::043fe3b466b9142c803f3b79f721c848
http://resolver.tudelft.nl/uuid:66399260-9551-46f5-92a8-bed977898f99
http://resolver.tudelft.nl/uuid:66399260-9551-46f5-92a8-bed977898f99
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Conference
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Conference
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Conference
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.