Výsledky vyhledávání - "Ma, Chenxiao"

Report

Provably Efficient Exploration in Reward Machines with Low Regret

Autor: Bourel, Hippolyte, Jonsson, Anders, Maillard, Odalric-Ambrym, Ma, Chenxiao, Talebi, Mohammad Sadegh

We study reinforcement learning (RL) for decision processes with non-Markovian reward, in which high-level knowledge of the task in the form of reward machines is available to the learner. We consider probabilistic reward machines with initially unkn

Externí odkaz: http://arxiv.org/abs/2412.19194

Zobrazit plný text záznamu

Akademický článek

Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.

Akademický článek

Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.

Akademický článek

Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.

Akademický článek

Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.

Akademický článek

Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.

Akademický článek

Social benefit assessment of urban utility tunnels planned in unbuilt new area: a case study of Xiong'an New Area.

Autor: Zhang, Ziyun, Zhang, Hui, Ma, Chenxiao

Publikováno v: IOP Conference Series: Earth & Environmental Science; 2020, Vol. 608, p1-6, 6p

Zobrazit plný text záznamu

Akademický článek

Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.

Vyhledávací nástroje:

Upřesnit hledání