Zobrazeno 1 - 10
of 106
pro vyhledávání: '"Wu, Weichen"'
Statistical inference with finite-sample validity for the value function of a given policy in Markov decision processes (MDPs) is crucial for ensuring the reliability of reinforcement learning. Temporal Difference (TD) learning, arguably the most wid
Externí odkaz:
http://arxiv.org/abs/2410.16106
The prevailing statistical approach to analyzing persistence diagrams is concerned with filtering out topological noise. In this paper, we adopt a different viewpoint and aim at estimating the actual distribution of a random persistence diagram, whic
Externí odkaz:
http://arxiv.org/abs/2310.11982
This paper is concerned with the problem of policy evaluation with linear function approximation in discounted infinite horizon Markov decision processes. We investigate the sample complexities required to guarantee a predefined estimation error of t
Externí odkaz:
http://arxiv.org/abs/2305.19001
The Bradley-Terry model is widely used for pairwise comparison data analysis. In this paper, we analyze the asymptotic behavior of the maximum likelihood estimator of the Bradley-Terry model in its logistic parameterization, under a general class of
Externí odkaz:
http://arxiv.org/abs/2205.04341
Autor:
Yang, Lifen1 (AUTHOR) yanglifen2989@163.com, Wu, Weichen2 (AUTHOR) wuweixiongde@126.com, Cai, Sa1,3 (AUTHOR) cais5209@163.com, Wang, Jing2 (AUTHOR) wangj796@mail2.sysu.edu.cn, Kuang, Guopeng1 (AUTHOR) kgp0317@163.com, Yang, Weihong1 (AUTHOR) yangwh0604@163.com, Wang, Juan1 (AUTHOR) wj2502@163.com, Han, Xi1 (AUTHOR) hanxi922@163.com, Pan, Hong1 (AUTHOR) panhong6662022@163.com, Shi, Mang2 (AUTHOR) shim23@mail.sysu.edu.cn, Feng, Yun1,3,4 (AUTHOR) shim23@mail.sysu.edu.cn
Publikováno v:
Viruses (1999-4915). May2024, Vol. 16 Issue 5, p674. 14p.
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Publikováno v:
In Information Sciences 6 February 2021 546:543-558
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.