Výsledky vyhledávání - "Sotnikov, Dmitry"

Report

Near-Optimal Regret in Linear MDPs with Aggregate Bandit Feedback

Autor: Cassel, Asaf, Luo, Haipeng, Rosenberg, Aviv, Sotnikov, Dmitry

In many real-world applications, it is hard to provide a reward signal in each step of a Reinforcement Learning (RL) process and more natural to give feedback when an episode ends. To this end, we study the recently proposed model of RL with Aggregat

Externí odkaz: http://arxiv.org/abs/2405.07637

Zobrazit plný text záznamu

Report

Delay-Adapted Policy Optimization and Improved Regret for Adversarial MDP with Delayed Bandit Feedback

Autor: Lancewicki, Tal, Rosenberg, Aviv, Sotnikov, Dmitry

Policy Optimization (PO) is one of the most popular methods in Reinforcement Learning (RL). Thus, theoretical guarantees for PO algorithms have become especially important to the RL community. In this paper, we study PO in adversarial MDPs with a cha

Externí odkaz: http://arxiv.org/abs/2305.07911

Zobrazit plný text záznamu

Akademický článek

Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.

Akademický článek

A Dimension Selection-Based Constrained Multi-Objective Optimization Algorithm Using a Combination of Artificial Intelligence Methods.

Autor: Di Wu, Sotnikov, Dmitry, Wang, G. Gary, Coatanea, Eric, Lyly, Mika, Salmi, Tiina

Publikováno v: Journal of Mechanical Design; Aug2023, Vol. 145 Issue 8, p1-15, 15p

Zobrazit plný text záznamu

Akademický článek

All-Pairs Shortest Paths in O(n²) Time with High Probability.

Autor: PERES, YUVAL¹ peres@microsoft.com, SOTNIKOV, DMITRY² dmitrysot@gmai.com, SUDAKOV, BENNY³ bsudakov@math.ucla.edu, ZWICK, URI² zwick@tau.ac.il

Publikováno v: Journal of the ACM. Aug2013, Vol. 60 Issue 4, p1-25. 25p.

Zobrazit plný text záznamu

Akademický článek

Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.

Akademický článek

Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.

Akademický článek

Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.

Akademický článek

Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.

Akademický článek

Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.

Vyhledávací nástroje:

Upřesnit hledání