Zobrazeno 1 - 10
of 26
pro vyhledávání: '"Ganesh, Swetha"'
Order-Optimal Global Convergence for Average Reward Reinforcement Learning via Actor-Critic Approach
This work analyzes average-reward reinforcement learning with general parametrization. Current state-of-the-art (SOTA) guarantees for this problem are either suboptimal or demand prior knowledge of the mixing time of the underlying Markov process, wh
Externí odkaz:
http://arxiv.org/abs/2407.18878
We present two Policy Gradient-based methods with general parameterization in the context of infinite horizon average reward Markov Decision Processes. The first approach employs Implicit Gradient Transport for variance reduction, ensuring an expecte
Externí odkaz:
http://arxiv.org/abs/2404.02108
Federated Reinforcement Learning (FRL) allows multiple agents to collaboratively build a decision making policy without sharing raw trajectories. However, if a small fraction of these agents are adversarial, it can lead to catastrophic results. We pr
Externí odkaz:
http://arxiv.org/abs/2403.09940
We introduce an observation-matrix-based framework for fully asynchronous online Federated Learning (FL) with adversaries. In this work, we demonstrate its effectiveness in estimating the mean of a random vector. Our main result is that the proposed
Externí odkaz:
http://arxiv.org/abs/2304.01525
Stochastic Heavy Ball (SHB) and Nesterov's Accelerated Stochastic Gradient (ASG) are popular momentum methods in stochastic optimization. While benefits of such acceleration ideas in deterministic settings are well understood, their advantages in sto
Externí odkaz:
http://arxiv.org/abs/2110.15547
Autor:
Ganesh, Swetha, Mohanty, Sumit
It is known that there is an alternative characterization of characteristic vertices for trees with positive weights on their edges via Perron values and Perron branches. Moreover, the algebraic connectivity of a tree with positive edge weights can b
Externí odkaz:
http://arxiv.org/abs/2009.05996
Autor:
Ganesh, Swetha, Mohanty, Sumit
Publikováno v:
In Linear Algebra and Its Applications 1 August 2022 646:195-237
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.