Zobrazeno 1 - 10
of 35
pro vyhledávání: '"Stojanovic, Stefan"'
We consider the problem of learning an $\varepsilon$-optimal policy in controlled dynamical systems with low-rank latent structure. For this problem, we present LoRa-PI (Low-Rank Policy Iteration), a model-free learning algorithm alternating between
Externí odkaz:
http://arxiv.org/abs/2410.23434
We study contextual bandits with low-rank structure where, in each round, if the (context, arm) pair $(i,j)\in [m]\times [n]$ is selected, the learner observes a noisy sample of the $(i,j)$-th entry of an unknown low-rank reward matrix. Successive co
Externí odkaz:
http://arxiv.org/abs/2402.15739
We study matrix estimation problems arising in reinforcement learning (RL) with low-rank structure. In low-rank bandits, the matrix to be recovered specifies the expected arm rewards, and for low-rank Markov Decision Processes (MDPs), it may for exam
Externí odkaz:
http://arxiv.org/abs/2310.06793
Popular iterative algorithms such as boosting methods and coordinate descent on linear models converge to the maximum $\ell_1$-margin classifier, a.k.a. sparse hard-margin SVM, in high dimensional regimes where the data is linearly separable. Previou
Externí odkaz:
http://arxiv.org/abs/2212.03783
Autor:
Regner, Hampus, Stojanovic, Stefan
Den globala utvecklingen som pågått sedan 1950-talet har resulterat i drastiska klimatförändringar vilket orsakat allvarliga miljöproblem. Dessa miljöproblem beror till stor del på en kraftig befolkningstillväxt. Befolkningstillväxt
Externí odkaz:
http://urn.kb.se/resolve?urn=urn:nbn:se:mdh:diva-59246
Good generalization performance on high-dimensional data crucially hinges on a simple structure of the ground truth and a corresponding strong inductive bias of the estimator. Even though this intuition is valid for regularized models, in this paper
Externí odkaz:
http://arxiv.org/abs/2203.03597
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Autor:
ILBAK, ISMAIL, STOJANOVIC, STEFAN, RYDZIK, LUKASZ, AMBROZY, TADEUSZ, WASACZ, WOJCIECH, KASICKI, KRZYSZTOF, ILBAK, YUNUS EMRE, JORGIC, BOJAN M., BLACH, WIESLAW
Publikováno v:
Ido Movement for Culture. Journal of Martial Arts Anthropology; 2024, Vol. 24 Issue 4, p26-32, 7p