Zobrazeno 1 - 2
of 2
pro vyhledávání: '"Sasek, Justin"'
Language models trained on diverse datasets unlock generalization by in-context learning. Reinforcement Learning (RL) policies can achieve a similar effect by meta-learning within the memory of a sequence model. However, meta-RL research primarily fo
Externí odkaz:
http://arxiv.org/abs/2411.11188
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.