Zobrazeno 1 - 4
of 4
pro vyhledávání: '"Ye, Johnny"'
We convert the DeepMind Mathematics Dataset into a reinforcement learning environment by interpreting it as a program synthesis problem. Each action taken in the environment adds an operator or an input into a discrete compute graph. Graphs which com
Externí odkaz:
http://arxiv.org/abs/2107.07373
Publikováno v:
Proceedings of the National Academy of Sciences of the United States of America, 2019 Jul . 116(31), 15453-15462.
Externí odkaz:
https://www.jstor.org/stable/26848141
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Publikováno v:
Proceedings of the National Academy of Sciences of the United States of America; 7/30/2019, Vol. 116 Issue 31, p15453-15462, 10p