Zobrazeno 1 - 10
of 10
pro vyhledávání: '"Fu, Yaosheng"'
As GPUs scale their low precision matrix math throughput to boost deep learning (DL) performance, they upset the balance between math throughput and memory system capabilities. We demonstrate that converged GPU design trying to address diverging arch
Externí odkaz:
http://arxiv.org/abs/2104.02188
Autor:
Inci, Ahmet, Bolotin, Evgeny, Fu, Yaosheng, Dalal, Gal, Mannor, Shie, Nellans, David, Marculescu, Diana
With deep reinforcement learning (RL) methods achieving results that exceed human capabilities in games, robotics, and simulated environments, continued scaling of RL training is crucial to its deployment in solving complex real-world problems. Howev
Externí odkaz:
http://arxiv.org/abs/2012.04210
Autor:
Pal, Saptadeep, Ebrahimi, Eiman, Zulfiqar, Arslan, Fu, Yaosheng, Zhang, Victor, Migacz, Szymon, Nellans, David, Gupta, Puneet
Deploying deep learning (DL) models across multiple compute devices to train large and complex models continues to grow in importance because of the demand for faster and more frequent training. Data parallelism (DP) is the most widely used paralleli
Externí odkaz:
http://arxiv.org/abs/1907.13257
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Autor:
Fu, Yaosheng, Wentzlaff, David
Publikováno v:
2014 IEEE International Symposium on Performance Analysis of Systems & Software (ISPASS); 2014, p116-125, 10p
Autor:
Balkind, Jonathan, McKeown, Michael, Fu, Yaosheng, Nguyen, Tri, Zhou, Yanqi, Lavrov, Alexey, Shahrad, Mohammad, Fuchs, Adi, Payne, Samuel, Liang, Xiaohua, Matl, Matthew, Wentzlaff, David
Publikováno v:
ACM SIGOPS Operating Systems Review; January 2017, Vol. 50 Issue: 2 p217-232, 16p
Autor:
Balkind, Jonathan, McKeown, Michael, Fu, Yaosheng, Nguyen, Tri, Zhou, Yanqi, Lavrov, Alexey, Shahrad, Mohammad, Fuchs, Adi, Payne, Samuel, Liang, Xiaohua, Matl, Matthew, Wentzlaff, David
Publikováno v:
ACM SIGARCH Computer Architecture News; May2016, Vol. 44 Issue 2, p217-232, 16p