Zobrazeno 1 - 6
of 6
pro vyhledávání: '"Soon, Ong Yew"'
Autor:
He, Xin, Zhang, Shunkang, Wang, Yuxin, Yin, Haiyan, Zeng, Zihao, Shi, Shaohuai, Tang, Zhenheng, Chu, Xiaowen, Tsang, Ivor, Soon, Ong Yew
Sparse Mixture of Experts (MoE) models, while outperforming dense Large Language Models (LLMs) in terms of performance, face significant deployment challenges during inference due to their high memory demands. Existing offloading techniques, which in
Externí odkaz:
http://arxiv.org/abs/2410.17954
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Autor:
Wang, Jun, Yi, Zhang, Zurada, Jacek M., Lu, Bao-Liang, Yin, Hujun, Handoko, Stephanus Daniel, Keong, Kwoh Chee, Soon, Ong Yew, Zhang, Guang Lan, Brusic, Vladimir
Publikováno v:
Advances in Neural Networks - ISNN 2006 (9783540344827); 2006, p716-721, 6p
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Publikováno v:
Cognitive Computation; Mar2021, Vol. 13 Issue 2, p229-230, 2p
Publikováno v:
International Journal of Systems Science; Jul2012, Vol. 43 Issue 7, p1347-1366, 20p, 6 Diagrams, 3 Charts, 2 Graphs