Zobrazeno 1 - 10
of 265
pro vyhledávání: '"Zhu, Kan"'
As the demand for long-context large language models (LLMs) increases, models with context windows of up to 128K or 1M tokens are becoming increasingly prevalent. However, long-context LLM inference is challenging since the inference speed decreases
Externí odkaz:
http://arxiv.org/abs/2406.10774
Large Language Models (LLMs) based on Mixture-of-Experts (MoE) architecture are showing promising performance on various tasks. However, running them on resource-constrained settings, where GPU memory resources are not abundant, is challenging due to
Externí odkaz:
http://arxiv.org/abs/2402.07033
Autor:
Zhao, Yilong, Lin, Chien-Yu, Zhu, Kan, Ye, Zihao, Chen, Lequn, Zheng, Size, Ceze, Luis, Krishnamurthy, Arvind, Chen, Tianqi, Kasikci, Baris
The growing demand for Large Language Models (LLMs) in applications such as content generation, intelligent chatbots, and sentiment analysis poses considerable challenges for LLM service providers. To efficiently use GPU resources and boost throughpu
Externí odkaz:
http://arxiv.org/abs/2310.19102
Publikováno v:
In Cities September 2024 152
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Autor:
Yang, Chao-Yue, Sun, Jian-Hui, Zhu, Kan, Du, Juan, Zhang, Ying, Lu, Cong-Hua, Liu, Wen-Yi, Zhang, Ke-Jun, Zhang, An-Qiang, Zeng, Ling, Jiang, Jian-Xin, Li, Li
Publikováno v:
In Chinese Journal of Traumatology May 2023 26(3):155-161
Autor:
Le, Bryan1 (AUTHOR) bynle@ucdavis.edu, Zhu, Kan1 (AUTHOR) minzhao@ucdavis.edu, Brown, Chelsea1 (AUTHOR), Reid, Brian1 (AUTHOR), Cressman, Amin2 (AUTHOR), Zhao, Min1 (AUTHOR), Fierro, Fernando A.2 (AUTHOR) ffierro@ucdavis.edu
Publikováno v:
International Journal of Molecular Sciences. Sep2023, Vol. 24 Issue 18, p14327. 12p.
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.