Zobrazeno 1 - 10
of 240
pro vyhledávání: '"Zhao, Junping"'
Autor:
Xiong, Yi, Wu, Hao, Shao, Changxu, Wang, Ziqing, Zhang, Rui, Guo, Yuhong, Zhao, Junping, Zhang, Ke, Pan, Zhenxuan
The expanding context windows in large language models (LLMs) have greatly enhanced their capabilities in various applications, but they also introduce significant challenges in maintaining low latency, particularly in Time to First Token (TTFT). Thi
Externí odkaz:
http://arxiv.org/abs/2410.00428
Autor:
Xu, Jiale, Zhang, Rui, Guo, Cong, Hu, Weiming, Liu, Zihan, Wu, Feiyang, Feng, Yu, Sun, Shixuan, Shao, Changxu, Guo, Yuhong, Zhao, Junping, Zhang, Ke, Guo, Minyi, Leng, Jingwen
Large Language Models (LLMs) are widely used across various domains, processing millions of daily requests. This surge in demand poses significant challenges in optimizing throughput and latency while keeping costs manageable. The Key-Value (KV) cach
Externí odkaz:
http://arxiv.org/abs/2407.15309
Autor:
Zhao, Junping, Yang, Hongyuan, Dong, Shuwen, Wang, Yimin, Lv, Xincha, Zhang, Qingcheng, Wen, Lixiong
Publikováno v:
In Chemical Engineering Journal 15 August 2024 494
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Publikováno v:
In Chemical Engineering Journal 15 May 2023 464
Publikováno v:
In Desalination 15 December 2021 520
Publikováno v:
In Computer Methods and Programs in Biomedicine July 2020 190
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Publikováno v:
In Journal of the Taiwan Institute of Chemical Engineers April 2019 97:170-177
Publikováno v:
New Journal of Chemistry; 12/21/2023, Vol. 47 Issue 47, p22007-22016, 10p