Zobrazeno 1 - 8
of 8
pro vyhledávání: '"Sun, Chenfan"'
Autor:
Horton, Maxwell, Cao, Qingqing, Sun, Chenfan, Jin, Yanzi, Mehta, Sachin, Rastegari, Mohammad, Nabi, Moin
Inference with transformer-based language models begins with a prompt processing step. In this step, the model generates the first output token and stores the KV cache needed for future generation steps. This prompt processing step can be computation
Externí odkaz:
http://arxiv.org/abs/2410.08391
Autor:
Mehta, Sachin, Sekhavat, Mohammad Hossein, Cao, Qingqing, Horton, Maxwell, Jin, Yanzi, Sun, Chenfan, Mirzadeh, Iman, Najibi, Mahyar, Belenko, Dmitry, Zatloukal, Peter, Rastegari, Mohammad
The reproducibility and transparency of large language models are crucial for advancing open research, ensuring the trustworthiness of results, and enabling investigations into data and model biases, as well as potential risks. To this end, we releas
Externí odkaz:
http://arxiv.org/abs/2404.14619
Publikováno v:
In Engineering Applications of Artificial Intelligence July 2024 133 Part A
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Autor:
Sun, Chenfan1 (AUTHOR), Zhan, Wei1 (AUTHOR), She, Jinhiu1 (AUTHOR), Zhang, Yangyang1 (AUTHOR)
Publikováno v:
Mathematical Problems in Engineering. 12/16/2020, p1-10. 10p.
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Autor:
Zhan, Wei, Sun, Chenfan, Wang, Maocai, She, Jinhui, Zhang, Yangyang, Zhang, Zhiliang, Sun, Yong
Publikováno v:
Soft Computing - A Fusion of Foundations, Methodologies & Applications; Jan2022, Vol. 26 Issue 1, p361-373, 13p
Autor:
Sun, Chenfan1 (AUTHOR), Zhan, Wei1 (AUTHOR), She, Jinhui1 (AUTHOR), Zhang, Yangyang1 (AUTHOR)
Publikováno v:
Mathematical Problems in Engineering. 12/16/2020, p1-1. 1p.