Výsledky vyhledávání - "Zhao, Yilong"

Report

Quest: Query-Aware Sparsity for Efficient Long-Context LLM Inference

Autor: Tang, Jiaming, Zhao, Yilong, Zhu, Kan, Xiao, Guangxuan, Kasikci, Baris, Han, Song

As the demand for long-context large language models (LLMs) increases, models with context windows of up to 128K or 1M tokens are becoming increasingly prevalent. However, long-context LLM inference is challenging since the inference speed decreases

Externí odkaz: http://arxiv.org/abs/2406.10774

Zobrazit plný text záznamu

Report

DeepSeek-V2: A Strong, Economical, and Efficient Mixture-of-Experts Language Model

Autor: DeepSeek-AI, Liu, Aixin, Feng, Bei, Wang, Bin, Wang, Bingxuan, Liu, Bo, Zhao, Chenggang, Dengr, Chengqi, Ruan, Chong, Dai, Damai, Guo, Daya, Yang, Dejian, Chen, Deli, Ji, Dongjie, Li, Erhang, Lin, Fangyun, Luo, Fuli, Hao, Guangbo, Chen, Guanting, Li, Guowei, Zhang, H., Xu, Hanwei, Yang, Hao, Zhang, Haowei, Ding, Honghui, Xin, Huajian, Gao, Huazuo, Li, Hui, Qu, Hui, Cai, J. L., Liang, Jian, Guo, Jianzhong, Ni, Jiaqi, Li, Jiashi, Chen, Jin, Yuan, Jingyang, Qiu, Junjie, Song, Junxiao, Dong, Kai, Gao, Kaige, Guan, Kang, Wang, Lean, Zhang, Lecong, Xu, Lei, Xia, Leyi, Zhao, Liang, Zhang, Liyue, Li, Meng, Wang, Miaojun, Zhang, Mingchuan, Zhang, Minghua, Tang, Minghui, Li, Mingming, Tian, Ning, Huang, Panpan, Wang, Peiyi, Zhang, Peng, Zhu, Qihao, Chen, Qinyu, Du, Qiushi, Chen, R. J., Jin, R. L., Ge, Ruiqi, Pan, Ruizhe, Xu, Runxin, Chen, Ruyi, Li, S. S., Lu, Shanghao, Zhou, Shangyan, Chen, Shanhuang, Wu, Shaoqing, Ye, Shengfeng, Ma, Shirong, Wang, Shiyu, Zhou, Shuang, Yu, Shuiping, Zhou, Shunfeng, Zheng, Size, Wang, T., Pei, Tian, Yuan, Tian, Sun, Tianyu, Xiao, W. L., Zeng, Wangding, An, Wei, Liu, Wen, Liang, Wenfeng, Gao, Wenjun, Zhang, Wentao, Li, X. Q., Jin, Xiangyue, Wang, Xianzu, Bi, Xiao, Liu, Xiaodong, Wang, Xiaohan, Shen, Xiaojin, Chen, Xiaokang, Chen, Xiaosha, Nie, Xiaotao, Sun, Xiaowen, Wang, Xiaoxiang, Liu, Xin, Xie, Xin, Yu, Xingkai, Song, Xinnan, Zhou, Xinyi, Yang, Xinyu, Lu, Xuan, Su, Xuecheng, Wu, Y., Li, Y. K., Wei, Y. X., Zhu, Y. X., Xu, Yanhong, Huang, Yanping, Li, Yao, Zhao, Yao, Sun, Yaofeng, Li, Yaohui, Wang, Yaohui, Zheng, Yi, Zhang, Yichao, Xiong, Yiliang, Zhao, Yilong, He, Ying, Tang, Ying, Piao, Yishi, Dong, Yixin, Tan, Yixuan, Liu, Yiyuan, Wang, Yongji, Guo, Yongqiang, Zhu, Yuchen, Wang, Yuduan, Zou, Yuheng, Zha, Yukun, Ma, Yunxian, Yan, Yuting, You, Yuxiang, Liu, Yuxuan, Ren, Z. Z., Ren, Zehui, Sha, Zhangli, Fu, Zhe, Huang, Zhen, Zhang, Zhen, Xie, Zhenda, Hao, Zhewen, Shao, Zhihong, Wen, Zhiniu, Xu, Zhipeng, Zhang, Zhongyu, Li, Zhuoshu, Wang, Zihan, Gu, Zihui, Li, Zilin, Xie, Ziwei

We present DeepSeek-V2, a strong Mixture-of-Experts (MoE) language model characterized by economical training and efficient inference. It comprises 236B total parameters, of which 21B are activated for each token, and supports a context length of 128

Externí odkaz: http://arxiv.org/abs/2405.04434

Zobrazit plný text záznamu

Report

Atom: Low-bit Quantization for Efficient and Accurate LLM Serving

Autor: Zhao, Yilong, Lin, Chien-Yu, Zhu, Kan, Ye, Zihao, Chen, Lequn, Zheng, Size, Ceze, Luis, Krishnamurthy, Arvind, Chen, Tianqi, Kasikci, Baris

The growing demand for Large Language Models (LLMs) in applications such as content generation, intelligent chatbots, and sentiment analysis poses considerable challenges for LLM service providers. To efficiently use GPU resources and boost throughpu

Externí odkaz: http://arxiv.org/abs/2310.19102

Zobrazit plný text záznamu

Report

RePAST: A ReRAM-based PIM Accelerator for Second-order Training of DNN

Autor: Zhao, Yilong, Jiang, Li, Gao, Mingyu, Jing, Naifeng, Gu, Chengyang, Tang, Qidong, Liu, Fangxin, Yang, Tao, Liang, Xiaoyao

The second-order training methods can converge much faster than first-order optimizers in DNN training. This is because the second-order training utilizes the inversion of the second-order information (SOI) matrix to find a more accurate descent dire

Externí odkaz: http://arxiv.org/abs/2210.15255

Zobrazit plný text záznamu

Report

Neural-PIM: Efficient Processing-In-Memory with Neural Approximation of Peripherals

Autor: Cao, Weidong, Zhao, Yilong, Boloor, Adith, Han, Yinhe, Zhang, Xuan, Jiang, Li

Publikováno v: IEEE Transactions on Computers, 2021

Processing-in-memory (PIM) architectures have demonstrated great potential in accelerating numerous deep learning tasks. Particularly, resistive random-access memory (RRAM) devices provide a promising hardware substrate to build PIM accelerators due

Externí odkaz: http://arxiv.org/abs/2201.12861

Zobrazit plný text záznamu

Akademický článek

Stability analysis and control parameter optimization for AC-DC hybrid spot networks

Autor: Zhang, Zhihua, Sun, Mingming, Wang, Hao, Wang, Kun, Zhao, Yilong

Publikováno v: In International Journal of Electrical Power and Energy Systems July 2024 158

Zobrazit plný text záznamu

Akademický článek

Influence of O–O formation pathways and charge transfer mediator on lipid bilayer membrane-like photoanodes for water oxidation

Autor: Li, Yingzheng, Zhan, Shaoqi, Deng, Zijian, Chen, Meng, Zhao, Yilong, Liu, Chang, Zhao, Ziqi, Ning, Hongxia, Li, Wenlong, Li, Fei, Sun, Licheng, Li, Fusheng

Publikováno v: In Journal of Energy Chemistry June 2024 93:526-537

Zobrazit plný text záznamu

Akademický článek

Bacillus subtilis field spray on alpine meadows promotes digestibility in Tibetan sheep via increasing the nutrient quality of herbage and enhancing rumen bacterial populations

Autor: Shi, Hairen, Fan, Qingshan, Wang, Shulin, Zhang, Jing, Zhang, Guangyun, Zheng, Haozhe, Zhao, Yilong, Chang, Shenghua, Hou, Fujiang

Publikováno v: In Animal Feed Science and Technology April 2024 310

Zobrazit plný text záznamu

Akademický článek

Polymeric viologen-based electron transfer mediator for improving the photoelectrochemical water splitting on Sb2Se3 photocathode

Autor: Liu, Chang, Li, Fusheng, Wang, Linqin, Li, Zeju, Zhao, Yilong, Li, Yingzheng, Li, Wenlong, Zhao, Ziqi, Fan, Ke, Li, Fei, Sun, Licheng

Publikováno v: In Fundamental Research March 2024 4(2):291-299

Zobrazit plný text záznamu

Report

SME: ReRAM-based Sparse-Multiplication-Engine to Squeeze-Out Bit Sparsity of Neural Network

Autor: Liu, Fangxin, Zhao, Wenbo, Zhao, Yilong, Wang, Zongwu, Yang, Tao, He, Zhezhi, Jing, Naifeng, Liang, Xiaoyao, Jiang, Li

Resistive Random-Access-Memory (ReRAM) crossbar is a promising technique for deep neural network (DNN) accelerators, thanks to its in-memory and in-situ analog computing abilities for Vector-Matrix Multiplication-and-Accumulations (VMMs). However, it

Externí odkaz: http://arxiv.org/abs/2103.01705

Zobrazit plný text záznamu

Vyhledávací nástroje:

Upřesnit hledání