A 95.6-TOPS/W Deep Learning Inference Accelerator With Per-Vector Scaled 4-bit Quantization in 5 nm

Autor: Ben Keller, Rangharajan Venkatesan, Steve Dai, Stephen G. Tell, Brian Zimmer, Charbel Sakr, William J. Dally, C. Thomas Gray, Brucek Khailany
Rok vydání: 2023
Předmět:
Zdroj: IEEE Journal of Solid-State Circuits. 58:1129-1141
ISSN: 1558-173X
0018-9200
Databáze: OpenAIRE