4.6-Bit Quantization for Fast and Accurate Neural Network Inference on CPUs.

Autor: Trusov, Anton1,2,3 (AUTHOR) dimonstr@iitp.ru, Limonova, Elena1,2 (AUTHOR) vva@smartengines.com, Nikolaev, Dmitry2,4 (AUTHOR), Arlazarov, Vladimir V.1,2 (AUTHOR)
Zdroj: Mathematics (2227-7390). Mar2024, Vol. 12 Issue 5, p651. 22p.
Databáze: Academic Search Ultimate
Nepřihlášeným uživatelům se plný text nezobrazuje