4.6-Bit Quantization for Fast and Accurate Neural Network Inference on CPUs.
Autor: | Trusov, Anton1,2,3 (AUTHOR) dimonstr@iitp.ru, Limonova, Elena1,2 (AUTHOR) vva@smartengines.com, Nikolaev, Dmitry2,4 (AUTHOR), Arlazarov, Vladimir V.1,2 (AUTHOR) |
---|---|
Zdroj: | Mathematics (2227-7390). Mar2024, Vol. 12 Issue 5, p651. 22p. |
Databáze: | Academic Search Ultimate |
Externí odkaz: | |
Nepřihlášeným uživatelům se plný text nezobrazuje | K zobrazení výsledku je třeba se přihlásit. |