Zobrazeno 1 - 10
of 103
pro vyhledávání: '"Amaral, José Nelson"'
Autor:
Kuzma, Braedy, Korostelev, Ivan, de Carvalho, João P. L., Moreira, José E., Barton, Christopher, Araujo, Guido, Amaral, José Nelson
The resurgence of machine learning has increased the demand for high-performance basic linear algebra subroutines (BLAS), which have long depended on libraries to achieve peak performance on commodity hardware. High-performance BLAS implementations r
Externí odkaz:
http://arxiv.org/abs/2305.18236
Autor:
Ferrari, Victor, Sousa, Rafael, Pereira, Marcio, de Carvalho, João P. L., Amaral, José Nelson, Moreira, José, Araujo, Guido
Convolution is one of the most computationally intensive operations that must be performed for machine-learning model inference. A traditional approach to compute convolutions is known as the Im2Col + BLAS method. This paper proposes SConv: a direct-
Externí odkaz:
http://arxiv.org/abs/2303.04739
Autor:
Iosup, Alexandru, Trubiani, Catia, Koziolek, Anne, Amaral, José Nelson, Bondi, Andre B., Brunnert, Andreas
Organizing professional conferences online has never been more timely. Responding to the new challenges raised by COVID-19, the organizers of the ACM/SPEC International Conference on Performance Engineering 2020 had to address the question: How shoul
Externí odkaz:
http://arxiv.org/abs/2005.09085
Publikováno v:
In Journal of Computer Languages October 2021 66
Publikováno v:
In Parallel Computing May 2016 54:2-14
Autor:
Paudel, Jeeva, Amaral, José Nelson
Publikováno v:
In Journal of Parallel and Distributed Computing February 2015 76:94-105
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Publikováno v:
ACM Transactions on Architecture & Code Optimization; Mar2023, Vol. 20 Issue 1, p1-18, 18p