Zobrazeno 1 - 10
of 65
pro vyhledávání: '"Sadayappan, Ponnuswamy"'
Autor:
Heisler, Eric, Saurav, Siddharth, Deshmukh, Aadesh, Mazumder, Sandip, Sadayappan, Ponnuswamy, Sundar, Hari
Heterogeneous computing environments combining CPU and GPU resources provide a great boost to large-scale scientific computing applications. Code generation utilities that partition the work into CPU and GPU tasks while considering data movement cost
Externí odkaz:
http://arxiv.org/abs/2305.19400
Autor:
An, Xiaojing, Ghosh, Priyanka, Keppler, Patrick, Kurt, Sureyya Emre, Krishnamoorthy, Sriram, Sadayappan, Ponnuswamy, Rajam, Aravind Sukumaran, Çatalyürek, Ümit V., Kalyanaraman, Ananth
Publikováno v:
In iScience 18 November 2022 25(11)
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Publikováno v:
Proceedings of the VLDB Endowment (PVLDB), Vol. 4, No. 4, pp. 231-242 (2011)
Scaling up the sparse matrix-vector multiplication kernel on modern Graphics Processing Units (GPU) has been at the heart of numerous studies in both academia and industry. In this article we present a novel non-parametric, self-tunable, approach to
Externí odkaz:
http://arxiv.org/abs/1103.2405
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Publikováno v:
In Parallel Computing 2011 37(10):694-712
Publikováno v:
High Performance Computing
Autor:
Cohen, Albert, Grosser, Tobias, Kelly, Paul H. J., Ramanujam, J., Sadayappan, Ponnuswamy, Verdoolaege, Sven
Publikováno v:
GPGPU 6-Sixth Workshop on General Purpose Processing Using GPUs
GPGPU 6-Sixth Workshop on General Purpose Processing Using GPUs, Mar 2013, Houston, United States
GPGPU 6-Sixth Workshop on General Purpose Processing Using GPUs, Mar 2013, Houston, United States
International audience; Tiling is a key technology to increase data reuse in computation kernels. For computations structured as one sequential outer "time" loop enclosing a set of parallel inner loops, the option of tiling only the parallel inner lo
Externí odkaz:
https://explore.openaire.eu/search/publication?articleId=dedup_wf_001::03830d7611df3b546275329e3684df64
https://inria.hal.science/hal-00786812/document
https://inria.hal.science/hal-00786812/document