Zobrazeno 1 - 10
of 29
pro vyhledávání: '"Grützmacher, Thomas"'
The performance of the GMRES iterative solver on GPUs is limited by the GPU main memory bandwidth. Compressed Basis GMRES outperforms GMRES by storing the Krylov basis in low precision, thereby reducing the memory access. An open question is whether
Externí odkaz:
http://arxiv.org/abs/2409.15468
Autor:
Cappello, Franck, Acosta, Mario, Agullo, Emmanuel, Anzt, Hartwig, Calhoun, Jon, Di, Sheng, Giraud, Luc, Grützmacher, Thomas, Jin, Sian, Sano, Kentaro, Sato, Kento, Singh, Amarjit, Tao, Dingwen, Tian, Jiannan, Ueno, Tomohiro, Underwood, Robert, Vivien, Frédéric, Yepes, Xavier, Kazutomo, Yoshii, Zhang, Boyuan
Publikováno v:
In Future Generation Computer Systems February 2025 163
Autor:
Aliaga, José I., Anzt, Hartwig, Grützmacher, Thomas, Quintana-Ortí, Enrique S., Tomás, Andrés E.
Krylov methods provide a fast and highly parallel numerical tool for the iterative solution of many large-scale sparse linear systems. To a large extent, the performance of practical realizations of these methods is constrained by the communication b
Externí odkaz:
http://arxiv.org/abs/2009.12101
Autor:
Abdelfattah, Ahmad, Anzt, Hartwig, Boman, Erik G., Carson, Erin, Cojean, Terry, Dongarra, Jack, Gates, Mark, Grützmacher, Thomas, Higham, Nicholas J., Li, Sherry, Lindquist, Neil, Liu, Yang, Loe, Jennifer, Luszczek, Piotr, Nayak, Pratik, Pranesh, Sri, Rajamanickam, Siva, Ribizel, Tobias, Smith, Barry, Swirydowicz, Kasia, Thomas, Stephen, Tomov, Stanimire, Tsai, Yaohung M., Yamazaki, Ichitaro, Yang, Urike Meier
Within the past years, hardware vendors have started designing low precision special function units in response to the demand of the Machine Learning community and their demand for high compute power in low precision formats. Also the server-line pro
Externí odkaz:
http://arxiv.org/abs/2007.06674
Autor:
Anzt, Hartwig, Cojean, Terry, Flegar, Goran, Göbel, Fritz, Grützmacher, Thomas, Nayak, Pratik, Ribizel, Tobias, Tsai, Yuhsiang Mike, Quintana-Ortí, Enrique S.
In this paper, we present Ginkgo, a modern C++ math library for scientific high performance computing. While classical linear algebra libraries act on matrix and vector objects, Ginkgo's design principle abstracts all functionality as "linear operato
Externí odkaz:
http://arxiv.org/abs/2006.16852
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Autor:
Aliaga, José I, Anzt, Hartwig, Grützmacher, Thomas, Quintana-Ortí, Enrique S, Tomás, Andrés E
Publikováno v:
International Journal of High Performance Computing Applications; Mar2023, Vol. 37 Issue 2, p82-100, 19p
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Autor:
Aliaga, José I, Anzt, Hartwig, Grützmacher, Thomas, Quintana-Ortí, Enrique S, Tomás, Andrés E
Supplemental Material for Compressed basis GMRES on high-performance graphics processing units by José I Aliaga, Hartwig Anzt, Thomas Grützmacher, Enrique S Quintana-Ortí, and Andrés E Tomás in The International Journal of High Performance Compu
Externí odkaz:
https://explore.openaire.eu/search/publication?articleId=doi_dedup___::c4fbb7857b3461e09be4b9636b696f8f