Efficient parallelization for 3D-3V sparse grid Particle-In-Cell: Single GPU architectures

Autor: Fabrice Deluzet, Gwenael Fubiani, Laurent Garrigues, Clément Guillet, Jacek Narski
Přispěvatelé: Institut de Mathématiques de Toulouse UMR5219 (IMT), Université Toulouse Capitole (UT Capitole), Université de Toulouse (UT)-Université de Toulouse (UT)-Institut National des Sciences Appliquées - Toulouse (INSA Toulouse), Institut National des Sciences Appliquées (INSA)-Université de Toulouse (UT)-Institut National des Sciences Appliquées (INSA)-Université Toulouse - Jean Jaurès (UT2J), Université de Toulouse (UT)-Université Toulouse III - Paul Sabatier (UT3), Université de Toulouse (UT)-Centre National de la Recherche Scientifique (CNRS), Groupe de Recherche Energétique, Plasmas et Hors Equilibre (LAPLACE-GREPHE), LAboratoire PLasma et Conversion d'Energie (LAPLACE), Université Toulouse III - Paul Sabatier (UT3), Université de Toulouse (UT)-Université de Toulouse (UT)-Centre National de la Recherche Scientifique (CNRS)-Institut National Polytechnique (Toulouse) (Toulouse INP), Université de Toulouse (UT), ANR-19-CE46-0004,MUFFIN,Multiéchelle et Trefftz pour le transport numérique(2019), ANR-11-LABX-0040,CIMI,Centre International de Mathématiques et d'Informatique (de Toulouse)(2011), Institut National des Sciences Appliquées (INSA)-Université de Toulouse (UT)-Institut National des Sciences Appliquées (INSA)-Université Toulouse - Jean Jaurès (UT2J)-Université Toulouse III - Paul Sabatier (UT3)
Jazyk: angličtina
Rok vydání: 2023
Předmět:
Zdroj: Computer Physics Communications
Computer Physics Communications, 2023, 480, ⟨10.1016/j.jcp.2023.112022⟩
ISSN: 0010-4655
DOI: 10.1016/j.jcp.2023.112022⟩
Popis: International audience; A. In the present paper, an efficient General Purpose Graphical Processing Unit (GPGPU)-based implementation of sparse grid Particle-In-Cell (PIC) methods is proposed. The parallelization, implementing novel strategies specific to Sparse-PIC methods and tailored to GPU architectures, provides speed-ups* as large as 100 on a single Tesla V100 GPU, with respect to sequential Computing Processing unit (CPU) execution; and a four order of magnitude reduction of the computational time in comparison with a standard PIC sequential CPU simulation. In addition, the simple implementation of the parallelization with the OpenACC framework offers portability to a large class of accelerators.
Databáze: OpenAIRE