Tiled Algorithms for Efficient Task-Parallel H-Matrix Solvers
Autor: | Carratalá-Sáez, Rocío, Faverge, Mathieu, Pichon, Grégoire, Sylvand, Guillaume, Quintana-Ortí, Enrique |
---|---|
Přispěvatelé: | Universitat Jaume I, High-End Parallel Algorithms for Challenging Numerical Simulations (HiePACS), Laboratoire Bordelais de Recherche en Informatique (LaBRI), Centre National de la Recherche Scientifique (CNRS)-École Nationale Supérieure d'Électronique, Informatique et Radiocommunications de Bordeaux (ENSEIRB)-Université Sciences et Technologies - Bordeaux 1-Université Bordeaux Segalen - Bordeaux 2-Centre National de la Recherche Scientifique (CNRS)-École Nationale Supérieure d'Électronique, Informatique et Radiocommunications de Bordeaux (ENSEIRB)-Université Sciences et Technologies - Bordeaux 1-Université Bordeaux Segalen - Bordeaux 2-Inria Bordeaux - Sud-Ouest, Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria), Optimisation des ressources : modèles, algorithmes et ordonnancement (ROMA), Inria Grenoble - Rhône-Alpes, Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria)-Laboratoire de l'Informatique du Parallélisme (LIP), École normale supérieure - Lyon (ENS Lyon)-Université Claude Bernard Lyon 1 (UCBL), Université de Lyon-Université de Lyon-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS)-École normale supérieure - Lyon (ENS Lyon)-Université Claude Bernard Lyon 1 (UCBL), Université de Lyon-Université de Lyon-Centre National de la Recherche Scientifique (CNRS), Airbus [France], Universitat Politecnica de Valencia (UPV), R. Carratalá-Sáez and E. S. Quintana-Ortí were supported by project TIN2017-82972-R from the Ministerio de Ciencia, Innovación y Universidades, Spain. R. Carratalá-Sáez was supported by the FPU program of the Ministerio de Educación, Cultura y Deporte, and a HiPEAC collaboration Grant (2019)., Plafrim, Pichon, Gregoire, APPEL À PROJETS GÉNÉRIQUE 2018 - Solveur linéaire creux exploitant des matrices hierarchiques - - SaSHiMi2018 - ANR-18-CE46-0006 - AAPG2018 - VALID, Solveurs pour architectures hétérogènes utilisant des supports d'exécution, objectif scalabilité - - SOLHARIS2019 - ANR-19-CE46-0009 - AAPG2019 - VALID, Université de Bordeaux (UB)-École Nationale Supérieure d'Électronique, Informatique et Radiocommunications de Bordeaux (ENSEIRB)-Centre National de la Recherche Scientifique (CNRS)-Université de Bordeaux (UB)-École Nationale Supérieure d'Électronique, Informatique et Radiocommunications de Bordeaux (ENSEIRB)-Centre National de la Recherche Scientifique (CNRS)-Inria Bordeaux - Sud-Ouest, École normale supérieure de Lyon (ENS de Lyon)-Université Claude Bernard Lyon 1 (UCBL), Université de Lyon-Université de Lyon-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS)-École normale supérieure de Lyon (ENS de Lyon)-Université Claude Bernard Lyon 1 (UCBL), Universitat Politècnica de València (UPV), ANR-18-CE46-0006,SaSHiMi,Solveur linéaire creux exploitant des matrices hierarchiques(2018), ANR-19-CE46-0009,SOLHARIS,Solveurs pour architectures hétérogènes utilisant des supports d'exécution, objectif scalabilité(2019), Institut Polytechnique de Bordeaux (Bordeaux INP), R. Carratalá-Sáez and E. S. Quintana-Ortí were supported by project TIN2017-82972-R from the Ministerio de Ciencia, Innovación y Universidades, Spain. R. Carratalá-Sáez was supportedby the FPU program of the Ministerio de Educación, Cultura y Deporte, and a HiPEAC collaboration Grant (2019)., Inria, plafrim, Université de Bordeaux (UB)-Centre National de la Recherche Scientifique (CNRS)-École Nationale Supérieure d'Électronique, Informatique et Radiocommunications de Bordeaux (ENSEIRB)-Université de Bordeaux (UB)-Centre National de la Recherche Scientifique (CNRS)-École Nationale Supérieure d'Électronique, Informatique et Radiocommunications de Bordeaux (ENSEIRB)-Inria Bordeaux - Sud-Ouest |
Jazyk: | angličtina |
Rok vydání: | 2020 |
Předmět: |
Hierarchical matrices
Processeurs multicœurs Matrices hiérarchiques linear systems Parallélisme à basede tâches [INFO] Computer Science [cs] Factorisation LU task-parallelism Systèmes linéaires LU factorization [INFO.INFO-DC] Computer Science [cs]/Distributed Parallel and Cluster Computing [cs.DC] [INFO]Computer Science [cs] [INFO.INFO-DC]Computer Science [cs]/Distributed Parallel and Cluster Computing [cs.DC] multicore processors ComputingMilieux_MISCELLANEOUS |
Zdroj: | 21st IEEE International Workshop on Parallel and Distributed Scientific and Engineering Computing (PDSEC 2020) 21st IEEE International Workshop on Parallel and Distributed Scientific and Engineering Computing (PDSEC 2020), May 2020, Orlando, United States PDSEC 2020-21st IEEE International Workshop on Parallel and Distributed Scientific and Engineering Computing PDSEC 2020-21st IEEE International Workshop on Parallel and Distributed Scientific and Engineering Computing, May 2020, News Orleans, United States. pp.1-10 [Research Report] RR-9327, Inria. 2020 PDSEC 2020-21st IEEE International Workshop on Parallel and Distributed Scientific and Engineering Computing, May 2020, News Orleans, United States |
Popis: | In this paper, we describe and evaluate an extension of the Chameleon library to operate with hierarchical matrices (H-Matrices) and hierarchical arithmetic (H-Arithmetic), producing efficient solvers for linear systems arising in Boundary Element Methods (BEM). Our approach builds upon an open-source H-Matrices library from Airbus, named Hmat-oss, that collects sequential numerical kernels for both hierarchical and low-rank structures; the tiled algorithms and task-parallel decompositions available in Chameleon for the solution of linear systems; andthe StarPU runtime system to orchestrate an efficient task-parallel (multi-threaded) execution on a multicore architecture.Using an application producing matrices with features close to real industrial applications, we present shared-memory results that demonstrate a fair level of performance, close to (and sometimes better than) the one offered by a pure H-Matrix approach, as proposed by Airbus Hmat proprietary (and non open-source) library. Hence, this combination Chameleon + Hmat-oss proposes the most efficient fully open-source software stack to solve dense compressible linear systems on shared memory architectures (distributed memory is under development).; Algorithmes parallèles pour améliorer l’efficacité dessolveurs utilisant des matrices hiérarchiquesRésumé :Dans cet article, nous présentons et évaluons les performances d’une extension de la bibliothèque Chameleon qui utilise des matrices hiérarchiques et des opérations en arithmétique hiérarchique afin de fournir une résolution efficace des systèmes linéaires apparaissant dans le cadre de la méthode des éléments finis de frontière (BEM). Notre approche se repose sur Hmat-oss, une bibliothèque de matrices hiérarchiques open-source fournie par Airbus qui propose des noyaux de calcul séquentiels pour les matrices hiérarchiques et de rang faible. Elle repose également sur les algorithmes à base de tuiles et le parallélisme par tâches disponible dans Chameleon pour la résolution de systèmes linéaires et sur le support d’exécution StarPU qui se charge d’ordonnancer efficacement les tâches dans un contexte multicœur.Afin de valider nos résultats, nous utilisons une application qui fournit des matrices similaires à celles obtenues dans un contexte industriel. Nous présentons des résultats en mémoire partagée qui présentent un très bon niveau de performance, proche (et parfois meilleur) que celui obtenu avec une approche H-matrice classique, comme proposée dans la bibliothèque propriétaire Hmat d’Airbus. Cette combinaison entre Chameleon et Hmat-ossest à ce jour la plus efficace implémentation open-source qui permet de compresser des systèmes linéaires en mémoire partagée (les développements étant en cours dans la version distribuée). |
Databáze: | OpenAIRE |
Externí odkaz: |