Utilisation de la compression Block Low-Rank pour accélérer un solveur direct creux supernodal
Autor: | Pichon, Grégoire |
---|---|
Přispěvatelé: | High-End Parallel Algorithms for Challenging Numerical Simulations (HiePACS), Laboratoire Bordelais de Recherche en Informatique (LaBRI), Université de Bordeaux (UB)-École Nationale Supérieure d'Électronique, Informatique et Radiocommunications de Bordeaux (ENSEIRB)-Centre National de la Recherche Scientifique (CNRS)-Université de Bordeaux (UB)-École Nationale Supérieure d'Électronique, Informatique et Radiocommunications de Bordeaux (ENSEIRB)-Centre National de la Recherche Scientifique (CNRS)-Inria Bordeaux - Sud-Ouest, Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria), plafrim, Université de Bordeaux (UB)-Centre National de la Recherche Scientifique (CNRS)-École Nationale Supérieure d'Électronique, Informatique et Radiocommunications de Bordeaux (ENSEIRB)-Université de Bordeaux (UB)-Centre National de la Recherche Scientifique (CNRS)-École Nationale Supérieure d'Électronique, Informatique et Radiocommunications de Bordeaux (ENSEIRB)-Inria Bordeaux - Sud-Ouest, Pichon, Gregoire |
Jazyk: | francouzština |
Rok vydání: | 2017 |
Předmět: | |
Zdroj: | Conférence d’informatique en Parallélisme, Architecture et Système (ComPAS'17) Conférence d’informatique en Parallélisme, Architecture et Système (ComPAS'17), Jun 2017, Sophia Antipolis, France |
Popis: | National audience; La résolution de systèmes linéaires creux est une opération de base dans la modélisation de nombreux problèmes physiques, comme l’électromagnétique ou l’astrophysique. Ce papier se focalise sur le solveur supernodal PaStiX et propose l’introduction de techniques de rangfaible pour réduire la complexité en temps et en mémoire du solveur. Plus précisément, le schéma de compression Block Low-Rank (BLR) est utilisé pour exploiter le rang faible des blocs apparaissant dans la résolution directe de systèmes creux. Une première approche, appelée Minimal Memory, permet de réduire l’empreinte mémoire du solveur jusqu’à un facteur 4.4 sur une architecture multi-threadée, composée de 24 threads et de 128 Go de mémoire. Une seconde stratégie, appelée Just-In-Time, permet de réduire le temps de résolution jusqu’à unfacteur 3.3. Ces deux approches, couplées avec deux techniques classiques de compression – décomposition en valeurs singulières (SVD) et l’algorithme Rank-Revealing QR (RRQR) – sont comparées en termes de temps, consommation mémoire et stabilité numérique. |
Databáze: | OpenAIRE |
Externí odkaz: |