Amélioration de la mémoire et du temps des solveurs directs creux linéaires de rang faible

Autor: Korkmaz, Esragul
Přispěvatelé: Université de Bordeaux (UB), Laboratoire Bordelais de Recherche en Informatique (LaBRI), Université de Bordeaux (UB)-École Nationale Supérieure d'Électronique, Informatique et Radiocommunications de Bordeaux (ENSEIRB)-Centre National de la Recherche Scientifique (CNRS), High-End Parallel Algorithms for Challenging Numerical Simulations (HiePACS), Université de Bordeaux (UB)-École Nationale Supérieure d'Électronique, Informatique et Radiocommunications de Bordeaux (ENSEIRB)-Centre National de la Recherche Scientifique (CNRS)-Université de Bordeaux (UB)-École Nationale Supérieure d'Électronique, Informatique et Radiocommunications de Bordeaux (ENSEIRB)-Centre National de la Recherche Scientifique (CNRS)-Inria Bordeaux - Sud-Ouest, Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria), Université de Bordeaux, Pierre Ramet, Mathieu Faverge
Jazyk: angličtina
Rok vydání: 2022
Předmět:
Zdroj: Data Structures and Algorithms [cs.DS]. Université de Bordeaux, 2022. English. ⟨NNT : 2022BORD0254⟩
Popis: Through the recent improvements toward exascale supercomputer systems, huge computations can be performed in reasonable times by using massively parallelized operations. Unfortunately, the increase of the computational units in these systems does not lead to a rise in the memory available per core. Therefore, this memory limitation forces the scientists/engineers to not only efficiently parallelize the operations but also minimize the memory used. Many scientific and engineering applications have to solve large sparse linear systems of the type Ax = b. Although the direct methods are the most robust solutions for these systems, they are costly in terms of their memory usage and time-to-solution. In this respect, the low-rank representations have been recently introduced into these solvers to reduce the time and memory footprint. In this work, our goal is to improve the low-rank feature of the block low-rank (BLR) sparse supernodal direct solver PaStiX. For this purpose, we compare some compression methods to determine the fastest kernel, which keeps the representative data with the smallest rank possible. Then, we focus on improving supernodal solver by reducing the number of re-compression during the updates. Firstly, we study the separator reordering strategies to identify the poorly compressible blocks involved in these updates and reduce their occurrences. Secondly, we propose an orthogonal solution to predict thecompressibility of the blocks before the numerical factorization. This last approach relies on the use of the level of fill of a symbolic block incomplete factorization. Thanks to these optimizations, the memory usage has been reduced more effectively compared to the state of the art solvers while also improving the time to solution. This thesis is a requested first step toward a advanced sparse direct solver using hierarchical compression schemes.; Grâce aux récentes améliorations apportées par les nouveaux supercalculateurs exaflopiques, des simulations de grande envergure peuvent être effectuées dans des délais raisonnables en utilisant des opérations massivement parallélisées. Malheureusement, l'augmentation du nombre d'unités de calcul dans ces systèmes n'est pas accompagnée d'une augmentation de la mémoire disponible par coeur. Par conséquent, cette limitation de la mémoire oblige les scientifiques et les ingénieurs à non seulement paralléliser efficacement les opérations, mais aussi à minimiser la mémoire utilisée. De nombreuses applications scientifiques et d'ingénierie doivent résoudre de grands systèmes linéaires creux du type Ax = b. Bien que les méthodes directes soient les solutions les plus robustes numériquement, elles sont coûteuses en termes d'utilisation de la mémoire et de temps de résolution. À cet égard, les techniques de compression de rang faible ont été récemment introduites dans ces solveurs afin de réduire leur complexité et leur empreinte mémoire. Dans ce travail, notre objectif est d'améliorer les représentations de rang faible par bloc dans le solveur direct supernodal creux PaStiX. Pour cela, nous comparons quelques méthodes de compression pour déterminer le noyau le plus rapide, qui conserve les données représentatives avec le plus petit rang possible. Nous nous concentrons sur l'amélioration du solveur supernodal en réduisant le nombre de recompressions lors des opérations de mise à jour. Tout d'abord, nous étudions les stratégies de renumérotation des séparateurs pour identifier les blocs peu compressibles impliqués dans ces mises à jour et réduire leurs occurrences. Ensuite, nous proposons une solution orthogonale pour prédire la compressibilité des blocs avant la factorisation numérique. Cette dernière approche s'appuie sur l'utilisation de la notion de niveau de remplissage pour une factorisation incomplète symbolique par blocs. Grâce à ces optimisations, l'utilisation de la mémoire a été fortement réduite, par rapport aux solveurs à l'état de l'art, tout en améliorant le temps de résolution. Cette thèse est un premier pas nécessaire vers un solveur direct creux performant utilisant des schémas de compression hiérarchiques
Databáze: OpenAIRE