Hardware-oriented Krylov methods for high-performance computing
Autor: | Dreier, N. (Nils-Arne) |
---|---|
Přispěvatelé: | Engwer, C. (Christian), Universitäts- und Landesbibliothek Münster |
Jazyk: | angličtina |
Rok vydání: | 2021 |
Předmět: |
ddc:510
block Krylov methods high-performance-computing hardware-oriented numerics numerical linear algebra communication-avioing communication-hiding Mathematics Block Krylov Methoden Hochleistungsrechnen Hardware-orientierte Numerik Numerische Lineare Algebra Kommunikationsvermeidung Kommunikationsüberlappung |
Popis: | Gegenstand dieser Dissertation ist die Formulierung von Krylovraumverfahren zur Lösung von linearen Gleichungssystemen mit mehreren rechten Seiten, welche die Eigenschaften moderner Hardware berücksichtigen. Dazu untersuchen wir ein innovatives Blockkrylovraum-Framework, welches es ermöglicht die Berechnungs- und Datentransferkosten der Blockkrylovraummethode an die Hardware anzupassen. Darauf aufbauend formulieren wir mehrere Krylovraummethoden. Für die Block CG und Block BiCGStab Methoden entwickeln wir eine adaptive Stabilisierungsstrategie. Des Weiteren optimieren wir die Methoden bezüglich der Kommunikation auf Systemen mit verteiltem Speicher. Dazu stellen wir mehrere Varianten der Algorithmen vor, welche sich durch ihre Kommunikationseigenschaften unterscheiden. Außerdem entwickeln wir für die GMRes Methode optimierte Varianten der Orthonormalisierung. Für alle optimierten Varianten zeigen wir numerische Tests, welche die Verbesserungen demonstrieren. In this work, we develop Krylov subspace methods to solve linear systems with multiple right-hand sides, tailored to modern hardware in high-performance computing. To this end, we analyze an innovative block Krylov subspace framework that allows to balance the computational and data-transfer costs to the hardware. Based on the framework, we formulate commonly used Krylov methods. For the CG and BiCGStab methods, we introduce an adaptive stabilization approach as an alternative to a deflation strategy. In addition, we optimize the methods further for distributed memory systems and the communication overhead. For this we present several variants of the algorithms, which differ in their communication properties. For the Block GMRes algorithm, we present optimizations for the orthogonalization. For all optimized method, we present tests that show their superiority. |
Databáze: | OpenAIRE |
Externí odkaz: |