Block Low-Rank multifrontal solvers: complexity, performance, and scalability - Algorithmes Parallèles et Optimisation Accéder directement au contenu
Thèse Année : 2017

Block Low-Rank multifrontal solvers: complexity, performance, and scalability

Solveurs multifrontaux exploitant des blocs de rang faible: complexité, performance et parallélisme

Résumé

We investigate the use of low-rank approximations to reduce the cost of sparsedirect multifrontal solvers. Among the different matrix representations that havebeen proposed to exploit the low-rank property within multifrontal solvers, we focus on the Block Low-Rank (BLR) format whose simplicity and flexibility make iteasy to use in a general purpose, algebraic multifrontal solver. We present different variants of the BLR factorization, depending on how the low-rank updates areperformed and on the constraints to handle numerical pivoting.We first investigate the theoretical complexity of the BLR format which, unlikeother formats such as hierarchical ones, was previously unknown. We prove thatthe theoretical complexity of the BLR multifrontal factorization is asymptoticallylower than that of the full-rank solver. We then show how the BLR variants canfurther reduce that complexity. We provide an experimental study with numericalresults to support our complexity bounds.After proving that BLR multifrontal solvers can achieve a low complexity, weturn to the problem of translating that low complexity in actual performance gainson modern architectures. We first present a multithreaded BLR factorization, andanalyze its performance in shared-memory multicore environments on a large setof real-life problems. We put forward several algorithmic properties of the BLRvariants necessary to efficiently exploit multicore systems by improving the arithmetic intensity and the scalability of the BLR factorization. We then move on to thedistributed-memory BLR factorization, for which additional challenges are identified and addressed.The algorithms presented throughout this thesis have been implemented withinthe MUMPS solver. We illustrate the use of our approach in three industrial applications coming from geosciences and structural mechanics. We also compare oursolver with the STRUMPACK package, based on Hierarchically Semi-Separableapproximations. We conclude this thesis by reporting results on a very large problem (130 millions of unknowns) which illustrates future challenges posed by BLRmultifrontal solvers at scale.
Nous nous intéressons à l’utilisation d’approximations de rang faible pour réduire le coût des solveurs creux directs multifrontaux. Parmi les différents formatsmatriciels qui ont été proposés pour exploiter la propriété de rang faible dans lessolveurs multifrontaux, nous nous concentrons sur le format Block Low-Rank (BLR)dont la simplicité et la flexibilité permettent de l’utiliser facilement dans un solveurmultifrontal algébrique et généraliste. Nous présentons différentes variantes de lafactorisation BLR, selon comment les mises à jour de rang faible sont effectuées, etcomment le pivotage numérique est géré.D’abord, nous étudions la complexité théorique du format BLR qui, contrairement à d’autres formats comme les formats hiérarchiques, était inconnue jusqu’àprésent. Nous prouvons que la complexité théorique de la factorisation multifrontale BLR est asymptotiquement inférieure à celle du solveur de rang plein. Nousmontrons ensuite comment les variantes BLR peuvent encore réduire cette complexité. Nous étayons nos bornes de complexité par une étude expérimentale.Après avoir montré que les solveurs multifrontaux BLR peuvent atteindre unefaible complexité, nous nous intéressons au problème de la convertir en gains deperformance réels sur les architectures modernes. Nous présentons d’abord unefactorisation BLR multithreadée, et analysons sa performance dans des environnements multicœurs à mémoire partagée. Nous montrons que les variantes BLR sontcruciales pour exploiter efficacement les machines multicœurs en améliorant l’intensité arithmétique et la scalabilité de la factorisation. Nous considérons ensuiteà la factorisation BLR sur des architectures à mémoire distribuée.Les algorithmes présentés dans cette thèse ont été implémentés dans le solveurMUMPS. Nous illustrons l’utilisation de notre approche dans trois applications industrielles provenant des géosciences et de la mécanique des structures. Nous comparons également notre solveur avec STRUMPACK, basé sur des approximationsHierarchically Semi-Separable. Nous concluons cette thèse en rapportant un résultat sur un problème de très grande taille (130 millions d’inconnues) qui illustre lesfuturs défis posés par le passage à l’échelle des solveurs multifrontaux BLR.
Fichier principal
Vignette du fichier
thesis.pdf (6.5 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

tel-01708791 , version 1 (14-02-2018)

Identifiants

  • HAL Id : tel-01708791 , version 1

Citer

Théo Mary. Block Low-Rank multifrontal solvers: complexity, performance, and scalability. Numerical Analysis [math.NA]. Université Paul Sabatier - Toulouse III, 2017. English. ⟨NNT : ⟩. ⟨tel-01708791⟩
241 Consultations
111 Téléchargements

Partager

Gmail Facebook X LinkedIn More