Algorithmique hiérarchique parallèle haute performance pour les problèmes à N-corps
FORTIN, Pierre
Laboratoire Bordelais de Recherche en Informatique [LaBRI]
Algorithms and high performance computing for grand challenge applications [SCALAPPLIX]
Laboratoire Bordelais de Recherche en Informatique [LaBRI]
Algorithms and high performance computing for grand challenge applications [SCALAPPLIX]
FORTIN, Pierre
Laboratoire Bordelais de Recherche en Informatique [LaBRI]
Algorithms and high performance computing for grand challenge applications [SCALAPPLIX]
< Reduce
Laboratoire Bordelais de Recherche en Informatique [LaBRI]
Algorithms and high performance computing for grand challenge applications [SCALAPPLIX]
Language
fr
Thèses de doctorat
Doctoral school
Mathématiques, Sciences et Technologies de l'Information (Informatique)Abstract
Cette thèse porte sur la méthode dite « méthode multipôle rapide » qui résout hiérarchiquement le problème à N-corps avec une complexité linéaire pour n'importe quelle précision. Dans le cadre de l'équation de Laplace, ...Read more >
Cette thèse porte sur la méthode dite « méthode multipôle rapide » qui résout hiérarchiquement le problème à N-corps avec une complexité linéaire pour n'importe quelle précision. Dans le cadre de l'équation de Laplace, nous souhaitons pouvoir traiter efficacement toutes les distributions de particules rencontrées en astrophysique et en dynamique moléculaire.<br /> Nous étudions tout d'abord deux expressions distinctes du principal opérateur (« multipôle-to-local ») ainsi que les bornes d'erreur associées. Pour ces deux expressions, nous présentons une formulation matricielle dont l'implémentation avec des routines BLAS (Basic Linear Algebra Subprograms) permet d'améliorer fortement l'efficacité de calcul. Dans la gamme de précisions qui nous intéresse, cette approche se révèle plus performante que les améliorations existantes (FFT, rotations et ondes planes), pour des distributions uniformes ou non.<br /> Outre une nouvelle structure de données pour l'octree sous-jacent et des contributions algorithmiques à la version adaptative, nous avons aussi efficacement parallélisé notre méthode en mémoire partagée et en mémoire distribuée. Enfin, des comparaisons avec des codes dédiés justifient l'intérêt de notre code pour des simulations en astrophysique.Read less <
English Abstract
This thesis focuses on the Fast Multipole Method which hierarchically solves the N-body problem with a linear operation count for any given precision. When considering Laplace equation, we aim at treating efficiently all ...Read more >
This thesis focuses on the Fast Multipole Method which hierarchically solves the N-body problem with a linear operation count for any given precision. When considering Laplace equation, we aim at treating efficiently all particle distributions that arise in astrophysics and in molecular dynamics.<br /> We first study two different expressions of the main operator ("multipole-to-local") as well as the corresponding error bounds. For these two expressions, we present a matrix formulation whose implementation with BLAS routines (Basic Linear Algebra Subprograms) offers impressive runtime speedup. For the targeted precisions, this approach appears to outperform the existing enhancements (FFT, rotations and plane waves), in case of both uniform and non uniform distributions.<br /> In addition to a new octree data structure and to algorithmic improvements of the adaptive version, we have also efficiently parallelized our method for shared and distributed memory architectures. Finally, comparisons with specialized codes justify the interest of our code for astrophysical simulations.Read less <
Keywords
problème à N-corps
méthode multipôle rapide
algorithme de Barnes & Hut
équation de Laplace
équation de Poisson
astrophysique
dynamique moléculaire
borne d'erreur
Transformée Rapide de Fourier
rotations
ondes planes
routines BLAS
octree
parallélisme
mémoire partagée
mémoire distribuée
English Keywords
N-body problem
Fast Multipole Method
Barnes-Hut algorithm
Laplace equation
Poisson equation
astrophysics
molecular dynamics
error bound
Fast Fourier Transform
plane waves
BLAS routines
parallelism
shared memory
distributed memory
Origin
Hal imported