Taking advantage of hybrid systems for sparse direct solvers via task-based runtimes
FAVERGE, Mathieu
High-End Parallel Algorithms for Challenging Numerical Simulations [HiePACS]
Laboratoire Bordelais de Recherche en Informatique [LaBRI]
High-End Parallel Algorithms for Challenging Numerical Simulations [HiePACS]
Laboratoire Bordelais de Recherche en Informatique [LaBRI]
RAMET, Pierre
High-End Parallel Algorithms for Challenging Numerical Simulations [HiePACS]
Laboratoire Bordelais de Recherche en Informatique [LaBRI]
Voir plus >
High-End Parallel Algorithms for Challenging Numerical Simulations [HiePACS]
Laboratoire Bordelais de Recherche en Informatique [LaBRI]
FAVERGE, Mathieu
High-End Parallel Algorithms for Challenging Numerical Simulations [HiePACS]
Laboratoire Bordelais de Recherche en Informatique [LaBRI]
High-End Parallel Algorithms for Challenging Numerical Simulations [HiePACS]
Laboratoire Bordelais de Recherche en Informatique [LaBRI]
RAMET, Pierre
High-End Parallel Algorithms for Challenging Numerical Simulations [HiePACS]
Laboratoire Bordelais de Recherche en Informatique [LaBRI]
High-End Parallel Algorithms for Challenging Numerical Simulations [HiePACS]
Laboratoire Bordelais de Recherche en Informatique [LaBRI]
THIBAULT, Samuel
Laboratoire Bordelais de Recherche en Informatique [LaBRI]
Efficient runtime systems for parallel architectures [RUNTIME]
< Réduire
Laboratoire Bordelais de Recherche en Informatique [LaBRI]
Efficient runtime systems for parallel architectures [RUNTIME]
Langue
en
Rapport
Ce document a été publié dans
2014-01-06p. 25
Résumé
Les architectures de calcul intègrent de plus en plus de coeurs de calcul partageant une même mémoire nécessairement hiérarchique. Les algorithmes, en particulier ceux relatifs à l'algèbre linéaire, nécessitent d'être ...Lire la suite >
Les architectures de calcul intègrent de plus en plus de coeurs de calcul partageant une même mémoire nécessairement hiérarchique. Les algorithmes, en particulier ceux relatifs à l'algèbre linéaire, nécessitent d'être adaptés à ces nouvelles architectures pour être efficaces. PaStIX est un solveur direct parallèle pour matrices creuses qui intègre un ordonnanceur dynamique pour des architectures hiérarchiques de grande taille. Dans ce papier, nous étudions la possibilité de remplacer cette stratégie interne d'ordonnancement par deux supports d'exécution génériques~: PaRSEC et StarPU. Ces supports d'exécution offrent la possibilité de dérouler le graphe de tâches de la factorisation numérique sur des noeuds de calcul disposant d'accélérateurs. Nous présentons une étude comparative des performances de notre solveur supernodal avec ces trois ordonnanceurs sur des architectures multicoeurs, et en particulier les gains obtenus avec plusieurs accélérateurs GPU. Ces résultats montrent qu'une approche basée sur un \DAG{} offre une interface de programmation uniforme pour réaliser du calcul haute performance sur des problèmes irréguliers comme ceux de l'algèbre linéaire creuse.< Réduire
Résumé en anglais
The ongoing hardware evolution exhibits an escalation in the number, as well as in the heterogeneity, of the computing resources. The pressure to maintain reasonable levels of performance and portability, forces the ...Lire la suite >
The ongoing hardware evolution exhibits an escalation in the number, as well as in the heterogeneity, of the computing resources. The pressure to maintain reasonable levels of performance and portability, forces the application developers to leave the traditional programming paradigms and explore alternative solutions. PaStiX is a parallel sparse direct solver, based on a dynamic scheduler for modern hierarchical architectures. In this paper, we study the replacement of the highly specialized internal scheduler in PaStiX by two generic runtime frameworks: PaRSEC and StarPU. The tasks graph of the factorization step is made available to the two runtimes, providing them with the opportunity to optimize it in order to maximize the algorithm efficiency for a predefined execution environment. A comparative study of the performance of the PaStiX solver with the three schedulers - native PaStiX, StarPU and PaRSEC schedulers - on different execution contexts is performed. The analysis highlights the similarities from a performance point of view between the different execution supports. These results demonstrate that these generic DAG-based runtimes provide a uniform and portable programming interface across heterogeneous environments, and are, therefore, a sustainable solution for hybrid environments.< Réduire
Mots clés en anglais
Sparse linear solver
DAG based runtime
multicore
GPU
Origine
Importé de halUnités de recherche