Afficher la notice abrégée

dc.contributor.advisorNamyst, Raymond
dc.contributor.advisorWacrenier, Pierre-André
dc.contributor.advisorGuermouche, Abdou
dc.contributor.authorHUGO, Andra-Ecaterina
dc.contributor.otherHérault, Thomas
dc.contributor.otherTerrasse, Isabelle
dc.date2014-12-12
dc.identifier.urihttp://www.theses.fr/2014BORD0373/abes
dc.identifier.urihttps://tel.archives-ouvertes.fr/tel-01162975
dc.identifier.nnt2014BORD0373
dc.description.abstractPour répondre aux besoins de précision et d'efficacité des simulations scientifiques, la communauté du Calcul Haute Performance augmente progressivement les demandes en terme de parallélisme, rajoutant ainsi un besoin croissant de réutiliser les bibliothèques parallèles optimisées pour les architectures complexes.L'utilisation simultanée de plusieurs bibliothèques de calcul parallèle au sein d'une application soulève bien souvent des problèmes d 'efficacité. En compétition pour l'obtention des ressources, les routines parallèles, pourtant optimisées, se gênent et l'on voit alors apparaître des phénomènes de surcharge, de contention ou de défaut de cache.Dans cette thèse, nous présentons une technique de cloisonnement de flux de calculs qui permet de limiter les effets de telles interférences. Le cloisonnement est réalisé à l'aide de contextes d'exécution qui partitionnement les unités de calculs voire en partagent certaines. La répartition des ressources entre les contextes peut être modifiée dynamiquement afin d'optimiser le rendement de la machine. A cette fin, nous proposons l'utilisation de certaines métriques par un superviseur pour redistribuer automatiquement les ressources aux contextes. Nous décrivons l'intégration des contextes d'ordonnancement au support d'exécution pour machines hétérogènes StarPU et présentons des résultats d'expériences démontrant la pertinence de notre approche. Dans ce but, nous avons implémenté une extension du solveur direct creux qr mumps dans la quelle nous avons fait appel à ces mécanismes d'allocation de ressources. A travers les contextes d'ordonnancement nous décrivons une nouvelle méthode de décomposition du problème basée sur un algorithme de \proportional mapping". Le superviseur permet de réadapter dynamiquement et automatiquement l'allocation des ressources au parallèlisme irrégulier de l'application. L'utilisation des contextes d'ordonnancement et du superviseur a amélioré la localité et la performance globale du solveur.
dc.description.abstractEnTo face the ever demanding requirements in term of accuracy and speed of scientific simulations, the High Performance community is constantly increasing the demands in term of parallelism, adding thus tremendous value to parallel libraries strongly optimized for highly complex architectures.Enabling HPC applications to perform efficiently when invoking multiple parallel libraries simultaneously is a great challenge. Even if a uniform runtime system is used underneath, scheduling tasks or threads coming from dfferent libraries over the same set of hardware resources introduces many issues, such as resource oversubscription, undesirable cache ushes or memory bus contention.In this thesis, we present an extension of StarPU, a runtime system specifically designed for heterogeneous architectures, that allows multiple parallel codes to run concurrently with minimal interference. Such parallel codes run within scheduling contexts that provide confined executionenvironments which can be used to partition computing resources. Scheduling contexts can be dynamically resized to optimize the allocation of computing resources among concurrently running libraries. We introduced a hypervisor that automatically expands or shrinks contexts using feedback from the runtime system (e.g. resource utilization). We demonstrated the relevance of this approach by extending an existing generic sparse direct solver (qr mumps) to use these mechanisms and introduced a new decomposition method based on proportional mapping that is used to build the scheduling contexts. In order to cope with the very irregular behavior of the application, the hypervisor manages dynamically the allocation of resources. By means of the scheduling contexts and the hypervisor we improved the locality and thus the overall performance of the solver.
dc.language.isoen
dc.subjectComposition
dc.subjectSupport d'exécution
dc.subjectHypervisor
dc.subject.enComposability
dc.subject.enRuntime
dc.subject.enHypervisor
dc.titleLa composition des codes parallèles sur plates-formes hétérogènes
dc.title.enComposability of parallel codes on heterogeneous architectures
dc.typeThèses de doctorat
dc.contributor.jurypresidentAmestoy, Patrick
bordeaux.hal.laboratoriesHiePACS
bordeaux.hal.laboratoriesLaboratoire bordelais de recherche en informatique
bordeaux.hal.laboratoriesInstitut national de recherche en informatique et en automatique (France). Centre de recherche Bordeaux - Sud-Ouest
bordeaux.type.institutionBordeaux
bordeaux.thesis.disciplineInformatique
bordeaux.ecole.doctoraleÉcole doctorale de mathématiques et informatique (Talence, Gironde)
star.origin.linkhttps://www.theses.fr/2014BORD0373
dc.contributor.rapporteurDesprez, Frédéric
dc.contributor.rapporteurManneback, Pierre
bordeaux.COinSctx_ver=Z39.88-2004&rft_val_fmt=info:ofi/fmt:kev:mtx:journal&rft.title=La%20composition%20des%20codes%20parall%C3%A8les%20sur%20plates-formes%20h%C3%A9t%C3%A9rog%C3%A8nes&rft.atitle=La%20composition%20des%20codes%20parall%C3%A8les%20sur%20plates-formes%20h%C3%A9t%C3%A9rog%C3%A8nes&rft.au=HUGO,%20Andra-Ecaterina&rft.genre=unknown


Fichier(s) constituant ce document

FichiersTailleFormatVue

Il n'y a pas de fichiers associés à ce document.

Ce document figure dans la(les) collection(s) suivante(s)

Afficher la notice abrégée