Afficher la notice abrégée

dc.contributor.advisorJeannot, Emmanuel
dc.contributor.advisorDenis, Alexandre
dc.contributor.authorREYNIER, Florian
dc.contributor.otherJaeger, Julien
dc.contributor.otherMorin, Christine
dc.date2022-06-24
dc.date.accessioned2023-03-27T08:20:52Z
dc.date.available2023-03-27T08:20:52Z
dc.identifier.urihttp://www.theses.fr/2022BORD0206/abes
dc.identifier.uri
dc.identifier.urihttps://tel.archives-ouvertes.fr/tel-04023709
dc.identifier.urihttps://oskar-bordeaux.fr/handle/20.500.12278/172601
dc.identifier.nnt2022BORD0206
dc.description.abstractDe nos jours, MPI est de facto le standard pour la programmation à mémoire distribuée pour les supercalculateurs. Les communications non bloquantes sont un des modèles proposés par le standard MPI. Ces opérations peuvent être utilisées pour recouvrir les communications avec du calcul (ou d’autres communications) afin d’amortir leurs coûts. Cependant, pour être utilisées efficacement, ces opérations nécessitent une progression asynchrone pouvant régulièrement utiliser un montant non négligeable de ressources de calcul (particulièrement les collectives non bloquantes). De plus, partager les ressources de calcul avec l’application peut provoquer un ralentissement global. Les mécanismes utilisés pour cette progression asynchrone parviennent difficilement à concilier un bon recouvrement en gardant un impact minimal sur l’application, ce qui raréfie leur utilisation. Afin de résoudre ces différents problèmes, nous avons suivi plusieurs étapes. Premièrement, nous proposons une étude approfondie de la progression asynchrone dans les implémentations MPI, en utilisant de nouvelles métriques se concentrant sur l’évaluation des mécanismes de progression et de leur impact sur le système global. Après avoir exposé les faiblesses de ces implémentations MPI, nous proposons une nouvelle solution pour la progression des collectives non bloquantes en utilisant des coeurs dédiés combinés à des algorithmes de collectives basés sur des évènements. Nous avons mesuré l’efficacité de cette solution en utilisant nos métriques, pour nous comparer avec les implémentations MPI étudiées dans la première étape. Enfin, nous avons développé un modèle permettant de prédire le gain potentiel et le surcout induit par l’utilisation d’opérations non bloquantes avec des coeurs dédiés. Ce modèle peut être utilisé pour évaluer l’utilité de transformer une application basée sur des opérations bloquantes en opérations non bloquantes pour bénéficier du recouvrement. Nous évaluons ce modèle sur plusieurs benchmarks.
dc.description.abstractEnNowadays, MPI is the de-facto standard for distributed-memory parallelism on supercomputers. One of the communication models offered by the MPI standard is MPI nonblocking communications. These communications can be used to overlap communication with computation (or other communications) in order to reduce their impact. However, to perform efficiently, these operations require asynchronous progression, which can need non negligible amount of computation resources regularly (especially for nonblocking collectives). However, sharing the compute resources with the application may cause an overall slowdown. The current mechanisms used to achieve this asynchronous progression struggle to reconcile a good overlap and minimal impact on the application, which leads to nonblocking collective operations being very seldom used in applications. To address this issue, we followed several steps. First, we proposed a thorough study of asynchronous progression in MPI implementations using newly defined metrics, focusing on the evaluation of progression mechanisms and their impact on the global runtime. After exposing the shortcomings of these MPI implementations, we propose a new solution for the progression of nonblocking collectives using dedicated cores combined with event-based collective algorithms. We measured the efficiency of this solution using our metrics, to compare ourselves with the MPI implementations studied in the first step. Finally, we developed a model to predict the potential gain and the overhead induced by the use of nonblocking operations with a dedicated core. This model can be used to evaluate the usefulness of transforming an application based on blocking operation to nonblocking ones to benefit from overlap. We evaluate this model on several benchmarks.
dc.language.isoen
dc.subjectMPI
dc.subjectProgression
dc.subjectNon bloquantes
dc.subjectCollectives
dc.subject.enMPI
dc.subject.enProgression
dc.subject.enNonblocking
dc.subject.enCollectives
dc.titleÉtude sur la progression des communications MPI à base de ressources dédiées
dc.title.enA study on progression of MPI communications using dedicated resources
dc.typeThèses de doctorat
dc.contributor.jurypresidentNamyst, Raymond
bordeaux.hal.laboratoriesLaboratoire bordelais de recherche en informatique
bordeaux.type.institutionBordeaux
bordeaux.thesis.disciplineInformatique
bordeaux.ecole.doctoraleÉcole doctorale de mathématiques et informatique
star.origin.linkhttps://www.theses.fr/2022BORD0206
dc.contributor.rapporteurKrajecki, Michaël
dc.contributor.rapporteurSkjellum, Anthony
bordeaux.COinSctx_ver=Z39.88-2004&rft_val_fmt=info:ofi/fmt:kev:mtx:journal&rft.title=%C3%89tude%20sur%20la%20progression%20des%20communications%20MPI%20%C3%A0%20base%20de%20ressources%20d%C3%A9di%C3%A9es&rft.atitle=%C3%89tude%20sur%20la%20progression%20des%20communications%20MPI%20%C3%A0%20base%20de%20ressources%20d%C3%A9di%C3%A9es&rft.au=REYNIER,%20Florian&rft.genre=unknown


Fichier(s) constituant ce document

FichiersTailleFormatVue

Il n'y a pas de fichiers associés à ce document.

Ce document figure dans la(les) collection(s) suivante(s)

Afficher la notice abrégée