Mouvement de données et placement des tâches pour les communications haute performance sur machines hiérarchiques

MOREAUD, Stéphanie

The system will be going down for regular maintenance. Please save your work and logout.

dc.contributor.advisor	Raymond Namyst et Brice Goglin(Raymond.Namyst@labri.fr)
hal.structure.identifier	Laboratoire Bordelais de Recherche en Informatique [LaBRI]
hal.structure.identifier	Efficient runtime systems for parallel architectures [RUNTIME]
dc.contributor.author	MOREAUD, Stéphanie
dc.contributor.other	Franck Cappello (rapporteur)
dc.contributor.other	Olivier Coulaud (président)
dc.contributor.other	Olivier Glück (examinateur)
dc.contributor.other	Brice Goglin (directeur de thèse)
dc.contributor.other	Raymond Namyst (directeur de thèse)
dc.contributor.other	Bernard Tourancheau (rapporteur)
dc.date.accessioned	2024-04-15T09:46:36Z
dc.date.available	2024-04-15T09:46:36Z
dc.identifier.uri	https://oskar-bordeaux.fr/handle/20.500.12278/198022
dc.description.abstract	Les architectures des machines de calcul sont de plus en plus complexes et hiérarchiques, avec des processeurs multicœurs, des bancs mémoire distribués, et de multiples bus d'entrées-sorties. Dans le cadre du calcul haute performance, l'efficacité de l'exécution des applications parallèles dépend du coût de communication entre les tâches participantes qui est impacté par l'organisation des ressources, en particulier par les effets NUMA ou de cache. Les travaux de cette thèse visent à l'étude et à l'optimisation des communications haute performance sur les architectures hiérarchiques modernes. Ils consistent tout d'abord en l'évaluation de l'impact de la topologie matérielle sur les performances des mouvements de données, internes aux calculateurs ou au travers de réseaux rapides, et pour différentes stratégies de transfert, types de matériel et plateformes. Dans une optique d'amélioration et de portabilité des performances, nous proposons ensuite de prendre en compte les affinités entre les communications et le matériel au sein des bibliothèques de communication. Ces recherches s'articulent autour de l'adaptation du placement des tâches en fonction des schémas de transfert et de la topologie des calculateurs, ou au contraire autour de l'adaptation des stratégies de mouvement de données à une répartition définie des tâches. Ce travail, intégré aux principales bibliothèques MPI, permet de réduire de façon significative le coût des communications et d'améliorer ainsi les performances applicatives. Les résultats obtenus témoignent de la nécessité de prendre en compte les caractéristiques matérielles des machines modernes pour en exploiter la quintessence.
dc.description.abstractEn	The emergence of multicore processors led to an increasing complexity inside the modern servers, with many cores, distributed memory banks and multiple Input/Output buses. The execution time of parallel applications depends on the efficiency of the communications between computing tasks. On recent architectures, the communication cost is largely impacted by hardware characteristics such as NUMA or cache effects. In this thesis, we propose to study and optimize high performance communication on hierarchical architectures. We first evaluate the impact of the hardware affinities on data movement, inside servers or across high-speed networks, and for multiple transfer strategies, technologies and platforms. We then propose to consider affinities between hardware and communicating tasks inside the communication libraries to improve performance and ensure their portability. To do so, we suggest to adapt the tasks binding according to the transfer method and the topology, or to adjust the data transfer strategies to a defined task distribution. Our approaches have been integrated in some main MPI implementations. They significantly reduce the communication costs and improve the overall application performance. These results highlight the importance of considering hardware topology for nowadays servers.
dc.language.iso	fr
dc.subject	calcul intensif
dc.subject	communication réseau
dc.subject	mémoire partagée
dc.subject	MPI
dc.subject	multiprocesseur
dc.subject	NUMA
dc.subject	multicœur
dc.subject	affinité matérielle
dc.subject	topologie
dc.subject.en	hardware affinity
dc.subject.en	topology
dc.subject.en	High Performance Computing
dc.subject.en	network communication
dc.subject.en	shared memory
dc.subject.en	multiprocessor
dc.subject.en	multicore
dc.title	Mouvement de données et placement des tâches pour les communications haute performance sur machines hiérarchiques
dc.type	Thèses de doctorat
dc.subject.hal	Informatique [cs]/Réseaux et télécommunications [cs.NI]
dc.subject.hal	Informatique [cs]/Modélisation et simulation
bordeaux.hal.laboratories	Laboratoire Bordelais de Recherche en Informatique (LaBRI) - UMR 5800	*
bordeaux.institution	Université de Bordeaux
bordeaux.institution	Bordeaux INP
bordeaux.institution	CNRS
bordeaux.type.institution	Université Sciences et Technologies - Bordeaux I
bordeaux.ecole.doctorale	Mathématiques et Informatique
hal.identifier	tel-00635651
hal.version	1
hal.origin.link	https://hal.archives-ouvertes.fr//tel-00635651v1
bordeaux.COinS	ctx_ver=Z39.88-2004&rft_val_fmt=info:ofi/fmt:kev:mtx:journal&rft.title=Mouvement%20de%20donn%C3%A9es%20et%20placement%20des%20t%C3%A2ches%20pour%20les%20communications%20haute%20performance%20sur%20machines%20hi%C3%A9rarchiques&rft.atitle=Mouvement%20de%20donn%C3%A9es%20et%20placement%20des%20t%C3%A2ches%20pour%20les%20communications%20haute%20performance%20sur%20machines%20hi%C3%A9rarchiques&rft.au=MOREAUD,%20St%C3%A9phanie&rft.genre=unknown

Files in this item

Files	Size	Format	View
There are no files associated with this item.

This item appears in the following Collection(s)

Laboratoire Bordelais de Recherche en Informatique (LaBRI) - UMR 5800

Show simple item record