Afficher la notice abrégée

dc.contributor.advisorOlivier Beaumont
dc.contributor.advisorSamuel Thibault
hal.structure.identifierLaboratoire Bordelais de Recherche en Informatique [LaBRI]
hal.structure.identifierSTatic Optimizations, Runtime Methods [STORM]
hal.structure.identifierReformulations based algorithms for Combinatorial Optimization [Realopt]
hal.structure.identifierHigh-End Parallel Algorithms for Challenging Numerical Simulations [HiePACS]
dc.contributor.authorKUMAR, Suraj
dc.contributor.otherDenis Trystram [Président]
dc.contributor.otherPadma Raghavan [Rapporteur]
dc.contributor.otherJulien Langou [Rapporteur]
dc.contributor.otherVéronika Rehn-Sonigo
dc.contributor.otherLionel Eyraud-Dubois
dc.contributor.otherEmmanuel Agullo
dc.contributor.otherAbdou Germouche
dc.date.accessioned2024-04-04T03:09:57Z
dc.date.available2024-04-04T03:09:57Z
dc.identifier.urihttps://oskar-bordeaux.fr/handle/20.500.12278/193650
dc.identifier.nnt2017BORD0572
dc.description.abstractDu fait des énormes capacités de calculs des accélérateurs tels que les GPUs et les Xeon Phi, l’utilisation de machines multicoques pourvues d’accélérateurs est devenue commune dans le domaine du calcul haute performance (HPC). La complexité induite par ces accélérateurs a suscité le développement de systèmes d’exécution à base de tâches, dans lesquels les dépendances entre les applications sont exprimées sous la forme de graphe de tâches et où les tâches sont ordonnancées dynamiquement sur les ressources de calcul. La difficulté est alors de concevoir des stratégies d’ordonnancement qui font une utilisation efficace des ressources de calculs et le développement de telles stratégies, même pour un unique noeud hybride, est un enjeu essentiel de la performance des systèmes HPC. Nous considérons dans cette thèse l’ordonnancement de noyaux d’algèbre linéaire dense sur des noeuds complètement hétérogènes et constitués de CPUs et de GPUs. Les performances relatives des accélérateurs par rapport aux coeurs classique dépend très fortement du noyau considéré. Par exemple, les accélérateurs sont beaucoup plus efficaces pour les produits de matrices, par exemple, que pour les factorisations. Dans cette thèse, nous analysons les performances de stratégies statiques et dynamiques d’ordonnancement et nous proposons un ensemble de stratégies intermédiaires, en ajoutant des composantes statiques (respectivement dynamiques) à des stratégies d’ordonnancements dynamique (respectivement statiques). Récemment, une stratégie appelée HeteroPrio a été proposée, qui s’appuie sur les affinités entre les tâches et les ressources pour un petit ensemble de tâches différentes s’exécutant sur deux types de ressources. Nous avons étendu cette stratégie d’ordonnancement pour des graphes de tâches généraux pour deux types de ressources puis pour plus de deux types. De manière complémentaire, nous avons également démontré des facteurs d’approximation et des pires cas pour HeteroPrio dans le cas d’un ensemble de tâches indépendantes sur différents types de plates-formes.
dc.description.abstractEnDue to massive computation power of accelerators such as GPU, Xeon phi, multicore machines equipped with accelerators are becoming popular in High Performance Computing (HPC). The added complexity led to the development of different task-based runtime systems, which allow computations to be expressed as graphs of tasks and rely on runtime systems to schedule those tasks among all resources of the platform. The real challenge is to design efficient schedulers for such runtimes to make effective utilization of all resources. Developing good schedulers, even for a single hybrid node, and analyzing them can thus have a strong impact on the performance of current HPC systems. We consider the problem of scheduling dense linear algebra applications on fully hybrid platforms made of CPUs and GPUs. The relative performance of CPU and GPU highly depends on the sub-routine. For instance, GPUs are much more efficient to process matrix-matrix multiplications than matrix factorizations. In this thesis, we analyze the performance of static and dynamic scheduling strategies and we propose a set of intermediate strategies, by adding static (resp. dynamic) features into dynamic (resp. static) strategies. A resource centric dynamic scheduler, HeteroPrio, which is based on affinity between tasks and resources, has been proposed recently for a set of small independent tasks on two types of resources. We extend and analyze this scheduler for general task graphs first on two types of resources and then on more than two types of resources. Additionally, we provide approximation ratios and worst case examples of HeteroPrio for a set of independent tasks on different platform sizes.
dc.language.isoen
dc.subjectAlgèbre linéaire dense
dc.subjectOrdonnancement dynamique
dc.subjectOrdonnancement à base de graphe de tâches
dc.subjectPlates-formes hétérogènes
dc.subjectSystèmes d’ordonnancement dynamiques
dc.subject.enDense Linear Algebra
dc.subject.enDynamic Schedulers
dc.subject.enTask-based Scheduling
dc.subject.enHeterogeneous Platforms
dc.subject.enRuntime Systems
dc.titleOrdonnancement de noyaux d'algèbre linéaire dense sur ressources hétérogènes
dc.title.enScheduling of Dense Linear Algebra Kernels on Heterogeneous Resources
dc.typeThèses de doctorat
dc.subject.halInformatique [cs]/Autre [cs.OH]
bordeaux.hal.laboratoriesInstitut de Mathématiques de Bordeaux (IMB) - UMR 5251*
bordeaux.institutionUniversité de Bordeaux
bordeaux.institutionBordeaux INP
bordeaux.institutionCNRS
bordeaux.type.institutionUniversité de Bordeaux
bordeaux.ecole.doctoraleÉcole doctorale de mathématiques et informatique (Talence, Gironde ; 1991-....)
hal.identifiertel-01538516
hal.version1
hal.origin.linkhttps://hal.archives-ouvertes.fr//tel-01538516v1
bordeaux.COinSctx_ver=Z39.88-2004&rft_val_fmt=info:ofi/fmt:kev:mtx:journal&rft.title=Ordonnancement%20de%20noyaux%20d'alg%C3%A8bre%20lin%C3%A9aire%20dense%20sur%20ressources%20h%C3%A9t%C3%A9rog%C3%A8nes&rft.atitle=Ordonnancement%20de%20noyaux%20d'alg%C3%A8bre%20lin%C3%A9aire%20dense%20sur%20ressources%20h%C3%A9t%C3%A9rog%C3%A8nes&rft.au=KUMAR,%20Suraj&rft.genre=unknown


Fichier(s) constituant ce document

FichiersTailleFormatVue

Il n'y a pas de fichiers associés à ce document.

Ce document figure dans la(les) collection(s) suivante(s)

Afficher la notice abrégée