Show simple item record

dc.contributor.advisorBeaumont, Olivier
dc.contributor.advisorThibault, Samuel
dc.contributor.authorKUMAR, Suraj
dc.contributor.otherRehn-Sonigo, Véronika
dc.contributor.otherEyraud-Dubois, Lionel
dc.contributor.otherAgullo, Emmanuel
dc.contributor.otherGermouche, Abdou
dc.date2017-04-12
dc.identifier.urihttp://www.theses.fr/2017BORD0572/abes
dc.identifier.urihttps://tel.archives-ouvertes.fr/tel-01538516
dc.identifier.nnt2017BORD0572
dc.description.abstractDu fait des énormes capacités de calculs des accélérateurs tels que les GPUs et les Xeon Phi, l’utilisation de machines multicoques pourvues d’accélérateurs est devenue commune dans le domaine du calcul haute performance (HPC). La complexité induite par ces accélérateurs a suscité le développement de systèmes d’exécution à base de tâches, dans lesquels les dépendances entre les applications sont exprimées sous la forme de graphe de tâches et où les tâches sont ordonnancées dynamiquement sur les ressources de calcul. La difficulté est alors de concevoir des stratégies d’ordonnancement qui font une utilisation efficace des ressources de calculs et le développement de telles stratégies, même pour un unique noeud hybride, est un enjeu essentiel de la performance des systèmes HPC. Nous considérons dans cette thèse l’ordonnancement de noyaux d’algèbre linéaire dense sur des noeuds complètement hétérogènes et constitués de CPUs et de GPUs. Les performances relatives des accélérateurs par rapport aux coeurs classique dépend très fortement du noyau considéré. Par exemple, les accélérateurs sont beaucoup plus efficaces pour les produits de matrices, par exemple, que pour les factorisations. Dans cette thèse, nous analysons les performances de stratégies statiques et dynamiques d’ordonnancement et nous proposons un ensemble de stratégies intermédiaires, en ajoutant des composantes statiques (respectivement dynamiques) à des stratégies d’ordonnancements dynamique (respectivement statiques). Récemment, une stratégie appelée HeteroPrio a été proposée, qui s’appuie sur les affinités entre les tâches et les ressources pour un petit ensemble de tâches différentes s’exécutant sur deux types de ressources. Nous avons étendu cette stratégie d’ordonnancement pour des graphes de tâches généraux pour deux types de ressources puis pour plus de deux types. De manière complémentaire, nous avons également démontré des facteurs d’approximation et des pires cas pour HeteroPrio dans le cas d’un ensemble de tâches indépendantes sur différents types de plates-formes.
dc.description.abstractEnDue to massive computation power of accelerators such as GPU, Xeon phi, multicore machines equipped with accelerators are becoming popular in High Performance Computing (HPC). The added complexity led to the development of different task-based runtime systems, which allow computations to be expressed as graphs of tasks and rely on runtime systems to schedule those tasks among all resources of the platform. The real challenge is to design efficient schedulers for such runtimes to make effective utilization of all resources. Developing good schedulers, even for a single hybrid node, and analyzing them can thus have a strong impact on the performance of current HPC systems. We consider the problem of scheduling dense linear algebra applications on fully hybrid platforms made of CPUs and GPUs. The relative performance of CPU and GPU highly depends on the sub-routine. For instance, GPUs are much more efficient to process matrix-matrix multiplications than matrix factorizations. In this thesis, we analyze the performance of static and dynamic scheduling strategies and we propose a set of intermediate strategies, by adding static (resp. dynamic) features into dynamic (resp. static) strategies. A resource centric dynamic scheduler, HeteroPrio, which is based on affinity between tasks and resources, has been proposed recently for a set of small independent tasks on two types of resources. We extend and analyze this scheduler for general task graphs first on two types of resources and then on more than two types of resources. Additionally, we provide approximation ratios and worst case examples of HeteroPrio for a set of independent tasks on different platform sizes.
dc.language.isoen
dc.subjectAlgèbre linéaire dense
dc.subjectOrdonnancement dynamique
dc.subjectOrdonnancement à base de graphe de tâches
dc.subjectPlates-formes hétérogènes
dc.subjectSystèmes d’ordonnancement dynamiques
dc.subject.enDense Linear Algebra
dc.subject.enDynamic Schedulers
dc.subject.enTask-based Scheduling
dc.subject.enHeterogeneous Platforms
dc.subject.enRuntime Systems
dc.titleOrdonnancement de noyaux d'algèbre linéaire dense sur ressources hétérogènes
dc.title.enScheduling of Dense Linear Algebra Kernels on Heterogeneous Resources
dc.typeThèses de doctorat
dc.contributor.jurypresidentTrystram, Denis
bordeaux.hal.laboratoriesLaboratoire bordelais de recherche en informatique
bordeaux.type.institutionBordeaux
bordeaux.thesis.disciplineInformatique
bordeaux.ecole.doctoraleÉcole doctorale de mathématiques et informatique (Talence, Gironde)
star.origin.linkhttps://www.theses.fr/2017BORD0572
dc.contributor.rapporteurRaghavan, Padma
dc.contributor.rapporteurLangou, Julien
bordeaux.COinSctx_ver=Z39.88-2004&rft_val_fmt=info:ofi/fmt:kev:mtx:journal&rft.title=Ordonnancement%20de%20noyaux%20d'alg%C3%A8bre%20lin%C3%A9aire%20dense%20sur%20ressources%20h%C3%A9t%C3%A9rog%C3%A8nes&rft.atitle=Ordonnancement%20de%20noyaux%20d'alg%C3%A8bre%20lin%C3%A9aire%20dense%20sur%20ressources%20h%C3%A9t%C3%A9rog%C3%A8nes&rft.au=KUMAR,%20Suraj&rft.genre=unknown


Files in this item

FilesSizeFormatView

There are no files associated with this item.

This item appears in the following Collection(s)

Show simple item record