Afficher la notice abrégée

hal.structure.identifierEfficient runtime systems for parallel architectures [RUNTIME]
hal.structure.identifierLaboratoire Bordelais de Recherche en Informatique [LaBRI]
dc.contributor.authorJEANNOT, Emmanuel
dc.date.accessioned2024-04-15T09:44:15Z
dc.date.available2024-04-15T09:44:15Z
dc.date.issued2012-12
dc.date.conference2012-12-17
dc.identifier.urihttps://oskar-bordeaux.fr/handle/20.500.12278/197827
dc.description.abstractEnWe discuss some performance issues of the tiled Cholesky factorization on non-uniform memory access-time (NUMA) shared memory machines. We show how to optimize thread placement and data placement in order to achieve performance gain up to 50% compared to state-of-the-art libraries such as Plasma or MKL.
dc.language.isoen
dc.publisherIEEE
dc.title.enPerformance Analysis and Optimization of the Tiled Cholesky Factorization on NUMA Machines
dc.typeCommunication dans un congrès
dc.subject.halInformatique [cs]/Calcul parallèle, distribué et partagé [cs.DC]
bordeaux.hal.laboratoriesLaboratoire Bordelais de Recherche en Informatique (LaBRI) - UMR 5800*
bordeaux.institutionUniversité de Bordeaux
bordeaux.institutionBordeaux INP
bordeaux.institutionCNRS
bordeaux.conference.titlePAAP 2012 - IEEE International Symposium on Parallel Architectures, Algorithms and Programming
bordeaux.countryTW
bordeaux.conference.cityTaipei
bordeaux.peerReviewedoui
hal.identifierhal-00772790
hal.version1
hal.invitednon
hal.proceedingsoui
hal.conference.end2012-12-20
hal.popularnon
hal.audienceInternationale
hal.origin.linkhttps://hal.archives-ouvertes.fr//hal-00772790v1
bordeaux.COinSctx_ver=Z39.88-2004&rft_val_fmt=info:ofi/fmt:kev:mtx:journal&rft.date=2012-12&rft.au=JEANNOT,%20Emmanuel&rft.genre=unknown


Fichier(s) constituant ce document

FichiersTailleFormatVue

Il n'y a pas de fichiers associés à ce document.

Ce document figure dans la(les) collection(s) suivante(s)

Afficher la notice abrégée