Mostrar el registro sencillo del ítem
Décomposition en valeurs singulières randomisée et positionnement multidimensionel à base de tâches
hal.structure.identifier | COmposabilité Numerique and parallèle pour le CAlcul haute performanCE [CONCACE] | |
dc.contributor.author | AGULLO, Emmanuel | |
hal.structure.identifier | COmposabilité Numerique and parallèle pour le CAlcul haute performanCE [CONCACE] | |
dc.contributor.author | COULAUD, Olivier | |
hal.structure.identifier | Topology-Aware System-Scale Data Management for High-Performance Computing [TADAAM] | |
dc.contributor.author | DENIS, Alexandre | |
hal.structure.identifier | High-End Parallel Algorithms for Challenging Numerical Simulations [HiePACS] | |
dc.contributor.author | FAVERGE, Mathieu | |
hal.structure.identifier | Biodiversité, Gènes & Communautés [BioGeCo] | |
hal.structure.identifier | Pleiade, from patterns to models in computational biodiversity and biotechnology [PLEIADE] | |
dc.contributor.author | FRANC, Alain | |
hal.structure.identifier | Biodiversité, Gènes & Communautés [BioGeCo] | |
hal.structure.identifier | Pleiade, from patterns to models in computational biodiversity and biotechnology [PLEIADE] | |
dc.contributor.author | FRIGERIO, Jean-Marc | |
hal.structure.identifier | STatic Optimizations, Runtime Methods [STORM] | |
dc.contributor.author | FURMENTO, Nathalie | |
hal.structure.identifier | Topology-Aware System-Scale Data Management for High-Performance Computing [TADAAM] | |
dc.contributor.author | GUILBAUD, Adrien | |
hal.structure.identifier | Topology-Aware System-Scale Data Management for High-Performance Computing [TADAAM] | |
dc.contributor.author | JEANNOT, Emmanuel | |
hal.structure.identifier | COmposabilité Numerique and parallèle pour le CAlcul haute performanCE [CONCACE] | |
dc.contributor.author | PERESSONI, Romain | |
hal.structure.identifier | Service Expérimentation et Développement [Bordeaux] [SED] | |
dc.contributor.author | PRUVOST, Florent | |
hal.structure.identifier | STatic Optimizations, Runtime Methods [STORM] | |
dc.contributor.author | THIBAULT, Samuel | |
dc.date.issued | 2022-09-09 | |
dc.description.abstract | Le positionnement multidimensionnel (MDS) est un algorithme important et robuste pour représenter les cas individuels d’un ensemble de données en fonction de leurs dissimilarités respectives. Cependant, les heuristiques, qui peuvent être un compromis avec la robustesse, sont souvent préférées en pratique en raison de sa consommation mémoire et de ses coûts potentiellement prohibitifs. L’introduction récente de techniques de projection aléatoire dans le MDS lui a permis de devenir compétitif sur des cas test plus importants. L’objectif de ce manuscrit est de proposer un MDS haute performance basé sur la projection aléatoire pour le traitement d’ensembles de données de taille encore plus grande (jusqu’à un million d’éléments). Nous proposons une conception de l’algorithme et nous l’implémentons dans une pile logicielle efficace, comprenant des solveurs numériques de pointe ainsi des systèmes d’exécution et des couches de communication optimisés. L’aboutissement de ce travail résultat est la capacité d’appliquer efficacement le MDS robuste à de grands ensembles de données sur des super-ordinateurs modernes. Nous évaluons l’algorithme etla pile logicielle résultants à la visualisation de nuages de points pour l’analyse des distances entre séquences de metabarcoding. | |
dc.description.abstractEn | The multidimensional scaling (MDS) is an important and robust algorithm for representing individual cases of a dataset out of their respective dissimilarities. However, heuristics, possibly trading-off with robustness, are often preferred in practice due to the potentially prohibitive memory and computational costs of the MDS. The recent introduction of random projection techniques within the MDS allowed it to be become competitive on larger testcases. The goal of this manuscript is to propose a high-performance distributed-memory MDS based on random projection for processing data sets of even larger size (up to one million items). We propose a task-based design of the whole algorithm and we implement it within an efficient software stack including state-of-the-art numerical solvers, runtime systems and communication layers. The outcome is the ability to efficiently apply robust MDS to large datasets on modern supercomputers. We assess the resulting algorithm and software stack to the point cloud visualization for analyzing distances between sequencesin metabarcoding. | |
dc.language.iso | en | |
dc.rights.uri | http://creativecommons.org/licenses/by/ | |
dc.subject | programmation à base de tâches | |
dc.subject | décomposition en valeur singulière randomisée | |
dc.subject | positionnement multidimensionel | |
dc.subject | projection aléatoire | |
dc.subject | mémoire distribuée | |
dc.subject | machine hétérogène | |
dc.subject | moteur d’exécution | |
dc.subject.en | task-based programming | |
dc.subject.en | randomized singular value decomposition (RSVD) | |
dc.subject.en | multidimensional scaling (MDS) | |
dc.subject.en | random projection | |
dc.subject.en | distributed memory | |
dc.subject.en | heterogeneous machine | |
dc.subject.en | runtime system | |
dc.title | Décomposition en valeurs singulières randomisée et positionnement multidimensionel à base de tâches | |
dc.title.en | Task-based randomized singular value decomposition and multidimensional scaling | |
dc.type | Rapport | |
dc.subject.hal | Informatique [cs]/Calcul parallèle, distribué et partagé [cs.DC] | |
bordeaux.page | 37 | |
bordeaux.type.institution | Inria Bordeaux - Sud Ouest | |
bordeaux.type.institution | Inrae - BioGeCo | |
bordeaux.type.report | rr | |
hal.identifier | hal-03773985 | |
hal.version | 1 | |
hal.origin.link | https://hal.archives-ouvertes.fr//hal-03773985v1 | |
bordeaux.COinS | ctx_ver=Z39.88-2004&rft_val_fmt=info:ofi/fmt:kev:mtx:journal&rft.title=D%C3%A9composition%20en%20valeurs%20singuli%C3%A8res%20randomis%C3%A9e%20et%20positionnement%20multidimensionel%20%C3%A0%20base%20de%20t%C3%A2ches&rft.atitle=D%C3%A9composition%20en%20valeurs%20singuli%C3%A8res%20randomis%C3%A9e%20et%20positionnement%20multidimensionel%20%C3%A0%20base%20de%20t%C3%A2ches&rft.date=2022-09-09&rft.spage=37&rft.epage=37&rft.au=AGULLO,%20Emmanuel&COULAUD,%20Olivier&DENIS,%20Alexandre&FAVERGE,%20Mathieu&FRANC,%20Alain&rft.genre=unknown |
Archivos en el ítem
Archivos | Tamaño | Formato | Ver |
---|---|---|---|
No hay archivos asociados a este ítem. |