Extension de l'analyse des correspondances à des donnéees multi-dimensionnelles : un point de vue géométrique
IANNACITO, Martina
COmposabilité Numerique and parallèle pour le CAlcul haute performanCE [CONCACE]
COmposabilité Numerique and parallèle pour le CAlcul haute performanCE [CONCACE]
FRANC, Alain
Pleiade, from patterns to models in computational biodiversity and biotechnology [PLEIADE]
Biodiversité, Gènes & Communautés [BioGeCo]
Pleiade, from patterns to models in computational biodiversity and biotechnology [PLEIADE]
Biodiversité, Gènes & Communautés [BioGeCo]
IANNACITO, Martina
COmposabilité Numerique and parallèle pour le CAlcul haute performanCE [CONCACE]
COmposabilité Numerique and parallèle pour le CAlcul haute performanCE [CONCACE]
FRANC, Alain
Pleiade, from patterns to models in computational biodiversity and biotechnology [PLEIADE]
Biodiversité, Gènes & Communautés [BioGeCo]
< Réduire
Pleiade, from patterns to models in computational biodiversity and biotechnology [PLEIADE]
Biodiversité, Gènes & Communautés [BioGeCo]
Langue
en
Communication dans un congrès
Ce document a été publié dans
MDS 2022 - SIAM Conference on Mathematics of Data Science, 2022-09-26, San Diego / Hybrid.
Résumé
Nous présentons une extension de l'analyse des correspondances (AC) aux tenseurs par la décomposition en valeurs singulières d'ordre élevé (HOSVD) d'un point de vue géométrique. L'analyse des correspondances est un outil ...Lire la suite >
Nous présentons une extension de l'analyse des correspondances (AC) aux tenseurs par la décomposition en valeurs singulières d'ordre élevé (HOSVD) d'un point de vue géométrique. L'analyse des correspondances est un outil bien connu en science des données, développé à partir de l'analyse en composantes principales et appliqué aux tableaux de contingence. En effet, l'AC associe un tableau de contingence à deux voies à deux nuages de points, liés par une relation barycentrique caractéristique. Différentes extensions algébriques de l'AC aux tableaux à plusieurs voies ont été proposées au fil des ans, sans toutefois négliger sa signification géométrique, pour autant que nous le sachions. En s'appuyant sur le modèle de Tucker et le HOSVD, nous proposons un moyen direct d'associer à chaque mode tensoriel un nuage de points. Nous prouvons que les nuages de points sont liés les uns aux autres. En utilisant spécifiquement la métrique CA, nous montrons que la relation barycentrique est toujours vraie dans le cadre tensoriel. Enfin, des exemples numériques sont utilisés pour souligner les avantages et les inconvénients de notre stratégie par rapport aux approches matricielles classiques.< Réduire
Résumé en anglais
We present an extension of Correspondence Analysis (CA) to tensors through High Order Singular Value Decomposition (HOSVD) from a geometric viewpoint. Correspondence analysis is a well-known tool in data science, developed ...Lire la suite >
We present an extension of Correspondence Analysis (CA) to tensors through High Order Singular Value Decomposition (HOSVD) from a geometric viewpoint. Correspondence analysis is a well-known tool in data science, developed from principal component analysis and applied to contingency tables. Indeed, CA associates a two-ways contingency table with two point clouds, linked by a characteristic barycentric relation. Different algebraic extensions of CA to multi-way tables have been proposed over the years, nevertheless neglecting its geometric meaning, as far as we are aware. Relying on the Tucker model and the HOSVD, we propose a direct way to associate with each tensor mode a point cloud. We prove that the point clouds are related to each other. Specifically using the CA metrics we show that the barycentric relation is still true in the tensor framework. Finally, numerical examples are used to underline the advantages and the drawbacks of our strategy with respect to the classical matrix approaches.< Réduire
Origine
Importé de halUnités de recherche