Méthodes linéaires de Réduction de Dimension
FRANC, Alain
Biodiversité, Gènes & Communautés [BioGeCo]
Pleiade, from patterns to models in computational biodiversity and biotechnology [PLEIADE]
Biodiversité, Gènes & Communautés [BioGeCo]
Pleiade, from patterns to models in computational biodiversity and biotechnology [PLEIADE]
FRANC, Alain
Biodiversité, Gènes & Communautés [BioGeCo]
Pleiade, from patterns to models in computational biodiversity and biotechnology [PLEIADE]
< Réduire
Biodiversité, Gènes & Communautés [BioGeCo]
Pleiade, from patterns to models in computational biodiversity and biotechnology [PLEIADE]
Langue
en
Rapport
Ce document a été publié dans
2022-09-23p. 69
Résumé
Ce document brosse un panorama des méthodes linéaires de l'Analyse de données multivariées. Il s'agit d'un domaine ancien et classique, bien établi depuis les années 60, et redevenu d'actualité en tant qu'étape clé dans ...Lire la suite >
Ce document brosse un panorama des méthodes linéaires de l'Analyse de données multivariées. Il s'agit d'un domaine ancien et classique, bien établi depuis les années 60, et redevenu d'actualité en tant qu'étape clé dans l'apprentissage statistique. On peut considérer ces méthodes comme faisant partie d'une approche algébrique de l'apprentissage statistique ou bien comme une réduction de dimension avec une tonalité plus géométrique. Ces deux approches sont étroitement liées : il est plus facile d'apprendre des patterns des données dans des espaces à faible dimension que dans des espaces à grande dimension. Nous montrons comment une apparente diversité de méthodes et outils se réduit en fait pour un tableau à une seule méthode : l'Analyse en Composantes Principales, avec la SVD (Singular Value Decomposition), de telle sorte que les efforts d'optimisation des codes pour l'analyse de jeux de données massives pourraient eut se focaliser sur cette méthode centrale partagée, au bénéfice de toutes les méthodes. Une extension à l'étude de plusieurs tableaux est présentée (Analyse canonique).< Réduire
Résumé en anglais
These notes are an overview of some classical linear methods in Multivariate Data Analysis. This is an good old domain, well established since the 60's, and refreshed timely as a key step in statistical learning. It can ...Lire la suite >
These notes are an overview of some classical linear methods in Multivariate Data Analysis. This is an good old domain, well established since the 60's, and refreshed timely as a key step in statistical learning. It can be presented as part of statistical learning, or as dimensionality reduction with a geometric flavor. Both approaches are tightly linked: it is easier to learn patterns from data in low dimensional spaces than in high-dimensional spaces. It is shown how a diversity of methods and tools boil down to a single core methods, PCA with SVD, such that the efforts to optimize codes for analyzing massive data sets can focus on this shared core method, and benefit to all methods. An extension to the study of several arrays is presented (Canonical Analysis).< Réduire
Mots clés
Réduction de dimension
Analyse de données multivariées
Apprentissage statistique
Analyse en Composantes Principales
Analyse Factorielle des Correspondances
Analyse avec variables instrumentales
Analyse canonique
Mots clés en anglais
Dimensionality reduction
Multivariate Data Analysis
Statistical Learning
Principal Components Analysis
Correspondence Analysis
Analysis with Instrumental Variables
Canonical Analysis
Origine
Importé de halUnités de recherche
Publications correspondantes
Affichage des publications liées par titre, auteur, créateur et discipline
-
Comment analyser les Indications Géographiques Protégées sans préjuger de leurs singularités ? Un cadre d'analyse politico-économique appliqué aux cas des Volailles Fermières des Landes, du Jambon de Bayonne et du Canard à Foie Gras du Sud-Ouest.
JULLIEN, Bernard; SMITH, A.(Communication au Symposium INRA – PSDR "Territoires et enjeux du développement régional 9-11 mars, FR, Lyon)Communication dans un congrès avec actes