Méthodes linéaires de Réduction de Dimension

FRANC, Alain

La plateforme OSKAR Bordeaux évolue pour rejoindre l'archive ouverte HAL. Retrouvez tous vos dépôts sur le nouveau portail HAL UB : https://u-bordeaux.hal.science/. Pour toute aide ou information, contactez-nous info@oskar-bordeaux.fr

Afficher la notice abrégée

hal.structure.identifier	Biodiversité, Gènes & Communautés [BioGeCo]
hal.structure.identifier	Pleiade, from patterns to models in computational biodiversity and biotechnology [PLEIADE]
dc.contributor.author	FRANC, Alain
dc.date.created	2022-09-23
dc.date.issued	2023-05-23
dc.description.abstract	Ce document brosse un panorama des méthodes linéaires de l'Analyse de données multivariées. Il s'agit d'un domaine ancien et classique, bien établi depuis les années 60, et redevenu d'actualité en tant qu'étape clé dans l'apprentissage statistique. On peut considérer ces méthodes comme faisant partie d'une approche algébrique de l'apprentissage statistique ou bien comme une réduction de dimension avec une tonalité plus géométrique. Ces deux approches sont étroitement liées : il est plus facile d'apprendre des patterns des données dans des espaces à faible dimension que dans des espaces à grande dimension. Nous montrons comment une apparente diversité de méthodes et outils se réduit en fait pour un tableau à une seule méthode : l'Analyse en Composantes Principales, avec la SVD (Singular Value Decomposition), de telle sorte que les efforts d'optimisation des codes pour l'analyse de jeux de données massives pourraient eut se focaliser sur cette méthode centrale partagée, au bénéfice de toutes les méthodes. Une extension à l'étude de plusieurs tableaux est présentée (Analyse canonique).
dc.description.abstractEn	These notes are an overview of some classical linear methods in Multivariate Data Analysis. This is a good old domain, well established since the 60's, and refreshed timely as a key step in statistical learning. It can be presented as part of statistical learning, or as dimensionality reduction with a geometric flavor. Both approaches are tightly linked: it is easier to learn patterns from data in low dimensional spaces than in high-dimensional spaces. It is shown how a diversity of methods and tools boil down to a single core methods, PCA with SVD, such that the efforts to optimize codes for analyzing massive data sets like distributed memory and task-based programming or to improve the efficiency of the algorithms like Randomised SVD can focus on this shared core method, and benefit to all methods.
dc.language.iso	en
dc.subject	Réduction de dimension
dc.subject	Analyse de données multivariées
dc.subject	Apprentissage statistique
dc.subject	Analyse en Composantes Principales
dc.subject	Analyse Factorielle des Correspondances
dc.subject	Analyse avec variables instrumentales
dc.subject	Analyse canonique
dc.subject.en	Dimensionality reduction
dc.subject.en	Multivariate Data Analysis
dc.subject.en	Statistical Learning
dc.subject.en	Principal Components Analysis
dc.subject.en	Correspondence Analysis
dc.subject.en	Analysis with Instrumental Variables
dc.subject.en	Canonical Analysis
dc.title	Méthodes linéaires de Réduction de Dimension
dc.title.en	Linear Dimensionality Reduction
dc.type	Rapport
dc.subject.hal	Mathématiques [math]/Analyse numérique [math.NA]
dc.subject.hal	Mathématiques [math]/Statistiques [math.ST]
dc.identifier.arxiv	2209.13597
bordeaux.page	99
bordeaux.type.institution	Inria Bordeaux Sud-Ouest
bordeaux.type.report	rr
hal.identifier	hal-03784623
hal.version	1
hal.origin.link	https://hal.archives-ouvertes.fr//hal-03784623v1
bordeaux.COinS	ctx_ver=Z39.88-2004&rft_val_fmt=info:ofi/fmt:kev:mtx:journal&rft.title=M%C3%A9thodes%20lin%C3%A9aires%20de%20R%C3%A9duction%20de%20Dimension&rft.atitle=M%C3%A9thodes%20lin%C3%A9aires%20de%20R%C3%A9duction%20de%20Dimension&rft.date=2023-05-23&rft.spage=99&rft.epage=99&rft.au=FRANC,%20Alain&rft.genre=unknown

Fichier(s) constituant ce document

Fichiers	Taille	Format	Vue
Il n'y a pas de fichiers associés à ce document.

Ce document figure dans la(les) collection(s) suivante(s)

BioGeCo (Biodiversité Gènes & Communautés) - UMR 1202

Afficher la notice abrégée

Méthodes linéaires de Réduction de Dimension

Fichier(s) constituant ce document

Ce document figure dans la(les) collection(s) suivante(s)

Publications correspondantes

Cours d'analyse spatiale. Série 1 : Analyses des structures et des dynamiques de l'espace ; Série 2 : Analyse des constructions idéologiques l'espace ; Annexes cartographiques ﻿

Analyser les textes à l’ère des humanités numériques. Quelques questions pour l’analyse statistique des données textuelles. ﻿

Comment analyser les Indications Géographiques Protégées sans préjuger de leurs singularités ? Un cadre d'analyse politico-économique appliqué aux cas des Volailles Fermières des Landes, du Jambon de Bayonne et du Canard à Foie Gras du Sud-Ouest. ﻿

Cours d'analyse spatiale. Série 1 : Analyses des structures et des dynamiques de l'espace ; Série 2 : Analyse des constructions idéologiques l'espace ; Annexes cartographiques

Analyser les textes à l’ère des humanités numériques. Quelques questions pour l’analyse statistique des données textuelles.

Comment analyser les Indications Géographiques Protégées sans préjuger de leurs singularités ? Un cadre d'analyse politico-économique appliqué aux cas des Volailles Fermières des Landes, du Jambon de Bayonne et du Canard à Foie Gras du Sud-Ouest.