Geodesic PCA in the Wasserstein space by convex PCA
hal.structure.identifier | Institut de Mathématiques de Bordeaux [IMB] | |
dc.contributor.author | BIGOT, Jérémie | |
hal.structure.identifier | Centre de modélisation mathématique / Centro de Modelamiento Matemático [Santiago] [CMM] | |
dc.contributor.author | GOUET, Raul | |
hal.structure.identifier | Ecole Nationale de l'Aviation Civile [ENAC] | |
hal.structure.identifier | Institut de Mathématiques de Toulouse UMR5219 [IMT] | |
dc.contributor.author | KLEIN, Thierry | |
hal.structure.identifier | Coordinadora para o Estudo dos Mamíferos Mariños [CEMMA] | |
dc.contributor.author | LOPEZ, Alfredo | |
dc.date.accessioned | 2024-04-04T03:02:25Z | |
dc.date.available | 2024-04-04T03:02:25Z | |
dc.date.issued | 2017-02 | |
dc.identifier.issn | 0246-0203 | |
dc.identifier.uri | https://oskar-bordeaux.fr/handle/20.500.12278/192980 | |
dc.description.abstract | Nous introduisons la méthode d'Analyse en Composantes Principales Géodésiques (GPCA) dans l'espace des mesures de probabilités à support sur la droite réelle, admettant un moment d'ordre deux, et muni de la métrique de Wasserstein. Nous discutons des avantages de cette approche par rapport à une ACP fonctionnelle standard de densités de probabilités dans l'espace de Hilbert des fonctions de carrés intégrable. Nous établissons la consistence de cette méthode en montrant que la GPCA empirique converge vers sa version population lorsque la taille de l'échantillon tend vers l'infini. Une propriété clé dans l'étude de la GPCA est l'isométrie entre l'espace de Wasserstein et un sous-espace convexe fermé de l'ensemble des fonctions de carrés intégrable, par rapport à une mesure de référence appropriée. De ce fait, nous considérons le problème général de l'ACP dans un sous-ensemble convexe fermé d'un espace de Hilbert séparable, qui sert de base à l'analyse de la GPCA. Nous proposons différents exemples illustratifs à partir de modèles statistiques simples pour montrer les bénéfices de cette approche pour l'analyse de données. La méthode est également appliquée à un exemple réel sur les pyramides des âges. | |
dc.description.abstractEn | We introduce the method of Geodesic Principal Component Analysis (GPCA) on the space of probability measures on the line, with finite second moment, endowed with the Wasserstein metric. We discuss the advantages of this approach, over a standard functional PCA of probability densities in the Hilbert space of square-integrable functions. We establish the consistency of the method by showing that the empirical GPCA converges to its population counterpart, as the sample size tends to infinity. A key property in the study of GPCA is the isometry between the Wasserstein space and a closed convex subset of the space of square-integrable functions, with respect to an appropriate measure. Therefore, we consider the general problem of PCA in a closed convex subset of a separable Hilbert space, which serves as basis for the analysis of GPCA and also has interest in its own right. We provide illustrative examples on simple statistical models, to show the benefits of this approach for data analysis. The method is also applied to a real dataset of population pyramids. | |
dc.language.iso | en | |
dc.publisher | Institut Henri Poincaré (IHP) | |
dc.subject.en | Wasserstein space | |
dc.subject.en | Geodesic and Convex Principal Component Analysis | |
dc.subject.en | Fréchet mean | |
dc.subject.en | Functional data analysis | |
dc.subject.en | Geodesic space | |
dc.subject.en | Inference for family of densities | |
dc.title.en | Geodesic PCA in the Wasserstein space by convex PCA | |
dc.type | Article de revue | |
dc.identifier.doi | 10.1214/15-aihp706 | |
dc.subject.hal | Mathématiques [math]/Probabilités [math.PR] | |
dc.subject.hal | Mathématiques [math]/Statistiques [math.ST] | |
bordeaux.journal | Annales de l'Institut Henri Poincaré (B) Probabilités et Statistiques | |
bordeaux.page | 1-26 | |
bordeaux.volume | 53 | |
bordeaux.hal.laboratories | Institut de Mathématiques de Bordeaux (IMB) - UMR 5251 | * |
bordeaux.issue | 1 | |
bordeaux.institution | Université de Bordeaux | |
bordeaux.institution | Bordeaux INP | |
bordeaux.institution | CNRS | |
bordeaux.peerReviewed | oui | |
hal.identifier | hal-01978864 | |
hal.version | 1 | |
hal.popular | non | |
hal.audience | Internationale | |
hal.origin.link | https://hal.archives-ouvertes.fr//hal-01978864v1 | |
bordeaux.COinS | ctx_ver=Z39.88-2004&rft_val_fmt=info:ofi/fmt:kev:mtx:journal&rft.jtitle=Annales%20de%20l'Institut%20Henri%20Poincar%C3%A9%20(B)%20Probabilit%C3%A9s%20et%20Statistiques&rft.date=2017-02&rft.volume=53&rft.issue=1&rft.spage=1-26&rft.epage=1-26&rft.eissn=0246-0203&rft.issn=0246-0203&rft.au=BIGOT,%20J%C3%A9r%C3%A9mie&GOUET,%20Raul&KLEIN,%20Thierry&LOPEZ,%20Alfredo&rft.genre=article |
Files in this item
Files | Size | Format | View |
---|---|---|---|
There are no files associated with this item. |