Transport optimal régularisé pour l'estimation des poids dans des modèles de mélange, et application à la cytométrie en flux
Idioma
en
Thèses de doctorat
Escuela doctoral
École doctorale de mathématiques et informatique (Talence, Gironde ; 1991-....)Resumen
Les modèles de mélange permettent de représenter différentes sous-populations au sein d’un ensemble d’individus. Dans ces modèles, le paramètre des poids quantifie la proportion des différentes sous-populations au sein de ...Leer más >
Les modèles de mélange permettent de représenter différentes sous-populations au sein d’un ensemble d’individus. Dans ces modèles, le paramètre des poids quantifie la proportion des différentes sous-populations au sein de la population générale représentée par le mélange. Dans cette thèse, nous développons des outils pour l’estimation de ce paramètre des poids. Les méthodes proposées dans ce document reposent sur le coût de transport optimal entre mesures de probabilités. Régulariser par l’entropie le problème de transport optimal permet d’en accélérer le calcul effectif. Les propriétés théoriques du coût de transport, et l’accélération algorithmique permise par le terme de régularisation, font du coût de transport régularisé un outil potentiellement efficace en estimation statistique. Dans cette thèse, on étudie une famille d’estimateurs des poids, où chaque estimateur est défini par le minimum d’une fonction faisant intervenir un coût de transport régularisé. Les travaux présentés dans cette thèse sont organisés selon trois axes. Tout d’abord, on utilise ces nouveaux estimateurs des poids pour le traitement de mesures de cytométrie en flux. Dans ce cadre applicatif, le modèle de mélange représente un ensemble de cellules biologiques, et chaque composante du mélange représente une certaine sous-population. On aborde ensuite le développement d’algorithmes efficaces pour le calcul des estimateurs proposés. On étudiera particulièrement des algorithmes stochastiques afin de minimiser les coûts de transport régularisés définissant les estimateurs des poids. Enfin, on s’attache à étudier l’impact statistique du terme de régularisation entropique ajouté au problème de transport optimal. Cette étude se fait pour l’estimation du coût de transport, ainsi que pour l’estimation des poids dans un modèle de mélange. Notre analyse nous permet de proposer un choix du paramètre de régularisation dépendant du nombre d’observations et de leur dimension.< Leer menos
Resumen en inglés
Mixture models are relevant to represent several sub-populations inside a global population. In these models, the weights parameter accounts for the proportions of the different sub-populations that compose the global ...Leer más >
Mixture models are relevant to represent several sub-populations inside a global population. In these models, the weights parameter accounts for the proportions of the different sub-populations that compose the global population. In this thesis, we develop new tools for the estimation of the weights parameter. Our developments are based on the notion of optimal transport cost between probability distributions. Recently, a regularized version of the optimal transport cost has demonstrated its computational efficiency. The theoretical properties of the optimal transport cost, and the computational improvement due to the regularizing term, make the regularized optimal transport cost a potentially effective tool for statistical estimation. The weights estimators introduced in this thesis, are defined as solutions to minimization problems involving regularized optimal transport costs. The works presented in this document revolve around three axes. First, we apply a new weights estimator on flow cytometry measurements. In this context, we study a population of cells represented by a mixture model, where each component of the model corresponds to a specific sub-population of cells. Second, we endeavor to design efficient algorithms to compute the proposed estimators. We focus on stochastic approaches to minimize the regularized optimal transport costs that define the weights estimators studied. Finally, we study the statistical impact of the regularization term added to the optimal transport problem. We address this point through the cases of the optimal transport cost estimation problem, and the weights estimation problem in mixture models. Our study results in a choice of the regularization parameter that depends on the number of observations available and their dimension< Leer menos
Palabras clave
Transport optimal
Régularisation entropique
Modèles de mélange
Estimation des poids
Cytométrie en flux
Algorithme stochastique
Palabras clave en inglés
Optimal transport
Entropic regularization
Mixture models
Weights estimation
Flow cytometry
Stochastic algorithm
Orígen
Importado de HalCentros de investigación