Afficher la notice abrégée

dc.contributor.advisorSaracco, Jérôme
dc.contributor.advisorChavent, Marie
dc.contributor.authorKUENTZ, Vanessa
dc.contributor.otherHusson, François
dc.date2009-11-20
dc.date.accessioned2020-12-14T21:12:40Z
dc.date.available2020-12-14T21:12:40Z
dc.identifier.urihttp://ori-oai.u-bordeaux1.fr/pdf/2009/KUENTZ_VANESSA_2009.pdf
dc.identifier.urihttps://oskar-bordeaux.fr/handle/20.500.12278/21994
dc.identifier.nnt2009BOR13871
dc.description.abstractCette thèse est consacrée au problème de la réduction de dimension. Cette thématique centrale en Statistique vise à rechercher des sous-espaces de faibles dimensions tout en minimisant la perte d'information contenue dans les données. Tout d'abord, nous nous intéressons à des méthodes de statistique multidimensionnelle dans le cas de variables qualitatives. Nous abordons la question de la rotation en Analyse des Correspondances Multiples (ACM). Nous définissons l'expression analytique de l'angle de rotation planaire optimal pour le critère de rotation choisi. Lorsque le nombre de composantes principales retenues est supérieur à deux, nous utilisons un algorithme de rotations planaires successives de paires de facteurs. Nous proposons également différents algorithmes de classification de variables qualitatives qui visent à optimiser un critère de partitionnement basé sur la notion de rapports de corrélation. Un jeu de données réelles illustre les intérêts pratiques de la rotation en ACM et permet de comparer empiriquement les différents algorithmes de classification de variables qualitatives proposés. Puis nous considérons un modèle de régression semiparamétrique, plus précisément nous nous intéressons à la méthode de régression inverse par tranchage (SIR pour Sliced Inverse Regression). Nous développons une approche basée sur un partitionnement de l'espace des covariables, qui est utilisable lorsque la condition fondamentale de linéarité de la variable explicative est violée. Une seconde adaptation, utilisant le bootstrap, est proposée afin d'améliorer l'estimation de la base du sous-espace de réduction de dimension. Des résultats asymptotiques sont donnés et une étude sur des données simulées démontre la supériorité des approches proposées. Enfin les différentes applications et collaborations interdisciplinaires réalisées durant la thèse sont décrites.
dc.description.abstractEnThis thesis concentrates on dimension reduction approaches, that seek for lower dimensional subspaces minimizing the lost of statistical information. First we focus on multivariate analysis for categorical data. The rotation problem in Multiple Correspondence Analysis (MCA) is treated. We give the analytic expression of the optimal angle of planar rotation for the chosen criterion. If more than two principal components are to be retained, this planar solution is used in a practical algorithm applying successive pairwise planar rotations. Different algorithms for the clustering of categorical variables are also proposed to maximize a given partitioning criterion based on correlation ratios. A real data application highlights the benefits of using rotation in MCA and provides an empirical comparison of the proposed algorithms for categorical variable clustering. Then we study the semiparametric regression method SIR (Sliced Inverse Regression). We propose an extension based on the partitioning of the predictor space that can be used when the crucial linearity condition of the predictor is not verified. We also introduce bagging versions of SIR to improve the estimation of the basis of the dimension reduction subspace. Asymptotic properties of the estimators are obtained and a simulation study shows the good numerical behaviour of the proposed methods. Finally applied multivariate data analysis on various areas is described.
dc.language.isofr
dc.subjectStatistique multidimensionnelle
dc.subjectDonnées qualitatives
dc.subjectRotation
dc.subjectClassification de variables
dc.subjectRégression semiparamétrique
dc.subjectMéthode de régression inverse par tranchage
dc.subjectCondition de linéarité
dc.subjectBootstrap
dc.subject.enMutivariate analysis, categorical data, rotation, variable clustering, semiparametric regression, Sliced Inverse Regression, linearity condition, bootstrap
dc.titleContributions à la réduction de dimension
dc.typeThèses de doctorat
dc.contributor.jurypresidentBercu, Bernard
bordeaux.hal.laboratoriesThèses de l'Université de Bordeaux avant 2014*
bordeaux.institutionUniversité de Bordeaux
bordeaux.type.institutionBordeaux 1
bordeaux.thesis.disciplineMathématiques appliquées, Statistique
bordeaux.ecole.doctoraleÉcole doctorale de mathématiques et informatique (Talence, Gironde)
star.origin.linkhttps://www.theses.fr/2009BOR13871
dc.contributor.rapporteurKiers, Henk H.A.L.
dc.contributor.rapporteurPoggi, Jean-Michel
dc.contributor.rapporteurSaporta, Gilbert
bordeaux.COinSctx_ver=Z39.88-2004&rft_val_fmt=info:ofi/fmt:kev:mtx:journal&rft.title=Contributions%20%C3%A0%20la%20r%C3%A9duction%20de%20dimension&rft.atitle=Contributions%20%C3%A0%20la%20r%C3%A9duction%20de%20dimension&rft.au=KUENTZ,%20Vanessa&rft.genre=unknown


Fichier(s) constituant ce document

FichiersTailleFormatVue

Il n'y a pas de fichiers associés à ce document.

Ce document figure dans la(les) collection(s) suivante(s)

Afficher la notice abrégée