Régression inverse par tranches sur flux de données
Langue
fr
Communication dans un congrès
Ce document a été publié dans
44e Journées de Statistique, 44e Journées de Statistique, 44e Journées de Statistique, 2012-05-21, Bruxelles. 2012p. 7 p.
Résumé
Dans cette communication, nous nous concentrons sur des données arrivant séquentiellement par bloc. Nous supposons la présence d'un modèle semi-paramétrique sous-jacent incluant une direction EDR (Effective Dimension ...Lire la suite >
Dans cette communication, nous nous concentrons sur des données arrivant séquentiellement par bloc. Nous supposons la présence d'un modèle semi-paramétrique sous-jacent incluant une direction EDR (Effective Dimension Reduction) commune dans chaque bloc. Nous proposons une approche SIR (Sliced Inverse Regression pour régression inverse par tranches) adaptative afin d'estimer b. L'estimateur proposé est plus rapide qu'une application séquentielle de la méthode SIR à l'union des blocs disponibles. Nous montrons la convergence en probabilité et la normalité asymptotique de cet estimateur. Dans une simulation, nous illustrons le bon comportement numérique de notre approche. Nous fournissons également des graphiques permettant de détecter s'il existe une dérive de la direction EDR ou bien des blocs de données aberrantes, et nous illustrons notre approche avec différents scénarios. Quelques extensions possibles de cette méthode sont discutées en conclusion. / In this communication, we consider block-wise evolving data streams. When a semiparametric regression model involving a common dimension reduction direction is assumed for each block, we propose an adaptive SIR (Sliced Inverse Regression) estimator of B. This estimator is faster than usual SIR applied to the union of all the blocks, both from computational complexity and running time points of view. We show the consistency of our estimator at the root-n rate and give its asymptotic distribution. In a simulation study, we illustrate the good numerical behavior of the estimator. We also provide a graphical tool in order to detect if there exists a drift of the dimension reduction direction or some aberrant blocks of data. We illustrate our approach with various scenarios. Finally, possible extensions of this method are given.< Réduire
Mots clés
analyse de données
méthode d'analyse
analyse statistique
Sliced Inverse Regression
flux de données
Origine
Importé de halUnités de recherche