Mostrar el registro sencillo del ítem

dc.contributor.advisorThiébaut, Rodolphe
dc.contributor.advisorHejblum, Boris
dc.contributor.authorGAUTHIER, Marine
dc.contributor.otherThiébaut, Rodolphe
dc.contributor.otherHejblum, Boris
dc.contributor.otherVilla-Vialaneix, Nathalie
dc.contributor.otherPicard, Franck
dc.contributor.otherNeuvial, Pierre
dc.date2021-12-02
dc.identifier.urihttp://www.theses.fr/2021BORD0304/abes
dc.identifier.uri
dc.identifier.urihttps://tel.archives-ouvertes.fr/tel-03539399
dc.identifier.nnt2021BORD0304
dc.description.abstractLa technologie RNA-seq s’impose comme le nouveau standard pour la mesure de l’expression génique. Ses variations peuvent être mises en lien avec de nombreuses pathologies ou phénotypes et peuvent être détectées par des méthodes statistiques dites d’analyse différentielle. L’objectif de l’analyse différentielle est d’identifier les gènes dont le niveau d’expression est significativement associé à un ensemble de variables. La complexité grandissante des schémas expérimentaux exige des approches plus flexibles, par la nature des variables à tester et par la prise en compte de covariables, tout en maîtrisant le taux de fausses découvertes. Nous introduisons une nouvelle méthode d’analyse différentielle pour données RNA-seq en masse reposant sur un modèle linéaire à effets mixtes et un test du score en composante de variance. Par une étude de simulations et une analyse d’un jeu de données réelles sur la Tuberculose, il apparaît que notre méthode conserve une bonne puissance statistique et limite le nombre de potentiels faux positifs, comparativement aux méthodes les plus populaires. Tandis que les données RNA-seq en masse correspondent à l’expression moyenne d’une population cellulaire, l’émergence récente de la technologie RNA-seq en cellule unique a permis de mesurer le niveau d’expression des gènes à l’échelle de la cellule offrant ainsi une résolution biologique inédite. La particularité de ce nouveau type de données réside dans le nombre important de zéros et l’hétérogénéité des distributions, souvent multimodales, rendant la modélisation difficile. Afin d’allier flexibilité et absence d’hypothèse distributionnelle, nous proposons une approche basée sur un test d’indépendance conditionnelle qui s’appuie sur une estimation originale des fonctions de distribution conditionnelles par des régressions multiples. Nous l’appliquons à un jeu de données réelles de cellules T CD8+ réactives au SARS-CoV-2, afin d’identifier les gènes différentiellement exprimés dans trois groupes de gravité COVID-19 tout en tenant compte de sept sous-populations cellulaires différentes.
dc.description.abstractEnRNA-seq technology is the new standard for measuring gene expression. Its variations can be linked to many pathologies or phenotypes and can be detected by statistical methods called differential analysis. The purpose of differential analysis is to identify genes whose expression is significantly associated with a set of variables. The increasing complexity of experimental designs requires more flexible approaches, in terms of the nature of the variables to be tested and the covariates to take into account, while controlling the false discovery rate. We introduce a new differential analysis method for bulk RNA-seq data based on a linear mixed effects model and a variance component score test. Through a simulation study and the analysis of a real-world Tuberculosis data set, it is shown that our method retains good statistical power and limits the number of potential false positives, compared to the most popular methods. While bulk RNA-seq data represent the average expression of a cell population, the recent development of single-cell RNA-seq technology allows to measure gene expression at the cell level, providing a new biological resolution. The specificity of this type of data lies in the large number of zeros and the heterogeneity of the distributions, often multimodal, making modelling difficult. In order to combine flexibility and distribution-free tool, we propose an approach based on a conditional independence test which relies on an original estimation of conditional cumulative distribution functions using multiple regressions. We apply it to a real data set of SARS-CoV-2 reactive CD8+ T cells, in order to identify genes differentially expressed in three COVID-19 severity groups while considering seven different cell subpopulations.
dc.language.isofr
dc.subjectAnalyse d’expression différentielle
dc.subjectGène
dc.subjectRNA-Seq en masse
dc.subjectImmunologie
dc.subjectRNA-seq en cellule unique
dc.subjectModèle mixte
dc.subjectTest d’indépendance conditionnelle
dc.subject.enSingle-cell RNA-seq
dc.subject.enGene
dc.subject.enDifferential expression analysis
dc.subject.enImmunology
dc.subject.enBulk RNA-seq
dc.subject.enMixed model
dc.subject.enConditional independence test
dc.titleMéthodes statistiques pour l’analyse différentielle de données RNA-seq en masse et en cellule unique appliquées en immunologie
dc.title.enStatistical methods for differential analysis of bulk and single-cell RNA-seq data applied in immunology
dc.typeThèses de doctorat
dc.contributor.jurypresidentVilla-Vialaneix, Nathalie
bordeaux.hal.laboratoriesBordeaux population Health
bordeaux.type.institutionBordeaux
bordeaux.thesis.disciplineSanté publique Option Biostatistiques
bordeaux.ecole.doctoraleÉcole doctorale Sociétés, politique, santé publique (Bordeaux)
star.origin.linkhttps://www.theses.fr/2021BORD0304
dc.contributor.rapporteurPicard, Franck
dc.contributor.rapporteurNeuvial, Pierre
bordeaux.COinSctx_ver=Z39.88-2004&rft_val_fmt=info:ofi/fmt:kev:mtx:journal&rft.title=M%C3%A9thodes%20statistiques%20pour%20l%E2%80%99analyse%20diff%C3%A9rentielle%20de%20donn%C3%A9es%20RNA-seq%20en%20masse%20et%20en%20cellule%20unique%20appliqu%C3%A9es%20&rft.atitle=M%C3%A9thodes%20statistiques%20pour%20l%E2%80%99analyse%20diff%C3%A9rentielle%20de%20donn%C3%A9es%20RNA-seq%20en%20masse%20et%20en%20cellule%20unique%20appliqu%C3%A9es%2&rft.au=GAUTHIER,%20Marine&rft.genre=unknown


Archivos en el ítem

ArchivosTamañoFormatoVer

No hay archivos asociados a este ítem.

Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem