Classification Ascendante Hiérarchique sous Contrainte de Contiguïté pour l’Analyse de données Hi-C
RANDRIAMIHAMISON, Nathanaël
Unité de Mathématiques et Informatique Appliquées de Toulouse [MIAT INRAE]
Méthodes avancées d’apprentissage statistique et de contrôle [ASTRAL]
Institut de Mathématiques de Toulouse UMR5219 [IMT]
Quality control and dynamic reliability [CQFD]
Unité de Mathématiques et Informatique Appliquées de Toulouse [MIAT INRAE]
Méthodes avancées d’apprentissage statistique et de contrôle [ASTRAL]
Institut de Mathématiques de Toulouse UMR5219 [IMT]
Quality control and dynamic reliability [CQFD]
RANDRIAMIHAMISON, Nathanaël
Unité de Mathématiques et Informatique Appliquées de Toulouse [MIAT INRAE]
Méthodes avancées d’apprentissage statistique et de contrôle [ASTRAL]
Institut de Mathématiques de Toulouse UMR5219 [IMT]
Quality control and dynamic reliability [CQFD]
< Reduce
Unité de Mathématiques et Informatique Appliquées de Toulouse [MIAT INRAE]
Méthodes avancées d’apprentissage statistique et de contrôle [ASTRAL]
Institut de Mathématiques de Toulouse UMR5219 [IMT]
Quality control and dynamic reliability [CQFD]
Language
fr
Thèses de doctorat
Doctoral school
École doctorale Mathématiques, informatique et télécommunications (Toulouse)Abstract
L'organisation spatiale du génome à l'intérieur du noyau des cellules a un impact majeur sur la régulation de l'expression des gènes, avec notamment des implications importantes dans le développement fœtal, la différentiation ...Read more >
L'organisation spatiale du génome à l'intérieur du noyau des cellules a un impact majeur sur la régulation de l'expression des gènes, avec notamment des implications importantes dans le développement fœtal, la différentiation cellulaire ou le développement de maladies. Ceci constitue la motivation initiale de ce travail dont l'objet est l'étude de la structure tri-dimensionnelle du matériel génétique et de ses variations à partir de données Hi-C. Tout d'abord, on se penche sur la modélisation de la structure hiérarchique du génome à partir de données Hi-C. On étudie les extensions d'un outil statistique naturel pour l'examen de structures hiérarchiques, la Classification Ascendante Hiérarchique (CAH), pour justifier son application au Hi-C. Cela permet de justifier la modélisation des structures par des arbres binaires (issues de la CAH). On développe ensuite une méthode de comparaison de deux échantillons d'arbres pour être capable d'identifier des différences significatives.Read less <
English Abstract
Spatial genome organization inside cell nuclei has a major impact over gene expression regulation, with important implications in fetal development, cell differentiation or diseases development such as cancer. This fact ...Read more >
Spatial genome organization inside cell nuclei has a major impact over gene expression regulation, with important implications in fetal development, cell differentiation or diseases development such as cancer. This fact is the starting point of this work whose aim is the study of three-dimensional structure of genome and of its variations using Hi-C data. First, we study the question of modeling the hierarchical structure of genome using Hi-C data. To do this, we considerate the extensions of a natural statistical tool when studying hierarchical structures, the Hierarchical Agglomerative Clustering (HAC), in order to justify its application to Hi-C data. This part justifies the modeling of structures by binary trees resulting from the HAC process. We then develop a method for comparing two samples of trees in order to be able to identify differences in structures between biological conditions with statistical guarantees.Read less <
Keywords
Classification ascendante hiérarchique
Contrainte de contiguïté
Dendrogrammes
Comparaisons d'arbres
Comparaisons de moyennes multivariées
English Keywords
Hierarchical Agglomerative Clustering
Contiguity constraint
Dendrograms
Tree comparisons
Multivariate means comparisons
Origin
Hal imported