A two-sample tree-based test for hierarchically organized genomic signals
RANDRIAMIHAMISON, Nathanaël
Institut de Mathématiques de Toulouse UMR5219 [IMT]
Unité de Mathématiques et Informatique Appliquées de Toulouse [MIAT INRAE]
Institut de Mathématiques de Toulouse UMR5219 [IMT]
Unité de Mathématiques et Informatique Appliquées de Toulouse [MIAT INRAE]
CHAVENT, Marie
Méthodes avancées d’apprentissage statistique et de contrôle [ASTRAL]
Institut de Mathématiques de Bordeaux [IMB]
Voir plus >
Méthodes avancées d’apprentissage statistique et de contrôle [ASTRAL]
Institut de Mathématiques de Bordeaux [IMB]
RANDRIAMIHAMISON, Nathanaël
Institut de Mathématiques de Toulouse UMR5219 [IMT]
Unité de Mathématiques et Informatique Appliquées de Toulouse [MIAT INRAE]
Institut de Mathématiques de Toulouse UMR5219 [IMT]
Unité de Mathématiques et Informatique Appliquées de Toulouse [MIAT INRAE]
CHAVENT, Marie
Méthodes avancées d’apprentissage statistique et de contrôle [ASTRAL]
Institut de Mathématiques de Bordeaux [IMB]
< Réduire
Méthodes avancées d’apprentissage statistique et de contrôle [ASTRAL]
Institut de Mathématiques de Bordeaux [IMB]
Langue
en
Article de revue
Ce document a été publié dans
Journal of the Royal Statistical Society: Series C Applied Statistics. 2024-03-14p. qlae011
Wiley
Résumé en anglais
This article addresses a common type of data encountered in genomic studies, where a signal along a linear chromosome exhibits a hierarchical organization. We propose a novel framework to assess the significance of ...Lire la suite >
This article addresses a common type of data encountered in genomic studies, where a signal along a linear chromosome exhibits a hierarchical organization. We propose a novel framework to assess the significance of dissimilarities between two sets of genomic matrices obtained from distinct biological conditions. Our approach relies on a data representation based on trees. It utilizes tree distances and an aggregation procedure for tests performed at the level of leaf pairs. Numerical experiments demonstrate its statistical validity and its superior accuracy and power compared to alternatives. The method’s effectiveness is illustrated using real-world data from GWAS and Hi-C data.< Réduire
Mots clés en anglais
cophenetic distances
moderated t statistics
p-value aggregation
tree distances
Origine
Importé de halUnités de recherche