Accelerating metabolic models evaluation with statistical metamodels: application to Salmonella infection models
FRIOUX, Clémence
Pleiade, from patterns to models in computational biodiversity and biotechnology [PLEIADE]
Pleiade, from patterns to models in computational biodiversity and biotechnology [PLEIADE]
HUET, Sylvie
Mathématiques et Informatique Appliquées du Génome à l'Environnement [Jouy-En-Josas] [MaIAGE]
Laboratoire de Psychologie Sociale et Cognitive [LAPSCO]
Université Clermont Auvergne [2017-2020] [UCA [2017-2020]]
Laboratoire d'ingénierie pour les systèmes complexes [UR LISC]
Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement [INRAE]
Mathématiques et Informatique Appliquées du Génome à l'Environnement [Jouy-En-Josas] [MaIAGE]
Laboratoire de Psychologie Sociale et Cognitive [LAPSCO]
Université Clermont Auvergne [2017-2020] [UCA [2017-2020]]
Laboratoire d'ingénierie pour les systèmes complexes [UR LISC]
Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement [INRAE]
LABARTHE, Simon
Pleiade, from patterns to models in computational biodiversity and biotechnology [PLEIADE]
Biodiversité, Gènes & Communautés [BioGeCo]
Mathématiques et Informatique Appliquées du Génome à l'Environnement [Jouy-En-Josas] [MaIAGE]
Mathématiques et Informatique Appliquées du Génome à l'Environnement [Jouy-En-Josas] [MaIAGE]
Voir plus >
Pleiade, from patterns to models in computational biodiversity and biotechnology [PLEIADE]
Biodiversité, Gènes & Communautés [BioGeCo]
Mathématiques et Informatique Appliquées du Génome à l'Environnement [Jouy-En-Josas] [MaIAGE]
Mathématiques et Informatique Appliquées du Génome à l'Environnement [Jouy-En-Josas] [MaIAGE]
FRIOUX, Clémence
Pleiade, from patterns to models in computational biodiversity and biotechnology [PLEIADE]
Pleiade, from patterns to models in computational biodiversity and biotechnology [PLEIADE]
HUET, Sylvie
Mathématiques et Informatique Appliquées du Génome à l'Environnement [Jouy-En-Josas] [MaIAGE]
Laboratoire de Psychologie Sociale et Cognitive [LAPSCO]
Université Clermont Auvergne [2017-2020] [UCA [2017-2020]]
Laboratoire d'ingénierie pour les systèmes complexes [UR LISC]
Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement [INRAE]
Mathématiques et Informatique Appliquées du Génome à l'Environnement [Jouy-En-Josas] [MaIAGE]
Laboratoire de Psychologie Sociale et Cognitive [LAPSCO]
Université Clermont Auvergne [2017-2020] [UCA [2017-2020]]
Laboratoire d'ingénierie pour les systèmes complexes [UR LISC]
Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement [INRAE]
LABARTHE, Simon
Pleiade, from patterns to models in computational biodiversity and biotechnology [PLEIADE]
Biodiversité, Gènes & Communautés [BioGeCo]
Mathématiques et Informatique Appliquées du Génome à l'Environnement [Jouy-En-Josas] [MaIAGE]
Mathématiques et Informatique Appliquées du Génome à l'Environnement [Jouy-En-Josas] [MaIAGE]
Pleiade, from patterns to models in computational biodiversity and biotechnology [PLEIADE]
Biodiversité, Gènes & Communautés [BioGeCo]
Mathématiques et Informatique Appliquées du Génome à l'Environnement [Jouy-En-Josas] [MaIAGE]
Mathématiques et Informatique Appliquées du Génome à l'Environnement [Jouy-En-Josas] [MaIAGE]
MARTINELLI, Julien
Computational systems biology and optimization [Lifeware]
Centre de Bioinformatique [CBIO]
Computational systems biology and optimization [Lifeware]
Centre de Bioinformatique [CBIO]
UGALDE-SALAS, Pablo
Pleiade, from patterns to models in computational biodiversity and biotechnology [PLEIADE]
< Réduire
Pleiade, from patterns to models in computational biodiversity and biotechnology [PLEIADE]
Langue
en
Actes de congrès/Proceedings
Ce document a été publié dans
ESAIM: Proceedings and Surveys. 2023, vol. 73, p. 187-217
EDP Sciences
Résumé
Les modèles numériques et mathématiques sont de plus en plus utilisés en écologie microbienne pour modéliser le devenir de communautés microbiennes dans leur écosystème. Ces modèles permettent de coupler, dans des modèles ...Lire la suite >
Les modèles numériques et mathématiques sont de plus en plus utilisés en écologie microbienne pour modéliser le devenir de communautés microbiennes dans leur écosystème. Ces modèles permettent de coupler, dans des modèles mécanistiques, des informations à l’échelle de l’espèce microbienne, telles que le génome, avec des mécanismes à plus larges échelles, telles que des distributions spatiales ou des gradients de métabolites. De nombreux modèles sont construits à partir de modèles métaboliques qui prédisent le comportement métabolique d’un microbe en résolvant un problème d’optimisation basé sur son génome et son environnement nutritionnel. Cependant, l’analyse de la dynamique des communautés à l’aide de ces modèles métaboliques implique la résolution de ce problème d’optimisation par espèce à chaque pas de temps, ce qui entraîne une charge de calcul importante qui augmente encore de plusieurs ordres de grandeur lorsque des dimensions spatiales sont ajoutées. Dans cet article, nous proposons un cadre statistique basé sur des métamodèles RKHS (Reproducing Kernel Hilbert Space) qui sont utilisés pour fournir des approximations rapides du modèle métabolique original. Le métamodèle peut remplacer l’étape d’optimisation dans la dynamique du système, fournissant des résultats comparables à un coût de calcul beaucoup plus faible. Nous commencerons par construire un modèle de dynamique des systèmes d’un microbiote intestinal simplifié composé d’une souche bactérienne commensale unique en interaction avec l’hôte et confronté à une infection par Salmonella . Ensuite, la méthode d’apprentissage automatique sera présentée, basée sur la méthode ANOVA-RKHS qui permer de sélectionner des variables et d’assurer ainsi la parcimonie du modèle. Un ensemble de données d’entraînement sera construit avec le système dynamique original et les hyperparamètres seront soigneusement choisis pour fournir des approximations rapides et précises. Enfin, la précision de ces métamodèles sera évaluée, notamment en comparant les résultats du système dynamique lorsque le modèle original est remplacé par son métamodèle. Le métamodèle permet une erreur relative globale de 4.71% tout en réduisant la charge de calcul par un facteur d’accélération supérieur à 45, tout en reproduisant correctement le comportement complexe qui se produit pendant l’infection par Salmonella . Ces résultats fournissent une preuve de concept de la potentialité des méthodes d’apprentissage automatique pour donner des approximations rapides des sorties de modèles métaboliques et ouvrent la voie à des modèles spatio-temporels de communautés microbiennes basés sur les EDP, intégrant le métabolisme microbien et les interactions hôte-microbiote-pathogène.< Réduire
Résumé en anglais
Mathematical and numerical models are increasingly used in microbial ecology to model the fate of microbial communities in their ecosystem. These models allow to connect in a mechanistic framework species-level informations, ...Lire la suite >
Mathematical and numerical models are increasingly used in microbial ecology to model the fate of microbial communities in their ecosystem. These models allow to connect in a mechanistic framework species-level informations, such as the microbial genomes, with macro-scale features, such as species spatial distributions or metabolite gradients. Numerous models are built upon specieslevel metabolic models that predict the metabolic behaviour of a microbe by solving an optimization problem knowing its genome and its nutritional environment. However, screening the community dynamics with these metabolic models implies to solve such an optimization problem by species at each time step, leading to a significant computational load further increased by several orders of magnitude when spatial dimensions are added. In this paper, we propose a statistical framework based on Reproducing Kernel Hilbert Space (RKHS) metamodels that are used to provide fast approximations of the original metabolic model. The metamodel can replace the optimization step in the system dynamics, providing comparable outputs at a much lower computational cost. We will first build a system dynamics model of a simplified gut microbiota composed of a unique commensal bacterial strain in interaction with the host and challenged by a Salmonella infection. Then, the machine learning method will be introduced, and particularly the ANOVA-RKHS that will be exploited to achieve variable selection and model parsimony. A training dataset will be constructed with the original system dynamics model and hyper-parameters will be carefully chosen to provide fast and accurate approximations of the original model. Finally, the accuracy of the trained metamodels will be assessed, in particular by comparing the system dynamics outputs when the original model is replaced by its metamodel. The metamodel allows an overall relative error of 4.71% but reducing the computational load by a speed-up factor higher than 45, while correctly reproducing the complex behaviour occurring during Salmonella infection. These results provide a proof-of-concept of the potentiality of machine learning methods to give fast approximations of metabolic model outputs and pave the way towards PDEbased spatio-temporal models of microbial communities and host-microbiota-pathogen interactions.< Réduire
Origine
Importé de halUnités de recherche