hal.structure.identifier | Métabolisme et Xénobiotiques [ToxAlim-MeX] | |
hal.structure.identifier | MetaboHUB-MetaToul | |
dc.contributor.author | LAISNEY, Guillaume | |
hal.structure.identifier | Plateforme Bordeaux Metabolome | |
hal.structure.identifier | Biologie du fruit et pathologie [BFP] | |
hal.structure.identifier | MetaboHUB | |
dc.contributor.author | BENABEN, David | |
hal.structure.identifier | Université Clermont Auvergne [UCA] | |
hal.structure.identifier | Mésocentre Clermont Auvergne | |
dc.contributor.author | BELLEMBOIS, Thomas | |
hal.structure.identifier | Unité de recherche sur les Biopolymères, Interactions Assemblages [BIA] | |
hal.structure.identifier | Plateforme de Profilage Métabolique et de Métabolomique [P2M2] | |
dc.contributor.author | BILLET, Kevin | |
hal.structure.identifier | Université de Rennes - UFR Sciences de la vie et de l'environnement [UR SVE] | |
hal.structure.identifier | Plateforme de Profilage Métabolique et de Métabolomique [P2M2] | |
hal.structure.identifier | MetaboHUB-Grand-Ouest | |
hal.structure.identifier | Institut de Génétique, Environnement et Protection des Plantes [IGEPP] | |
dc.contributor.author | BOUCHEREAU, Alain | |
hal.structure.identifier | Institut de Génétique, Environnement et Protection des Plantes [IGEPP] | |
hal.structure.identifier | Plateforme bioinformatique GenOuest [Rennes] | |
dc.contributor.author | BOUDET, Matéo | |
hal.structure.identifier | Plateforme Bordeaux Metabolome | |
hal.structure.identifier | Biologie du fruit et pathologie [BFP] | |
hal.structure.identifier | Université de Bordeaux [UB] | |
hal.structure.identifier | MetaboHUB-Bordeaux | |
dc.contributor.author | CABASSON, Cécile | |
hal.structure.identifier | Plateforme de Profilage Métabolique et de Métabolomique [P2M2] | |
hal.structure.identifier | Institut de Génétique, Environnement et Protection des Plantes [IGEPP] | |
hal.structure.identifier | MetaboHUB-Grand-Ouest | |
dc.contributor.author | DELLERO, Younes | |
hal.structure.identifier | Métabolisme et Xénobiotiques [ToxAlim-MeX] | |
hal.structure.identifier | MetaboHUB-MetaToul | |
dc.contributor.author | FRAINAY, Clément | |
hal.structure.identifier | Université Clermont Auvergne [UCA] | |
hal.structure.identifier | Mésocentre Clermont Auvergne | |
hal.structure.identifier | Plateforme Auvergne Bioinformatique [AuBi] | |
hal.structure.identifier | Institut Français de Bioinformatique [IFB-core] | |
dc.contributor.author | GOUE, Nadia | |
hal.structure.identifier | Unité de Nutrition Humaine [UNH] | |
hal.structure.identifier | MetaboHUB-Clermont | |
dc.contributor.author | GUILHOT, Nicolas | |
hal.structure.identifier | Laboratoire d'étude des Résidus et Contaminants dans les Aliments [LABERCA] | |
hal.structure.identifier | Plateforme Metabolomics, Lipidomics and Steroidomics Analysis [MELISA] | |
dc.contributor.author | GUITTON, Yann | |
hal.structure.identifier | Université Clermont Auvergne [UCA] | |
hal.structure.identifier | Mésocentre Clermont Auvergne | |
dc.contributor.author | MAHUL, Antoine | |
hal.structure.identifier | MetaToul Agromix | |
hal.structure.identifier | Laboratoire de Recherche en Sciences Végétales [LRSV] | |
hal.structure.identifier | MetaboHUB-MetaToul | |
dc.contributor.author | MARTI, Guillaume | |
hal.structure.identifier | Unité de Nutrition Humaine [UNH] | |
hal.structure.identifier | MetaboHUB-Clermont | |
dc.contributor.author | PAULHE, Nils | |
hal.structure.identifier | Plateforme Bordeaux Metabolome | |
hal.structure.identifier | Biologie du fruit et pathologie [BFP] | |
hal.structure.identifier | MetaboHUB-Bordeaux | |
dc.contributor.author | PRIGENT, Sylvain | |
hal.structure.identifier | Unité de Nutrition Humaine [UNH] | |
hal.structure.identifier | MetaboHUB-Clermont | |
dc.contributor.author | SOUC, Faustine | |
hal.structure.identifier | Unité de recherche sur les Biopolymères, Interactions Assemblages [BIA] | |
dc.contributor.author | WEBER, Magalie | |
hal.structure.identifier | Unité de Nutrition Humaine [UNH] | |
hal.structure.identifier | MetaboHUB-Clermont | |
dc.contributor.author | GIACOMONI, Franck | |
hal.structure.identifier | Institut de Génétique, Environnement et Protection des Plantes [IGEPP] | |
hal.structure.identifier | Plateforme de Profilage Métabolique et de Métabolomique [P2M2] | |
hal.structure.identifier | MetaboHUB-Grand-Ouest | |
dc.contributor.author | FILANGI, Olivier | |
dc.date.issued | 2025 | |
dc.date.conference | 2025-06-10 | |
dc.description.abstract | L’annotation de la littérature scientifique sur les matrices végétales représente un défi majeur pour la contextualisation des données en métabolomique. À ce jour, il n’existe pas de système d’indexation standardisé pour les espèces végétales, contrairement au domaine médical. Des initiatives comme Planteome, qui développe des ontologies spécialisées pour les plantes, demeurent donc largement sous-exploitées.Face à ce constat, le projet "FORVM Plants" propose de recourir à des modèles de langage (LLM) afin d’établir des associations entre composés chimiques et concepts ontologiques. Cette approche vise à améliorer l’interprétation des données expérimentales issues de matrices végétales en métabolomique. Pour surmonter le manque d’annotation, une méthode d’annotation automatique de la littérature scientifique par des termes ontologiques, basée sur la similarité sémantique des LLM, est proposée. Ces modèles sont capables de saisir le sens des mots et des phrases au-delà de leur simple forme lexicale.Cette stratégie s’appuie également sur la méthodologie développée dans le projet FORVM Disease, qui permet d’établir des associations statistiquement significatives entre composés chimiques et concepts de l’ontologie MeSH (Medical Subject Headings). L’intégration de ces approches ouvre de nouvelles perspectives pour la contextualisation des données expérimentales, notamment sur les plateformes de métabolomique.Les premiers résultats, obtenus grâce à la plateforme Big Data Metabolomics Semantic Data Lake, ont permis de générer des annotations et des associations pertinentes pour l’identification de biomarqueurs. Actuellement, ces connaissances sont en cours de validation dans trois domaines d’application : la réponse des Brassicacées au stress hydrique et osmotique, la caractérisation des variétés de cannabis riches en THC et en CBD, ainsi que l’étude du métabolisme redox des tomates. Cette stratégie innovante offre ainsi un cadre prometteur pour l’exploitation des ontologies végétales et l’extraction de connaissances à grande échelle dans le domaine de la métabolomique. | |
dc.description.abstractEn | The annotation of scientific literature on plant matrices represents a major challenge for the contextualization of data in metabolomics. Unlike the medical field, there is currently no standardized indexing system for plant species. As a result, initiatives such as Planteome, which develops specialized ontologies for plants, remain largely underutilized.To address this gap, the "FORVM Plants" project proposes the use of language models (LLMs) to establish associations between chemical compounds and ontological concepts. This approach aims to improve the interpretation of experimental data derived from plant matrices in metabolomics. To overcome the lack of annotation, an automatic annotation method based on the semantic similarity capabilities of LLMs is proposed, enabling the assignment of ontological terms to scientific literature. These models can capture the meaning of words and phrases beyond their lexical form.This strategy also builds upon the methodology developed in the FORVM Disease project, which establishes statistically significant associations between chemical compounds and concepts from the MeSH (Medical Subject Headings) ontology. Integrating these approaches opens new perspectives for the contextualization of experimental data, particularly within metabolomics platforms.Preliminary results, obtained using the Big Data Metabolomics Semantic Data Lake platform, have enabled the generation of relevant annotations and associations for biomarker identification. Currently, this knowledge is being validated in three application areas: the response of Brassicaceae to water and osmotic stress, the characterization of cannabis varieties rich in THC and CBD, and the study of redox metabolism in tomatoes. This innovative strategy thus offers a promising framework for leveraging plant ontologies and extracting large-scale knowledge in the field of metabolomics. | |
dc.language.iso | en | |
dc.rights.uri | http://hal.archives-ouvertes.fr/licences/publicDomain/ | |
dc.subject.en | Metabolomic | |
dc.subject.en | Big data | |
dc.subject.en | Semantic web | |
dc.subject.en | IA | |
dc.subject.en | Knowlede Graph | |
dc.subject.en | Datalake | |
dc.title.en | FORVM Plants | |
dc.title.en | Annotation of scientific literature to contextualize plant metabolism data | |
dc.type | Autre communication scientifique (congrès sans actes - poster - séminaire...) | |
dc.subject.hal | Informatique [cs]/Bio-informatique [q-bio.QM] | |
dc.subject.hal | Informatique [cs]/Intelligence artificielle [cs.AI] | |
dc.subject.hal | Informatique [cs]/Calcul parallèle, distribué et partagé [cs.DC] | |
dc.subject.hal | Sciences du Vivant [q-bio]/Biologie végétale/Amélioration des plantes | |
bordeaux.page | 1-1 | |
bordeaux.conference.title | RFMF 2025 - 17èmes journées scientifiques du Réseau Francophone de Métabolomique et Fluxomique | |
bordeaux.country | FR | |
bordeaux.conference.city | Paris | |
bordeaux.peerReviewed | oui | |
hal.identifier | hal-05121234 | |
hal.version | 1 | |
hal.invited | non | |
hal.proceedings | non | |
hal.conference.end | 2025-06-13 | |
hal.popular | non | |
hal.audience | Internationale | |
hal.origin.link | https://hal.archives-ouvertes.fr//hal-05121234v1 | |
bordeaux.COinS | ctx_ver=Z39.88-2004&rft_val_fmt=info:ofi/fmt:kev:mtx:journal&rft.date=2025&rft.spage=1-1&rft.epage=1-1&rft.au=LAISNEY,%20Guillaume&BENABEN,%20David&BELLEMBOIS,%20Thomas&BILLET,%20Kevin&BOUCHEREAU,%20Alain&rft.genre=conference | |