Show simple item record

hal.structure.identifierMétabolisme et Xénobiotiques [ToxAlim-MeX]
hal.structure.identifierMetaboHUB-MetaToul
dc.contributor.authorLAISNEY, Guillaume
hal.structure.identifierPlateforme Bordeaux Metabolome
hal.structure.identifierBiologie du fruit et pathologie [BFP]
hal.structure.identifierMetaboHUB
dc.contributor.authorBENABEN, David
hal.structure.identifierUniversité Clermont Auvergne [UCA]
hal.structure.identifierMésocentre Clermont Auvergne
dc.contributor.authorBELLEMBOIS, Thomas
hal.structure.identifierUnité de recherche sur les Biopolymères, Interactions Assemblages [BIA]
hal.structure.identifierPlateforme de Profilage Métabolique et de Métabolomique [P2M2]
dc.contributor.authorBILLET, Kevin
hal.structure.identifierUniversité de Rennes - UFR Sciences de la vie et de l'environnement [UR SVE]
hal.structure.identifierPlateforme de Profilage Métabolique et de Métabolomique [P2M2]
hal.structure.identifierMetaboHUB-Grand-Ouest
hal.structure.identifierInstitut de Génétique, Environnement et Protection des Plantes [IGEPP]
dc.contributor.authorBOUCHEREAU, Alain
hal.structure.identifierInstitut de Génétique, Environnement et Protection des Plantes [IGEPP]
hal.structure.identifierPlateforme bioinformatique GenOuest [Rennes]
dc.contributor.authorBOUDET, Matéo
hal.structure.identifierPlateforme Bordeaux Metabolome
hal.structure.identifierBiologie du fruit et pathologie [BFP]
hal.structure.identifierUniversité de Bordeaux [UB]
hal.structure.identifierMetaboHUB-Bordeaux
dc.contributor.authorCABASSON, Cécile
hal.structure.identifierPlateforme de Profilage Métabolique et de Métabolomique [P2M2]
hal.structure.identifierInstitut de Génétique, Environnement et Protection des Plantes [IGEPP]
hal.structure.identifierMetaboHUB-Grand-Ouest
dc.contributor.authorDELLERO, Younes
hal.structure.identifierMétabolisme et Xénobiotiques [ToxAlim-MeX]
hal.structure.identifierMetaboHUB-MetaToul
dc.contributor.authorFRAINAY, Clément
hal.structure.identifierUniversité Clermont Auvergne [UCA]
hal.structure.identifierMésocentre Clermont Auvergne
hal.structure.identifierPlateforme Auvergne Bioinformatique [AuBi]
hal.structure.identifierInstitut Français de Bioinformatique [IFB-core]
dc.contributor.authorGOUE, Nadia
hal.structure.identifierUnité de Nutrition Humaine [UNH]
hal.structure.identifierMetaboHUB-Clermont
dc.contributor.authorGUILHOT, Nicolas
hal.structure.identifierLaboratoire d'étude des Résidus et Contaminants dans les Aliments [LABERCA]
hal.structure.identifierPlateforme Metabolomics, Lipidomics and Steroidomics Analysis [MELISA]
dc.contributor.authorGUITTON, Yann
hal.structure.identifierUniversité Clermont Auvergne [UCA]
hal.structure.identifierMésocentre Clermont Auvergne
dc.contributor.authorMAHUL, Antoine
hal.structure.identifierMetaToul Agromix
hal.structure.identifierLaboratoire de Recherche en Sciences Végétales [LRSV]
hal.structure.identifierMetaboHUB-MetaToul
dc.contributor.authorMARTI, Guillaume
hal.structure.identifierUnité de Nutrition Humaine [UNH]
hal.structure.identifierMetaboHUB-Clermont
dc.contributor.authorPAULHE, Nils
hal.structure.identifierPlateforme Bordeaux Metabolome
hal.structure.identifierBiologie du fruit et pathologie [BFP]
hal.structure.identifierMetaboHUB-Bordeaux
dc.contributor.authorPRIGENT, Sylvain
hal.structure.identifierUnité de Nutrition Humaine [UNH]
hal.structure.identifierMetaboHUB-Clermont
dc.contributor.authorSOUC, Faustine
hal.structure.identifierUnité de recherche sur les Biopolymères, Interactions Assemblages [BIA]
dc.contributor.authorWEBER, Magalie
hal.structure.identifierUnité de Nutrition Humaine [UNH]
hal.structure.identifierMetaboHUB-Clermont
dc.contributor.authorGIACOMONI, Franck
hal.structure.identifierInstitut de Génétique, Environnement et Protection des Plantes [IGEPP]
hal.structure.identifierPlateforme de Profilage Métabolique et de Métabolomique [P2M2]
hal.structure.identifierMetaboHUB-Grand-Ouest
dc.contributor.authorFILANGI, Olivier
dc.date.issued2025
dc.date.conference2025-06-10
dc.description.abstractL’annotation de la littérature scientifique sur les matrices végétales représente un défi majeur pour la contextualisation des données en métabolomique. À ce jour, il n’existe pas de système d’indexation standardisé pour les espèces végétales, contrairement au domaine médical. Des initiatives comme Planteome, qui développe des ontologies spécialisées pour les plantes, demeurent donc largement sous-exploitées.Face à ce constat, le projet "FORVM Plants" propose de recourir à des modèles de langage (LLM) afin d’établir des associations entre composés chimiques et concepts ontologiques. Cette approche vise à améliorer l’interprétation des données expérimentales issues de matrices végétales en métabolomique. Pour surmonter le manque d’annotation, une méthode d’annotation automatique de la littérature scientifique par des termes ontologiques, basée sur la similarité sémantique des LLM, est proposée. Ces modèles sont capables de saisir le sens des mots et des phrases au-delà de leur simple forme lexicale.Cette stratégie s’appuie également sur la méthodologie développée dans le projet FORVM Disease, qui permet d’établir des associations statistiquement significatives entre composés chimiques et concepts de l’ontologie MeSH (Medical Subject Headings). L’intégration de ces approches ouvre de nouvelles perspectives pour la contextualisation des données expérimentales, notamment sur les plateformes de métabolomique.Les premiers résultats, obtenus grâce à la plateforme Big Data Metabolomics Semantic Data Lake, ont permis de générer des annotations et des associations pertinentes pour l’identification de biomarqueurs. Actuellement, ces connaissances sont en cours de validation dans trois domaines d’application : la réponse des Brassicacées au stress hydrique et osmotique, la caractérisation des variétés de cannabis riches en THC et en CBD, ainsi que l’étude du métabolisme redox des tomates. Cette stratégie innovante offre ainsi un cadre prometteur pour l’exploitation des ontologies végétales et l’extraction de connaissances à grande échelle dans le domaine de la métabolomique.
dc.description.abstractEnThe annotation of scientific literature on plant matrices represents a major challenge for the contextualization of data in metabolomics. Unlike the medical field, there is currently no standardized indexing system for plant species. As a result, initiatives such as Planteome, which develops specialized ontologies for plants, remain largely underutilized.To address this gap, the "FORVM Plants" project proposes the use of language models (LLMs) to establish associations between chemical compounds and ontological concepts. This approach aims to improve the interpretation of experimental data derived from plant matrices in metabolomics. To overcome the lack of annotation, an automatic annotation method based on the semantic similarity capabilities of LLMs is proposed, enabling the assignment of ontological terms to scientific literature. These models can capture the meaning of words and phrases beyond their lexical form.This strategy also builds upon the methodology developed in the FORVM Disease project, which establishes statistically significant associations between chemical compounds and concepts from the MeSH (Medical Subject Headings) ontology. Integrating these approaches opens new perspectives for the contextualization of experimental data, particularly within metabolomics platforms.Preliminary results, obtained using the Big Data Metabolomics Semantic Data Lake platform, have enabled the generation of relevant annotations and associations for biomarker identification. Currently, this knowledge is being validated in three application areas: the response of Brassicaceae to water and osmotic stress, the characterization of cannabis varieties rich in THC and CBD, and the study of redox metabolism in tomatoes. This innovative strategy thus offers a promising framework for leveraging plant ontologies and extracting large-scale knowledge in the field of metabolomics.
dc.language.isoen
dc.rights.urihttp://hal.archives-ouvertes.fr/licences/publicDomain/
dc.subject.enMetabolomic
dc.subject.enBig data
dc.subject.enSemantic web
dc.subject.enIA
dc.subject.enKnowlede Graph
dc.subject.enDatalake
dc.title.enFORVM Plants
dc.title.enAnnotation of scientific literature to contextualize plant metabolism data
dc.typeAutre communication scientifique (congrès sans actes - poster - séminaire...)
dc.subject.halInformatique [cs]/Bio-informatique [q-bio.QM]
dc.subject.halInformatique [cs]/Intelligence artificielle [cs.AI]
dc.subject.halInformatique [cs]/Calcul parallèle, distribué et partagé [cs.DC]
dc.subject.halSciences du Vivant [q-bio]/Biologie végétale/Amélioration des plantes
bordeaux.page1-1
bordeaux.conference.titleRFMF 2025 - 17èmes journées scientifiques du Réseau Francophone de Métabolomique et Fluxomique
bordeaux.countryFR
bordeaux.conference.cityParis
bordeaux.peerReviewedoui
hal.identifierhal-05121234
hal.version1
hal.invitednon
hal.proceedingsnon
hal.conference.end2025-06-13
hal.popularnon
hal.audienceInternationale
hal.origin.linkhttps://hal.archives-ouvertes.fr//hal-05121234v1
bordeaux.COinSctx_ver=Z39.88-2004&rft_val_fmt=info:ofi/fmt:kev:mtx:journal&rft.date=2025&rft.spage=1-1&rft.epage=1-1&rft.au=LAISNEY,%20Guillaume&BENABEN,%20David&BELLEMBOIS,%20Thomas&BILLET,%20Kevin&BOUCHEREAU,%20Alain&rft.genre=conference


Files in this item

FilesSizeFormatView

There are no files associated with this item.

This item appears in the following Collection(s)

Show simple item record