Afficher la notice abrégée

dc.contributor.advisorFerraro, Pascal
dc.contributor.authorGAILLARD, Anne-Laure
dc.contributor.otherGiraud, Mathieu
dc.date2011-11-30
dc.date.accessioned2020-12-14T21:10:19Z
dc.date.available2020-12-14T21:10:19Z
dc.identifier.urihttp://ori-oai.u-bordeaux1.fr/pdf/2011/GAILLARD_ANNE-LAURE_2011.pdf
dc.identifier.urihttps://oskar-bordeaux.fr/handle/20.500.12278/21589
dc.identifier.nnt2011BOR14381
dc.description.abstractAvec l’explosion de la quantité de données biologiques disponible, développer de nouvelles méthodes de traitements efficaces est une problématique majeure en bioinformatique. De nombreuses structures biologiques sont modélisées par des structures arborescentes telles que les structures secondaires d’ARN et l’architecture des plantes. Ces structures contiennent des motifs répétés au sein même de leur structure mais également d’une structure à l’autre. Nous proposons d’exploiter cette propriété fondamentale afin d’améliorer le stockage et le traitement de tels objets.En nous inspirant du principe de filtres sur les séquences, nous définissons dans cette thèse une méthode de filtrage sur les arborescences ordonnées permettant de rechercher efficacement dans une base de données un ensemble d’arborescences ordonnées proches d’une arborescence requête. La méthode se base sur un découpage de l’arborescence en graines et sur une recherche de graines communes entre les structures. Nous définissons et résolvons le problème de chainage maximum sur des arborescences. Nous proposons dans le cas des structures secondaires d’ARN une définition de graines (l−d) centrées.Dans un second temps, en nous basant sur des techniques d’instanciations utilisées, par exemple, en infographie et sur la connaissance des propriétés de redondances au sein des structures biologiques, nous présentons une méthode de compression permettant de réduire l’espace mémoire nécessaire pour le stockage d’arborescences non-ordonnées. Après une détermination des redondances nous utilisons une structure de données plus compacte pour représenter notamment l’architecture de la plante, celle-ci pouvant contenir des informations topologiques mais également géométriques.
dc.description.abstractEnThe explosion of available biological data urges the need for bioinformatics methods. Manybiological structures are modeled by tree structures such as RNA secondary structure and plantsarchitecture. These structures contain repeating units within their structure, but also betweendifferent structures. We propose to exploit this fundamental property to improve storage andtreatment of such objects.Following the principle of sequence filtering, we define a filtering method on ordered treesto efficiently retrieve in a database a set of ordered trees close from a query. The method isbased on a decomposition of the tree into seeds and the detection of shared seeds between thesestructures. We define and solve the maximum chaining problem on trees. We propose for RNAsecondary structure applications a definition of (l−d) centered seed.Based on instantiation techniques used for instance in computer graphics and the repetitivenessof biological structures, we present a compression method which reduces the memoryspace required for plant architecture storage. A more compact data structure is used in order torepresent plant architecture. The construction of this data structure require the identification ofinternal redundancies and taking into account both topological and geometrical informations.
dc.language.isofr
dc.subjectBioinformatique
dc.subjectAlgorithmique
dc.subjectArborescence
dc.subjectArchitecture des plantes
dc.subjectStructure d'ARN
dc.subject.enBioinformatic
dc.subject.enAlgorithmic
dc.subject.enTree
dc.subject.enPlant architecture
dc.subject.enRNA structure
dc.titleIdentification de motifs au sein des structures biologiques arborescentes
dc.title.enPattern identification in biological tree structure
dc.typeThèses de doctorat
dc.contributor.jurypresidentSherman, David James
bordeaux.hal.laboratoriesThèses de l'Université de Bordeaux avant 2014*
bordeaux.hal.laboratoriesLaboratoire Bordelais de Recherche en Informatique
bordeaux.institutionUniversité de Bordeaux
bordeaux.institutionBordeaux INP
bordeaux.institutionCNRS
bordeaux.type.institutionBordeaux 1
bordeaux.thesis.disciplineInformatique
bordeaux.ecole.doctoraleÉcole doctorale de mathématiques et informatique (Talence, Gironde)
star.origin.linkhttps://www.theses.fr/2011BOR14381
dc.contributor.rapporteurDenise, Alain
dc.contributor.rapporteurGaspin, Christine
dc.contributor.rapporteurSagot, Marie-France
bordeaux.COinSctx_ver=Z39.88-2004&rft_val_fmt=info:ofi/fmt:kev:mtx:journal&rft.title=Identification%20de%20motifs%20au%20sein%20des%20structures%20biologiques%20arborescentes&rft.atitle=Identification%20de%20motifs%20au%20sein%20des%20structures%20biologiques%20arborescentes&rft.au=GAILLARD,%20Anne-Laure&rft.genre=unknown


Fichier(s) constituant ce document

FichiersTailleFormatVue

Il n'y a pas de fichiers associés à ce document.

Ce document figure dans la(les) collection(s) suivante(s)

Afficher la notice abrégée