Règles de cohérence pour l'annotation génomique : développement et mise en oeuvre in silico et in vivo
Thèses de doctorat
Date de soutenance
2008-01-17Résumé
L'annotation génomique identifie l'ensemble des éléments significatifs présents sur l'ADN génomique, le support du programme de fonctionnement de l'organisme. Elle prédit leurs fonctions biologiques et leurs relations. ...Lire la suite >
L'annotation génomique identifie l'ensemble des éléments significatifs présents sur l'ADN génomique, le support du programme de fonctionnement de l'organisme. Elle prédit leurs fonctions biologiques et leurs relations. L'annotation d'un génome complet est soumise à diverses contraintes: elle doit être réalisée rapidement et représenter l'organisme comme système biologique fonctionnel cohérent. Nous proposons une méthode de vérification de la qualité de l'annotation génomique, basée sur un ensemble de règles de cohérence définies d'après les connaissances et contraintes biologiques admises par la communauté scientifique. Ces règles vérifient la complétude de l'annotation (présence des éléments vitaux pour l'organisme) et son absence d'erreur (sens biologique correct des éléments décrits). Notre méthode est appliquée dans le cadre du projet Génolevures, un projet de génomique comparée chez les levures hémiascomycètes. Nous avons mis en place un système d'annotation facilitant le travail d'annotation manuelle par les experts. L'intégration de nos règles dans ce système permet de garantir la bonne qualité de l'annotation produite. Nous avons choisi de valider expérimentalement l'application de ces règles en étudiant les interactions protéine-protéine chez les levures Saccharomyces cerevisiae et Yarrowia lipolytica par la technique de l'électrophorèse en gel de polyacrylamide en bleu natif et SDS (BN/SDS PAGE). Les résultats obtenus apportent de nouvelles connaissances chez les levures étudiées. Ils démontrent l'universalité de certaines règles et le bien fondé de la stratégie d'annotation.< Réduire
Résumé en anglais
Genome annotation identifies all significant elements located on genomic DNA, support on which the functional program for organism is written. It predicts their biological functions and their relationships. The annotation ...Lire la suite >
Genome annotation identifies all significant elements located on genomic DNA, support on which the functional program for organism is written. It predicts their biological functions and their relationships. The annotation of a completely sequenced genome is subject to several constraints : it must be done quickly and represent the organism as a coherent biological functionnal system. We propose a method to check the quality of genome annotation, based on a set of coherency rules defined according to knowledge and constraints accepted by the scientific community. These rules check, on the one hand, the completeness of the annotation (presence of vital functions), and on the other hand, the absence of errors (correctness of biological sense of predicted elements). Our method is applied in the Génolevures project, a comparative genomics project within the hemiascomycetous yeasts. We developed the annotation system that eases the manual annotation work by experts. The integration of our rules within this system garantees the good quality of the resulting annotation. We further chose to validate experimentaly these rules with studying protein-protein interactions of yeasts Saccharomyces cerevisiae and Yarrowia lipolytica, using blue native and SDS polyacrylamide gel electrophoresis (BN/SDS PAGE). The results offer both new biological knowledge for the studied yeasts and a demonstration of the universality of certain rules as well as the well-founded of the annotation strategy.< Réduire
Mots clés
Biologie cellulaire
Informatique
annotation
génome
règles de cohérence
bio-informatique
interaction protéine-protéine
électrophorèse BN/SDS
Unités de recherche