Colib’read on galaxy: a tools suite dedicated to biological information extraction from raw NGS reads
LE BRAS, Yvan
Service Expérimentation et Développement [SED [Rennes]]
Plateforme bioinformatique GenOuest [Rennes]
Service Expérimentation et Développement [SED [Rennes]]
Plateforme bioinformatique GenOuest [Rennes]
COLLIN, Olivier
Plateforme bioinformatique GenOuest [Rennes]
Service Expérimentation et Développement [SED [Rennes]]
Plateforme bioinformatique GenOuest [Rennes]
Service Expérimentation et Développement [SED [Rennes]]
MONJEAUD, Cyril
Plateforme bioinformatique GenOuest [Rennes]
Service Expérimentation et Développement [SED [Rennes]]
Voir plus >
Plateforme bioinformatique GenOuest [Rennes]
Service Expérimentation et Développement [SED [Rennes]]
LE BRAS, Yvan
Service Expérimentation et Développement [SED [Rennes]]
Plateforme bioinformatique GenOuest [Rennes]
Service Expérimentation et Développement [SED [Rennes]]
Plateforme bioinformatique GenOuest [Rennes]
COLLIN, Olivier
Plateforme bioinformatique GenOuest [Rennes]
Service Expérimentation et Développement [SED [Rennes]]
Plateforme bioinformatique GenOuest [Rennes]
Service Expérimentation et Développement [SED [Rennes]]
MONJEAUD, Cyril
Plateforme bioinformatique GenOuest [Rennes]
Service Expérimentation et Développement [SED [Rennes]]
Plateforme bioinformatique GenOuest [Rennes]
Service Expérimentation et Développement [SED [Rennes]]
LACROIX, Vincent
Baobab [LBBE]
Equipe de recherche européenne en algorithmique et biologie formelle et expérimentale [ERABLE]
Baobab [LBBE]
Equipe de recherche européenne en algorithmique et biologie formelle et expérimentale [ERABLE]
RIVALS, Eric
Institut de Biologie Computationnelle [IBC]
Méthodes et Algorithmes pour la Bioinformatique [MAB]
Institut de Biologie Computationnelle [IBC]
Méthodes et Algorithmes pour la Bioinformatique [MAB]
SACOMOTO, Gustavo
Baobab [LBBE]
Equipe de recherche européenne en algorithmique et biologie formelle et expérimentale [ERABLE]
Baobab [LBBE]
Equipe de recherche européenne en algorithmique et biologie formelle et expérimentale [ERABLE]
CAZAUX, Bastien
Institut de Biologie Computationnelle [IBC]
Méthodes et Algorithmes pour la Bioinformatique [MAB]
Institut de Biologie Computationnelle [IBC]
Méthodes et Algorithmes pour la Bioinformatique [MAB]
URICARU, Raluca
Laboratoire Bordelais de Recherche en Informatique [LaBRI]
Centre de Bioinformatique de Bordeaux [CBIB]
< Réduire
Laboratoire Bordelais de Recherche en Informatique [LaBRI]
Centre de Bioinformatique de Bordeaux [CBIB]
Langue
en
Article de revue
Ce document a été publié dans
GigaScience. 2016-02, vol. 5, n° 1
Oxford Univ Press
Résumé en anglais
Background: With next-generation sequencing (NGS) technologies, the life sciences face a deluge of raw data.Classical analysis processes for such data often begin with an assembly step, needing large amounts of computingresources, ...Lire la suite >
Background: With next-generation sequencing (NGS) technologies, the life sciences face a deluge of raw data.Classical analysis processes for such data often begin with an assembly step, needing large amounts of computingresources, and potentially removing or modifying parts of the biological information contained in the data. Ourapproach proposes to focus directly on biological questions, by considering raw unassembled NGS data, through asuite of six command-line tools.Findings: Dedicated to ‘whole-genome assembly-free’ treatments, the Colib’read tools suite uses optimizedalgorithms for various analyses of NGS datasets, such as variant calling or read set comparisons. Based on the use of ade Bruijn graph and bloom filter, such analyses can be performed in a few hours, using small amounts of memory.Applications using real data demonstrate the good accuracy of these tools compared to classical approaches. Tofacilitate data analysis and tools dissemination, we developed Galaxy tools and tool shed repositories.Conclusions: With the Colib’read Galaxy tools suite, we enable a broad range of life scientists to analyze raw NGSdata. More importantly, our approach allows the maximum biological information to be retained in the data, and usesa very low memory footprint.< Réduire
Mots clés en anglais
Metagenomics
De Bruijn graph
Whole-genome assembly-less treatment
Bloom filter
NGS
RNA-seq
Variant calling
long read correction
Project ANR
Digital and Hardware Solutions and Modeling for the Environement and Life Sciences - ANR-10-LABX-0020
Origine
Importé de halUnités de recherche