Colib’read on galaxy: a tools suite dedicated to biological information extraction from raw NGS reads
LE BRAS, Yvan
Service Expérimentation et Développement [SED [Rennes]]
Plateforme bioinformatique GenOuest [Rennes]
Service Expérimentation et Développement [SED [Rennes]]
Plateforme bioinformatique GenOuest [Rennes]
COLLIN, Olivier
Plateforme bioinformatique GenOuest [Rennes]
Service Expérimentation et Développement [SED [Rennes]]
Plateforme bioinformatique GenOuest [Rennes]
Service Expérimentation et Développement [SED [Rennes]]
MONJEAUD, Cyril
Plateforme bioinformatique GenOuest [Rennes]
Service Expérimentation et Développement [SED [Rennes]]
Leer más >
Plateforme bioinformatique GenOuest [Rennes]
Service Expérimentation et Développement [SED [Rennes]]
LE BRAS, Yvan
Service Expérimentation et Développement [SED [Rennes]]
Plateforme bioinformatique GenOuest [Rennes]
Service Expérimentation et Développement [SED [Rennes]]
Plateforme bioinformatique GenOuest [Rennes]
COLLIN, Olivier
Plateforme bioinformatique GenOuest [Rennes]
Service Expérimentation et Développement [SED [Rennes]]
Plateforme bioinformatique GenOuest [Rennes]
Service Expérimentation et Développement [SED [Rennes]]
MONJEAUD, Cyril
Plateforme bioinformatique GenOuest [Rennes]
Service Expérimentation et Développement [SED [Rennes]]
Plateforme bioinformatique GenOuest [Rennes]
Service Expérimentation et Développement [SED [Rennes]]
LACROIX, Vincent
Baobab [LBBE]
Equipe de recherche européenne en algorithmique et biologie formelle et expérimentale [ERABLE]
Baobab [LBBE]
Equipe de recherche européenne en algorithmique et biologie formelle et expérimentale [ERABLE]
RIVALS, Eric
Institut de Biologie Computationnelle [IBC]
Méthodes et Algorithmes pour la Bioinformatique [MAB]
Institut de Biologie Computationnelle [IBC]
Méthodes et Algorithmes pour la Bioinformatique [MAB]
SACOMOTO, Gustavo
Baobab [LBBE]
Equipe de recherche européenne en algorithmique et biologie formelle et expérimentale [ERABLE]
Baobab [LBBE]
Equipe de recherche européenne en algorithmique et biologie formelle et expérimentale [ERABLE]
CAZAUX, Bastien
Institut de Biologie Computationnelle [IBC]
Méthodes et Algorithmes pour la Bioinformatique [MAB]
Institut de Biologie Computationnelle [IBC]
Méthodes et Algorithmes pour la Bioinformatique [MAB]
URICARU, Raluca
Laboratoire Bordelais de Recherche en Informatique [LaBRI]
Centre de Bioinformatique de Bordeaux [CBIB]
< Leer menos
Laboratoire Bordelais de Recherche en Informatique [LaBRI]
Centre de Bioinformatique de Bordeaux [CBIB]
Idioma
en
Article de revue
Este ítem está publicado en
GigaScience. 2016-02, vol. 5, n° 1
Oxford Univ Press
Resumen en inglés
Background: With next-generation sequencing (NGS) technologies, the life sciences face a deluge of raw data.Classical analysis processes for such data often begin with an assembly step, needing large amounts of computingresources, ...Leer más >
Background: With next-generation sequencing (NGS) technologies, the life sciences face a deluge of raw data.Classical analysis processes for such data often begin with an assembly step, needing large amounts of computingresources, and potentially removing or modifying parts of the biological information contained in the data. Ourapproach proposes to focus directly on biological questions, by considering raw unassembled NGS data, through asuite of six command-line tools.Findings: Dedicated to ‘whole-genome assembly-free’ treatments, the Colib’read tools suite uses optimizedalgorithms for various analyses of NGS datasets, such as variant calling or read set comparisons. Based on the use of ade Bruijn graph and bloom filter, such analyses can be performed in a few hours, using small amounts of memory.Applications using real data demonstrate the good accuracy of these tools compared to classical approaches. Tofacilitate data analysis and tools dissemination, we developed Galaxy tools and tool shed repositories.Conclusions: With the Colib’read Galaxy tools suite, we enable a broad range of life scientists to analyze raw NGSdata. More importantly, our approach allows the maximum biological information to be retained in the data, and usesa very low memory footprint.< Leer menos
Palabras clave en inglés
Metagenomics
De Bruijn graph
Whole-genome assembly-less treatment
Bloom filter
NGS
RNA-seq
Variant calling
long read correction
Proyecto ANR
Digital and Hardware Solutions and Modeling for the Environement and Life Sciences
Orígen
Importado de HalCentros de investigación