Arrêt de service programmé du vendredi 10 juin 16h jusqu’au lundi 13 juin 9h. Pour en savoir plus
Accéder directement au contenu Accéder directement à la navigation
Article dans une revue

Toward perfect reads: self-correction of short reads via mapping on de Bruijn graphs

Abstract : Motivations Short-read accuracy is important for downstream analyses such as genome assembly and hybrid long-read correction. Despite much work on short-read correction, present-day correctors either do not scale well on large data sets or consider reads as mere suites of k-mers, without taking into account their full-length read information. Results We propose a new method to correct short reads using de Bruijn graphs, and implement it as a tool called Bcool. As a first step, Bcool constructs a compacted de Bruijn graph from the reads. This graph is filtered on the basis of k-mer abundance then of unitig abundance, thereby removing from most sequencing errors. The cleaned graph is then used as a reference on which the reads are mapped to correct them. We show that this approach yields more accurate reads than k-mer-spectrum correctors while being scalable to human-size genomic datasets and beyond. Availability and Implementation
Type de document :
Article dans une revue
Liste complète des métadonnées

Littérature citée [35 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/hal-02407243
Contributeur : Pierre Peterlongo Connectez-vous pour contacter le contributeur
Soumis le : jeudi 12 décembre 2019 - 14:06:41
Dernière modification le : lundi 4 avril 2022 - 09:28:26
Archivage à long terme le : : vendredi 13 mars 2020 - 21:50:02

Fichier

main.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

Citation

Antoine Limasset, Jean-François Flot, Pierre Peterlongo. Toward perfect reads: self-correction of short reads via mapping on de Bruijn graphs. Bioinformatics, Oxford University Press (OUP), 2019, ⟨10.1093/bioinformatics/btz102⟩. ⟨hal-02407243⟩

Partager

Métriques

Consultations de la notice

112

Téléchargements de fichiers

208