MetaSPAdes: 最全能的宏基因组组装工具

软件简介

SPAdes是基因组组装的经典工具之一。这里我们所说的metaSPAdes,是SPAdes所提供的宏基因组组装模式。与megahit类似,它的原理同样是基于k-mer迭代的德布莱英图方法。在各种组装工具的评测论文中(如:Assembling metagenomes, one community at a time (BMC Genomics); Practical evaluation of 11 de novo assemblers in metagenome assembly (Journal of Microbiological Methods)),研究者们推荐在进行宏基因组序列组装时,如果具有充足的运行内存(RAM),metaSPAdes优于megahit。

在我的宏基因组数据处理中,metaSPAdes被大量应用,然而,它常常会因为运存不足而中途退出。

metaSPAdes会自动识别读长类型(如100bp、150bp和250bp等)并自动选择k-mer list类型。

参数列表

-o 输出目录
-1,-2 双端Reads文件
-t 线程数
-m 最大内存限定(Gb)
-k k-mer list,对于250bp推荐填写:21,33,55,77,99,127

在确定metaSPAdes的参数时,应仔细查看以下帮助页:https://ablab.github.io/spades/datatypes.html。

常用命令

1
metaspades.py -o outdir -1 R1.fastq -2 R2.fastq -t 48 -m 500 -k 21,33,55,77,99,127

MetaSPAdes: 最全能的宏基因组组装工具
https://emmettpeng.github.io/2024/07/13/metaspades/
Author
Emmett Peng
Posted on
July 13, 2024
Licensed under