欢迎关注"生信修炼手册"!
GAGE全称Genome Assembly Gold-Standard Evaluations,该项目选取了4个物种,然后用常用的几款基因组组装软件分别进行组装,最后对所有组装结果进行评估,为选取基因组组装软件提供了参考 。
官网如下:
该项目组织了基因组组装方面的专家团队,对以下4个物种的基因组组装效果进行了评测
- Staphylococcus aureus
- Rhodobacter sphaeroides
- Human (e.g. chromosome 14)
- Bombus impatiens (a species of bee)
对于组装而言,最核心的问题是组装软件和参数的设置,GAGE 评估了以下8款软件
- AByss
- ALLPATHS-LG
- Bambus2
- Celera Assembler
- MSR-CA
- SGA
- SOAPdenovo
- Velvet
官网提供了上述四个物种的原始序列,可以用于下载测试,链接如下
官网还开源了不同组装软件的用法和参数设置,链接如下
http://gage.cbcb.umd.edu/recipes/index.html以
soapdenovo
为例,结果如下
对于不同物种不同软件的组装结果,从contig和scaffold 两方面进行了评估。以human
为例,评估结果如下
对于一个组装结果而言,其组装序列数目越小,N50越大,说明组装效果越好。从上表可以看出,Allpaths-LG的组装效果是最好的。
GAGE不仅为选取组装软件提供了参考,同时也可以作为一个基因组组装的学习资源。官网提供了测序序列,也提供软件运行的代码,我们只需要照着分析,就可以完成基本的分析工作了。
扫描关注微信号,更多精彩内容等着你!