经常有人问我说,想要搭建一个生物信息分析的平台,问需要什么配置,是不是去电脑城买了最新款的i7处理器,多配置几条内存条,在买几块硬盘就组装好了生物信息分析平台,使用很少的钱,就可以得到很高的配置。其实我在之前的推文中已经强调过了个人电脑PC,工作站,服务器是不相同的。你当然可以用自己组装的电脑完成很多分析,但个人电脑和服务器还是不同的,可以说是民用和军用的区别。下面的案例来自于“生信开发者”公众号作者的一次经历。

桌面级PC用来分析临床全外显子组测序数据存在的问题

一直认为桌面级PC跑全外显子组测序(WES)数据分析应该没问题。两个月前入手了一款八代i7 8700k CPU,64G内存,4T机械硬盘+512G固态硬盘的PC设备,装了centos7.4,跑起来无论是Trio 还是proband-only WES确实挺快的,都差不多在5h内跑完了。
我把这台机器当服务器在用,一直开着,长时间没关机。最近又跑WES的时候,出现了几个怪现象,一直报错,跑到GATK GenotypeGVCF的时候 ,先是出现了

line number 5209295: 1119970<9 is not a valid start position in the VCF format
的错误,我很奇怪gvcf文件中怎么会出现1119970<9 这样的坐标呢?

微服务 开发 windows_服务器

于是我用vim 打开了一个超大的VCF文件,对照相应的ref基因型,结合临近的点的坐标,手动修改了那个地方成111997049,保存后重新运行,又出现了新的错误,

The provided VCF file is malformed at approximately line number 1324325: 111¹98840 is not a valid start position in the VCF format

微服务 开发 windows_个人电脑_02


这么改下去不是办法,google查找了之后,确实有说是因为内存错误导致的问题,于是我把那个GVCF文件删了重新跑了一遍,重新生成了一下GVCF文件,然后再跑GenotypeGVCF,一切正常了。

服务器的CPU一般都支持ECC内存纠错的,能保证长时间稳定运行,不出错,不死机,而桌面级PC没有这个设计,现在的高端桌面级PC运行速度确实比较快了,用来跑WES或其他生物信息软件做科研还是值得推荐,用于临床的话,还得谨慎考虑。