云计算如何才能落地?深圳华大基因研究院(以下简称华大基因)构建的生物云就是生物技术与云计算技术相结合的一个成功范例。

3年前,华大基因携手北京荣之联科技股份有限公司(以下简称荣之联)组成200多人的项目部,启动了华大基因的生物云建设。如今,华大基因生物云系统已经初具规模,计算能力超过百万亿次,存储能力超过10PB,不仅可以为华大基因这个“世界测序工厂”提供实验和研究环境,而且可以通过对外提供基因测序等服务获得丰厚的收益。以前主要依靠国家科研经费的华大基因,如今依托生物云,年收入已经超过10亿元,形成了良性的发展循环。
不能让云漂在空中
在荣之联副总经理李志坚看来,云计算虽然只不过是新瓶装旧酒,因为从信息技术发展的脉络看,即使没有云计算概念的出现,基于SOA的架构实现数据中心的虚拟化、智能化和自动化也是顺理成章的事。
但是云计算技术的应用确是企业新的业务需求与信息技术相互碰撞出的火花。从这个角度讲,云计算落地的关键是商业模式的创新,而不是技术本身。“如今,用户最关心的不是采用什么样的新技术,拥有多强的计算能力,而是云计算如何才能够帮助企业解决实际业务和流程中的各种问题。”李志坚表示,“空谈云计算的概念没有任何意义。作为云计算基础架构解决方案供应商,荣之联要做的是引导用户的需求,帮助用户以云计算的理念去构建新型的数据中心,提高数据中心IT设备的利用率,实现基础架构的虚拟化、自动化、智能化和绿色节能。这才是让云落地的关键。”
2008年开始,业界开始热炒云计算的概念,到现在,云落地成了业界关注的焦点。让云落地,关键要选好落脚点。凭借十多年的行业应用经验,荣之联选择了生物行业作为突破口。
荣之联的业务范围覆盖多个行业。尤其是在以高性能计算和数据密集型存储为主的能源、高校、生物等领域,荣之联拥有明显的技术优势和丰富的实践经验。比如华大基因需要很强的计算能力和海量存储。在华大基因的实验室中有上百台基因测序仪,每台测序仪的旁边都有一个磁盘阵列,这些测序仪每天能产生5GB的数据。为满足华大基因海量数据存储的需要,荣之联将存储架构分为三层,包括一级的高性能磁盘阵列和高性能并行NAS、二级低端存储以及三级的磁盘磁带归档。
李志坚表示:“进入云计算时代,系统集成商也面临着转型的问题。今天的荣之联不再是传统意义上的以系统产品销售为主的集成商,而是一个解决方案和服务供应商。荣之联既了解生物行业用户的需求,又能够很好地把握信息技术发展的脉搏,两者相结合,构成了荣之联在生物云领域的独特优势。”
30亿美元到1万美元
上个世纪80年代,如果想完整地测出一个人的基因,大约需要花费30亿美元,相当于美国登月计划的全部经费。但是现在,做同样的事,只需花费1万美元。基因测序能力的提高与信息技术的不断发展有密切关系。如今,生物研究70%~80%的工作量要依靠IT来完成。以华大基因生物云为例,它每运行一次可以产生200GB的高质量数据,并可对两个人类基因组进行30倍深度覆盖率的测序。
云计算技术在生物科技领域的应用刚刚开始,其发展前景十分广阔。强大的计算能力、高性能的海量数据存储、动态的基础架构、更低的基因测序成本、基于云的服务模式……这些都是云计算给生物科技领域带来的巨大变化。以前,许多生物研究机构需要磁盘的高性能,但手里只有买得起磁带的钱。随着信息技术的发展,特别是云计算的出现,上述的尴尬情况将一去不返。“华大基因建设生物云系统,一开始也是为了满足自身的计算和存储需要。但是随着系统的不断完善,将会把闲置的云资源用于对外提供服务,既充分利用了现有资源又增加了收入,何乐而不为?”李志坚表示。
华大基因生物云主要包括三大功能:第一,提供生物基因数据服务,即把华大基因自己测序得到的数据和从NCBI、EBI得到的数据提供给用户使用;第二,提供生物基因研究专项服务,比如为付费用户提供基因测序服务;第三,提供生物应用软件的接入服务,并开放生物基因软件开发包,即允许用户编程使用华大基因生物云中的数据、服务和软件。
华大基因目前在深圳、香港和北京有三个数据中心,而这些数据中心从选址到施工建设全都由荣之联一手包办。李志坚表示:“荣之联是云计算的推动者,可以为用户提供从咨询设计、产品选型、方案测试和验证、系统部署到维护服务的全套服务。”
在生物云建设方面,荣之联已经成了先行者。如今,荣之联正努力将帮助华大基因建设生物云的经验推广到整个生物研究领域。除了生物云,荣之联还在打造政府云、动漫云等,并且致力于让这些云落地。