中国新超算彻底告别进口CPU 国产芯片已可与国外抗衡


蓝天·2017-10-17· 本土IC 


https://www.laoyaoba.com/html/news/newsdetail?source=pc&news_id=651997



 



  日前,飞腾已经完成FT-2000plus服务器CPU的研制工作,飞腾公司的合作伙伴正在积极研发相应的整机产品。FT-2000plus这款芯片是以FT2000为基础的改进版本,虽然在单核性能上和Intel还存在一定差距,但在多核性能上,已经达到Intel服务器CPU E5 主流产品的水平。

  据传,国防科大正在研发的1000P超算天河3号(性能指标是神威太湖之光的8倍),其原型机的CPU或将采用FT-2000或其后继产品作为主控CPU。考虑到在天河2A上,国防科大已经用自主研发的加速器矩阵2000取代Intel的Xeon Phi计算卡。从今往后,天河系列超算也将和神威系列超算一样,彻底告别国外CPU或加速器,实现芯片的全国产化。


  (网传天河3号原型机计算节点,板上有2片FT-2000,业内专家告诉笔者,这是误传)

  FT-2000系列芯片是厚积薄发的结果

  近年来,国内某些企业热衷于“走捷径”,先后与Intel、IBM、ARM、高通等国外芯片巨头技术合作或合资,有的公司把国外的CPU IP授权买回来做集成,就宣传是自主知识产权,甚至还有公司将国外的芯片包装一下变成国产芯片。

  虽然这种走捷径的做法可以在短时间内拿出性能不错的芯片,但由于国外公司始终怀有“教会徒弟、饿死师傅”心理,不会将最先进的技术授权给中国,而且国内单位在拿到国外技术授权后,容易陷入知其然,不知其所以然的困境,不具备技术发展的可持续性,在国外公司开发出下一代产品之后,只能再次引进国外技术。

  相比之下,飞腾选择了较为困难的自主研发道路,虽然发展会慢一些,但更具后劲。早在十多年前,飞腾就基于IA-64指令集设计CPU,之后又以Sparc开源代码为基础设计了FT-1000和FT-1500两款CPU,FT-1000被用于天河1号超算,FT-1500被用于天河2号超算。在2012年前后,飞腾选择了ARM阵营,获得了ARM指令集授权,可以基于ARM 64指令集设计自己的CPU。并在数年时间里先后开发出了FTC660、FTC661两款CPU核,以及FT-1500A/4、FT-1500A/16、FT-2000、FT-2000plus等CPU。

  FT-1500A/4被用于PC和笔记本,采用28nm制造工艺。集成了4个FTC660 CPU核,主频1.5GHz—2.0GHz,集成了2MB二级cache和8MB三级cache,集成了2个DDR3-1600存储控制器,可提供25.6GB/s访存带宽,最大功耗为15W。

  FT-1500A/16被用于服务器,采用28nm制造工艺。集成了16个FTC660 CPU核,主频1.5GHz,集成了8MB二级cache和8MB三级cache,集成了4个DDR3-1600存储控制器,可提供51.2GB/s访存带宽,最大功耗为35W。

  FT-2000采用28nm制造工艺,可被用于超算计算节点和高性能服务器。集成了64个FTC661处理器核。工作主频1.5GHz—2.0GHz。集成了32MB二级cache,扩展支持128MB三级cache。支持16个DDR3-1600存储控制器,可提供204.8GB/s访存带宽。


  最新的FT-2000Plus采用了台积电16nm制造工艺,主频为2.0GHz—2.4GHz,集成了64个FTC661处理器核。为了提高集成度,抛弃了L3cache,将DDR4内存控制器集成到了片内。目前,飞腾系列CPU已经形成了一个家族,可满足党政军多个领域的实际需求。

  足以和Intel主流服务器抗衡 CPU 在国内ARM服务器CPU中处于领跑位置

  根据实际测试FT-2000在2GHz主频下,采用GCC4.8编译器,SPEC2006的测试成绩分别为SPECint_rate2006:570、 SPECfp_rate2006:482,与Intel Xeon E5-2695v3相当。

  而最新的FT-2000Plus因为删除了L3导致在SPEC测试中某些子项分数下降,把集成DDR4等改进带来的提升抹平了,使FT-2000Plus在同主频下与FT-2000的性能相差不大。那飞腾公司为何要这么做呢?原因应该是为了商业化,提高FT-2000plus的集成度可以方便主机厂,降低开发FT-2000plus整机产品的成本。不过,在使用了更好的台积电16nm制造工艺之后主频可以最高稳定到2.4G,使FT-2000plus相对于FT-2000还是有不小的性能提升,能够满足高端服务器和超算主控CPU的性能要求。

  近年来,不少厂家都开始着手开发ARM服务器CPU。在国内,华为和华芯通也在着手开发ARM服务器CPU。不过,就目前而言,飞腾的ARM服务器CPU在性能上处于绝对领先地位。

  华芯通是中国大陆与高通成立的合资公司,从高通手中获得了源码并基于该源码设计自己的CPU。不过,由于华芯通北京研发中心启用时日尚短,正式商用产品问世尚需时日。

  相比之下,华为研发ARM服务器CPU的时间要早得多,而且在北京和美国都有研发中心,已经有产品Hi1612问世。虽然在宣传上,华为声称Hi1612是“自主研发”,“除存储单元外均具有完整知识产品”,但其实上,这款服务器CPU采用台积电16nm制造工艺,其内核是ARM Cortex A57。


  而且Hi1612的性能也比较一般,也许是因为华为缺乏服务器CPU设计经验,这款服务器CPU的性能相对有限,以飞腾的FT2000作参照,华为的这款服务器CPU在制造工艺领先2代的情况下,以FT2000一半的功耗实现了不足FT2000一半的性能。

  不过,据小道消息,华为的下一款ARM服务器正在研发中,而且位于龙芯公司斜对门的华为北京研发中心已经拿ARM Cortex A72修改了至少2个版本(华为有钱,买了ARM的“大礼包”),加上位于美国的研发中心可以提供技术支持,在有ARM Cortex A72为基础的情况下,华为的下一款ARM服务器CPU的性能值得期待。

  结语

  诚然,FT-2000/FT-2000plus还是存在一些短板的,比如单线程性能偏弱。无论是FT2000,还是FT-2000plus,虽然在多线程性能上达到了Intel中高端服务器CPU的性能,但在单线程性能上,还是有不小的差距——即便主频控制在2.5GHz,Intel的服务器CPU的SPECint_base2006的成绩也在25以上,而FT2000的SPECint_base2006只有12.4(@2.0GHz),FT-2000plus预计也只有14+分(@2.4GHz)。

  软件生态也是一个问题,由于飞腾选择了跟随ARM生态的道路,使飞腾的商业化推广很大程度上取决于ARM生态的完善情况。而在服务器生态上,ARM和X86相比差距较大,这也非常不利于FT-2000/FT-2000plus的商业化。

  不过,万事开头难,迄今为止,湖南长城银河公司、湘计海盾公司、航天706所已经推出了基于新一代飞腾微处理器的自主可控产品。


  (飞腾CPU整机产品)

  长城银河公司就开发出了EF111系列计算服务器、智恒AF21B一体机、致翔NF15N笔记本电脑和世恒KF510系列桌面型台式计算机等整机产品。其中,EF111系列计算服务器基于全新一代国产FT2000 Plus 处理器的高性能服务器,可应用于ERP、高性能数据库、虚拟化和商业智能、大数据分析等领域。航天科工二院 706所也推出天玥64核高端机架式服务器。

  根据公开资料显示,天河3号的原型机已经选定FT-2000系列芯片作为其计算节点上使用的CPU。这不仅对天河超算摆脱进口芯片掣肘是一个好消息,对于FT-2000来说,也是一个非常好的广告。