Marvell第二代ARM处理器ThunderX2解析



https://www.cnbeta.com/articles/tech/853137.htm



 



长久以来,服务器数据中心市场一直被x86 CPU架构所垄断,而在近些年,ARM架构不断吹响进军服务器领域的号角,虽然始终算不上成功,但巨头们从未放弃。台北电脑展上,Marvell(美满电子)就详细介绍了第二代基于ARM架构的服务器处理器“ThunderX2 CN99XX”,号称多项性能指标都可以媲美乃至碾压Intel Xeon至强、AMD EPYC霄龙。



Marvell公司成立于1995年,总部位于美国加州圣克拉拉,在美国、以色列、印度、德国、中国都设有研发中心,员工总数超过5000,全球专利超过1万件,2019财年收入29亿美元,是最受尊敬的半导体企业之一,核心业务覆盖存储、网络、计算三大领域,特别是拥有超过15年的高性能多核心CPU研发经验,累计出货几十亿颗,而且在ARM服务器处理器上也已耕耘数代。

2017年,Marvell以约60亿美元的价格收购了美国无工厂半导体企业Cavium(凯为半导体),从而获得了后者的ARM/MIPS产品线,包括这款ThunderX2。

ARM架构处理器拥有高能效、低成本、开放架构、广泛生态等独特优势,1990年以来累计出货量超过1300亿颗,而且不断加速,1991-2013年花了22年出货500亿颗,2013-2017年只用了4年就出货500亿颗,预计2017-2021年可出货1000亿颗。

它采用台积电16nm工艺制造,可选BGA整合封装、LGA独立封装,基于64位ARMv8.1全面定制的乱序执行核心,最多32个物理核心、128个逻辑核心(每核心4线程),频率常规模式2.5GHz、加速模式可达3.0GHz,每核心32KB数据和指令缓存、256KB二级缓存,共享32MB三级缓存。

技术方面支持ARM虚拟化扩展、RAS特性、ARM TrustZone安全保护,扩展方面可提供最多56条PCIe 3.0(14个控制器)、两个SATA 6Gbps、两个USB 3.0。

支持双路并行,通过CCPI2一致性总线互连,带宽高达600Gbps,可实现跨处理器的缓存一致性。

内存方面,每路支持最多八条DDR4,频率最高2666MHz,双路最大容量4TB。

ThunderX2将提供40多种不同配置的型号,但暂未公布具体功耗。

Marvell强调,ThunderX2在核心数量、内存带宽、IO通道、性价比方面完胜Intel至强,同时在内存带宽、应用吞吐方面远超AMD霄龙,而在多项云基准测试中,性能相比20核心40线程的Intel至强金牌6148可高出10-100%。

官方还给出了部分权威媒体的部分测试项目,Java、整数性能、内存带宽方面都非常抢眼。

Marvell表示,ThunderX2可应用于高性能计算、云计算、边缘计算等诸多领域,满足计算、存储、联网工作负载的最高要求,并通过提供更高级别的计算性能和生态系统,加速ARM服务器在主流云、高性能计算数据中心内的采用和部署。

同时,ThunderX2也已经有了诸多应用实例,比如美国能源部旗下桑迪亚国家实验室的超级计算机“Stra”,就配备了145152个ThunderX2核心,是目前最强大的ARM超算,主要用于美国核武器研究。

美国洛斯阿莫斯国家实验室采用ThunderX2核心提高了超算可用性,而不是一味追求峰值性能。

法国原子能机构CEA的超算系统也基于ThunderX2,用于核能源、国防相关。

生态方面,Marvell ARM服务器平台也已经得到了诸多OEM厂商和平台、IHV硬件厂商、操作系统和固件、中间件、应用和工具的支持。

Marvell副总裁及服务器处理器部总经理Gopal Hegde在台北电脑展期间接受采访时表示,ARM服务器在云端有着独特的优势,在现有庞大安卓手机生态的基础上,可以借助平台、架构的一致性,顺利实现ARM云端的计算和渲染,同时随着软硬件生态系统的完善,企业数据从x86服务器转向ARM服务器也越来越顺利,Marvell也会提供全心全意的帮助。

同时,Marvell计划每两年推出一代新的ARM服务器平台,每次都可以实现2倍甚至更高的性能提升。

他还透露,ARM两年前就预测未来五年,全球20%的服务器都会基于ARM架构,在中国市场的比例或许还会高一些,因为中国敢于尝试新鲜事物。