大家都知道,在AFA(All-Flash Array)的市场上,美国是大幅领先中国的。根据Gartner最新发布的外部存储市场跟踪数据,2019年Q1,美国国内的全闪存阵列(Gartner叫SSA:Solid-State Array)占整个阵列市场的56%,已经超过了混合阵列12个百分点了。

虽然中国使劲追赶,但是,从销售数据上,中国的全闪存阵列占比只占整个阵列市场的26%,约为混合阵列的1/3。

这个差距其实比中美两国的GDP差距要大多了。为什么两国有这么巨大的差异呢?我觉得还是国内的AFA产品技术相对国外存储公司来说,还差一些火候。

但是,最近华为发布的全新架构的OecanStor Dorado V6全闪存阵列,从架构和特性上比上一代产品OecanStor Dorado V3有了巨大的进步。大家知道,华为一般不用V4这个命名(不吉利),但为啥不叫OecanStor Dorado V5(对应混合阵列的OceanStor V5)而直接叫OecanStor Dorado V6呢,我猜想是因为其全新的架构和特性远远超过OecanStor Dorado V3和OceanStor V5的总和,因此直接叫OecanStor Dorado V6,以提醒客户其巨大的进步。

这款OecanStor Dorado V6由于采用了华为大量自研的芯片,是一款真正的中国 “芯” 全闪存阵列,具有强烈的中国特色。

具体的进步体现在哪里?我下面和大家来分三部分和大家聊一聊。

** 国产芯片,永快一步 **

在OecanStor Dorado V6里,有5种华为自研的芯片(不只是5颗哦):

智能多协议接口芯片Hi1822承载了本应由通用CPU负责的协议解析工作,加速前端访问性能20%;

智能处理器芯片采用业界标杆性能的ARM-basedCPU鲲鹏920,算力优于业界水准25%;

智能AI芯片昇腾310基于机器学习框架,主动分析并掌握多个应用模型的I/O规律,实现内存空间的智能预取,读缓存命中率提升50%;

智能SSD控制芯片Hi1812e承载核心FTL(FlashTranslation Layer)算法,加速SSD盘内数据访问,读时延优于业界水准10%;

智能BMC管理芯片Hi1710内置华为存储故障基因库,加速部件故障诊断和定位,故障恢复时间从2小时缩短到10分钟。

以上5种自研芯片,有3种的老版本是OecanStor Dorado V3使用过的,虽然这次芯片的版本有了巨大的更新。但其中的鲲鹏CPU和晟腾AI芯片是OecanStor Dorado V6特有的。

这里,我们先来了解一下这款鲲鹏920 CPU(AI芯片后面再讲)。

  • 高性能鲲鹏920处理器,在SPECint benchmark测试成绩超过930分,位居第一,超越业界主流CPU 25%

  • OceanStor Dorado V6单引擎有768核CPU,业界核数最多,独有的CoreFarm众核智能调度算法,发挥众核最大性能,达到单引擎160万IOPS的高性能体验。

  • 业界首创有“芯”的智能硬盘框,鲲鹏920芯片装备的智能硬盘框,承担CPU算力,系统性能30%提升。

这里我特别要强调一点就是,鲲鹏CPU不仅仅用在OecanStor Dorado V6的引擎上,而且还用在硬盘框上,使得硬盘框具有计算能力,一些加密和压缩的操作完全可以卸载到智能硬盘框的鲲鹏处理器处理,系统的性能必然大大提高。这个智能硬盘框,在主流厂商里面应该是第一个。

SmartMatrix,永远在线

看完OecanStor Dorado V6的芯片加持部分,我们来了解一下其互联架构SmartMatrix的设计和上一代有啥不同。

SmartMatrix架构采用了多控前后端的全互联共享架构,前端通过FC-AA保证故障场景下的客户无感知的高可靠性,后端通过100GE RoCE实现高端8控对IP硬盘框的共享,达成控制器8坏7情况下硬盘仍然可用的高可靠。同时由于在硬件架构中采用了全互联CPU及cache架构,构筑了NVME端到端协议栈化的架构,SmartMatrix在高可靠的前提下也可获得极高的性能。

这里我就要重点提一下针对上一代OecanStor Dorado V3的一些重大改变:

  • 前端LUN级全对称AA架构。上一代产品虽然控制器是AA的,但是在LUN级别是有归属的,这样在控制器故障时系统需要切换LUN归属控制器(业界叫LUN Trespass),应用可以感觉到切换,对业务会有一些影响,一般IO夯住时间要长一些。业界一般是传统高端存储才具有这个高级特性。华为的OecanStor Dorado V6,圆满解决这个问题后,预计未来在金融Core Banking系统等关键业务场景中将会得到大量采用。

  • 全IP互联。现在,OecanStor Dorado V6引擎(控制器)之间,引擎和硬盘框之间,引擎和主机之间,全部支持100GE RoCE互联。由于RoCE上面也跑IP,因此,可以说是全IP互联架构。原来OecanStor Dorado V3架构比较复杂,引擎直接是PCIe互联,硬盘框采用SAS互联,对外主机采用FC/iSCSI互联。现在,可以全部统一到100GE RoCE上,当然,对外接口也保留对传统FC的支持。

  • 端到端的NVMe-oF。上一代OecanStor Dorado V3只有后端支持NVMe,现在,在全IP互联下,前后端都支持NVMe-oF了。当然,为了保持兼容性,前端也可以不跑NVMe-oF,而采用传统的FC/iSCSI,后端也兼容传统的SAS硬盘框,支持SAS的SSD。

正是基于这些软硬件的改进,SmartMatrix全互联架构可实现:

控制器8坏7业务0中断(原特性);

控制器故障业务0感知(新特性);

1秒在线升级业务0影响(新特性)。

端云AI,永智高效

持续帮助企业提升效率是IT系统的使命,在智能化时代它的重要性更为突出。华为OceanStor Dorado V6全闪存存储基于AI芯片和AI算法实现全生命周期的智能运维,创新的设备永新商业模式避免数据迁移导致的业务割接与中断,提供流畅的使用体验。

云上云下协同:华为OceanStor Dorado V6全闪存存储采用边缘个性化智能和云上通用智能相结合原理,设备内置昇腾A310 AI芯片增量训练,深度学习业务特征,提升个性化体验;eService智能运维管理平台实时统计现网19万+设备规律,提取共性能力,增强基础运维能力。

AI贯穿业务全生命周期:从资源规划、业务发放、系统调优、风险预测、故障定位实现全方位智能管理,使得性能容量趋势提前60天预判、系统提前14天发现故障盘、93%问题发现即给出方案。

FLASH EVER设备永新:智能弹性架构实现模块化升级,10年以内数据无需迁移,用户即可持续享用最新一代软硬件能力,保护用户投资。这个全新特性,可以有效解决传统存储的叉车升级的麻烦,生命周期结束升级设备硬件无压力。

由于OecanStor Dorado V6有昇腾AI芯片的加持,使得其在智能程度上大大优于上一代产品。AI在各个方面都得到应用,在Cache预取算法上尤其值得了解一下。因为虽然闪存很快,但是相比内存还是差不少,因此,在AFA时代,内存做Cache依然有很大意义。但传统的Cache算法在现代IO混杂负载场景下效果很差。

大量IO的读取,好比大厅里大量人在同时讨论,需要准确辨别出每个人并且理解相应的说话内容。可见,智能Cache预取算法所进行的大量I/O序列的分析和深度挖掘,不仅需要智能的算法,也依赖强大的计算能力。而华为OceanStor Doardo V6存储真是集高性能计算和智能算法于一体的智能存储产品,是业界首创植入AI芯片(昇腾310)的存储。通过AI学习引擎中的智能算法分析和挖掘,可以自动识别IO“语音关联”的规律,将客户即将读取的数据预取到DRAM等高端介质层,让上层业务在OecanStor Dorado V6上感受最快速的数据读取体验。做到真正的知“输”达“理”,根据你的输入,就能知道你输入中蕴含的应用规律。此外,随着使用时间的积累,通过智能算法孜孜不倦的学习,OecanStor Dorado V6对于上层业务的规律会挖掘的更透彻,用户体验会更上一层楼。不仅如此,OecanStor Dorado V6会将自己的智慧“保存”起来,当新旧设备更替,进行数据迁移后,继续发挥作用。

相比上一代产品OecanStor Dorado V3只支持16个控制器,OecanStor Dorado V6支持到了32个控制器,系统整体性能高达20000万IOPS,时延低至0.1ms。特性方面,我用红色也标出OecanStor Dorado V6重大的新特性。

OecanStor Dorado V6的推出,我觉得在几个关键的领域拉起和业界标杆的差距:

  • 支持LUN级AA,拉齐了和HDS VSP 1500F等高端存储的差距;

  • 支持用AI提升Cache命中率和1分钟内完成升级,拉齐和EMC PowerMax的差距;

  • 支持全IP互联和端到端NVMe-oF,拉齐了和Kaminario的差距;

  • 支持在线升级控制器硬件,拉齐了和Pure Storage的差距;

  • 支持深度AI运维,拉齐了和HPE InfoSight的差距;

而且,OecanStor Dorado V6这次还在一些创新上超越了主流厂商:

  • 首创智能硬盘框。OecanStor Dorado V6在智能硬盘框内置鲲鹏处理器,可以卸载控制器引擎上的部分负载到硬盘框上,比如加密、压缩、数据校验和硬盘重构等。这样的好处是数据无需送到引擎,处理起来更加高效;

  • 首创内置AI芯片。OecanStor Dorado V6内置昇腾AI芯片,因此可以处理大量的数据,可以支持更智能更复杂的AI算法,将会在智能运维、智能Cache预读、智能QoS等等构造差异化,为未来存储向全自动驾驶方向发展打下坚定的基础。

随着闪存的价格持续下滑,在主存储领域,磁盘已经没有任何优势。Gartner在2018年Market Insight: Preparing for the SSD Rise and HDD Demise一文中指出:当闪存介质降到HDD每GB平均销售价格(ASP)的三倍时(因为闪存的重删压缩率一般超过3:1),闪存技术通常会出现一个拐点,会加速取代HDD。

因此,Gartner预测,2023年,所有的数据中心的10,000rpm的HDD几乎都被SSD代替。Gartner建议,现在就停止在数据中心环境中使用15,000 rpm和10,000 rpm HDD技术。

而且,SSD全面替换HDD盘,还有下面的利好。

  • 更快:机械盘写时延需要2毫秒,而当前业界最快的NVMe SSD盘写时延仅需0.02ms,SSD盘HDD机械盘快100倍;

  • 更稳:根据业内统计,HDD机械盘的5年返还率高达13.4%, 同等条件下,SSD盘的5年返还率仅为0.8%,显然,SSD比HDD机械盘更稳;

  • 更经济:HDD盘的功耗为10瓦,而SSD盘的功耗仅为3瓦,SSD盘比HDD机械盘更经济。