在昨天的EMC Word上,EMC宣布收购初创公司DSSD。在未来的几年内一定是flash存储高速增长的时代,那么EMC收购DSSD,扩充自己的flash存储产品线完全满足了自身发展的战略需求。这件事件的背后需要关注的是为什么EMC会收购DSSD公司,而不去收购诸如Skyera之类已经有独特产品的公司呢?

众所周知,EMC有自己的flash存储产品线XtreamIO,并且也有基于PCIeSSD卡及相关软件的解决方案。那么EMC为什么还需要去收购其他的flash存储产品呢?个人认为这里面有两个方面的原因:第一,XtreamIO作为flash盘阵不算太完美,应该算是一个比较通用的中端flash存储产品。其竞争对手应该是创业公司purestorage的产品。第二,在flash存储领域应该会出现更进一步的产品细分。Flash有延迟低、IOPS高、随机读写能力强、存储密度高等几大特点。利用不同的特点,可以打造出满足不同应用需求的产品。目前,应该说还没有一款产品能够满足所有应用环境的需求。EMC作为一家存储巨头,肯定会在各个领域都会有产品进行覆盖,所以,收购一家DSSD公司对flash存储产品线进行扩充算是合情合理。

flash存储领域,XtreamIO应该算是一个中端存储设备,有很多厂商硬件定制的flash存储设备无论在性能上,还是从容量上都会比XtreamIO高一档次。因此,此次EMC收购的产品应该会定位高端。由于DSSD的产品要到2015年才能发布,因此,目前还没有DSSD产品的任何介绍。从发布的消息来看,DSSD打造了一个概念:Rack Scale flash storage。直观理解也就是在RACK级别对storage具有很好的可扩展性。其主要是为了满足大数据的应用需求。换句话理解,DSSD是直接面向大数据应用的,在数据中心替换现有的磁盘存储系统。

 

wKioL1No7VHDiNSiAAIHDnV0-60823.jpg

 

由于DSSD具有很好的IO延迟、非常高的IOPS特性,其主要市场为:

1)内存数据库市场,例如SAP HANA

2)实时数据分析市场

3)高性能应用场合

 

wKiom1No7ZTQwoCnAAFraGIMQIQ966.jpg

 

从上图可以看到,和混合存储、其他的全闪存阵列相比,DSSD具有更低的IO延迟,因此,可以更好的满足对IO实时性要求更高的应用。另外,从上图也可以看到,在高、中、低端的flash产品布局中,EMC就差DSSD了,一旦拥有DSSD这样的产品之后,就可以基本覆盖整条产品链了。

DSSD具体是一个怎样的产品呢?会不会和IBM Flashsystem类似的产品呢?这是我们最为好奇的。由于目前产品还没有发布,但是从DSSD创始人Bill Moore的一个报告中,可以一窥DSSD产品的技术特点。

 

wKioL1No7YSR7CXfAAHRwIj-GO4730.jpg

 

wKiom1No7cHwJ8ltAAGVW_-Q7Sk766.jpg

 

从上面的两张图中我们可以发现,DSSD的产品主要关注IOPS。传统磁盘存储产品36rack的情况下能够达到400万的随机IOPS;在采用DSSD之后,一个rack就可以达到150M随机IOPS,性能提升了37.5倍。从存储容量来看,flash存储的单机柜容量要比传统磁盘阵列要高。随着去年推出的3D Nand flash的大量应用,flash存储的单机柜容量将会成倍增长。今天将要发布的skyera产品可以达到单机柜21PB的存储容量。所以,综合而言,采用DSSD的解决方案之后,IOPS的性能提升了一大截,并且单机柜的容量也增强了很多。这里有一个问题是功耗。从上图可以看到对于flash存储,1PB的存储容量需要消耗16kw;对于磁盘存储系统,20PB的存储容量需要消耗20kw。显然,采用flash存储之后,每GB的能源消耗增大了。由于16nm等新工艺的使用,flash工作频率的不断提高,使得半导体的开关动态功耗急剧增大,所以,flash存储的功耗也会很高。在未来flash存储的发展过程中,我觉得功耗控制会是一个非常重要的问题。单位存储密度提升了,与此同时,单位面积的功耗也会急剧增大。如何做到绿色flash存储是一个挑战。

从上面的分析可以知道,DSSD产品的主要关注如何提升系统的IOPS,降低IO延迟。为了达到这个目的,仅仅简单的采用flash存储介质是不行的,需要软硬件的全面配合。硬件方面,目前还不知道是什么样的架构,但可以猜测的是DSSD应该会采用类似于IBM Flashsystem那样的硬件结构,通过基于PCIeSSD模块组合构成一个RAID节点。采用这种硬件架构最大的好处就是降低IO延迟,去除了SAS层额外引入的时间延迟。所以,估计DSSD在硬件架构方面会和IBM FlashsystemViolin memory以及Skyera他们的系统类似。正确的答案需要等到明年产品发布的时候才能知道。

 

wKioL1No7bGS7tqBAAF1mU0FKpY616.jpg

 

在软件方面DSSD也会为IO延迟作很多优化,从上图的延迟说明图可以看出,采用传统SSD加上SAS/SATA的方案会存在300us的延迟。另外kernel的各个层次之间也会存在25us左右的延迟。因此,如果要实现一个低延迟的系统,整个IO stack将会做很多调整。个人认为,针对flash存储,整个软件层需要和FTL全面结合起来。文件系统、逻辑卷管理和FTL在很多方面都是相似的,所以,不需要像传统IO Stack一样把这些模块全部实现,然后堆叠在一起。比较理想的方案是将文件系统、卷管理器和FTL整合在一起,从而可以减少虚拟化的层次,降低IO延迟。

 

wKioL1No7c_yAdS8AAAyZNLgi9c272.jpg

 

DSSD的创业者很多来自于以前SUNZFS团队。ZFS是一款当时非常前沿的文件系统,涵盖了存储虚拟化的内容。所以,在软件方面一定会借鉴了很多ZFS文件系统的内容。

去年flash存储可谓此起彼伏,今年、明年flash存储应该会稳步增长,会出现很多让人眼前一亮的新东西。