几年前,当EMC首次提出信息生命周期管理(ILM)的理念时,整个业界为之欢欣鼓舞。但在随后的几年中,没有厂商能够提供真正粒度化、自动化的分层存储技术,这也使得ILM看起来像是空中楼阁。2010年,3PAR、Compellent等公司引起了业界的广泛关注,其中重要的原因是,这些厂商已经能够提供成熟的自动分级存储技术。
手动还是自动化
在谈论ILM之前,我们首先要了解什么是信息生命周期。信息生命周期是指随着时间变化而发生的信息价值的改变。在创新之初,数据通常具有最高的价值且使用频繁。但是,随着数据存在时间的不断延长,人们对数据的访问就不那么频繁了,数据本身的价值也逐渐降低。掌握信息生命周期改变的规律,并根据信息价值的改变部署和灵活调整存储基础设施,就可以达到事半功倍的效果,不仅可以提升整个存储系统的性能,而且能降低整体拥有成本。
举例来说,在一个订单处理系统中,当公司收到一个新订单时,信息的价值是最高的。当订单处理完毕,客户信息和订单数据都不会被实时访问时,信息的价值就降低了。此时,公司就可以把这些不会被经常访问的数据迁移到更便宜的、可用性和可访问性能更低的二级存储设备上。天长日久,这些保存在二级存储设备上的数据又可以进行归档,从而腾出更多空间存储更有价值的信息。这就是所谓的ILM。
EMC认为,ILM是一种主动的策略。ILM允许一个IT组织根据预先定义的商业策略来高效地管理数据的整个生命周期,并通过优化存储基础设施来实现更大的投资回报。EMC归纳出ILM策略的5个典型特征:以业务为中心,与业务的关键流程、关键应用以及初始状态整合在一起,以满足现在及将来的信息增长需求;集中式管理,即与业务相关的所有信息都应该在ILM策略的考虑范围之内;ILM应该作为一个策略来实现,并且包含所有的业务应用、流程和资源;一个ILM策略应该适用于异构环境,把所有类型的存储平台和操作系统都考虑进来;由于信息价值的不同,ILM策略应该考虑不同的存储需要,并且按照信息对商业和价值来分配存储资源。
在存储设备的部署上,企业可以首先实现网络分层存储,将应用或数据分类,以手动方式在不同存储层次间移动数据;然后逐步过渡到面向应用的ILM,即针对不同信息类型定义不同的业务策略,并ILM部署到主要应用上,并使其过程自动化;最后在整个企业范围内实现ILM和基于策略的自动化。ILM从理论到实践,要过的第一道关就是如何从以手动方式实现转变为自动化地实现分层存储。3PAR公司营销副总裁Craig Nunes表示:“以自动化的方式实现分层存储是ILM能否得到大规模普及的关键。3PAR的Adaptive Optimization(自适应优化)软件能够实现3PAR InServ F系列和T系列存储服务器存储子卷的自动分层,再配合SSD技术,可以为企业和云数据中心提供自动分层存储解决方案。”
更细粒度的自动分层
有ILM作为理论指导,又有EMC FAST、IBM智能分层(Smart Tiering)、3PAR Adaptive Optimization等分层存储技术作基础,再加上价格逐渐降低的SSD介质,自动分层存储的春天已经不远了。
2009年底,IBM发布了智能分层技术。IBM智能分层技术可以更好地支持IBM CARS(法规遵从、信息可用、信息保持和信息安全)解决方案的部署,从而提升信息架构的自动化管理能力和响应能力。用户的存储架构中拥有多种不同的存储介质,包括SATA磁盘、光纤磁盘、固态盘等,而且又有在线、近线、离线等不同应用。智能分层使得用户可以更好地利用不同的存储介质。分层存储不是一个新概念,但是以前用户在实施分层存储时不仅需要规模庞大的专业技术团队,而且随着业务的不断变化,分层存储的实施难度会加大。IBM的智能分层技术与IBM软件紧密相关,使得用户可以更加智能、轻松地实施分层存储。
EMC公布的FAST技术的愿景是,结合逻辑子卷(sub-LUN)分层、容量按需分配、块级及文件级重复数据删除、数据压缩、磁盘驱动器降速、内置归档以及私有云/公共云联邦等功能,提升系统的自动化管理能力,同时提高管理效率和成本效益。如今,EMC FAST技术已经运用到EMC Symmetrix V-Max、EMC CLARiiON CX4网络存储系统和EMC Celerra NS统一存储系统中。EMC高级副总裁、统一存储部门总经理Rich Napolitano表示:“EMC FAST技术使得客户可以在一个系统内或者在云中对数据进行移动和分层。这不仅提供了一系列归档新方法,也极大地简化了非结构化数据的规模化管理。”
各厂商提供的分层存储方案各不相同。但从分层存储技术的走向看,从基于存储卷的自动分层到基于存储子卷的自动分层,实现更细粒度的自动分层是大趋所趋。3PAR在其高端存储阵列中采用Adaptive Optimization软件,可以实现存储子卷的自动分层。Adaptive Optimization软件能够智能地监控子卷的性能,并根据一定时期内数据访问的频率判定哪些是活跃数据,哪些是静态数据,然后基于用户可配置的策略,自动地、不中断地在各个存储层上重新平衡工作负载。3PAR的子卷数据不中断迁移技术和具有附加策略优先权机制的管理员控制功能,可以最大限度地降低Adaptive Optimization在使用过程中对系统性能带来的不利影响。
Adaptive Optimization软件具有服务质量(QoS)梯度管理功能,可以按照特定的性能和成本要求在某一应用程序内进行数据迁移。例如,服务质量梯度可用于具有高服务级别需求的数据(如季节性订单管理的应用)应用,当工作负载开始增加时,服务质量梯度管理功能将发挥作用,迅速、自动地将数据迁移到高性能的资源(如固态盘)中,并将其保留在那里。Craig Nunes表示:“有了Adaptive Optimization软件,3PAR InServ阵列能够在单一卷中整合多个存储层(固态盘、光纤磁盘和SATA磁盘的自由组合),从而达到用户所需的服务级别,并且整个存储系统每GB的成本比全部使用光纤磁盘低得多。”
用好SSD
除了自动分层存储软件以外,固态盘的出现也给分层存储的实施增添了一个份量极重的砝码。以前,在企业级存储应用中,主要使用的是光纤磁盘,后来为了降低成本又引入了企业级SATA磁盘。近两年,随着更高性能的固态盘的出现,人们在存储介质方面有了更大的选择空间。固态盘的价格呈逐年下降的趋势,虽然从每GB的成本看,固态盘还高于光纤磁盘,但是从每IOPS的成本看,固态盘则优于光纤磁盘。这也为用户在存储系统中新增一个存储层(层0)提供了可能。当前,关于将SSD应用于缓存还是分层存储技术还存在争论。不过,从已经面市的解决方案看,大多数厂商还是将SSD用于分层存储。STEC公司技术营销副总裁Scott Stetzer表示:“固态盘不仅占地空间小、性能高,而且为存储行业重新思考现有的分层存储模式提供了机会。”
Craig Nunes举例说:“假如使用320块300GB的光纤磁盘构成一个存储系统,在存储容量和性能基本相同的情况下,如果换成固态盘与SATA磁盘组合的方式,可以节省30%的成本。”3PAR在其高端存储系统中使用的固态盘都是50GB的中端产品。虽然每个固态盘的容量小,但是由于采用了3PAR独特的主动网格集群架构,用户可以通过使用多个固态盘的方式满足性能的要求。
Craig Nunes表示:“Adaptive Optimization与固态盘的组合可以更好地支持自动分层存储管理。将自动分层存储技术应用于云数据中心,不仅可以降低成本,而且可以改善存储基础设施的灵活性,提高在虚拟环境中处理不断变化和不可预测的工作负载的能力。”