现如今虚拟化发展如日中天,继服务器虚拟化之后,存储虚拟化技术也开始在各种领域广泛应用。
对于服务器虚拟化,如今用户已经很了解了,就是通过虚拟化软件,将一台物理服务器虚拟为多台虚拟服务器,借助Vmotion等迁移特性,提高服务器计算资源的利用率。但是对于存储虚拟化,很多人就不了解了。套用服务器虚拟化的经验,存储虚拟化莫非也是将一个物理磁盘或者阵列,虚拟为多个虚拟盘或虚拟阵列,答案是否定的。从服务器虚拟化,到存储虚拟化只有一个共同点,就是通过池化资源的方式,提高计算资源或者存储资源的利用率。
池化的话题
对于存储而言,池化的概念并不陌生。可以说,存储池化概念的提出不始于存储虚拟化,在存储从服务器直联存储到以SAN或者NAS为代表的网络存储的发展过程中,就提出了池化的概念。
借助池化,网络存储可以有效提升存储的利用率。因此,从直联存储向网络存储的发展过程,从技术上看,就是一个磁盘池化的过程。JBOD也好,RAID也好,以及SAN和NAS都是借助池化来提升磁盘的利用率。如今,存储虚拟化技术不可避免的又提出了池化。那么,此池化与彼池化有什么区别呢?
为什么网络存储池化之外,还需要一个存储虚拟化的池化呢?换句话说,是不是SAN或者NAS的网络存储不够彻底。对此,IBM存储架构师马静指出,信息化不 断发展,在用户信息化应用过程中,在不同时期会有不同的需求,引入不同的应用系统。与此同时,产品技术的发展,不同时期也会有所不同,两者结合,就造成了 不同的应用系统并存,造成所谓信息孤岛。存储也是这样,针对不同应用而设计的多套SAN、NAS系统并存,造成所谓存储的信息孤岛。那么,不同的SAN、 NAS系统之间,其存储资源是无法进行共享。
对于多套网络存储系统并存,中国民航计算机信息中心生产调度部负责人戚前方指出,从企业发 展的角度,SAN的出现就是企业需求的表现。如果纯粹从理论的角度,用一个SAN所构建的网络存储系统支撑企业所有应用系统的存储需求,这是有可能的。但 从实际情况看,这是非常困难的。戚前方指出,目前很多企业都存在着多套SAN系统并存,不同SAN系统利用率不同,但是又没有办法让多个SAN系统之间形 成资源联动。戚前方表示,作为用户他非常需要能够灵活调配存储资源的解决方案。
用一套SAN系统来整合企业存储,从技术上也有很大难度。马静指出,一来SAN存储目前还没有完全一个通用的标准,各家主流厂商所生产的SAN 系统,虽有标准但所遵循程度不一,没有做到完全的标准化。还有一方面,各家管理平台不一样,因此用SAN来满足存储资源池化,实现存储资源的灵活调配,几 乎不可行。这也是存储虚拟化产生和发展的原因。
存储虚拟化
所谓存储虚拟化技术,就是借助相关的存储虚拟化设备,如IBM所推出的SVC,对目前用户环境下的多套存储系统进行整合,进行虚拟化配置之后映 射给主机系统,实现存储资源的最大共享。马静指出,虚拟化之后,对于用户而言不需要了解数据是存储在哪个系统,从而实现了存储资源的透明化。
“从用户的角度看,存储最好能够像家中的水龙头一样,打开就有水,就能用,但是你不需要了解,水龙头的水来自哪个水厂。只要能够进行存储资源的灵活调配,数据信息可以自动流动,这就是存储虚拟化所能够带来的意义。”戚前方说。
“在技术实现上,存储虚拟化是一套物理设备,是一个软硬件的集成方案。”马静介绍说。
就IBM存储虚拟化解决方案而言,SVC是在SAN网络层进行虚拟化,通过在主机和SAN存储设备之间构建一个虚拟引擎连接,将主机传输出来的I/O数据,直接导向虚拟引擎节点,对于IBM而言,就是导向SVC,然后在SVC的控制下,经SAN交换机,交付各个SAN系统,进行后端存储保存。总而言之,就是在原有的存储结构中,新加入了一个存储虚拟化层,并用这个新加入的存储虚拟化层,对于应用系统数据进行统一管理和调配。
据马静介绍,之所以大费周折,对现有存储系统进行虚拟化改造,是因为,存储虚拟化可以带来一系列的好处。一来,它实现了存储资源的池化和共享。 众所周知,目前的存储系统所采用很多磁盘,其实并不完全由于存储容量的考虑,只要是为满足存储系统对性能的要求,通过多磁盘并行存储,改善系统的 IOPS.实施存储虚拟化,相当于建立了一个整合多套存储资源的存储池,也意味着可以使用更多磁盘,不仅提高了性能,同时磁盘资源配置更加灵活。二来,存 储虚拟化还可以利旧,继续发挥一些老旧存储系统。以一些老旧中低端存储为例,这些系统的特点是缓存比较小,通常只有几个G,超过8G的都很少,对整个存储 系统影响比较大,但是他们的磁盘容量大。采用存储虚拟化,以SVC为例,它采用集群配置的方式,一个节点就有8G缓存,因此在存储虚拟化的统一调度下,可 以显著提高老旧存储系统的性能,同时发挥其大容量的需求。
此外,一些高级的管理特性,如Thin Provisioning(自动精简配置)等,这些管理特性以往只有在高端存储系统才具有,尽管今年来,这些高端技术和管理特性也在逐步往中低端产品下移,单是对于老旧系统而言,不具备这样的管理特性。此外如快照,它是保持CDP(连 续数保护)很重要的一个特性,可以确保系统故障时,恢复到快照时间点。但是快照也有一个缺点,就是占用存储磁盘的空间,很多中低端存储就是受容量限制,无 法开展快照应用。IBM在快照技术上具有专利技术,其快照卷较之源卷可以做得非常小,即发挥了快照的特性,又减少存储容量的影响。这样的一些技术,通过引 入存储虚拟化被自动引入,从而将现有的存储系统拉升一个台阶。这也是存储虚拟化所带来的好处。
平衡与取舍
存储虚拟化的好处显而易见的,但是落实到应用,用户不可避免的会有所担心。对此,戚前方指出,主要的担心有两点:一是存储虚拟化层自身的开销, 对原有存储系统的影响;二来就是对于备份中心而言,目前企业多采用同步同构模式,或者采用异构同步的模式,随着存储虚拟化层的引入,对于备份的模式会产生 怎么样的影响。
对于这些担心,马静观点认为,在整个数据链路通道上,增加一层虚拟化的,从整个系统的高可用性来说,肯定有所降低,毕竟增加了一个环节。但这是 一个取舍的问题。要享受存储虚拟化的种种好处,那么就要付出一些代价。实际上,对于存储虚拟化层的可靠性,在设计上有很多的技术考虑和保证。以SVC为 例,它采用集群配备和扩展的模式,可以从2个节点一直扩展到8个节点,未来可以扩展到更多,所支持的存储容量从TB级一直可以到PB级。在稳定性方 面,IBM SVC设计可以达到99.999%,具有很高的质量保证。兼容性方面,从2003年设计开始,SVC已经有6年的历史,其间IBM与几十家光纤交换机、主 机、操作系统和存储厂商都有合作,目前用户可以透过网站了解兼容性情况。实际上,也只有做到了兼容,才会有存储虚拟化。
据了解,引入存储虚拟化,至少停机一次。首先需要用户停机,确保所有数据全部保存到后端磁盘,做到数据的完整、可用。在此之后,把SVC存储虚 拟化系统接入到SAN里来,它需要做好相应的部署工作,如一一映射管理等,因为必须要保证数据的可用和一致。但这个过程比较容易控制,因不牵扯具体数据拷 贝时间,因此所需要的时间很短,少则一个小时,如果整合的系统非常多,所需要时间就会加长。待部署工作完成之后,就可以进行虚拟化配置,此后系统就可以工 作了。此外,在服务器方面,需要按照一个软件,以确保不会产生链路故障,不会影响数据的一致性,同时肩负负载均衡的功能。
总之,存储虚拟化前期规划非常重要,需要针对用户应用现状,给出专业化的解决方案。所谓大块头需要大智慧,对于存储虚拟化应用而言,就需要整体的规划部署,取舍与平衡。据了解,为了推动存储虚拟化应用发展,IBM方面会推出一系列的优惠策略,以及专业化的咨询与服务。
更多精彩内容请关注:
IBM存储化官方微博
IBM存储化官方网站