本文发表于计算机世界网-mpsa:数据集中新选择。
 
随着企业it系统的丰富和发展,企业信息系统的内部结构和相互关系变得越来越复杂。信息管理人员已经深刻地意识到集中管理的必要。于是近年来在各个行业数据应用中,“数据集中”成了一个时髦的字眼,就连地域跨度大
和应用类型较多的中小企业,也纷纷投资进行各种规模的“数据集中”。

横在面前的壁垒

就目前的应用和技术发展现状而言,“数据集中”核心存储系统可以选择的常见技术方案只有两种: san架构和nas架构。众所周知,san架构具有高性能、高可靠和扩展能力强等优势,但是成本较高、实施及维护复杂,而且难于实现文件共享;nas架构具有天生的跨平台文件共享能力,安装使用也非常简单方便,但面对网络资源的大量占用,使得它难以担负关键性业务的核心存储系统。由此可见,单纯的san或nas无法完全满足海量存储系统的全面需求。

而且对于中小型企业来说,更重要的问题是资金有限。以十几万或几十万元人民币的投资力度,无法构建类似emc公司提出的esn那样的庞大而复杂的系统。这就要求中小企业在搭建存储系统、实现数据集中时,采用成本较低、但功能强大、技术全面的解决方案。同时需要注意的是,中小企业大多成长速度难以预期,还需要相应的信息系统具有极强的可扩展能力和灵活性。

“mpsa”技术出墙来

对此,一些专业厂商及权威技术组织开始提出一些新的技术解决这些问题。例如iscsi和dafs等。这些技术近年来取得一定成果,但是由于技术本身的成熟性、技术开放性和配套设备厂商支持力度等因素,这些技术的实际使用范围目前还不够大,对国内用户来说,更是乏例可陈。针对这种状况,以成熟技术来整合san和nas两种系统优势的“mpsa”(multi-protocol storage architecture多协议存储架构)应运而生。如果您是中小型用户,完全可从低成本的产品解决方案入手,随应用发展,再不断扩展,使mpsa成为海量存储体系。如果您是大型用户,可以选择技术先进、应用高端的产品解决方案,借助它的兼容性和包容性,这些先进技术能够不断得以完善,使您的mpsa总是处于技术领先地位。

目前,用户可以在市场上见到auspex、netapp、maxtor和亚美联公司等国内外厂商推出的mpsa解决方案。其中auspex和netapp的方案主要专注于传统nas解决方案的改进和补充,而maxtor的方案更适合低端桌面级的应用。亚美联公司的mpsa技术整合程度较高,它在整合nas和san两种技术优势之上,集成了数据备份、数据加密保护等上层应用级的功能。

解析6种关键数据

在具体了解mpsa架构之前,我们先对企业数据进行一些必要的分析和研究。依重要性划分,一般企业信息系统内主要存在6种数据: 索引数据、不可重复业务数据、可重复业务数据、衍生数据、边缘数据和过时数据。这几种数据的重要性级别,依由高到低的次序排列。

索引数据是指系统中的文件系统原数据、数据库日志等一类具有索引性质的数据。它们在系统中所占的存储空间不大,但其重要性却最高,一旦损坏,会严重影响到系统中的其他数据信息的完整性和正确性。例如数据库的日志文件。一般来讲,为了保证这类数据的完好无损,系统会将其复制多份,分散保存在不同位置,以便互相备份。

业务数据是企业存储系统的主要保护对象,也是系统中占存储空间最多的一类数据。根据来源,它可分为可重复业务数据和不可重复业务数据两类。证券交易市场中的行情数据,就是典型的可重复业务数据,这类数据具有一定的可复制性,而且一般无须长久保存,但是在业务进行期间,数据必须保证随时可用。即具有在线性。与之相对应的,每个证券交易营业部的交易数据,就是典型的不可重复数据。这类数据对每一个系统都是独有的,无法从其他类似或相关系统中复制到。除了保证在线外,大多还要进行离线存储保护。

随着erp、crm等技术的发展,企业的信息系统中,出现了大量的衍生数据和边缘数据。例如从最初的业务数据整理计算出的分析结果和业务报表,就属于边缘数据,而分析过程中产生的数据,在报表生成之前,就属于衍生数据。这些数据都是从最初的业务数据中衍生出来的,在得到一定的数据结果之后,对系统就不再有效,而成为过时数据。对于这些数据,更应尽快将其从存储系统中清除,以减轻企业信息系统的负担。

由此可见,在同一个企业同一个信息系统中,业务数据的特征以及其对存储系统的要求不尽相同。传统上简单的采用单一模式进行集中数据存储,显然无法满足真实的系统需求。

管窥mpsa架构

了解了企业信息系统数据的复杂性之后,我们再来具体了解mpsa技术,以及它是如何解决以上问题的。

mpsa架构(如附图所示)将企业存储系统分成3个层次(即“三层存储系统”)。第一个层次采用以传统san架构为基础的存储方式,第二层次采用以传统nas架构为基础的存储方式,而第三层次采用离线存储方式。这3个层次相互配合,协调统一的实现多重机制的海量数据存储系统。
 

第一层子系统中,存储设备通过光纤接口连接到前端的核心服务器。这种方式提供了与san架构相同的高性能,并对其中存储的数据提供了极高的在线保护,适用于企业信息系统中的索引数据和在线性要求高的业务数据。

第二层子系统是可以通过以太网被所有前端服务器和工作站共同访问和使用。它继承了nas技术的共享优势,并提供了一定的数据保护能力,适用于衍生数据和过程数据及其他共享性要求高的数据。

第三层子系统的作用是保存离线数据。一些暂时不需要、但又不可永久性删除的数据都可以存储在这层系统中。另外,对不可重复业务数据的备份,也存储在其中。这层系统以磁带介质为数据载体,在保证系统实现功能的同时,极大地节约单位容量的存储成本。

mpsa架构并不是一个简单的“san+nas+带机/带库”的解决方案。在这一架构中,存储系统的整合程度,比任何单一的san架构或者nas架构都要高。以数据备份系统来说,无论san架构还是nas架构中,数据备份系统历来都是独立的部分。备份软件、数据库、操作系统和群集软件之间的关系经常是纠缠不清的,而在mpsa架构中,前端服务器彻底摆脱了数据备份系统兼容性的困扰,并无须为数据备份工作付出任何宝贵的cpu时间。另外,在mpsa架构中,各个子系统并不是孤立的。通过核心管理部分的协同调度,各部分的存储空间可以灵活分配,从而使系统的整合度进一步提高。同时,对于每一层中涉及的产品,可以来自不同厂商,如果是中小企业用户,完全可以选择性能可靠、价位合适的不同品牌的产品,大大降低构建存储系统的成本。

取精华去糟粕

应该强调的是,mpsa是一个完全开放的系统架构。在第一层子系统中,用户几乎可以选择任何光纤接口的磁盘阵列产品,而绝大多数的带库产品都可以使用在第三层子系统中。这一开放性带给用户的最大利益就是降低成本。有了如此广泛的选择空间,无论是巨无霸级的超大型企业,还是资金有限的中小型企业,都可以籍mpsa优势构建自己的数据存储系统。

此外,mpsa架构还具有对新技术的包容性。目前iscsi等一批新兴的技术正在酝酿成熟中。一旦成熟,其可选范围就会增加,第二层子系统可以立即引入这一技术。其实,在mpsa架构中已经融合了lan-free数据备份技术和虚拟存储技术。

总之,mpsa架构为广大中小企业用户提供了一个高性能、功能丰富、高度整合、扩展能力强、结构灵活多变而且成本低廉的数据集中存储方案。一个包含了3个层次的子系统及相关软件的mpsa系统,容量达到1tb时,其用户价格也不过30万元~50万元。

小释esn

emc公司esn所构成的是一个分布式的高速网络,它使用标准的ip存储技术和通道技术,让用户可以将存储器、集线器和服务器等连接起来,构成一个单一的、易于管理的、集中式的信息基础结构,把企业各部门和业务单位以及远距离位置处的信息资源整合于一体。在这种架构下,需要采用emc技术与产品,总投资成本会高一些。据悉,特为清华大学捐赠emc教室的emc ceo来华时表示非常重视中国市场,未来除为行业用户设计的esn等之外,还将为广大中型企业提供经济、高效的相关存储方案。