云存储是为解决传统存储无法解决的问题而产生的,并不是要完全取代传统的存储。存储方案的选择,要根据数据的形态、数据量及数据读写的方式来做规划。每个存储方案都有它的优点与缺点。

 

云存储的种类及适合的应用

 

  我们可以把云存储分成二类, Block Storage 与 File Storage 。

  Block Storage 会把单笔的数据写到不同的硬盘,借以得到较大的单笔读写带宽,适合用在数据库或是需要单笔数据快速读写的应用。它的优点是对单笔数据读写很快,缺点是成本较高,并且无法解决真正海量文件的储存,像 EqualLogic 3PAR 的产品属于这一类。

  File Storage 是基于文件级别的存储,它是把一个文件放在一个硬盘上,即使文件太大拆分时,也放在同一个硬盘上。它的缺点是对单一文件的读写会受到单一硬盘效能的限制,优点是对一个多文件、多人使用的系统,总带宽可以随着存储节点的增加而扩展,它的架构可以无限制的扩容,并且成本低廉,代表的厂商如 Parascale 。

 

那些应用适合 Block Storage

快速更改的单一文件系统

快速更改单一文件的例子包括 数据库、共用的电子表单,在这些例子中,好几个人共享一个文件,文件经常性地、频繁的更改。为了达到这样的目的,系统必须具备很大的内存、很快的硬盘及快照等功能,市场上有很多这样的产品可以选择。

 

针对单一文件大量写的高性能计算( HPC )

某些高性能计算有成千上百个使用端,同时读写单一个文件,为了提高读写效能,这些文件被分布到很多个节点,这些节点需要紧密地协作,才能保证数据的完整性,这些应用由集群软件负责处理复杂的数据传输。例如石油探勘及财务数据模拟。

 

哪些应用适合 File Storage

File Storage 适合应用的场合如下

 

1.   文件较大,总读取带宽要求较高 — 例如 网站、 IPTV

2.   多个文件同时写入 – 例如 监控

3.   长时间存放的文件 – 例如文件备份、存放或搜寻

 

这些应用有一些共通的特性

1.   文件的并发读取

2.   文件及文件系统本身较大

3.   文件使用期较长

4.   对成本控制要求较高

 

下面我们介绍一下典型的 File Storage 应用

文件及内容搜寻

大部分的情形,数据久了之后,使用的机会就比较少,但为了可以查询,不管是公司资料还是媒体内容,查询的成本必须低于数据本身的价值,这样才划得来。用户可以使用旧的甚至淘汰不用的服务器建立云存储,存放这些旧的数据以供查询。

 

Tier-2 NAS

File Storage 支持标准的网络协议,对使用者来说,就是一个 NAS ,用户在使用时,几乎不需更动数据中心任何的应用端程序,一些旧的数据,可以迁移到这个云存储中,我们可以把它作为 Tier-2 的 NAS 来使用。 Tier-2 是指二级存储的意思。

 

多文件大量写入的应用

监控是大量数据写入的典型应用,成千上万的摄像头,将数据写到各自的文件中,在一个云存储中,有很多存储节点,每个存储节点可以提供多个摄像头写入,在写的带宽不够时,只要增加存储节点即可,由于数据集中处理,只需要一个管理人员,便能管理整个监控系统。

 

数据大量读取的应用

数据挖掘及高性能计算是大量读取的标准应用,这些应用需要很大的读取带宽,这些带宽的要求往往不是现有一般的 NAS 可以提供的,云存储可以把很多文件分散写到不同的存储节点,以便透过多个存储节点的并发得到最大的带宽。这里的高性能计算与 Block Storage 中说的不同点是,这里的高性能计算所读取的不是单一文件,而是从不同存储节点读取很多文件,这是 File Storage 的强项。

 

多个使用端都希望读取同一个文件的应用

IPTV 及网站的特质是,一个文件同时供很多人读取,为了应付大量及突如其来的读取需求,云存储会复制多份文件,以满足应用端读取的需求。

 

结论

  以上我简单了介绍云存储的种类及适合的应用,有机会我再仔细介绍每一个应用。总之云存储是希望借由服务器便宜的成本及弹性的架构,解决传统存储不能满足的问题,客户可以根据数据的形态,选择合适的存储方案。

 

作者 Bill Lin 目前任职于 Parascale 公司