什么是存储

集中式存储的架构 集中式存储设备_运维

狭义的存储定义:CD、DVD、ZIP,磁带,硬盘等存储介质
广义的存储定义:

  • 存储硬件系统(磁盘阵列,控制器,磁盘柜,磁带库等)
  • 存储软件(备份软件,管理软件,快照,复制等增值软件)
  • 存储网络(HBA卡,光纤交换机,FC/SAS线缆等)
  • 存储解决方案(集中存储,归档,备份,容灾等)

集中式存储

集中式存储的架构 集中式存储设备_服务器_02

集中式存储系统,即整个存储是集中在一个系统中的。
企业级的存储设备一般都是集中式存储。但集中式存储并不是一个单独的设备,是集中在一套系统当中的多个设备。以

  • 华为公司的存储为例,整个存储系统可能需要几个机柜来存放。集中式存储按照技术架构可以划分为SAN和NAS,其中SAN又可以细分为FC-SAN、IP-SAN。
  • 集中式存储最大的特点就是部署结构简单,无需考虑如何对服务进行多个节点的部署,也就不用考虑多个节点之间的分布式协作问题。

集中式存储的缺点:

  • 孤立的存储资源,存储通过专用网络连接到有限数量的服务器;
  • 集中式纵向扩容通过增加硬盘框实现,硬件控制器性能(单控制器带盘能力)成为瓶颈;
  • 集中式存储横向扩容需要通过控制器全连接实现,硬件控制器性能成为扩容瓶颈;
  • 集中式存储资源缺乏共享,存储设备和资源往往由不同厂家提供,设备之间无法进行资源共享,数据中心看到的是一个个孤立的存储池;
  • 集中式存储采用集中式元数据管理方式,系统所能提供的并发操作能力将受限于元数据服务的性能,元数据服务也将会成为系统的性能瓶颈;

分布式存储

集中式存储的架构 集中式存储设备_集中式存储的架构_03

  • 分布式存储系统,是将数据分散存储在多台独立的服务器上。
  • 分布式网络存储系统采用可扩展的系统结构,利用多台存储服务器分担存储负荷,它不但提高了系统的可靠性、可用性和存取效率,还易于扩展。
  • 随着分布式存储越来越普及,现在一些对性能要求比较高的应用也开始使用分布式存储,比如金融系统的数据库。
  • 分布式存储利用软件重构存储服务形式,通过软件模拟原先硬件控制器实现功能的同时,规避硬件控制器的种种弊端。
  • 资源池:类似于SAN的RAID组概念。

存储业务类型

  • 块存储
  • 以块为单位,提供存储空间
  • 文件存储
  • 以文件为单位,通过文件系统提供存储空间
  • 对象存储
  • 以对象为单位,通过软件提供存储空间,其核心思想是元数据(一般指的是数据的位置)和数据分离。

对象存储是一种新兴存储技术,对象存储系统综合了NAS和SAN的优点,同时具有SAN的高速直接访问和NAS的数据共享等优势,提供了高可靠性、跨平台性以及安全的数据共享的存储体系结构

对象存储与块存储、文件存储的对比如下:

块存储对存储层直接访问,开销最小,效率最高,速度最快。但成本最高,扩展困难。块存储采用iSCSI/FC协议,很难跨网络传输。适合的应用场景是企业数据库,如运行Oracle等

文件存储是在块存储之上构建了文件系统,采用目录-目录-文件的方式组织数据,更容易管理。因为大多数应用程序都是对文件进行操作,因此文件存储更容易和应用系统对接。文件系统受目录树的限制,扩展性受限,一般最多扩展到几十PB。文件系统适用于企业内部应用整合,文件共享场景;

对象存储是在块存储之上构建了对象管理层,与文件系统相比,对象系统层是扁平的,扩展限制少,因此拥有近乎无限的扩展性。对象由唯一的Key,文件,数据(文件),元数据,自定义元数据构成,由于包含了自管理信息,更加智能。对象存储采用兼容标准的互联网协议接口,可以跨地域传输。对象存储适用于面向互联网服务的存储场景,以及企业内部的归档、备份场景。