一、SAN
SAN(Storage area/attach network):存储 区域/附加 网络
架构图:
- IP-SAN:支持ISCSI协议的SAN
- FC-SAN:支持网状通道协议的SAN
- Server-SAN
FusionStorage就是Server-SAN
名词解释:
- SDS存储 software define storage 软件定义存储
- SDN:software define network 软件定义网络
- ovs:open virtual switch 虚拟交换机(软件)
- linuxbridge:虚拟交换机(软件)
二、Server-SAN架构
Server-SAN:由多个服务器自带的存储组成的存储资源池,同时拥有计算资源
支持线性扩展/横向扩容,直接对接新的服务器,把新加入的服务器的存储加入存储池里实现存储扩容
三、传统存储 VS 分布式存储
四、FusionStorage架构
部署要求:最少3个节点,12块硬盘
- FSM(Fusion Storage Manager):FS的管理员,提供告警、日志、监控、配置等维护功能,一般都是主备部署
- FSA(Fusion Storage Agent):代理,和FSM对接,部署在服务器节点上,实现服务器和FSM互通;(FSA下面有 MDC、OSD、VBS三个节点)
- MDC (Metadata Controller):元数据控制,实现对分布式集群的状态控制,以及控制数据分布规则、数据重建规则等;
最少部署3个节点以上,多以单数,3、5、7以上,形成MDC集群;
选择3个、5个、7个或者9个节点创建控制集群时,对应的控制集群节点上会启动MDC进程,由ZK集群在多个MDC中选举主MDC,主MDC对其它MDC进行监控,主MDC故障时产生新的主MDC。
- 状态控制:
- 数据分布规则:安排底层的副本数据在哪些服务器上
- 数据重建规则:数据Down掉后是否重建
- ZK(Zookeeper):为MDC集群提供选举仲裁
- zookeeper 是一个分布式协调框架,是一个文件系统 + 通知机制。
- 文件系统:ZK是众多目录组成,里面有各种文件和脚本
- 通知机制:就是通知其他节点
- zk集群特点:整个集群,采用半数以上存活机制
- 选举机制:Leader follower
zk选举的三个概念:
- VBS(Virtual Block Service):VBS通过SCSI或iSCSI接口提供分布式存储接入点服务,使应用服务器能够通过VBS访问分布式存储资源。选择服务器启用VBS后,该服务器上启动VBS进程,部署VBS进程的服务器形成VBS集群。
- OSD加入存储池的服务器上会启动OSD进程,一个服务器上启动一个OSD(下面包含了多个“实例”,理解为线程)进程(这是8版本的说法,而我们现在实验环境是6版本,所以,一个服务器上有很多OSD进程,一块磁盘对应一个OSD)。
五、FusionStorage部署方式
融合部署
指的是将VBS和OSD部署在同一台服务器中
虚拟化应用推荐采用融合部署的方式部署
分离部署
指的是将VBS和OSD分别部署在不同的服务器中
高性能数据库应用则推荐采用分离部署的方式
融合部署或分离部署对资源的要求是不一样的。接下来看一看资源要求。
六、多副本机制 && EC机制
多副本机制:
FS采用多副本机制保证数据的可靠性,即同一份数据可复制保存为2~3副本
EC机制:
Erasure Coding(简称EC,即纠删码)是一种冗余保护机制,通过计算校验片的方式实现数据冗余保护。
分布式存储系统在写入数据时,将数据切分为N个数据块(N为偶数),通过EC编码算法计算得到M个校验块(M取值2、3或4)。
存储节点的个数≥N+M时采用N+M冗余配比,当(N+M)/M≤存储节点的个数<N+M时采用N+M:1冗余配比。
如何在有限的节点下,快速判定是否支持某种冗余配比呢?
只要节点数>= N+M 数,就支持N+M冗余配比;
只要节点数*M >= N+M 数,就支持N+M:1冗余配比。