一、简介
独立硬盘冗余阵列(RAID, Redundant Array of Independent Disks),旧称廉价磁盘冗余阵列(Redundant Array of Inexpensive Disks),简称磁盘阵列。其基本思想就是把多个相对便宜的硬盘组合起来,成为一个硬盘阵列组,使性能达到甚至超过一个价格昂贵、容量巨大的硬盘。根据选择的版本不同,RAID比单颗硬盘有以下一个或多个方面的好处:增强数据集成度,增强容错功能,增加处理量或容量。另外,磁盘阵列对于电脑来说,看起来就像一个单独的硬盘或逻辑存储单元。分为RAID-0,RAID-1,RAID-1E,RAID-5,RAID-6,RAID-7,RAID-10,RAID-50,RAID-60。
2.简单来说,RAID把多个硬盘组合成为一个逻辑扇区,因此,操作系统只会把它当作一个硬盘。RAID常被用在服务器电脑上,并且常使用完全相同的硬盘作为组合。由于硬盘价格的不断下降与RAID功能更加有效地与主板集成,它也成为玩家的一个选择,特别是需要大容量存储空间的工作,如:视频与音频制作。
3.最初的RAID分成不同的档次,每种档次都有其理论上的优缺点,不同的档次在两个目标间获取平衡,分别是增加数据可靠性以及增加存储器(群)读写性能。这些年来,出现对于RAID观念不同的应用。
二、RAID实现的方式
1.外接式磁盘阵列:通过扩展卡提供适配能力;
2.内接式RAID:主板集成RAID控制器;
3.软件RAID:软件方式实现的RAID功能(Linux)
三、标准RAID
1.RAID 0
RAID 0亦称为带区集。它将两个以上的磁盘并联起来,成为一个大容量的磁盘。在存放数据时,分段后分散存储在这些磁盘中,因为读写时都可以并行处理,所以在所有的级别中,RAID 0的速度是最快的。但是RAID 0既没有冗余功能,也不具备容错能力,如果一个磁盘(物理)损坏,所有数据都会丢失,危险程度与JBOD相当。
2.RAID 1
(1)两组以上的N个磁盘相互作镜像,在一些多线程操作系统中能有很好的读取速度,理论上读取速度等于硬盘数量的倍数,与RAID 0相同。另外写入速度有微小的降低。只要一个磁盘正常即可维持运作,可靠性最高。其原理为在主硬盘上存放数据的同时也在镜像硬盘上写一样的数据。当主硬盘(物理)损坏时,镜像硬盘则代替主硬盘的工作。因为有镜像硬盘做数据备份,所以RAID 1的数据安全性在所有的RAID级别上来说是最好的。但无论用多少磁盘做RAID 1,仅算一个磁盘的容量,是所有RAID中磁盘利用率最低的一个级别。
(2)如果用两个不同大小的磁盘建RAID 1,可用空间为较小的那个磁盘,较大的磁盘多出来的空间也可以分区成一个区来使用,不会造成浪费。
3.RAID 5
RAID Level 5是一种储存性能、数据安全和存储成本兼顾的存储解决方案。它使用的是Disk Striping(硬盘分区)技术。RAID 5至少需要三块硬盘,RAID 5不是对存储的数据进行备份,而是把数据和相对应的奇偶校验信息存储到组成RAID5的各个磁盘上,并且奇偶校验信息和相对应的数据分别存储于不同的磁盘上。当RAID5的一个磁盘数据发生损坏后,可以利用剩下的数据和相应的奇偶校验信息去恢复被损坏的数据。RAID 5可以理解为是RAID 0和RAID 1的折衷方案。RAID 5可以为系统提供数据安全保障,但保障程度要比镜像低而磁盘空间利用率要比镜像高。RAID 5具有和RAID 0相近似的数据读取速度,只是因为多了一个奇偶校验信息,写入数据的速度相对单独写入一块硬盘的速度略慢,若使用“回写缓存”可以让性能改善不少。同时由于多个数据对应一个奇偶校验信息,RAID 5的磁盘空间利用率要比RAID 1高,存储成本相对较便宜。
4.RAID 6
(1)与RAID 5相比,RAID 6增加第二个独立的奇偶校验信息块。两个独立的奇偶系统使用不同的算法,数据的可靠性非常高,任意两块磁盘同时失效时不会影响数据完整性。RAID 6需要分配给奇偶校验信息更大的磁盘空间和额外的校验计算,相对于RAID 5有更大的IO操作量和计算量,其“写性能”强烈取决于具体的实现方案,因此RAID6通常不会通过软件方式来实现,而更可能通过硬件/固件方式实现。
(2)同一数组中最多容许两个磁盘损坏。更换新磁盘后,数据将会重新算出并写入新的磁盘中。依照设计理论,RAID 6必须具备四个以上的磁盘才能生效。
三、混合RAID
1.JBOD
JBOD( Just a Bunch Of Disks)在分类上,JBOD并不是RAID的档次。由于并没有规范,市场上有两类主流的做法:
(1)使用单独的链接端口如SATA、USB或1394同时控制多个各别独立的硬盘,使用这种模式通常是较高级的设备,还具备有RAID的功能,不需要依靠JBOD达到合并逻辑扇区的目的。
(2)只是将多个硬盘空间合并成一个大的逻辑硬盘,没有错误备援机制。
数据的存放机制是由第一颗硬盘开始依序往后存放,即操作系统看到的是一个大硬盘(由许多小硬盘组成的)。但如果硬盘损毁,则该颗硬盘上的所有数据将无法救回。若第一颗硬盘损坏,通常无法作救援(因为大部分文件系统将磁盘分区表(partition table)存在磁盘前端,即第一颗),失去磁盘分区表即失去一切数据,若遭遇磁盘阵列数据或硬盘出错的状况,危险程度较RAID 0更剧。它的好处是不会像RAID,每次访问都要读写全部硬盘。但在部分的JBOD数据恢复实践中,可以恢复未损毁之硬盘上的数据。同时,因为每次读写操作只作用于单一硬盘,JBOD的传输速率与I/O表现均与单颗硬盘无异。
2.RAID 7
RAID 7并非公开的RAID标准,而是Storage Computer Corporation的专利硬件产品名称,RAID 7是以RAID 3及RAID 4为基础所发展,但是经过强化以解决原来的一些限制。另外,在实现中使用大量的高速缓存以及用以实现异步数组管理的专用即时处理器,使得RAID 7可以同时处理大量的IO要求,所以性能甚至超越了许多其他RAID标准的实做产品。但也因为如此,在价格方面非常的高昂。
3.RAID 10
(1)RAID 10是先镜射再分区数据,再将所有硬盘分为两组,视为是RAID 0的最低组合,然后将这两组各自视为RAID 1运作。
(2)当RAID 10有一个硬盘受损,其余硬盘会继续运作。
4.RAID 01
(1)RAID 01则是跟RAID 10的程序相反,是先分区再将数据镜射到两组硬盘。它将所有的硬盘分为两组,变成RAID 1的最低组合,而将两组硬盘各自视为RAID 0运作。
(2)RAID 01只要有一个硬盘受损,同组RAID 0的所有硬盘都会停止运作,只剩下其他组的硬盘运作,可靠性较低。如果以六个硬盘建RAID 01,镜射再用三个建RAID 0,那么坏一个硬盘便会有三个硬盘离线。因此,RAID 10远较RAID 01常用,零售主板绝大部分支持RAID 0/1/5/10,但不支持RAID 01。
5.RAID 50
(1)RAID 5与RAID 0的组合,先作RAID 5,再作RAID 0,也就是对多组RAID 5彼此构成Stripe访问。由于RAID 50是以RAID 5为基础,而RAID 5至少需要3颗硬盘,因此要以多组RAID 5构成RAID 50,至少需要6颗硬盘。以RAID 50最小的6颗硬盘配置为例,先把6颗硬盘分为2组,每组3颗构成RAID 5,如此就得到两组RAID 5,然后再把两组RAID 5构成RAID 0。
(2)RAID 50在底层的任一组或多组RAID 5中出现1颗硬盘损坏时,仍能维持运作,不过如果任一组RAID 5中出现2颗或2颗以上硬盘损毁,整组RAID 50就会失效。
(3)RAID 50由于在上层把多组RAID 5构成Stripe,性能比起单纯的RAID 5高,容量利用率比RAID5要低。比如同样使用9颗硬盘,由各3颗RAID 5再组成RAID 0的RAID 50,每组RAID 5浪费一颗硬盘,利用率为(1-3/9),RAID 5则为(1-1/9)。
6.RAID 60
(1)RAID 6与RAID 0的组合:先作RAID 6,再作RAID 0。换句话说,就是对两组以上的RAID 6作Stripe访问。RAID 6至少需具备4颗硬盘,所以RAID 60的最小需求是8颗硬盘。
(2)由于底层是以RAID 6组成,所以RAID 60可以容许任一组RAID 6中损毁最多2颗硬盘,而系统仍能维持运作;不过只要底层任一组RAID 6中损毁3颗硬盘,整组RAID 60就会失效,当然这种情况的概率相当低。
(3)比起单纯的RAID 6,RAID 60的上层通过结合多组RAID 6构成Stripe访问,因此性能较高。不过使用门槛高,而且容量利用率低是较大的问题。
四、应用
RAID2、3、4较少实际应用,因为RAID5已经涵盖了所需的功能,因此RAID2、3、4大多只在研究领域有实现,而实际应用上则以RAID5为主。
(2)RAID4有应用在某些商用机器上,像是NetApp公司设计的NAS系统就是使用RAID4的设计概念。
五、RAID具体实现方式
1.硬件方式实现:通过BIOS参数调整来实现;
2.软件实现方式:通过软件工具mdadm来实现;
3.RAID设备可命名为/dev/md0、/dev/md1、/dev/md2等等;
六、mdadm工具使用
1.mdadm:是一个模式化工具
2.语法:mdadm [mode] <raiddevice> [option] <component-devices>
mode(模式):
-C:创建;
-A:装配;重新识别此前实现的RAID;
-F:监控;
-f,-r,-a:管理;
<raiddevice>:/dev/md#;
<component-devices>:任意块设备;
option:
-C:创建模式,还有以下子选项:
-n #: 使用#个块设备来创建此RAID;
-l #:指明要创建的RAID的级别;
-a {yes|no}:自动创建目标RAID设备的设备文件;
-c CHUNK_SIZE: 指明块大小;
-x #: 指明空闲盘的个数;
3.支持的RAID级别有:RAID0,RAID1,RAID4,RAID5,RAID6,RAID10
4.-D:显示RAID详细信息:
mdadm -D /dev/md#;
5.管理模式:
-f:标记指定磁盘为损坏;
-a:添加磁盘;
-r:删除磁盘;
6.观察md状态:
cat /proc/mdstat;
7.停止md设备:
mdadm -S /dev/md#;
七、创建一个10G可用空间的RAID5设备
示例:我用四块硬盘做实验,分别是/dev/sdb、/dev/sdc、/dev/sdd、/dev/sde
1.具体步骤如下:
(1)分区:
① fdisk /dev/sdb;(划分/dev/sdb1设备,大小为10G,并修改ID,这里ID修改为fd;同理,其他三块硬盘也按照同样方法分区,这里我用命令来分区;)
②dd if=/dev/sdb of=/dev/sdc bs=1 count=512;
②dd if=/dev/sdb of=/dev/sdd bs=1 count=512;
②dd if=/dev/sdb of=/dev/sde bs=1 count=512;
(2)同步分区:
①partx -a /dev/sdb;
②partx -a /dev/sdc;
③partx -a /dev/sdd;
④partx -a /dev/sde;
(3)使用mdadm创建并定义RAID设备:
① mdadm -C /dev/md0 -a yes -l 5 -n 3 -x 1 /dev/sd{b,c,d,e}1;
(4)显示RAID详细信息:
①mdadm -D /dev/md0;
(5)观察md状态:
①cat /proc/mdstat;
②blkid;
(6)生成配置文件:
①mdadm -Ds /dev/md0 > /etc/mdadm.conf;
②cat /etc/mdadm.onf
(7)格式化:
①mkfs.ext4 /dev/md0;
(8)挂载,写进/etc/fstab文件里实现自动挂载:
①mkdir /mnt/raid;
②/dev/md0 /mnt/raid ext4 defaults 0 0;
③mount -a;
④df -h;
⑤cp -r /etc/* /mnt/raid
(9)测试,模拟磁盘故障:
/dev/sdc1,/dev/sdd1为活动硬盘;/dev/sde1为空闲硬盘;现在模拟/dev/sdb1硬盘损坏,看空闲硬盘/dev/sde1会不会自动顶替损坏硬盘工作,用户能否正常访问数据,步骤如下:
① mdadm /dev/md0 -f /dev/sdb1;
②mdadm -D /dev/md0;
③mdadm /dev/md0 -r /dev/sdb1;移除磁盘
④mdadm /dev/md0 -a /dev/sdb1;添加磁盘
通过实验证明,空闲硬盘会顶替损坏硬盘工作,用户可以正常访问数据;
(10)测试,模拟真实硬盘故障:
场景再现:假设硬盘/dev/sdd1,/dev/sde1故障了,修复方法:我们可以找个容量大的硬盘划分分区,并把分区加入RAID成员或者重新加磁盘,方法如下
①fdisk /dev/sda;(划分/dev/sda6,/dev/sda7分区,大小为10G,修改ID,改为fd)
②mdadm /dev/md0 -a /dev/sda6
③mdadm /dev/md0 -a /dev/sda7
##这条命令与上面无关④mdadm –G /dev/md0 –n4 -a /dev/sd##;添加新成员
注:RAID实验可以用硬盘或者分区,用硬盘做RAID实验就不用划分分区;用分区做RAID实验要注意分区大小要一致;
八、删除RAID
步骤:
(1)取消挂载:
①umount /mnt/raid;
(2)停止md设备:
①mdadm -S /dev/md0;
②mdadm -D /dev/md0;
(3)启动md设备:
①mdadm -A /dev/md0;
②mdadm -R /dev/md0;强制启动
②mdadm -D /dev/md0;
注:停止或启动md设备都需要依赖于/etc/mdadm.conf文件,所以这个文件要事先生成;
(4)删除RAID成员信息:
①blkid;
②mdadm --zero-superblock /dev/sda#;
(5)删除成员分区:
①fdisk /dev/sda;(/dev/sda7,/dev/sda8)
(6)清除/etc/fstab文件信息;
(7)删除md文件:
①rm -f /etc/mdadm.conf
九、磁盘阵列比较表
RAID档次 | 最少硬盘 | 最大容错 | 可用容量 | 读取性能 | 写入性能 | 安全性 | 目的 | 应用产业 |
单一硬盘 | 参考 | 0 | 1 | 1 | 1 | 无 | ||
JBOD | 1 | 0 | n | 1 | 1 | 无(同RAID0) | 增加容量 | 个人(暂时)存储备份 |
0 | 2 | 0 | n | n | n | 一个硬盘异常,全部硬盘都会异常 | 追求最大容量、速度 | 视频剪接缓存用途 |
1 | 2 | n-1 | 1 | n | 1 | 最高,一个正常即可 | 最球最大安全性 | 个人、企业备份 |
5 | 3 | 1 | n-1 | n-1 | n-1 | 高 | 最求最大容量、最小预算 | 个人、企业备份 |
6 | 4 | 2 | n-1 | n-2 | n-2 | 安全性较RAID5高 | 同RAID5,但较安全 | 个人、企业备份 |
10 | 4 | n/2 | n/2 | n | n/2 | 安全性高 | 综合RAID0/1优点,理论速度较快 | 大型数据库、服务器 |
注:1、n代表硬盘总数;
2、JBOD可接到现有硬盘,直接增加容量;
https://blog.51cto.com/yacheng0316/1964611