数据分布示意图(以4块磁盘组成的阵列为例):
P = D1 ⊕ D2 ⊕ D3 ⊕ D4
P为校验位,D1~D4分别代表四个数据位,⊕表示异或操作。
可以看到,当D1,D2,D3,D4中其余的一个数据丢失的时候,可以利用其余的三个数据位和校验位P进行恢复,具体的恢复公式如下:
例如,当D1丢失的时候,D1 = D2 ⊕ D3 ⊕ D4 ⊕ P
同时可以看到,当两快磁盘出现故障的时候,RAID5无法恢复。
数据分示意布图(以4D+1P为例):
校验位的生成:
P = D1 ⊕ D2 ⊕ D3 ⊕ D4 ⊕ D5 ⊕ D6
Q = GF(D1) ⊕ GF(D2) ⊕ GF(D3) ⊕ GF(D4) ⊕ GF(D5) ⊕ GF(D6)
D1~D6:条带化的数据
P:P校验位
Q:Q校验位
⊕:异或操作
GF(D1):对D1位进行Galois Field变换。
RAID6与RAID5数据安全性比较:
RAID6是在RAID5的改进,RAID6不仅能在一个磁盘离线的情况下将数据恢复(使用和RAID5一样的异或校验),而且由于用了两个盘作为纠错盘,所以能应付两个磁盘同时离线的情况。由于目前磁盘的容量越来越大等因素,在大型的关键数据库中(如商业银行大型的数据库等)出现两个磁盘同时出错的概率也在上升,这也使得RAID6技术越来越被看好。
笔者针对同样是8个磁盘,数据利用率同样是75%,但分别用RAID5和RAID6进行构建的磁盘阵列情况进行比较。一个用两个独立的RAID5(3D+1P)构建;另一个用RAID6(6D+1P+1Q)构建,应用伯努利(Bernoulli)概率分布分析如下(假设单个磁盘在10年内出现故障的概率是):
两个独立的RAID5(3D+1P)构建的系统数据安全的概率分析:
在三种情况下,该系统的数据是安全的:
1. 8个磁盘都没有损坏的情况,概率是
2. 8个磁盘只有一个损坏的情况,概率是
3. 两个独立RAID5(3D+1P)系统中,各损坏一个磁盘的情况,概率是
所以,两个独立的RAID5(3D+1P)构建的系统数据安全的总概率是
一个RAID6(6D+1P+1Q)构建的系统数据安全的概率分析:
1. 8个磁盘都没有损坏的情况,概率是 [与上个系统相同]
2. 8个磁盘只有一个损坏的情况,概率是 [与上个系统相同]
3. 8个磁盘中有两个损坏的情况,概率是
所以,一个RAID6(6D+1P+1Q)构建的系统数据安全的总概率是
实际一点,假设单个磁盘在10年内出现故障的概率是 ,则用RAID5构建的系统,十年内不出故障的安全概率为99.881629%;对比用RAID6构建的系统,十年内不出故障的安全概率为99.994607%。
可见,RAID6的数据安全级别是相当高的。当然RAID5的安全性也相当好了。从上面数据看起来,两者相差不大。但是对于出现故障的概率RAID5是0.118371%, RAID6是0.005393%.这样看来,提高还是很大的。随着磁盘的容量越来越大导致数据出错概率的增大。两者的差距还会进一步加大,RAID6的优势就更明显了。而当磁盘容量增至20多TB的时候,RAID6的安全性比RAID5已经高出1000倍左右。
总结篇
对RAID6做一下总结如下:
在使用大数据块的情况下,RAID6的随机读取性能很好;因为不但要在每硬盘上写入校验数据而且要在专门的校验硬盘上写入数据,RAID6的随机写入性能很差。RAID6的持续写入性能一般,在使用小数据块时表现很好。总体而言,RAID6拥有更快速的读取性能,更高的容错能力。但同时,RAID6也存在写入速度很慢的缺点,RAID控制器在设计上更加复杂,成本更高。
RAID6是一项很有吸引力的技术,它允许一个阵列中的两块磁盘同时出现故障而不会丢失数据。现在的磁盘可靠性已经很高,尤其是高端的光纤通道磁盘,那么有必要对两块磁盘同时出现故障的情况进行设防吗?答案是肯定的,目前的磁盘容量已经很大,如果一块磁盘出现故障,那么整个RAID组中的磁盘都需要进行数据重构,磁盘容量越大需要的时间越长,在数据重构的时间内如果再发生磁盘故障,那么所有的数据都将丢失。因此RAID6技术将可靠性提高了1000倍以上。
可以看到,RAID更加注重的是数据的安全性,而且由于成本之高,所以并不适合所有的企业,对于一般安全性的数据而言,RAID5还是比较合适的,只有高安全性数据,才需要RAID6技术。
上一篇:近期将陆续更新,请大家关注
下一篇:iSCSI基础概念
-
RAID5升级为RAID6
RAID5升级为RAID6的有效方法。
升级 RAID5 RAID6
举报文章
请选择举报类型
补充说明
0/200
上传截图
格式支持JPEG/PNG/JPG,图片不超过1.9M