RAID(Redundant Array of Independent Disks)

中文意思是独立冗余磁盘阵列简单的说,RAID是一种把多块独立的硬盘(物理硬盘)按不同的方式组合起来形成一个硬盘组(逻辑硬盘),从而提供比单个硬盘更高的存储性能和提供数据备份技术。组成磁盘阵列的不同方式成为RAID级别(RAID Levels)。
该有一些存储的技术性术语:

       硬盘镜像(Disk Mirroring):硬盘镜像最简单的形式是,一个主机控制器带二个互为镜像的硬盘。数据同时写入二个硬盘,二个硬盘上的数据完全相同,因此一个硬盘故障时,另一个硬盘可提供数据。
  硬盘数据跨盘(Disk Spanning):利用这种技术,几个硬盘看上去像是一个大硬盘;这个虚拟盘可以把数据跨盘存储在不同的物理盘上,用户不需关心哪个盘上存有他需要的数据。
  硬盘数据分段(Disk Striping):数据分散存储在几个盘上。数据的第一段放在盘0,第2段放在盘1,……直至达到硬盘链中的最后一个盘,然后下一个逻辑段将放在硬盘0,再下一个逻辑段放在盘1,如此循环直至完成写操作。
  双控(Duplexing):这里指的是用二个控制器来驱动一个硬盘子系统。一个控制器发生故障,另一个控制器马上控制硬盘操作。此外,如果编写恰当的控制器软件,可实现不同的硬盘驱动器同时工作。
  容错(Fault Tolerant):具有容错功能的机器有抗故障的能力。例如RAID 1镜像系统是容错的,镜像盘中的一个出故障,硬盘子系统仍能正常工作。
  主机控制器(Host Adapter):这里指的是使主机和外设进行数据交换的控制部件(如SCSI控制器)。
  热修复(Hot Fix):指用一个硬盘热备份来替换发生故障的硬盘。要注意故障盘并不是真正地被物理替换了。用作热备份的盘被加载上故障盘原来的数据,然后系统恢复工作。
  热补(Hot Patch):具有硬盘热备份,可随时替换故障盘的系统.
  热备份(Hot Spare):与CPU系统带电连接的硬盘,它能替换下系统中的故障盘。与冷备份的区别是,冷备份盘平时与机器不相连接,硬盘故障时才换下故障盘。

       热备份盘用来给阵列中的硬盘作为备份,当阵列中其中一块硬盘损坏时,该盘上数据会通过其他硬盘数据和校验信息,恢复到备份盘上,热备份盘叫做HOTSPARE,做完阵列后,在SERVERAID MANAGER软件下,旁边有加号的硬盘即是热备份盘。
        

  平均数据丢失时间(MTBDL-Mean Time Between Data Loss):发生数据丢失的事件间的平均时间。
  平均无故障工作时间(MTBF-Mean Time Between Failure或MTIF):设备平均无故障运行时间。
  廉价冗余磁盘阵列(RAID-Redundant Array of Inexpensive Drives):一种将多个廉价硬盘组合成快速,有容错功能的硬盘子系统的技术。
  系统重建(Reconstruction or Rebuild):一个硬盘发生故障后,从其它正确的硬盘数据和奇偶信息恢复故障盘数据的过程。
  恢复时间(Reconstruction Time):为故障盘重建数据所需要的时间。
  单个大容量硬盘(SLED-Singe Expensive Drive)。
  传输速率(Transfer Rate):指在不同条件下存取数据的速度。
  虚拟盘(Virtual Disk):与虚拟存储器类似,虚拟盘是一个概念盘,用户不必关心他的数据写在哪个物理盘上。虚拟盘一般跨越几个物理盘,但用户看到的只是一个盘。


                             技术术语整理于“百度”大神.
        懂得了这些基本的原理才能正确 理解RAID level的一些区别,我这里总结一下,经常碰到的设备,能做的raid的概念..不总用的.先不总结了.

       主要是RAID 0,1,5,6,10的一些场景性能各种对比总结

       A适用环境

       RAID 0 适用于流媒体服务器等需要高读写性能的非关键场合.
       RAID 5 适用于web、E-mail 服务器等对性能和可靠性有一定要求的场合.
       RAID 6 适用于数据库服务器等对可靠性和性能有较高要求的场合.
       RAID 10 适用于数据库服务器等要求高性能、高可靠性的场合.
   
       B可靠性
       
       RAID 0 无冗余功能,如果1个硬盘损坏,所有的数据都无法使用。相对其他
RAID 级别,RAID 0 可靠性最低,不适合关键业务。

    RAID 1 采用镜像技术对数据进行实时备份。RAID 组中只有一个工作盘,其余
硬盘都作为它的镜像盘。每次写数据时必须同时写入工作盘和镜像盘,读数据
时则只能从工作盘读出。一旦工作盘发生故障,镜像盘就会接替该工作盘的工
作。当更换故障盘后,数据可以重构,恢复工作盘的正确数据。相对其他RAID
级别,RAID 1 的可靠性最高。

    RAID 5 为保障存储数据的可靠性,采用循环冗余校验方式,并将校验数据分散存储在RAID 组的各成员盘上,当RAID 组的某个成员盘出现故障时,通过其他
成员盘上的数据可以重新构建故障硬盘上的数据。

    RAID 6 对数据进行两个独立的逻辑运算,得出两组校验数据,并将这些校数
据分散存储在RAID 组的各成员盘上。RAID 6 允许RAID 组内同时有两个成员
盘发生故障。故障盘上的数据可以通过其他成员盘上的数据重构。

    RAID 10 将数据分散存储到RAID 组的成员盘上,同时为每个成员盘提供镜像
盘,实现数据全冗余保存。RAID10比RAID5可靠性更高。
    

    C读写性能
   
    RAID0可以并行读写,读写速度最快,适用于需要高带宽的应用。

    RAID1写数据时必须同时写入工作盘和镜像盘,读数据时则只能从工作盘读
出,因此相对其他RAID 级别性能较低。

    RAID5常应用于写操作较多的场合,通常RAID 5 写性能比RAID 10 更好,读
性能不如RAID 10。

    RAID6具有双重数据校验,因此运算负担较大,实现较复杂。RAID6通常读写
性能较RAID5更差。

    RAID10具有较好的读写性能。镜像盘个数越多,读性能越高,写性能越低.


    D成本
    
    RAID 0 硬盘利用率为100%,成本最低。

    RAID 1 为工作盘提供镜像盘,硬盘利用率为1/m(m 为镜像组内成员盘个数)。
    RAID 1 的硬盘利用率比RAID 5 低,成本较高。

    RAID 5 硬盘利用率为(n-1)/n(n 为RAID 组内成员盘个数),当RAID组由
3 个硬盘组成时,利用率最低,为66.7%。RAID 5 的组内校验数据实际上只相
当于占用一个硬盘的容量,因此该级别的存储成本较低。

    RAID 6 硬盘利用率为(n-2)/n(n 为RAID 组内成员盘个数),当RAID组由
4 个硬盘组成时,利用率最低,只有50%。RAID 6 的组内校验数据实际上只相
当于占用两个硬盘的容量,因此该级别的存储成本比RAID 5 高,而比RAID 1
和RAID 10 低。

    RAID 10 为工作盘提供镜像盘,硬盘利用率为1/m(m 为镜像组内成员盘个
数)。RAID 10 的硬盘利用率比RAID 5 低,成本较高。

    硬盘最少数量对比:
    Raid0,至少两块.
    Raid1,至少两块.
    Raid5,至少三块.
    Raid6,至少四块.
    Raid10,至少四块.

  待续...培训去了..