写在前面

对于运维来说,数据读取、安全与存储,也是至关重要的一点,数据存储的技术点也是相当的多,面比较广,今天,民工哥来给各位小伙伴聊一聊有关于数据存储的“那些事儿”


存储的概念介绍

数据存储对象包括数据流在加工过程中产生的临时文件或加工过程中需要查找的信息。数据以某种格式记录在计算机内部或外部存储介质上。数据存储要命名,这种命名要反映信息特征的组成含义。数据流反映了系统中流动的数据,表现出动态数据的特征;数据存储反映系统中静止的数据,表现出静态数据的特征,解释来源于百度百科。


民工哥用一句话总结:数据存储就是将一定量的数据通过不同的存储架构存储到不同的存储介质当中


存储介质介绍

磁盘和磁带都是常用的存储介质

磁盘又分机械式磁盘、SSD等类型



数据存储组织方式因存储介质而异。在磁带上数据仅按顺序文件方式存取;在磁盘上则可按使用要求采用顺序存取或直接存取方式。数据存储方式与数据文件组织密切相关,其关键在于建立记录的逻辑与物理顺序间对应关系,确定存储地址,以提高数据存取速度。


存储方式

DAS直接附加存储方式‍

就与普通的PC机存储一样,将外部的存储设备直接加在服务器内部来存储数据


这种存储方式,比较适用于小型网络结构,数据量小,对数据的传输与读取速度要求不高的场景下


NAS网络存储方式‍

它是采用独立于应用服务器,单独为网络数据存储而开发的一种文件服务来连接所有的存储设备,通过这种方式来存储数据,可单独为所有应用服务共享使用


这种存储方式安装布署比较简单,可以即插即用,而且不依赖于操作系统,缺点就是存储的性能不太好


SAN存储方式‍

这种存储方式是1991年IBM公司推出的,基于光纤介质的一种存储方式,它的组成如下:


1)存储和备份设备:包括磁带、磁盘和光盘库等。


2)光纤通道网络连接部件:包括主机总线适配卡、驱动程序、光缆、集线器、交换机、光纤通道和SCSI间的桥接器


3)应用和管理软件:包括备份软件、存储资源管理软件和存储设备管理软件。


磁盘阵列系统介绍

由于数据存储量的增长,单块磁盘设备不能满足正常的存储量需求了,因此引入了磁盘阵列系统这个概念,常用的磁盘阵列有以下几个


RAID 0

RAID0是所有磁盘阵列中读写性能最好,也是最简单的实现方式



但它缺点是没有数据冗余及恢复机制,它至少需要两块盘进行组建,从而将两块磁盘的空量叠加在一起,形成一个新的大的存储容量磁盘,由于它的缺点,当其中一块磁盘损坏,就会造成数据丢失无法恢复,这种阵列可以存储一些大量的日志数据


RAID 1

RAID 1它被称为镜像阵列,因此结构中的磁盘是互为镜像互备的



此结构最少需要两块盘组成,当一块磁盘损坏可以即时恢复数据,它的读取性能比较好,存储的性能较差,因为同一份数据需要写入到两块磁盘中


RAID 10 01

RAID10需要四块盘进行组建,理论上两块盘也可以,不过没有任何实际可用的意义



这类结构要求最好磁盘的容量最好一致,否则整个阵列只能识别最小容量的磁盘设备,它是独立工作的两组RAID1,然后再组成RAID0这样的阵列结构


RAID01(或称之为RAID0+1)



它的结构是先将磁盘组成RAID0,然后再组成多个独立的RAID1


RAID5

这种结构至少需要三块磁盘组成



它是基于基偶校验的原理,它的算法核心是XOR,可以允许损坏一块磁盘,然后通过这种XOR算法,能很快的完成数据的恢复




更多精彩内容请关注民工哥微信公众号

浅析数据存储的“那些事儿”_数据