作者:吴业亮

VDO(Virtual Data Optimize虚拟数据优化):通过压缩或删除存储设备上的数据来优化存储空间
VDO层放置在现有块存储设备例如RAID设备或本地磁盘的顶部。这些块设备也可以是加密设备。存储层(如LVM logic卷和文件系统放置在VDO层的顶部。
VDO按以下顺序将三个阶段应用于数据,减少存储设备上的占用空间

零区块的排除:

在初始化阶段,整块为0的会被元数据记录下来,这个可以用水杯里面的水和沙子混合的例子来解释,使用滤纸(零块排除),把沙子(非零空间)给过滤出来,然后就是下一个阶段的处理

重复数据删除:

在第二阶段,输入的数据会判断是不是冗余数据(在写入之前就判断),这个部分的数据通过UDS内核模块来判断(U niversal D eduplication S ervice),被判断为重复数据的部分不会被写入,然后对元数据进行更新,直接指向原始已经存储的数据块即可

压缩:

一旦消零和重删完成,LZ4压缩会对每个单独的数据块进行处理,然后压缩好的数据块会以固定大小4KB的数据块存储在介质上,由于一个物理块可以包含很多的压缩块,这个也可以加速读取的性能

实验
1、安装VDO模块,需要的软件包是kmod-kvdo vdo

# yum install vdo kmod-kvdo -y
# systemctl start vdo
# systemctl enable vdo

如果内核加载不上需要重启下

2、创建VDO卷

# vdo create --name=vdo1 --device=/dev/sdd --vdoLogicalSize=5G

虚拟数据优化器(VDO)以重复数据删除,压缩和精简配置的形式为Linux提供了内联数据缩减。设置VDO卷时,可以指定要在其上构造VDO卷的块设备以及计划提供的逻辑存储量。

当托管活动的虚拟机或容器时,红帽建议以10:1的逻辑与物理比率配置存储:即,如果您使用1 TB的物理存储,则将其表示为10 TB的逻辑存储。
对于对象存储(例如Ceph提供的类型),Red Hat建议使用3:1的逻辑与物理比率:也就是说,将1 TB的物理存储表示为3 TB的逻辑存储。

3、分析一个VDO卷(deduplication重复删除数据 compression压缩)

# vdo status --name=vdo1

4、给vdo1一个xfs文件系统,之后挂载到/mnt/vdo1上

#mkfs.xfs -K /dev/mapper/vdo1

-K选项可防止立即丢弃文件系统中未使用的块,从而使命令返回更快

刷新存储设备

# udevadm settle
#mkdir /mnt/vod1
vdostats

挂载使用

#mount /dev/mapper/vdo1 /mnt/vdo1/

5、使用vdostats命令查看卷的初始统计信息和状态

# vdostats --human-readable

Device Size Used Available Use% Space saving%

/dev/mapper/vdo1 8.0G 4.0G 4.0G 50% 98%

6、创建文件

# cp /run/media/root/RHEL-8-0-0-BaseOS-x86_64/images/install.img /root/install.img

7、移动文件到挂载点中,然后看一下结果

#mv /root/install.img /mnt/install.1.img

# vdostats --human-readable

Device Size Used Available Use% Space saving%

/dev/mapper/vdo1 8.0G 4.4G 3.6G 54% 73%

8、重新复制一遍

# cp /root/install.img /mnt/vdo1/install.2.img

# vdostats --human-readable

Device Size Used Available Use% Space saving%

/dev/mapper/vdo1 8.0G 4.4G 3.6G 55% 70%

总结:会发现传一个相同的文件,但是空间并不会发生变化。