【时间】2018.10.18
【题目】剪切波的一些知识(附python及matlab实现剪切波变换的代码)
概述
本文是阅读论文《基于剪切波变换的人脸表情识别》后,对于其中有关剪切波内容的一些笔记。
剪切波是一种多尺度几何分析工具,可以看做是对小波变换的一种改进。小波因其多分辨率特性而成为表情识别的有效算法之一。但众所周知的是,小波变换具有有限的方向选择性和基函数各向同性。剪切波是2006年提出的一种新的多尺度几何方法,在图像处理领域已经得到了广泛应用。
【附】GitHub中剪切波变换的python实现代码--https://github.com/grlee77/PyShearlets
matlab实现代码---百度云 链接:https://pan.baidu.com/s/1LbB8nanqW-MBOxajOf4XvA
提取码:1rvw
1.1 剪切波的定义及离散算法
Shearlet【48】是一类新的多尺度几何分析方法,该方法通过对基本函数的缩放、剪切和平移等仿射变换来构造,体现了函数的几何和数学特性,如近几年来许多领域的研究学者所强调的函数的方向性、尺度和振荡等。Shearlet 可以和多分辨率分析关联起来,这样就可以获得像小波-样的迭代算法,并推广到经典的级联算法(49。因此Shearlet变换作为一种新型的多尺度几何分析工具为图像处理领域的研究人员所广泛接受。
1.1.1 Shear let变换的定义和性质
连续剪切波变换解决了波前集问题,其平移参数可检测到所有奇异点的位置,而剪切参数则可显示出奇异曲线的方向。
1.1.2.ShearIet变换的离散化
1.2离散可分离剪切波变换及其数值计算
1.2.1 离散可分离剪切波变换(DSST)
Wang.Q Lim[481在2010年提出了离散可分离剪切波变换(Discrete Shearlet Transform,DSST).
离散可分离剪切波变换(DSST)的计算方法可通过如下步骤表示:
1.3图像的剪切波分解
离散剪切变换通过剪切矩阵将原始图像映射到不同的方向上。方向性的实现通常有两种方法:旋转和剪切。在某种意义上,旋转是一个非常方便的工具,它保留了重要的几何信息,如长度、角度和并行性。然而,这种方法不保留整数格,对于数字化有一定的困难。与此相反,剪切矩阵最不但能够提供方向性,当剪切参数k是整数时,还保留了整数格。图2.4显示了一副标准图像“zoneplate"(256X256)经过剪切变换后的结果,有L=6个方向。
在图2.4中,上行为在水平锥cn内的三个方向,下行为在垂直锥cl内的三个方向。输入原始图像尺寸为256×256,由图可知剪切变换后各个方向分量尺寸仍为256×256。由图2.4可以看出,剪切波具有很强的方向敏感性。
各向异性小波变换将图像分解为低频子带和高频子带。在各向异性小波变换中,沿水平和垂直方向的变换个数是不相等的,也就是说在同一尺度上,沿水平方向上的变换,l-和垂直方向上的变换%并不需要相等【49】。
将剪切变换得到的各方向子带进行各向异性离散小波变换完成多分辨率分解,即实现剪切波变换。图2.6显示了标准图像“zoneplate’’经过三尺度6方向剪切波变换后的剪切波系数。
1.4 ShearIet域的图像特征分析
1.4.1 图像在Shear Iet域的能量分布
即具有能量聚集性,由此可得到较高的压缩比。图像经过Shearlet变换后,能量的分布会随着变换尺度n的变化呈现出一定的规律。本节通过仿真分析了图像在Shearlet域的能量分布。为了体现结论的普遍性,仿真图像选用标准“lena’’(512X512)灰度图像,如图(2.7)所示,并给出了其在Shearlet域能量峰值最分解尺度变化的曲线。图2.8(a)--2.8(e)给出了“lena’’图像在分解尺度n=l,3,5,7,9时的Shearlet系数的能量分布。
从图2.8(a)~(e)可以清楚的看出:对于
的图像,对其进行11尺度二维离散Shearlet变换时,能量主要集中在
的区域内,即低频分量部分;随着分解尺度的增大,图像在Shearlet域的能量分布趋于二维坐标平面的原点。此对于
的图像,Shearlet变换的系数为
,定义能量比p为:
图2.9分别给出了“lena”图像的Shearlet域能量比值P随尺度变化的过程。由图2.9可以看出,随着分解尺度的增大,低频区域包含的总能量却在慢慢减少,尽管如此,在六尺度Shearlet分解时,Shearlet域的能量在此区域内的聚焦度依然达到了90%以上。由以上分析可知,图像的Shearlet变换具有良好的聚焦性。所以当我们利用Shearlct变换提取表情特征时,低频分量应该作为识别的重要特征。
1.4.2图像在ShearIet域的低频与高频特征
(1)由图2.10(a)~图2.14(a)可以看出,Shearlet变换后的低频分量主要体现了图像的轮廓信息。在表情识别中,体现的主要是表情的概貌。当分解尺度由小变大时,低频分量含有的信息越来越少,仅由低频部分重构的图像越来越模糊。当分解尺度较少时,相当于经历了截止频率较高的低通滤波器,高频成分浮现出来,还能清晰的看到图像的边缘,如图2.10(a)所示。分解尺度较大时,相当于截止频率较低的低通滤波器,如图2.14(a)所示。
(2)由图2.10(b)~图2.14(b)可以看出,由高频部分重构的图像可以很明显的观察到“lena"的边缘信息。图像的边缘和纹理信息主要包含在含有高频部分的信息中,随着分解尺度的增大,边缘和纹理信息越来越明显,而在表情识别中,人脸面部的边缘和纹理信息在识别过程中发挥着重要的作用。当对图像进行完全分解时,对应于截止频率非常低的高通滤波器,只有小部分低频分量被滤除出,仅由高频信息重构的图像接近原图像,如图2.14(b)所示。
(3)当分解尺度适中时,由低频和高频所重构的图像均既包含了原图像的轮廓信息,也包含了原图像的边缘信息,如图2.1l(a)和2.12(b)所示,这对于表情识别是非常重要的。
1.4.3图像在ShearIet域的各尺度高频特征
高频部分主要体现了图像的边缘和纹理信息,那么对于刀尺度Shearlet变换来说,研究各尺度高频分量之间的有何区别,又有何相关的性质的有必要的。对图像进行完全分解,分别使用各尺度高频系数做二维离散Shearlet反变换,得到分别由各尺度高频Shearlet系数重构出的图像。
选用“lena’’(512X512)图像进行仿真,在完全分解尺度,脚下的仿真结果如图2.15(a)~(i)所示,方向数目均为6。
由图2.15(a)~(i)可以看出,随着尺度的逐渐增大,图像在Shearlct域的各尺度高频信息经过逆变换所得到的图像的边缘经历了一个由模糊到清晰再到模糊的过程,图2.15(b)~(d)重构边缘效果比较好,而且在图2.15(g)一(i)中,边缘信息越来越模糊。因此在本文的识别系统中,并不将表情图像的Shearlet系数全部用做特征,而考虑将低频分量与某一尺度体现边缘效果好的高频分量融合作为表情特征进行提取。