AdaBoost算法是一种自适应的Boosting算法,基本思想是选取若干弱分类器,组合成强分类器。根据人脸的灰度分布特征,AdaBoost选用了Haar特征[38]。AdaBoost分类器的构造过程如图2-4所示。
图2-4 Adaboost分类器的构造过程
1)Haar-like矩形特征
Haar-like矩形特征是根据图像的区域灰度对比特性进行设计的,常用的Haar-like特征[39]如图2-5所示,Haar-like特征值定义为白色区域像素值之和与黑色区域像素值之和的差值。
图2-5 常用的Haar-like矩形特征
一幅图像中Haar-like矩形特征的个数非常多,对于一个大小的窗口,就包含大约16万个矩形特征,计算量非常大。为提高运算速度,Viola等[17]将积分图应用于Haar-like特征值的计算。对于一幅图像,点处的积分图像值定义为该点左上方所有点的像素值之和,即:
(2-4)
其中表示积分图像在点处的积分图像值,表示原图像在点处的像素值。通过对原图像的一次遍历即可完成积分图像的初始化。完成积分图像初始化后,对矩形区域内像素值之和的计算变得非常简单:一个矩形内的像素值之和可以由构成该矩形的四个点来确定。对于图2-6所示的图像,若要计算区域的像素值之和,可用式(2-5)得到:
(2-5)
图2-6 积分图像示意图
2)弱分类器
对于一个“是”或“否”问题,随机猜测,正确的概率为50%。而如果有一个分类器的分类精度稍大于50%,则称之为弱分类器。在Adaboost算法中,弱分类器由Haar-like矩形特征生成,构造方法如下:
(2-6)
其中是弱分类器,是矩形特征,是阈值,控制不等号的方向,取值为,将检测样本的特征值与阈值进行比较,为1表示人脸,0表示“非人脸”。
3)强分类器
将若干个弱分类器进行组合构造分类能力更好的强分类器。矩形特征很多,因此会构造大量弱分类器,从中选取分类效果最好的若干个弱分类器,同时将有效特征进行提升,构造强分类器[40][41][42]。
假设要选取个弱分类器来构造强分类器,现有个训练样本,其中人脸样本有个,非人脸样本有个,样本表示为,代表样本图像,当属于人脸时,,否则。构造强分类器的具体步骤如下:
(1)对训练样本的权值进行初始化:
(2-7)
其中代表第零次迭代,第个样本的权值。
(2)循环迭代,迭代次数,对于第次迭代,操作如下:
(a)、对权值进行归一化,使服从概率分布: 。
(b)、对所有弱分类器进行一次遍历,计算每个弱分类器对所有训练样本的误差之和,计算公式为:
(2-8)
其中代表第个弱分类器的误差,代表第个训练样本在第次迭代的权值,表示第个弱分类器对第个样本的判别值。
(c)、从所有弱分类器中选出误差最小者作为本次迭代的最优弱分类器,记为,其引起的总误差为。
(d)、对训练样本的权值进行更新,公式为:
(2-9)
其中,的取值规则为:当被正确分类时,,否则。
(e)、若,令,进入下一次迭代。
(3)结束循环,得到强分类器:
(2-10)
其中,。表示人脸,表示非人脸。
4)级联强分类器
通常情况下,大部分待检测的“非人脸”窗口与人脸差别很大,可以用很少的特征进行分类;而少数与人脸差异不大的待检窗口应该用更多的特征来区分,基于这一事实,AdaBoost引入了级联强分类器[40][42],如图2-7所示,将多个强分类器串联起来,强分类器一级比一级严格。前面的分类器由比较重要的特征构成,要求能够快速的排除大部分的“非人脸”窗口,后面的分类器一般比较复杂,用来区分少数与人脸相似的待检窗口。每一级强分类器遵循的原则是:在保证人脸图像通过率的前提下,尽可能多的排除“非人脸”。
由实验结果可知,Adaboost检测算法引起了误检和漏检的情况:人脸姿态发生变化时会造成漏检,可以通过训练人脸在不同姿态下的分类器来解决;当图像中存在与人脸的灰度分布情况类似的区域时,会造成误检,如图2-8中的人脸雕塑,由于雕塑是三维的,在外界光照的影响下,雕塑的二维图像中人脸区域的灰度分布与真实人脸的灰度分布相似,因此造成误检测,此外,当背景中某个区域的灰度分布与人脸灰度分布相似时,也会造成误检测。
本章针对Adaboost的误检问题进行了研究。传统的Adaboost算法只利用了人脸的灰度信息,而目前图像采集设备所采集的图像一般是彩色的,本章同时利用图像的灰度信息和彩色信息,将Adaboost算法与肤色检测算法相结合,用来降低误检率