传统图像处理方法实现目标识别

这篇文章主要从宏观角度上讲述目标检测与识别算法。

三个步骤

传统的目标检测与识别算法包含三个步骤:区域选择、特征提取、分类回归。首先,对输入的待检测图像利用滑动窗口进行遍历,生成大量的候选区域;然后,采用手工设计的特征提取算法对候选区域的信息进行特征提取;最后将提取到的特征信息送入分类器中进行回归与分类。

区域选择方法

提出的选择性搜索方法(Selective Search),利用区域划分算法将输入图像分成很多个小的区域,比较相邻区域之间的特征(颜色、纹理、尺寸和空间),将具有相似特征的两个小区域进行合并,直到没有相似区域为止,得到候选区域。 值得注意的是,rcnn算法借鉴了该方法。

特征提取方法

Haar 特征用于人脸检测器的使用,利用简单特征分类器增强级联的方法快速计算图像中目标的 Haar 特征,对图像中像素值变化较大的区域具有较好的表达能力,使其能对图像中的边缘信息进行很好的特征表达。不过 Haar 特征针对不同的识别问题需要设计更加适应当前场景的特征,无法适用于多场景的目标检测,并且由于数据量不大,泛化能力弱。

Hough实现倾斜图片矫正

SIFT 将图像中的关键点(角点、边缘点等)作为特征点,确定关键点的特征方向,通过比较匹配特征点,建立对应关系。SIFT 特征有较好的尺度不变性,能减少噪声、角度变化等对目标的干扰,具有一定的鲁棒性。能在海量数据的特征库中进行高速匹配,即使单个物体也能产生大量的特征向量,检测速度快,广泛应用于特征匹配中。

HOG 用于行人检测问题并取得优秀的效果,通过计算局部区域的梯度直方图来作为特征。HOG 特征将图像划分为较小的区域,统计各个区域内像素点的梯度直方图,形成图像的特征描述。利用直方图存储目标的边缘信息,具有更强的表达能力,对几何和光照变化有较好的不变性,在行人检测任务中表现优越。

分类回归方法

目前常用的分类器包括:支持向量机(SVM)、SoftMax 分类器、AdaBoost(Adaptive Boosting)、朴素贝叶斯分类器(NaiveBayes)、随机森林 RF(RandomForests)等。

总结

其实这一篇文章夹杂我个人一些私心,想要从理论上对图像处理进行的更加深刻一些。总体上这篇文章讲的比较浅显,多是一些理论知识,缺少代码实践。