python基于深度学习的图像目标识别计数图像目标识别算法

转载

JAVA小侠影 2023-12-17 11:24:19

文章标签 图像处理计算机视觉算法特征提取目标检测 文章分类 Python 后端开发

传统图像处理方法实现目标识别

这篇文章主要从宏观角度上讲述目标检测与识别算法。

三个步骤

传统的目标检测与识别算法包含三个步骤：区域选择、特征提取、分类回归。首先，对输入的待检测图像利用滑动窗口进行遍历，生成大量的候选区域；然后，采用手工设计的特征提取算法对候选区域的信息进行特征提取；最后将提取到的特征信息送入分类器中进行回归与分类。

区域选择方法

提出的选择性搜索方法(Selective Search)，利用区域划分算法将输入图像分成很多个小的区域，比较相邻区域之间的特征（颜色、纹理、尺寸和空间），将具有相似特征的两个小区域进行合并，直到没有相似区域为止，得到候选区域。值得注意的是，rcnn算法借鉴了该方法。

特征提取方法

Haar 特征用于人脸检测器的使用，利用简单特征分类器增强级联的方法快速计算图像中目标的 Haar 特征，对图像中像素值变化较大的区域具有较好的表达能力，使其能对图像中的边缘信息进行很好的特征表达。不过 Haar 特征针对不同的识别问题需要设计更加适应当前场景的特征，无法适用于多场景的目标检测，并且由于数据量不大，泛化能力弱。

Hough实现倾斜图片矫正

SIFT 将图像中的关键点（角点、边缘点等）作为特征点，确定关键点的特征方向，通过比较匹配特征点，建立对应关系。SIFT 特征有较好的尺度不变性，能减少噪声、角度变化等对目标的干扰，具有一定的鲁棒性。能在海量数据的特征库中进行高速匹配，即使单个物体也能产生大量的特征向量，检测速度快，广泛应用于特征匹配中。

HOG 用于行人检测问题并取得优秀的效果，通过计算局部区域的梯度直方图来作为特征。HOG 特征将图像划分为较小的区域，统计各个区域内像素点的梯度直方图，形成图像的特征描述。利用直方图存储目标的边缘信息，具有更强的表达能力，对几何和光照变化有较好的不变性，在行人检测任务中表现优越。