计算机视觉特征检测及应用思维导图计算机视觉特征提取

转载

mob6454cc6441b6 2024-02-21 18:02:55

文章标签 计算机视觉特征检测及应用思维导图计算机视觉 opencv 特征点极值 文章分类 计算机视觉人工智能

图像特征

颜色特征
几何特征

颜色特征

量化颜色直方图
	适用颜色空间：rgb hsv等颜色空间
	操作：
		颜色空间量化 单元(bin)由单元中心代表
		统计落在量化单元上的像素数量
	优势：
		计算高效
	劣势：
		量化问题
		分布稀疏
聚类颜色直方图
	避免出现大量的bin中的像素数量非常稀疏的情况

几何特征

边缘定义： 像素值快速变化的区域 -> 一阶导数的极值区域
	边缘提取:
		由于导数对噪音敏感 先高斯去噪 再使用一阶导数获取极值
		防止极值是由于噪音像素导致 而不是边缘

基于特征点的特征描述子

从不同的距离 不同的方向 角度 不同的光照条件下观察一个物体时 物体的大小
形状 明暗都会有所不同 但我们依然可以判断它是同一件物体

几何特征：关键点
特征点/关键点
	**不同视角图片之间的映射**
	稳定局部特征点
		可重复性 显著性
		抗图片变换
			外貌变换（亮度 光照）
			几何变换（平移 选择 尺度）
			
	兴趣点/关键点
		图片配准/拼接
		运动跟踪
		物体识别
		机器人导航
		3d重建
	
	哪些点可以成为兴趣点/关键点？
	Harris角点(Corner )
		一种显著点
			在任何方向上移动小观察窗 导致大的像素变动
		平区域: 任何方向上无变动
		边区域，角点区域：任何方向上有变动
	局部特征：
		基于尺度空间不变的特征
		特点：
			具有良好的不变性
				旋转 尺度缩放 平移 亮度变化
				对视角变化 仿射变换 和 噪音也有一定程度的稳定性
			独特性好 信息量丰富
				适用于在海量特征数据库中进行快速 准确的匹配
			多量性
				即使少数物体也可以产生大量SIFT特征
			计算快
				经优化的SIFT匹配算法甚至可以达到实时性
		
		DOG	(Difference of Gaussians)
		DOG金字塔的第1组第1层是由高斯金字塔的第1组第2层减第1组第1层得到的。
		以此类推，逐组逐层生成每一个差分图像，所有差分图像构成差分金字塔。
		概括为DOG金字塔的第o组第l层图像是有高斯金字塔的第o组第l+1层减第o组第l层得到的。
		同样得到高频细节边缘信息 但运算量比 LoG快很多 
	
	SIFT 特征运算步骤:
		在DOG尺度空间中获取极值点 即关键点
		计算机没有主观意识去识别哪里是特征点，它能做的，
		只是分辨出变化率最快的点。彩色图是三通道的，
		不好检测突变点。需要将RGB图转换为灰度图，
		此时灰度图为单通道，灰度值在0~255之间分布。
		而且当图像放大或者缩小时，
		它读取的特征点与原先可能差异很大，
		所以其中一个办法就是把物体的尺度空间图像集合提供给计算机，
		让它针对考虑不同尺度下都存在的特征点
		
		对关键点处理
			位置插值(获取精确的关键点)
			去除边缘点
		
		关键点的方向估计
			为了实现图像旋转不变性，需要给特征点的方向进行赋值。
			利用特征点邻域像素的梯度来确定其方向参数，再利用图像的梯度直方图求取关键点局部结构的稳定方向
			区域坐标旋转
			计算采样区域的直方图
**极值点**
	判断极值点:	以x为检测点，其周围的点，除了同层所包围的8个点外，还有上一层
	的9个点与下一层的9个点。 这个点要比同层8个 上下共18个点 都要大或者小。
	
	SIFT-DoG 空间极值点就是“关键点”
		圆半径 -> 特征点尺度
		圆心 -> 特征点坐标
**特征点方向估计**
取图像1中的某个关键点，并找出其与图像2中欧式距离最近的前两个关键点，在这两个关键点中，如果最近的距离除以次近的距离少于某个比例阈值，则接受这一对匹配点。

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。