图像特征
颜色特征
几何特征
颜色特征
量化颜色直方图
适用颜色空间:rgb hsv等颜色空间
操作:
颜色空间量化 单元(bin)由单元中心代表
统计落在量化单元上的像素数量
优势:
计算高效
劣势:
量化问题
分布稀疏
聚类颜色直方图
避免出现大量的bin中的像素数量非常稀疏的情况
几何特征
边缘定义: 像素值快速变化的区域 -> 一阶导数的极值区域
边缘提取:
由于导数对噪音敏感 先高斯去噪 再使用一阶导数获取极值
防止极值是由于噪音像素导致 而不是边缘
基于特征点的特征描述子
从不同的距离 不同的方向 角度 不同的光照条件下观察一个物体时 物体的大小
形状 明暗都会有所不同 但我们依然可以判断它是同一件物体
几何特征:关键点
特征点/关键点
**不同视角图片之间的映射**
稳定局部特征点
可重复性 显著性
抗图片变换
外貌变换(亮度 光照)
几何变换(平移 选择 尺度)
兴趣点/关键点
图片配准/拼接
运动跟踪
物体识别
机器人导航
3d重建
哪些点可以成为兴趣点/关键点?
Harris角点(Corner )
一种显著点
在任何方向上移动小观察窗 导致大的像素变动
平区域: 任何方向上无变动
边区域,角点区域:任何方向上有变动
局部特征:
基于尺度空间不变的特征
特点:
具有良好的不变性
旋转 尺度缩放 平移 亮度变化
对视角变化 仿射变换 和 噪音也有一定程度的稳定性
独特性好 信息量丰富
适用于在海量特征数据库中进行快速 准确的匹配
多量性
即使少数物体也可以产生大量SIFT特征
计算快
经优化的SIFT匹配算法甚至可以达到实时性
DOG (Difference of Gaussians)
DOG金字塔的第1组第1层是由高斯金字塔的第1组第2层减第1组第1层得到的。
以此类推,逐组逐层生成每一个差分图像,所有差分图像构成差分金字塔。
概括为DOG金字塔的第o组第l层图像是有高斯金字塔的第o组第l+1层减第o组第l层得到的。
同样得到高频细节边缘信息 但运算量比 LoG快很多
SIFT 特征运算步骤:
在DOG尺度空间中获取极值点 即关键点
计算机没有主观意识去识别哪里是特征点,它能做的,
只是分辨出变化率最快的点。彩色图是三通道的,
不好检测突变点。需要将RGB图转换为灰度图,
此时灰度图为单通道,灰度值在0~255之间分布。
而且当图像放大或者缩小时,
它读取的特征点与原先可能差异很大,
所以其中一个办法就是把物体的尺度空间图像集合提供给计算机,
让它针对考虑不同尺度下都存在的特征点
对关键点处理
位置插值(获取精确的关键点)
去除边缘点
关键点的方向估计
为了实现图像旋转不变性,需要给特征点的方向进行赋值。
利用特征点邻域像素的梯度来确定其方向参数,再利用图像的梯度直方图求取关键点局部结构的稳定方向
区域坐标旋转
计算采样区域的直方图
**极值点**
判断极值点: 以x为检测点,其周围的点,除了同层所包围的8个点外,还有上一层
的9个点与下一层的9个点。 这个点要比同层8个 上下共18个点 都要大或者小。
SIFT-DoG 空间极值点就是“关键点”
圆半径 -> 特征点尺度
圆心 -> 特征点坐标
**特征点方向估计**
取图像1中的某个关键点,并找出其与图像2中欧式距离最近的前两个关键点,在这两个关键点中,如果最近的距离除以次近的距离少于某个比例阈值,则接受这一对匹配点。