计算机视觉包括三个领域(R3),Recognition,Reconstruction ,Reorganization。识别和检测只能是第一个R,SLAM算第二个R。图像处理属于计算机视觉的底层处理。增强现实AR、IBR、计算摄影(computational photography)是计算机视觉和其他领域如图形学、VR、成像学的交集。

计算机视觉目录:图像形成;图像处理;模型拟合与优化;深度学习;深度估计;特征检测与匹配;分割;基于特征的对齐;运动估计;由运动到结构与SLAM;图像拼接;计算摄影学;立体匹配;3D 重建;基于图像的渲染

数字图像处理目录:

1、立体匹配 Stereo correspondence

应用于,立体匹配是从图像生成三维点云的常规手段

人根据左眼和右眼的外观差异来感知深度。简单的实验,将手指垂直地放在眼睛前面,交替地闭上每只眼睛,能看到手指相对于场景背景左右跳跃。1张图片无法测量物体深度,2张可以。

下图,两个相机拍摄同一场景,两个场景中相同的点就是一个同名点对,立体匹配就是寻找两幅图中所有的同名点对。

计算机视觉三大顶级会议的历史 计算机视觉三大领域_计算机视觉

下图,一个概念“极线”约束。在这条极线上找同名点对。大大缩短了寻找同名点对的复杂程度。 

计算机视觉三大顶级会议的历史 计算机视觉三大领域_计算机视觉三大顶级会议的历史_02

下图,极线来源于极平面和相机平面的交线。极平面由两个相机和物体P三个点组成。

计算机视觉三大顶级会议的历史 计算机视觉三大领域_图像处理_03

  一个相机无法测距。下图,两个相机O1、Or,通过公式可以求出深度,就是物体P与相机的距离。视差和深度成反比。

计算机视觉三大顶级会议的历史 计算机视觉三大领域_计算机视觉三大顶级会议的历史_04

2、SLAM

经典的运动重建(SFM,Structure From Motion),也叫做同步定位和制图(simultaneous localization and mapping,SLAM)。是假设场景静态情况下,通过摄像机的运动来获取图像序列,并得到场景3-D结构的估计。是计算机视觉的重要任务;在机器人领域,这个任务还会估计现场摄像头的姿态和位置,即定位任务。

X.公开图片数据集

计算机视觉三大顶级会议的历史 计算机视觉三大领域_计算机视觉_05

参考文献:

1、《Computer Vision_ Algorithms and Applications-Richard Szeliski 》

2、《Digital Image Processing_3ed_Gonzalez_冈萨雷斯》

3、【3D视觉工坊】第八期公开课:立体视觉之立体匹配理论与实战_哔哩哔哩_bilibili  https://www.bilibili.com/video/BV1Uv411q7GU

4、单目视觉深度估计测距的前生今世 - 知乎  https://zhuanlan.zhihu.com/p/56263560