- 视觉信息获取(图像获取)
采样、量化、表示 - 视觉信息处理(图像处理)
图像预处理、滤波、变换、分割、特征表示和检测 - 视觉信息理解(图像理解)
三维信息恢复和重建、运动信息提取
一.计算机视觉的发展历史
- 20世纪50年代:统计模式识别
- 二维图像分析和识别,如光学字符识别、工件表面、显微图片和航空图片的分析和解释等
- 20世纪60年代:Roberts的三维积木世界
- 通过计算机程序从数字图像中提取出诸如立方体、楔形体、棱柱体等多面体的三维结构,并对物体形状及物体的空间关系进行描述
- 开创了以理解三维场景为目的的三维视觉研究
- 后人解决了由线段解释景物和处理阴影等问题
- 20世纪70年代:Marr为代表的计算理论
核心是从图像恢复物体的三维形状
提出要从不同层次去研究信息处理的问题
强调计算理论和算法实现 - 20世纪80年代:主动视觉(Active Vision)
主动视觉的四个特征:主动性(Active) 、选择性(Selective) 目的性(Purposive) 、定性性(Qualitative)
对计算机视觉新的理解:根据任务,调整成像参数,选择感兴趣的区域,获取相关的图像信息
二.Marr视觉理论
1.提出人(背景)
David Marr
(1945-1980)是英国心理学家。他将心理学、人工智能和神经生理学的结果结合起来,对视觉的研究做出了重要贡献。他是计算视觉的奠基人。
David Marr 70年代末在美国MIT提出了第一个较为完善的视觉系统框架,尽管此框架存在很多缺陷,但过去几十年一直处于主导地位。
2.视觉处理的三个阶段
3. 内容
马尔计算视觉理论包含二个主要观点:
- 首先,马尔认为人类视觉的主要功能是复原三维场景的可见几何表面,即三维重建问题;
- 其次,马尔认为这种从二维图像到三维几何结构的复原过程是可以通过计算完成的,并提出了一套完整的计算理论和方法。
- 所以,马尔视觉计算理论在一些文献中也被称为三维重建理论。
4.注意 错误性
后三十多年的研究中,人们发现马尔理论的基本假设:“人类视觉的主要功能是复原三维场景的可见几何表面”基本上是不正确的,“物体识别中的三维表达的假设”也基本与人类物体识别的神经生理机理不相符。
三.图像采样
略