用书:
计算机视觉教程(微课版 第3版)
- 作者: 章毓晋
- 出版社: 人民邮电出版社
不一定全,只针对我们期末画的范围,只有一到六章。
目录
第一章 绪论
一、计算机视觉的定义
1. 视觉
2. 计算机视觉
二、常见的应用领域
三、图像的显示方式
1. 图像表达
2. 图像显示设备
3. 表达和显示方式
四、图像的常见格式
六、像素邻域的概念
1. 4邻域、对角邻域、8邻域
2. 连接
3. M邻接
七、像素间距离的计算
1. 欧氏距离(距离)
2. 城区距离(距离,曼哈顿距离)
3. 棋盘距离(距离,切比雪夫距离)
4. 闵可夫斯基距离(闵氏距离
第一章 绪论
一、计算机视觉的定义
1. 视觉
- 概念:视觉是人类观察世界、认知世界的重要功能手段。人类从外界获得的信息约有75%来自视觉系统。
- 分类:视觉进一步可分为视感觉和视知觉
- 视感觉中主要研究的内容有:
① 光的物理特性
② 光刺激视觉感受器官的程度
③ 光作用于视网膜后经视觉系统加工而产生的感觉 - 视知觉
① 视知觉主要论述人们从客观世界接收到视觉刺激后如何反应以及反应所采用的方式。
② 视知觉是在神经中枢进行的一组活动,它把视野中一些分散的刺激加以组织,构成具有一定形状的整体以认识世界。
- 视觉的最终目的:
从狭义上说,是要能对客观场景做出对观察者有意义的解释和描述。
2. 计算机视觉
- ⭐概念:用计算机实现人类的视觉功能,对客观世界中三维场景的感知、加工和解释。
- 目标:计算机视觉的研究目标是根据感知到的图像对客观世界中实际的目标和场景做出有意义的判断。
- 研究方法:计算机视觉的研究方法目前主要有两种:
- 仿生学的方法:参照人类视觉系统的结构原理
- 工程的方法:实现系统的功能
- 研究目标:计算机视觉的主要研究目标可归纳成两个:
- 建立计算机视觉系统来完成各种视觉任务
- 加深对人脑视觉机理的掌握和理解
- 硬件差异
- 具体来说,生物视觉是运行在皮质细胞和有机神经元的相互连接的网络上,而计算机视觉运行在由晶体管组成的电子芯片上
- 相关学科
- 图像理解:与计算机视觉有相同的目标;
- 机器视觉:更关注通过视觉传感器获取环境的图像,构建具有视觉感知功能的系统以及实现检测和辨识物体的算法;
- 模式识别:图像就是模式的一种;
- 人工智能:视觉功能是人类智能的体现;
- 计算机图形学:计算机视觉的反/逆问题。
二、常见的应用领域
(1) 工业视觉
(2) 人机交互
(3) 安全监控
(4) 军事公安
(5) 遥感测绘
(6) 视觉导航
(7) 生物医学
(8) 虚拟现实
(9) 图像自动解释
(10) 对人类视觉系统和机理,以及人脑心理和生理的研究等
三、图像的显示方式
1. 图像表达
- 图像表达一般分为矩阵表达和矢量表达两种形式。
(1)矩阵表达:
(2)矢量表达:
(3)图像表达的函数:
2. 图像显示设备
主要包括可以随机存取的阴极射线管(CRT)、电视显示器和液晶显示屏(LCD)。
除了显示屏,各种打印设备(打印机)也可以看作图像显示设备。
3. 表达和显示方式
1. 二值图像
- 二值图像的3种不同的显示方式:
(a)离散点集 (b)覆盖区域 (c)矩阵表达
例:图1-1左侧是一幅二值图像,该图像是由64个像素点构成的,这些像素点分为两种颜色,即黑色和白色。该图像在被存储到计算机中时,白色的像素点被存储“1”,黑色的像素点被存储为“0”
2. 灰度图像
- 又称标准图像。
二值图像仅仅能够表示黑白两种颜色,色彩比较单一,因此呈现的信息不够丰富。如果使用更多的颜色来呈现图像,就可以让图像具有更丰富的层次。于是就有了灰度图像:
- 二值图
- 灰度图
- 选取其中9*9像素的区域,其中每个像素的灰度值如右所示:
四、图像的常见格式
1. 图像存储器
(1) 处理过程中使用的快速存储器
(2) 可以较快地重新调用的在线或联机存储器
(3) 不经常使用的数据库(档案库)存储器
2.图像文件格式
(1) BMP格式
(2) GIF格式
(3) TIFF格式
(4) JPEG格式
六、像素邻域的概念
1. 4邻域、对角邻域、8邻域
- (a) 4邻域——N4(p)(p(x,y):(x+1,y);(x-1,y);(x,y+1);(x,y-1))每个像素与p距离为1。
- (b) 对角邻域——ND(p)(p(x,y):(x-1,y-1);(x+1,y-1);(x-1,y+1);(x+1,y+1))每个像素与p距离为根号2。
- (c) 8邻域——N8(p) = N4(p)+ND(p) = 3x3邻域(4邻域+对角邻域)。
- 邻接:对两个像素p和q来说,如果q在p的邻域中,则称p和q满足邻接关系(区别于连接!)
2. 连接
- 条件1:一个像素在另一个像素的邻域中(邻接关系)
- 条件2:灰度值相等(或同在一个灰度值集合中)
同时满足条件1和条件2,则称这两个像素是连接的。
3. M邻接
意义:保证像素p到q间存在一条不含回路的通路。
(用m邻接来消除8邻接产生的二义性)
条件:
- 前提:灰度值满足集合V的像素p和q
- 符合下列两个条件其中之一:
- q在p的4邻域中。
- q在p的对角领域中,并且q的4邻域与p的4领域交集为空。
本质:消除了8邻接多余的连接路径。当像素间同时存在4-邻接和8-邻接时,优先采用4-邻接,屏蔽和一个像素同时存在4邻接的两个像素之间的8邻接。
七、像素间距离的计算
1. 欧氏距离(
距离)
定义:范数为2的距离。
设像素𝒑和𝒒的坐标分别为 𝒙, 𝒚 和 𝐬,𝐭。
直观理解:欧氏距离是最容易直观理解的距离度量方法,我们小学、初中和高中接触到的两个点在空间中的距离一般都是指欧氏距离。欧式距离就是数学中学习的直线距离公式。
2. 城区距离(
距离,曼哈顿距离)
定义:范数为1的距离。
直观理解:只能走横竖两个方向,不能走斜向。两个点的距离就是横向加竖向的距离之和。相当于走直角的步数。
3. 棋盘距离(
距离,切比雪夫距离)
定义:国际象棋的国王从一个方格到另一个方格的最小步数。
直观理解:围着P点的所有元素都是相邻的,也就是它下一步可以走到包围它的八个点的任何一个,包括横竖和斜向。两点之间的最短距离,等于两点间横向距离与竖向距离中的最大值。
4. 闵可夫斯基距离(闵氏距离)
定义:闵氏距离不是一种距离,而是一组距离的定义。
① w=1时,闵氏距离为曼哈顿距离
② w=2时,闵氏距离为欧式距离
③ w=∞时,闵氏距离为切比雪夫距离