计算机视觉算法与应用第二版中文版pdf 计算机视觉教程第三版

转载

jowvid 2024-06-26 10:58:28

文章标签 笔记计算机视觉 opencv python 邻域 文章分类 计算机视觉人工智能

用书：

计算机视觉教程（微课版第3版）

作者: 章毓晋
出版社: 人民邮电出版社

不一定全，只针对我们期末画的范围，只有一到六章。

第一章绪论

一、计算机视觉的定义

1. 视觉

2. 计算机视觉

二、常见的应用领域

三、图像的显示方式

1. 图像表达

2. 图像显示设备

3. 表达和显示方式

四、图像的常见格式

六、像素邻域的概念

1. 4邻域、对角邻域、8邻域

2. 连接

3. M邻接

七、像素间距离的计算

1. 欧氏距离（距离）

2. 城区距离（距离，曼哈顿距离）

3. 棋盘距离（距离，切比雪夫距离）

4. 闵可夫斯基距离（闵氏距离

第一章绪论

一、计算机视觉的定义

1. 视觉

概念：视觉是人类观察世界、认知世界的重要功能手段。人类从外界获得的信息约有75%来自视觉系统。
分类：视觉进一步可分为视感觉和视知觉

视感觉中主要研究的内容有：
① 光的物理特性
② 光刺激视觉感受器官的程度
③ 光作用于视网膜后经视觉系统加工而产生的感觉
视知觉

① 视知觉主要论述人们从客观世界接收到视觉刺激后如何反应以及反应所采用的方式。

② 视知觉是在神经中枢进行的一组活动，它把视野中一些分散的刺激加以组织，构成具有一定形状的整体以认识世界。

视觉的最终目的：

从狭义上说，是要能对客观场景做出对观察者有意义的解释和描述。

2. 计算机视觉

⭐概念：用计算机实现人类的视觉功能，对客观世界中三维场景的感知、加工和解释。
目标：计算机视觉的研究目标是根据感知到的图像对客观世界中实际的目标和场景做出有意义的判断。
研究方法：计算机视觉的研究方法目前主要有两种：

仿生学的方法：参照人类视觉系统的结构原理
工程的方法：实现系统的功能

研究目标：计算机视觉的主要研究目标可归纳成两个：

建立计算机视觉系统来完成各种视觉任务
加深对人脑视觉机理的掌握和理解

硬件差异
具体来说，生物视觉是运行在皮质细胞和有机神经元的相互连接的网络上，而计算机视觉运行在由晶体管组成的电子芯片上
相关学科

图像理解：与计算机视觉有相同的目标；
机器视觉：更关注通过视觉传感器获取环境的图像，构建具有视觉感知功能的系统以及实现检测和辨识物体的算法；
模式识别：图像就是模式的一种；
人工智能：视觉功能是人类智能的体现；
计算机图形学：计算机视觉的反/逆问题。

二、常见的应用领域

(1) 工业视觉

(2) 人机交互

(3) 安全监控

(4) 军事公安

(5) 遥感测绘

(6) 视觉导航

(7) 生物医学

(8) 虚拟现实

(9) 图像自动解释

(10) 对人类视觉系统和机理，以及人脑心理和生理的研究等

三、图像的显示方式

1. 图像表达

图像表达一般分为矩阵表达和矢量表达两种形式。

（1）矩阵表达：

计算机视觉算法与应用第二版中文版pdf 计算机视觉教程第三版_邻域

（2）矢量表达：

计算机视觉算法与应用第二版中文版pdf 计算机视觉教程第三版_邻域_02

（3）图像表达的函数：

计算机视觉算法与应用第二版中文版pdf 计算机视觉教程第三版_python_03

2. 图像显示设备

主要包括可以随机存取的阴极射线管（CRT）、电视显示器和液晶显示屏（LCD）。

除了显示屏，各种打印设备（打印机）也可以看作图像显示设备。

3. 表达和显示方式

1. 二值图像

二值图像的3种不同的显示方式：

(a)离散点集 (b)覆盖区域 (c)矩阵表达

计算机视觉算法与应用第二版中文版pdf 计算机视觉教程第三版_opencv_04

例：图1-1左侧是一幅二值图像，该图像是由64个像素点构成的，这些像素点分为两种颜色，即黑色和白色。该图像在被存储到计算机中时，白色的像素点被存储“1”，黑色的像素点被存储为“0”

计算机视觉算法与应用第二版中文版pdf 计算机视觉教程第三版_计算机视觉_05

2. 灰度图像

又称标准图像。

二值图像仅仅能够表示黑白两种颜色，色彩比较单一，因此呈现的信息不够丰富。如果使用更多的颜色来呈现图像，就可以让图像具有更丰富的层次。于是就有了灰度图像：

二值图

计算机视觉算法与应用第二版中文版pdf 计算机视觉教程第三版_python_06

灰度图

计算机视觉算法与应用第二版中文版pdf 计算机视觉教程第三版_python_07

选取其中9*9像素的区域，其中每个像素的灰度值如右所示：

计算机视觉算法与应用第二版中文版pdf 计算机视觉教程第三版_计算机视觉_08

四、图像的常见格式

1. 图像存储器

(1) 处理过程中使用的快速存储器

(2) 可以较快地重新调用的在线或联机存储器

(3) 不经常使用的数据库（档案库）存储器

2.图像文件格式

(1) BMP格式

(2) GIF格式

(3) TIFF格式

(4) JPEG格式

六、像素邻域的概念

1. 4邻域、对角邻域、8邻域

计算机视觉算法与应用第二版中文版pdf 计算机视觉教程第三版_计算机视觉_09

(a) 4邻域——N4(p)（p(x,y):(x+1,y);(x-1,y);(x,y+1);(x,y-1)）每个像素与p距离为1。
(b) 对角邻域——ND(p)（p(x,y):(x-1,y-1);(x+1,y-1);(x-1,y+1);(x+1,y+1)）每个像素与p距离为根号2。
(c) 8邻域——N8(p) = N4(p)+ND(p) = 3x3邻域（4邻域+对角邻域）。
邻接：对两个像素p和q来说，如果q在p的邻域中，则称p和q满足邻接关系（区别于连接！）