目录

3-计算机视觉技术及应用

3.1-计算机视觉定义及概述

3.2-计算机视觉的主要研究内容

3.3-人工智能与深度学习


第三章 计算机视觉技术及应用

3.1-计算机视觉定义及概述

  1. 计算机视觉:信号处理理论与计算机出现后,人们试图用摄像机获取环境图像并将其转换成数字信号,用计算机实现对视觉信息处理的全过程。➡️ 形成新兴的学科:计算机视觉。
  2. 数字图像:
  1. 二维图像,用有限数字数值像素的表示,用数组/矩阵表示,其光照位置和强度都是离散的
  2. 数字图像是由模拟图像数字化得到的,以像素为基本元素,可以用数字计算机存储和处理的图像
  1. 数字图像处理:将图像信号转化为数字信号,并用计算机对其处理
  2. 图像处理 🆚 计算机视觉
  1. 图像处理:人是最终解释者。对图像操作,以提高图像质量、恢复图像以及压缩解压图像
  2. 计算机视觉:计算机是图像的解释者。使计算机具有通过二维图像认知三维环境的能力,图像处理是计算机视觉达到其目的所使用的技术
  1. 视觉计算理论—视觉系统研究的三个层次:计算理论 ➡️ 表示与算法 ➡️ 硬件实现
  2. 视觉计算理论—视觉信息处理的三个阶段:
  1. 基元图:图像的密度变化可能与物体边界这类具体的物理性质相对应,因此主要描述图像的密度变化及其局部几何关系
  2. 2.5维图:以观察者为中心,描述可见面的方位、轮廓、深度及其他性质
  3. 3维模型:以物体为中心,用来处理和识别的三维形状表象

3.2-计算机视觉的主要研究内容

  1. 计算机视觉研究内容
  1. 图像获取
  2. 摄像机标定:从摄像机获取的信息出发,计算三维空间中物体的几何信息,并由此重建和识别物体。而空间物体表面某点的三维几何位置,与其在图像中对应点之间的相互关系,是由摄像机成像的几何模型才能决定,几何模型即为摄像机参数。获得参数的实验过程叫做摄像机标定。
  3. 纹理分析
  1. 纹理标志三要素:局部序列性;这些序列由基本部分非随机排列组成;各部分大致都是均匀的统一体
  2. 一般认为,纹理就是指在图像中反复出现的局部模式和排列规则
  3. 过程:提取纹理特征参数
  1. 对象检测和识别
  2. 特征检测:
  1. 概念:表征图像所蕴含语义的属性数据
  2. 目的:为了让计算机具有认识/识别图像的能力
  3. 常见的图像特征:焦点、边缘、直线和纹理
  1. 立体视觉;从2个或多个视点观察同一个物体,以获取在不同视觉下的感知图像,通过三角测量原理计算图像像素的位置偏差来获取物体的三维信息。是由多幅图像获取物体三维信息的方法,是计算机视觉的一个重要分支。
  2. 运动估计
  3. 图像分割

3.3-人工智能与深度学习

  1. 深度学习
  1. 本质:通过构建多隐层的模型和海量训练数据(可为无标签数据),来学习更有用的特征,从而最终提升分类或预测的准确性。“深度模型” 是手段,“特征学习” 是目的。
  1. 人感知深度靠的是人眼的视差
  2. 与浅层学习区别
  1. 强调了模型结构的深度,通常有5-10多层的隐层节点
  2. 明确突出了特征学习的重要性,通过逐层特征变换,将样本在原空间的特征表示变换到一个新特征空间,从而使分类或预测更加容易。与人工规则构造特征的方法相比,利用大数据来学习特征,更能够刻画数据的丰富内在信息。
  1. 人脑🧠工作原理
  1. 从原始信号(像素级信号)到进一步信号处理,得到一些信息的边缘特征,然后进行抽象判断物体的形状,最后进一步抽象,得到物体的模型
  2. 高层特征是低层特征的组合,从低层到高层的特征它越来越抽象,越来越能表现语义,从而有利于目标的识别以及分类 人脑工作原理
  1. 深度学习 🆚 神经网络
  1. 相同点
    二者均采用分层结构,系统包括输入层、隐层(多层)、输出层组成的多层网络,只有相邻层节点之间有连接,同一层以及跨层节点之间相互无连接,每一层可以看作是一个logistic回归模型。
  2. 不同点:算法不同
  1. 神经网络:采用BP算法调整参数,即采用迭代算法来训练整个网络。随机设定初值,计算当前网络的输出,然后根据当前输出和样本真实标签之间的差去改变前面各层的参数,直到收敛
  2. 深度学习:采用逐层训练机制。采用该机制的原因在于如果采用BP机制,对于1个deep network (7层以上),残差传播到最前面的层将变得很小,出现所谓gradient diffusion (梯度扩散)。

计算机视觉章毓晋第三版第一章答案 计算机视觉教程 章毓晋_学习

 

计算机视觉章毓晋第三版第一章答案 计算机视觉教程 章毓晋_学习_02


 若笔记📒存在记录错误,请批评指正!