计算机视觉技术 - 简介
计算机视觉 (Computer Version, CV) 是一门研究如何使计算机“看”的科学,更进一步的说,就是是指用摄影机和计算机代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使计算机处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取“信息”的人工智能系统,信息是指可以用来帮助做一个“决定”的信息。
数字图像处理
一幅图像可以定义为一个二维函数f(x,y),其中x和y是空间(平面坐标),而在任一空间坐标(x,y)处的幅值f称为图像在改点处的强度或灰度,当x,y和灰度值f为离散数值时,我们就称该图像为数字图像。数字图像处理是指借助计算机来处理数字图像。
计算机视觉应用
计算机视觉在多年的发展中,以下列出常见的应用场域。
人脸识别
对图像中的人脸进行检测、识别和跟踪。
图 1. 人脸识别
多目标跟踪
多目标跟踪是CV领域一个热门方向,广泛应用于机器人导航、智能监控视频、工业检测、航空航天等领域。主要任务是找到图像序列中运动的物体,并将不同帧的运动物体一一对应,最后给出不同物体的运动轨迹。
图 2. 多目标跟踪
图像分割
图像分割是指根据灰度、彩色、空间纹理、几何形状等特征把图像划分成若干个互不相交的区域,使得这些特征在同一区域内表现出一致性或相似性,而在不同区域间表现出明显的不同。简单的说就是在一副图像中,把目标从背景中分离出来。
图 3. 图像分割
风格迁移
图像风格迁移,是指利用算法学习著名画作的风格,然后再把这种风格应用到另外一张图片上的技术。著名的国像处理应用 Prisma 是利用风格迁移技术,将普通用户的照片自动变换为具有艺术家的风格的图片。
图 4. 风格迁移