计算机视觉是一门研究如何让计算机“看”的学科。
简单来说,就是指利用摄影机和电脑等机器,来代替人眼对目标进行识别、跟踪以及测量等,并进一步对图形进行处理,使之成为更适合人眼观察或传送、检测的图像。
目前,非常火的VR、AR,3D处理等方向,都是计算机视觉的一部分。图像处理是计算机视觉的关键,因此要研究1和学习计算机视觉,必须掌握图像知识,下面小编整理了一些图像的基础知识,希望对各位小伙伴学习和研究计算机视觉有所帮助。
一张图像所包含的信息:维数、高度、宽度、深度、通道数、颜色格式、数据首地址、结束地址、数据量等等。
图像深度:存储每个像素所用的位数(bits)
当一个像素占用的位数越多时,它所能表现的颜色就更多,更丰富。
举例:一张400*400的8位图,这张图的原始数据量是多少?像素值如果是整型的话,取值范围是多少?
1.原始数据量计算:400 * 400 * ( 8/8 )=160.000Bytes
(约为160K)
2.取值范围:2的8次方,0~255
图片格式与压缩:常见的图片格式JPEG,PNG,BMP等本质上都是图片的一种压缩编码方式
举例:JPEG压缩
1.将原始图像分为8*8的小块,每个block里有64pixels。
2.将图像中每个8*8的block进行DCT变换(越是复杂的图像,越不容易被压缩)
3.不同的图像被分割后,每个小块的复杂度不一样,所以最终的压缩结果也不一样
图像分类:
1、二值图像(Binary Image)
即图像上的每一个像素只有两种可能的取值或灰度等级状态,0和1.0代表黑(背景),1代表白(前景)。每个像素只需要1Bit就可以完整存储信息。
2、灰度图像(gray image)
灰度图和二值图像一样只包含一个通道的信息,是二值图像的进化版,是彩色图像的退化版。灰度图像每个像素只有一个采样颜色,通常为从最暗黑色到最亮的白色的灰度,使用8Bit保存信息,有256级灰度。(如果用16位,则有65536级)
3、彩色图像
彩色图像有三个颜色通道,即R(红)、G(绿)、B(蓝),三个分量来表示,分量介于(0.255)
完 谢谢观看