今天是个特殊的日子 1024 ,出于本能强行写下一篇文章。伟大而又平凡的程序猿祝你节日快乐。

该文将尽可能简短的描述基于numpy,在python中使用skimage的io或PIL或其他方法读取图片后GRB数据的结构与呈现方式。

我们肉眼看到的图片无非两种(灰色和彩色),而通过编程语言转换为电脑能认识的模样也就是数字了。这些数字决定了在电脑中它是彩色还是灰色,对于彩色图片决定的方式就是——颜色通道,而最常见的就是RGB三通道了,顾名思义RGB三色通道就是指由R、G、B三个通道组成的。

这里需要说明的一点就是RGB三色道分别对应三个矩阵,而这三个矩阵都是数字向量构成的矩阵,并不代表颜色的意思(矩阵能代表颜色吗?),这里比较贴切可以理解为调色板,例如当该矩阵的某个位置的数值较大,则表示该处对应调色板使用的颜色就越”白/浅“,而越小则对应调色板使用颜色越“黑/深”。8bit的图像,对应的矩阵元素取值为0-255(也可以使用0-1表示),这里我们主要理解数据,对于图像的理解下面给出链接。

看一张图片:

cv显示rgb图片单通道 python python中rgb颜色通道_通道

这是一张彩色图片,现在通过skimage的io方法读取该图片后在numpy中呈现的数据格式如下:

cv显示rgb图片单通道 python python中rgb颜色通道_numpy_02

通过shape得到图形形状(287,496,3),其中287表示行,496表示列,3表示分量(即三个通道分量),是不是有点蒙,下面正是本文要讲的重点,如何理解上面读取出来的数据格式?

 

首先我们应该按 来看,可以看到有3列 (即190 48 64对应往下的3列),这便是RGB对应的 3 个通道,从头到尾的一列数据构成了一个通道分量,共三个:

cv显示rgb图片单通道 python python中rgb颜色通道_RGB数据结构_03

然后再来理解287,从上图中可以看到有很多的 [

cv显示rgb图片单通道 python python中rgb颜色通道_numpy_04

最后再来看496,这个数字从哪来?上面的287个矩阵中每一个矩阵的每一列都有496个元素(数字),虽然这些数字是按照行来分块,但实际上列之间的元素才有关联,每一列的元素组合成行,构成了该通道矩阵的一行数据:

cv显示rgb图片单通道 python python中rgb颜色通道_RGB数据结构_05

下面来看看将上面的整体矩阵分解为三个通道后的模样,做个对比是不是清楚很多了。

cv显示rgb图片单通道 python python中rgb颜色通道_numpy_06

上面的三个通道为相同的矩阵大小,而后将三者按照通道顺序排列重叠后构成了RGB彩色图片,当然顺序有可能不是RBG,例如opencv转换后为BGR。

以上为彩色图片在numpy中解析后的理解介绍,下面是部分代码:

from skimage import io

path_c = r"G:\c.png"
color = io.imread(path_c)
print(color,color.shape)

# R
print(color[:,:,0],color[:,:,0].shape)
# G
print(color[:,:,1],color[:,:,1].shape)
# B
print(color[:,:,2],color[:,:,2].shape)

fig,axes = plt.subplots(1,3,figsize=(12,7))
axes[0].imshow(color[:,:,0])
axes[0].set_title('R')
axes[1].imshow(color[:,:,1])
axes[1].set_title('G')
axes[2].imshow(color[:,:,2])
axes[2].set_title('B')

plt.show()

 

该文仅为理解图片的数据构成,跟多详细的内容还请自行Google。