矩阵实验

  • 矩阵
  • 工程应用:图像平滑
  • 看待矩阵的四种视角:数据、系统、变换、空间
  • 线性变换
  • 工程应用:图形变化
  • 矩阵变化的推导
  • 总结



 


矩阵

在线性代数里,用的最多的概念是【矩阵】。

一个具体的矩阵:

矩阵实验:图形图像处理_竖排


一个抽象的矩阵:

矩阵实验:图形图像处理_线性代数_02


矩阵,是把数字按照横竖排起来。

  • 您看上图,前一个是 矩阵实验:图形图像处理_竖排_03矩阵实验:图形图像处理_竖排_04 列 (矩阵实验:图形图像处理_线性代数_05),后一个是 矩阵实验:图形图像处理_竖排_03矩阵实验:图形图像处理_批处理_07 列 (矩阵实验:图形图像处理_批处理_08)。

 
来源:向量的扩展,向量是横着的一排数字,每个数字代表一个维度的分量。

  • 比方说,学生的考试科目,是有 矩阵实验:图形图像处理_批处理_09
    那在年纪成绩评比时,通常是按所有维度算的 -> 矩阵实验:图形图像处理_批处理_10
    而评比单科王是按一个维度算的 -> 矩阵实验:图形图像处理_线性代数_11
    还有一些可能只是按基础算 -> 矩阵实验:图形图像处理_批处理_12
    矩阵实验:图形图像处理_竖排_13,可以用来计算和某个候选人的相似性。
    每一个评比的要求都是一个向量,而又有这么多评比,所以就有了 矩阵实验:图形图像处理_竖排_14
    这么多向量如果把它们放在一起,该怎么排列呢?

    如同所示,这种把向量按照横竖排起来的摆放方式,是很自然的结果,只不过数学家给它取了一个名字:矩阵,并且发现了一系列相应的计算

所以说,矩阵就是把向量按照横竖排起来的摆放方式而得来的,矩阵不是原因,而是结果,矩阵产生的原因就是向量的扩展。

 

作用,是将以前的单个计算(俩个元素的加减乘除)变成了批处理(俩个矩阵的加减乘除)。

如:

  • 俩个元素之间的计算:矩阵实验:图形图像处理_竖排_15
  • 俩个矩阵之间的批处理:矩阵实验:图形图像处理_竖排_16

正是这种计算方式,将以前的单个计算(俩个元素的加减乘除)变成了批处理(俩个矩阵的加减乘除)。

这种批处理的计算,与计算机搭配起来,简直是绝配 — 所以,线性代数对于我们来说,生活和工作都能用上。

 
运算:矩阵加法、矩阵数乘、矩阵乘法。

  • 矩阵加法:矩阵实验:图形图像处理_线性代数_17,前提是俩个相加的矩阵的行列相同
     
  • 矩阵数乘:矩阵实验:图形图像处理_竖排_18
     
  • 矩阵乘法:矩阵实验:图形图像处理_竖排_19
    第一个矩阵的形状是 矩阵实验:图形图像处理_竖排_20,第二个矩阵的形状是 矩阵实验:图形图像处理_竖排_21 ,俩俩相乘的矩阵是 矩阵实验:图形图像处理_批处理_22,中间的 矩阵实验:图形图像处理_批处理_23 被划掉了 ---- 因此俩个矩阵相乘需要满足一个条件,乘号前的矩阵的 列数 要等于后面矩阵的 行数
    矩阵乘法很重要吧,我在编程时经常听别人说起,况且那时候并没有学工程数学。
  1. 先确定生成矩阵的尺寸,乘号前的矩阵的 列数 要等于后面矩阵的 行数
  2. 生成矩阵的第 矩阵实验:图形图像处理_批处理_24 行第 矩阵实验:图形图像处理_竖排_25 列的值为:前面矩阵第 矩阵实验:图形图像处理_批处理_24 行 和 后面矩阵第 矩阵实验:图形图像处理_竖排_25

矩阵乘法就 矩阵实验:图形图像处理_批处理_23

  • 矩阵卷积(二维):矩阵矩阵实验:图形图像处理_线性代数_29 以某个步长在 矩阵矩阵实验:图形图像处理_批处理_30 表面 滑动加权求和
    演示一下卷积过程,

接着矩阵 矩阵实验:图形图像处理_线性代数_29 从矩阵 矩阵实验:图形图像处理_批处理_30左上角 准备滑动,如下图:

矩阵实验:图形图像处理_竖排_33


黄色区域的元素相乘,得到 矩阵实验:图形图像处理_批处理_34矩阵实验:图形图像处理_线性代数_35相加值为 矩阵实验:图形图像处理_批处理_34

假设设定的滑动步长为 矩阵实验:图形图像处理_线性代数_35

矩阵实验:图形图像处理_线性代数_38


继续滑动,对应位置相乘再求和得到 矩阵实验:图形图像处理_批处理_34,如下图:

矩阵实验:图形图像处理_竖排_40


继续滑动,对应位置相乘再求和得到 2,如下图:

矩阵实验:图形图像处理_竖排_41


…,最终矩阵卷积生成的矩阵,对比 矩阵矩阵实验:图形图像处理_批处理_30

矩阵实验:图形图像处理_线性代数_43


矩阵矩阵实验:图形图像处理_线性代数_29 (小矩阵),也被称为“卷积核”、“滤波器”;矩阵卷积也是卷积神经网络的原理。

 


工程应用:图像平滑

上面所说的矩阵卷积是二维的,因此我们以灰色图为例,彩色图是三维的。

图片是由很多 矩阵实验:图形图像处理_批处理_45

  • 如果像素是 矩阵实验:图形图像处理_批处理_46,那像素即黑色;
  • 如果像素是 矩阵实验:图形图像处理_批处理_47,那像素即白色;

而矩阵正好有行、列,我们可以把图片转为矩阵,通过操控矩阵来改变图片。

图片平滑让一张清晰的图片变模糊

因为图片的像素值反应了一个图片的亮度,如果我们把图片中的像素值和周围的像素值相似,那整个图片的色调就差不多,也变模糊了。

而图片平滑的过程和矩阵卷积的过程是一样的,最核心的地方就是设计卷积核

图像平滑算法:

  1. 设计一个卷积核,使得图像矩阵的每一个像素值尽可能的与周围的像素值接近,这张图片每部分就会差不多;
  2. 积核尺寸、滑动步长、周边范围等超参数设计,以需求而定;
  3. 需要考虑一个细节,矩阵卷积生成的矩阵会缩小一圈,图片也会变小一圈;解决方法是在矩阵A最外围补一圈零。
# 运行:在命令行输入 python 当前源文件.py
import numpy as np
from PIL import Image                     # 图片处理模块
from scipy import signal

# 1.读取一张图片
filename = "./demo.png"
img_rgb = Image.open(filename)
img_rgb.show()

# 2.将彩色图片转为灰度图
img_gray = img_rgb.convert('L')
img_gray.show()

# 3.将灰度图转为像素矩阵
matrix = np.asarray(img_gray)
print("matrix.shape=", matrix.shape)  

# 4.定义卷积核(均值滤波器)
filter_3x3 = np.array([[ 1/9, 1/9, 1/9 ],
                       [ 1/9, 1/9, 1/9 ],
                       [ 1/9, 1/9, 1/9 ]])

print("filter_3x3=", filter_3x3.shape)      # 采用的 3*3 的过滤器
print(np.around(filter_3x3, decimals=2))   # 打印图片的像素值

# 5.开始卷积(图像平滑)
result = signal.convolve2d(matrix, filter_3x3, mode='same')
print("result.shape=", result.shape)
print(np.around(result, decimals=0))

# 6.把像素矩阵转回图片
img_rlt = Image.fromarray(result)
img_rlt.show()

读取的图片 demo.png

矩阵实验:图形图像处理_批处理_48


简单起见,转为黑白图片(二维):

矩阵实验:图形图像处理_线性代数_49


调用图像平滑算法:

矩阵实验:图形图像处理_竖排_50


有些模糊了,但 矩阵实验:图形图像处理_线性代数_51 可能不太明显,可以改为 矩阵实验:图形图像处理_竖排_52

  • filter_3x3 改为 filter_7x7
# 7x7的,均值是 1/49
filter_7x7 = np.ones((7,7)) / (7*7)

除此之外,卷积核还可以改进,一般采用高斯分布(在保留细节方面,图片平滑效果最好),因此也称为 “高斯滤波器”。

二维高斯分布:

矩阵实验:图形图像处理_批处理_53


矩阵实验:图形图像处理_竖排_54 的 矩阵矩阵实验:图形图像处理_线性代数_55

# 7x7 高斯滤波器
gaussian_filter_7x7 = np.array([  [ 0.00000067, 0.00002292, 0.00019117, 0.00038771, 0.00019117, 0.00002292, 0.00000067],
                                  [ 0.00002292, 0.00078633, 0.00655965, 0.01330373, 0.00655965, 0.00078633, 0.00002292],
                                  [ 0.00019117, 0.00655965, 0.05472157, 0.11098164, 0.05472157, 0.00655965, 0.00019117],
                                  [ 0.00038771, 0.01330373, 0.11098164, 0.22508352, 0.11098164, 0.01330373, 0.00038771],
                                  [ 0.00019117, 0.00655965, 0.05472157, 0.11098164, 0.05472157, 0.00655965, 0.00019117],
                                  [ 0.00002292, 0.00078633, 0.00655965, 0.01330373, 0.00655965, 0.00078633, 0.00002292],
                                  [ 0.00000067, 0.00002292, 0.00019117, 0.00038771, 0.00019117, 0.00002292, 0.00000067] ])
								  # 调用的时候,将 filter_3x3 改为 gaussian_filter_7x7。

除此之外,还可以实现图片的边缘检测(应用在自动驾驶的车道检测、计算机视觉基础等等)。

# 第 4 步,定义卷积核改为定义算子
sobel = np.array([[ -1, -2, -1 ],                        
                  [  0,  0,  0 ],
                  [  1,  2,  1 ]]) 

# 调用语句 result = signal.convolve2d(matrix, filter_3x3, mode='same')
result = signal.convolve2d(matrix, sobel, mode='same')

左边是原图,右边是效果图(边缘检测算法):

矩阵实验:图形图像处理_竖排_56

 


看待矩阵的四种视角:数据、系统、变换、空间

学线代时,可能比较注重具体的计算,但学完了却发现对线代的理解还是不够深刻。

一个可能的原因是,没有特别深刻的理解,我们在代数中的这些符号,比如说 矩阵矩阵实验:图形图像处理_批处理_57,这个 矩阵矩阵实验:图形图像处理_批处理_57

代数,是用字母代表数,但我们到底代表的是哪些数…在更加抽象的数学里,我们的代数代表的不仅仅是数,而是一个对象。

那么,代表的这个对象是什么?

这个就是我们要明确的。

看待矩阵的四种视角:

  • 数据:把矩阵看成数据,矩阵实验:图形图像处理_线性代数_59矩阵实验:图形图像处理_批处理_60列,每一行代表一个样本,每一列代表一个特征,多用于数据科学;
  • 系统:把矩阵看成线性系统(中学的多元一次方程组),那求解那些线性方程组就可以用矩阵运算,多用于计算线性代数的线性方程组;
  • 变换:把矩阵看成对向量的一个函数,或者说是一种变换,因为一个矩阵和一个向量相乘,得到结果依然是向量,可以把矩阵看成输入一个向量,输出一个向量的函数,多用于图形学的图像图形的变化;
  • 空间:把矩阵看成一个空间,这样看一个矩阵乘一个向量,就是向量在矩阵所表示的空间中所对应的位置是哪里,多用于线性代数的向量空间。

 


线性变换

矩阵可不仅仅是只能处理图片的数字表格,试着换一种角度看矩阵:变换。

  • 矩阵乘法:矩阵实验:图形图像处理_批处理_61,画在几何。

矩阵实验:图形图像处理_竖排_62


矩阵实验:图形图像处理_竖排_63(红色) 经过 矩阵实验:图形图像处理_批处理_64 得到 另一个向量(绿色),矩阵实验:图形图像处理_批处理_64

只不过,在线性代数里,我们称 矩阵实验:图形图像处理_批处理_64

若我们把矩阵看做一个变换,图形变换就会十分方便。

图形变换:图形的缩放、旋转、仿射等等,也用于游戏开发、动漫制作等等。

 


工程应用:图形变化

或许您应该有一个疑问,矩阵,是怎样实现图形变换的 ???

图形的变化:

  • 图形旋转
  • 图形平移
  • 图形放大
  • 图形缩小
  • 图形翻转
  • 图形剪切(正体 变斜体
  • … …

比如,这个是怎么做到的:

矩阵实验:图形图像处理_线性代数_67


经过旋转:

矩阵实验:图形图像处理_竖排_68


先考虑一个小问题吧,怎么使得一个图形绕 矩阵实验:图形图像处理_竖排_69

矩阵实验:图形图像处理_竖排_70


其实,黄色的梯形是由 矩阵实验:图形图像处理_批处理_71 个点组成,经历 矩阵实验:图形图像处理_批处理_71 个点的坐标,也就是 矩阵实验:图形图像处理_批处理_71

首先,我们让 矩阵实验:图形图像处理_批处理_74 翻转,翻转后也就是 矩阵实验:图形图像处理_线性代数_75

现在我们改为以矩阵的形式翻转:矩阵实验:图形图像处理_批处理_76

我们需要做的就是找到一个能使其转换完成的 矩阵实验:图形图像处理_批处理_64,因为输入的矩阵和输出的矩阵都是同行同列(2行, 1列),根据矩阵乘法的要求,矩阵实验:图形图像处理_批处理_64

得到一个式子:

  • 矩阵实验:图形图像处理_批处理_79 则有:矩阵实验:图形图像处理_竖排_80

我们确定好 矩阵实验:图形图像处理_批处理_81

  • 因为 矩阵实验:图形图像处理_竖排_82 ,推出 矩阵实验:图形图像处理_批处理_83
  • 因为 矩阵实验:图形图像处理_线性代数_84, 推出 矩阵实验:图形图像处理_线性代数_85

所以,矩阵 矩阵实验:图形图像处理_线性代数_86

可这个翻转计算只是针对 矩阵实验:图形图像处理_批处理_74,为了提高计算效率(批处理),我们把 矩阵实验:图形图像处理_竖排_88

矩阵矩阵实验:图形图像处理_批处理_57

  • 矩阵实验:图形图像处理_线性代数_90

以上是图形的左右翻转(绕 矩阵实验:图形图像处理_竖排_69

矩阵实验:图形图像处理_线性代数_92


图形的上下翻转(绕 矩阵实验:图形图像处理_批处理_93

  • 矩阵实验:图形图像处理_竖排_94

 


线性变换,也可以实现图形的水平剪切。

剪切:把 正体字 变成 斜体字,就是一个剪切。

矩阵实验:图形图像处理_竖排_95


图形的水平剪切如上图,纵坐标不变,横坐标运动。

结合矩阵:矩阵实验:图形图像处理_线性代数_96,有一个控制系数 矩阵实验:图形图像处理_批处理_97.

根据矩阵乘法 ,令 矩阵实验:图形图像处理_线性代数_98 则有:矩阵实验:图形图像处理_竖排_99

通过对比系数,矩阵实验:图形图像处理_批处理_100,当 矩阵实验:图形图像处理_批处理_101 时,往右剪切;当 矩阵实验:图形图像处理_竖排_102


图形的竖直剪切如下图,纵坐标运动,横坐标不变。

矩阵实验:图形图像处理_竖排_103


 

变换矩阵:矩阵实验:图形图像处理_竖排_104,注意 矩阵实验:图形图像处理_批处理_97

 


完整代码:

# 运行:在命令行输入 python 当前源文件.py
import numpy as np
import matplotlib.pyplot as plt

# 1.定义变换矩阵A,用于图形平移(竖直平移)
A = np.array([[1,0],[0,-1]])

# 1.定义变换矩阵A,用于图形剪切
# k = -0.8
# A = np.array([[1,0],[k,1]])

# 1.定义变换矩阵A,图形旋转
# theta = -(3.14/4)
# A = np.array([[np.cos(theta),np.sin(theta)],[-np.sin(theta),np.cos(theta)]])

# 1.定义变换矩阵A,图形整体放大 1 倍
# A = np.array([[2,0],[0,-2]])  

# 1.定义变换矩阵A,图形整体缩小 0.75 倍
# A = np.array([[0.5,0],[0,0.5]])  

# 2. 定义输入矩阵(即输入图形)
B = np.array([[0, 1, 1, 0, 0],[1, 1, 0, 0, 1]])

# 3. 计算输出矩阵(矩阵乘法)
Y = np.dot(A,B)

# 4. 绘制图形
plt.axis([-3,3,-3,3])
plt.axvline(x=0, color='#A9A9A9')
plt.axhline(y=0, color='#A9A9A9')
plt.grid(True)
plt.plot(B[0],B[1],'-yo',lw=2)  # 绘制输入图形
plt.plot(Y[0],Y[1],'-go',lw=2)  # 绘制输入图形
plt.show()

具体用法,请往下看。


图形平移

  • 竖直平移的变换矩阵是:矩阵实验:图形图像处理_竖排_106,水平平移的变换矩阵是:矩阵实验:图形图像处理_线性代数_107
# 1.定义变换矩阵A,用于图形平移(竖直平移)
A = np.array([[1,0],[0,-1]])

矩阵实验:图形图像处理_批处理_108


 


图形剪切

  • 水平剪切的变换矩阵是:矩阵实验:图形图像处理_线性代数_109,竖直剪切的变换矩阵是:矩阵实验:图形图像处理_线性代数_110, 会影响方向。
# 1.定义变换矩阵A,用于图形剪切
k = -0.8
A = np.array([[1,0],[k,1]])

矩阵实验:图形图像处理_竖排_111


 


图形放大

水平放大的矩阵是:矩阵实验:图形图像处理_线性代数_112,竖直放大的变换矩阵是:矩阵实验:图形图像处理_批处理_113

# 1.定义变换矩阵A,图形整体放大 1 倍
A = np.array([[2,0],[0,2]])

矩阵实验:图形图像处理_竖排_114


图形缩小同理。

 


图形旋转

  • 逆时针旋转的变换矩阵是:矩阵实验:图形图像处理_批处理_115,顺时针旋转的变换矩阵是:矩阵实验:图形图像处理_批处理_116
# 1.定义变换矩阵A,图形旋转
theta = -(3.14/4)
A = np.array([[np.cos(theta),np.sin(theta)],[-np.sin(theta),np.cos(theta)]])

矩阵实验:图形图像处理_线性代数_117


旋转的角度最复杂,我们可能不太清楚这个角度是怎么来的。

 


矩阵变化的推导

我们推导一下,图形旋转的变化过程。

矩阵实验:图形图像处理_竖排_118


推导的前置知识:高中的三角函数。

不一定要每一步都弄明白,但要知道我们可以把矩阵看成一种对向量的变换(函数),这个很重要,理解的越深刻越好。

我们看最简单的情况,如下图。

矩阵实验:图形图像处理_批处理_119


蓝色的向量旋转 矩阵实验:图形图像处理_线性代数_120 度角得到红线 ,如果我们设这个变换的矩阵为 矩阵实验:图形图像处理_批处理_81,则有这样一个式子:

  • 矩阵实验:图形图像处理_批处理_122,则有:矩阵实验:图形图像处理_线性代数_123

因为是经过旋转得到的,因此新的坐标和原来的坐标一定是有联系的,这个联系就是角度 矩阵实验:图形图像处理_批处理_124

推导过程:

  • 设向量(蓝色)的模为 矩阵实验:图形图像处理_线性代数_125,由三角关系式得到:矩阵实验:图形图像处理_线性代数_126,即 矩阵实验:图形图像处理_批处理_127矩阵实验:图形图像处理_批处理_128,即 矩阵实验:图形图像处理_批处理_129
     
  • 向量(红色)由于仅有旋转没有伸缩,因此红色向量的模依然是 矩阵实验:图形图像处理_线性代数_125矩阵实验:图形图像处理_批处理_131,即 矩阵实验:图形图像处理_批处理_132矩阵实验:图形图像处理_批处理_133,即 矩阵实验:图形图像处理_线性代数_134
     
  • 矩阵实验:图形图像处理_竖排_135, 矩阵实验:图形图像处理_竖排_136
     
  • 矩阵实验:图形图像处理_竖排_137,比对系数确定 矩阵实验:图形图像处理_线性代数_138
     
  • 矩阵实验:图形图像处理_竖排_139,一步步化简得到最后的。
     
  • 矩阵实验:图形图像处理_线性代数_140
     
  • 矩阵实验:图形图像处理_竖排_141,这个结果就是变换 矩阵矩阵实验:图形图像处理_线性代数_142

矩阵实验:图形图像处理_线性代数_143


图形旋转角度就是这么推导过来的,在《数学女孩 4》的矩阵 — 线性变换一节,里面就有其TA图形变换的推导过程。

 


总结

第一部分,介绍了矩阵、来源、运算,工程应用是矩阵卷积,趁热打铁去搞定卷积网络吧。

第二部分,介绍了看待矩阵的四种视角,我们选的是变换,工程应用是图形图像处理。

归根结底,是函数表示变换。任意函数都是从输入到输出的变换。矩阵可以看做是向量的函数:)

这种变换,还可以扩展到三维空间,比如说电视成像、转播。

电视机成像的原理大概是,通过一把电子枪,把电子打到屏幕上:

矩阵实验:图形图像处理_线性代数_144

不过对于这样的彩色图片一把电子枪是不够的:

矩阵实验:图形图像处理_竖排_145


可以把这幅图片以 红色、绿色、蓝色 为基,分为三张图片:

矩阵实验:图形图像处理_线性代数_146


用三把电子枪分别把 红色矩阵实验:图形图像处理_竖排_147、绿色矩阵实验:图形图像处理_竖排_148、蓝色矩阵实验:图形图像处理_线性代数_55

矩阵实验:图形图像处理_批处理_150

电视转播则不同,信号不是以 红色矩阵实验:图形图像处理_竖排_147、绿色矩阵实验:图形图像处理_竖排_148、蓝色矩阵实验:图形图像处理_线性代数_55

矩阵实验:图形图像处理_线性代数_154

不是靠三原色 矩阵实验:图形图像处理_批处理_155 传递,而是通过 矩阵实验:图形图像处理_批处理_156矩阵实验:图形图像处理_竖排_157

  • 矩阵实验:图形图像处理_批处理_158,采用亮度-色差来描述颜色的颜色空间
  • 矩阵实验:图形图像处理_竖排_159

彩色电视机背后有 矩阵实验:图形图像处理_竖排_157矩阵实验:图形图像处理_批处理_156 接口,完整地插入 矩阵实验:图形图像处理_竖排_157矩阵实验:图形图像处理_批处理_156

矩阵实验:图形图像处理_线性代数_164

  • 若是接入 矩阵实验:图形图像处理_批处理_165,可产生黑白图像;
  • 若是再接入 矩阵实验:图形图像处理_线性代数_166矩阵实验:图形图像处理_线性代数_167

矩阵实验:图形图像处理_批处理_155 转换为 矩阵实验:图形图像处理_线性代数_169矩阵实验:图形图像处理_批处理_156,这个过程也是矩阵函数的一个实例:

矩阵实验:图形图像处理_线性代数_171

加油:)