文章目录

  • 1.特征值和特征向量
  • 2.矩阵的特征分解
  • 3.直观理解
  • 4.通过特征分解求逆矩阵
  • 5.对特殊矩阵的矩阵分解
  • 对称矩阵
  • 参考

1.特征值和特征向量

线性代数中,特征分解(eigendecomposition)是将矩阵分解为由特征值和特征向量表示的矩阵之积的方法。

给定一个方阵

矩阵的特征分解_线性代数

,我们认为在以下条件下,

矩阵的特征分解_特征值_02


矩阵的特征分解_特征值_03

特征值

矩阵的特征分解_矩阵_04

是相应的特征向量

矩阵的特征分解_特征向量_05

直观地说,这个定义意味着将

矩阵的特征分解_特征值_03

乘以向量

矩阵的特征分解_矩阵_07

会得到一个新的向量,该向量指向与

矩阵的特征分解_矩阵_07

相同的方向,但按系数

矩阵的特征分解_特征向量_09

缩放。值得注意的是,对于任何特征向量

矩阵的特征分解_矩阵_04

和标量

矩阵的特征分解_对称矩阵_11


矩阵的特征分解_特征值_12


矩阵的特征分解_特征向量_13

也是一个特征向量。

因此,当我们讨论与

矩阵的特征分解_特征向量_09

相关的特征向量时,我们通常假设特征向量被标准化为长度为1(这仍然会造成一些歧义,因为

矩阵的特征分解_矩阵_07


矩阵的特征分解_特征值_16

都是特征向量,但我们必须接受这一点)。

我们可以重写上面的等式来说明

矩阵的特征分解_对称矩阵_17


矩阵的特征分解_特征值_03

的特征值和特征向量的组合:

矩阵的特征分解_矩阵_19

但是

矩阵的特征分解_矩阵_20

只有当

矩阵的特征分解_特征值_21

有一个非空零空间时,同时

矩阵的特征分解_特征值_21

是奇异的,

矩阵的特征分解_矩阵_07

才具有非零解,即:

矩阵的特征分解_对称矩阵_24

现在,我们可以使用行列式的先前定义将表达式

矩阵的特征分解_矩阵_25

扩展为

矩阵的特征分解_特征向量_09

中的(非常大的)多项式,其中,

矩阵的特征分解_特征向量_09

的度为

矩阵的特征分解_特征向量_28

。它通常被称为矩阵

矩阵的特征分解_特征值_03

的特征多项式。

然后我们找到这个特征多项式的

矩阵的特征分解_特征向量_28

(可能是复数)根,并用

矩阵的特征分解_矩阵_31

表示。这些都是矩阵

矩阵的特征分解_特征值_03

的特征值,但我们注意到它们可能不明显。为了找到特征值

矩阵的特征分解_特征值_33

对应的特征向量,我们只需解线性方程

矩阵的特征分解_矩阵_20

,因为

矩阵的特征分解_特征值_21

是奇异的,所以保证有一个非零解(但也可能有多个或无穷多个解)。

应该注意的是,这不是实际用于数值计算特征值和特征向量的方法(记住行列式的完全展开式有

矩阵的特征分解_矩阵_36

项),这是一个数学上的争议。

以下是特征值和特征向量的属性(所有假设在

矩阵的特征分解_线性代数

具有特征值

矩阵的特征分解_矩阵_31

的前提下):

  • 矩阵的特征分解_矩阵_39

  • 的迹等于其特征值之和
  • 矩阵的特征分解_特征值_40

  • 矩阵的特征分解_矩阵_39

  • 的行列式等于其特征值的乘积
  • 矩阵的特征分解_特征向量_42

  • 矩阵的特征分解_矩阵_39

  • 的秩等于
  • 矩阵的特征分解_矩阵_39

  • 的非零特征值的个数
  • 假设
  • 矩阵的特征分解_矩阵_39

  • 非奇异,其特征值为
  • 矩阵的特征分解_特征值_46

  • 和特征向量为
  • 矩阵的特征分解_特征向量_47

  • 。那么
  • 矩阵的特征分解_矩阵_48

  • 是具有相关特征向量
  • 矩阵的特征分解_特征向量_47

  • 矩阵的特征分解_特征向量_50

  • 的特征值,即
  • 矩阵的特征分解_特征向量_51

  • 。(要证明这一点,取特征向量方程,
  • 矩阵的特征分解_矩阵_52

  • ,两边都左乘
  • 矩阵的特征分解_特征向量_50

  • 对角阵的特征值
  • 矩阵的特征分解_对称矩阵_54

  • 实际上就是对角元素
  • 矩阵的特征分解_特征向量_55

注意:只有可对角化矩阵才能特征分解

2.矩阵的特征分解


矩阵的特征分解_特征值_56

是一个

矩阵的特征分解_矩阵_57

的方阵,且有

矩阵的特征分解_特征向量_28

个线性独立的特征向量

矩阵的特征分解_线性代数_59

,A可以被分解为

矩阵的特征分解_特征值_60


其中

矩阵的特征分解_线性代数_61


矩阵的特征分解_矩阵_57

方阵,且第

矩阵的特征分解_矩阵_63


矩阵的特征分解_特征值_03

的特征向量

矩阵的特征分解_特征值_65


矩阵的特征分解_线性代数_66

是对角矩阵,其对角线上的元素为对应的特征值,即

矩阵的特征分解_矩阵_67


一般而言,特征向量

矩阵的特征分解_线性代数_59

被单位化,但是未被单位化的特征向量

矩阵的特征分解_特征向量_69

也可以作为

矩阵的特征分解_线性代数_61

的列向量。可以理解为

矩阵的特征分解_线性代数_61

中向量的长度被

矩阵的特征分解_矩阵_72

抵消了。

3.直观理解

先说结论

将向量看作空间中一个点,矩阵可视作点的运动,对于可以矩阵分解的矩阵:

  • 特征值就是运动的速度
  • 特征向量就是运动的方向

令矩阵

矩阵的特征分解_特征值_73


矩阵的特征分解_特征值_56

左乘一个单位矩阵

矩阵的特征分解_对称矩阵_75

,即

矩阵的特征分解_线性代数_76


我们看下向量

矩阵的特征分解_特征值_77

发生了什么变换

矩阵的特征分解_特征向量_78

向量

矩阵的特征分解_对称矩阵_79

,向量

矩阵的特征分解_线性代数_80

可以看出,

矩阵的特征分解_对称矩阵_81

分别逆时针旋转

矩阵的特征分解_线性代数_82


怎么办到的呢?给定要给一个题目,将二维平面上一点逆时针旋转

矩阵的特征分解_特征向量_83

,求旋转后得坐标。可以解得:

矩阵的特征分解_对称矩阵_84



矩阵的特征分解_矩阵_85


矩阵的特征分解_线性代数_86


比对一下上式与

矩阵的特征分解_矩阵_72

,会发现两者相同,所以,

矩阵的特征分解_矩阵_72

得作用就是将单位矩阵每个列向量逆时针旋转

矩阵的特征分解_线性代数_82

对角矩阵

矩阵的特征分解_线性代数_90

则是将向量沿着特征向量的方向放缩,

矩阵的特征分解_线性代数_61

再将旋转的向量还原回去。

4.通过特征分解求逆矩阵

若矩阵

矩阵的特征分解_特征值_56

可被特征分解且特征值中不含

矩阵的特征分解_对称矩阵_93

,则矩阵

矩阵的特征分解_特征值_56

为非奇异矩阵,且其逆矩阵

矩阵的特征分解_矩阵_95


因为

矩阵的特征分解_线性代数_90

为对角矩阵,其逆矩阵容易计算出

矩阵的特征分解_对称矩阵_97

5.对特殊矩阵的矩阵分解

对称矩阵

任意的实对称矩阵的特征值都是实数且有

矩阵的特征分解_特征向量_28

个线性无关的特征向量,并且这些特征向量都可以正交单位化得到一组正交且模长为1的向量。实对称矩阵可被分解成

矩阵的特征分解_矩阵_99


矩阵的特征分解_线性代数_61

为正交矩阵,

矩阵的特征分解_线性代数_90

为实对角矩阵

参考

​特征分解​​​​如何理解矩阵特征值?​