1.特征值的直观理解

特征值,表示一个矩阵的向量被拉伸或压缩的程度。

先从直观上理解,以索大哈哈大笑的图像为例,水平方向分量为$x_1$,垂直方向分量为$x_2$: image.png

  1. 图1 ——> 图2:图片垂直方向没变,水平方向压缩为原来的一半,即此过程水平方向的特征值缩小为原来的一半:$\lambda = 1/2$;
  2. 图2 ——> 图3:图片水平方向没变,垂直方向变化同上,即:$\lambda = 1/2$;
  3. 图3 ——> 图4:图片水平旋转了180度,即:$\lambda = -1$。

这里简单考虑了水平方向和垂直方向的简单变化。

这一过程的表达式为:$Ax = \lambda x$,即一个向量(或函数)被矩阵相乘,表示对这个向量做了一个线性变换。如果变换后还是这个向量本身乘以一个常数,这个常数就叫特征值。


接下来正式考虑矩阵的特征值。

2.投影矩阵的特征值

首先考虑投影矩阵,对投影矩阵$P$而言:

image.png

  1. 正处于投影平面的任意向量$x_1$而言有$Px_1=x_1$,即$\lambda=1$;
  2. 垂直于投影平面的任意向量$x_2$而言有$Px_2=0$,即$\lambda=0$。

综上即:即投影矩阵的特征值为0或者1。

3.特征值求法

如何求解$Ax = \lambda x$?

思想:转化为求解方程组的问题:$(\lambda E-A) x= 0$ 这里由于$x \neq 0$,所以矩阵$\lambda E- A$必须是奇异的(不可逆的),其对应的行列式$|\lambda E-A|=0$被称为特征(值)方程,而$\lambda E - A$则被称作特征多项式

求矩阵$A =\begin{bmatrix}3&1\1&3\end{bmatrix}$的特征值和特征向量:

  1. 首先构造特征方程: $\begin{vmatrix}\lambda-3&1\1&\lambda-3\end{vmatrix} = (\lambda -3)^2 - 1 = \lambda^2 -6\lambda + 8 = (\lambda-2)(\lambda -4)=0$

可以解得:$\lambda_1 = 2, \lambda_2 = 4$

而最终化简得到的关于$\lambda$的表达式中,其实6表示8表示行列式的值

特征值还有一点猫腻:

  • 特征值之和等于迹 $\sum_{i=1}^n \lambda_{i} = \sum_{i}^n a_{ii}(即tr(A))$

  • 特征值乘积等于对应方阵行列式的值 ,即$\prod_{i=1}^n \lambda_{i} = |A|$

  1. 求解特征向量

即将$\lambda$ 重新待会特征多项式当中求解基础解系即可,此处不做阐述。

4.特征值的幂

对于矩阵A左乘一个可逆特征向量矩阵S

$AS = A \begin{bmatrix} \vdots & \vdots &\vdots & & \vdots & \ x_1&x_2&x_3&\dots&x_n\\vdots & \vdots &\vdots & & \vdots \end{bmatrix} = \begin{bmatrix} \vdots & \vdots &\vdots & & \vdots & \ \lambda_1x_1&\lambda_2x_2&\lambda_3x_3&\dots&\lambda_nx_n\\vdots & \vdots &\vdots & & \vdots \end{bmatrix} =$ 由$Ax=\lambda x$,可以将矩阵A转化为对角阵

$\begin{bmatrix} \vdots & \vdots &\vdots & & \vdots & \ x_1&x_2&x_3&\dots&x_n\\vdots & \vdots &\vdots & & \vdots \end{bmatrix}$ $\begin{bmatrix} \lambda_1 & 0 &0 &\dots& 0 & \ 0&\lambda_2&0&\dots&0\\vdots & \vdots &\vdots &\dots & \vdots \0&0&0&\dots&\lambda_n\end{bmatrix}$ = $S\Lambda$

得到$AS = S\Lambda$,即$S^{-1}AS = \Lambda$,也即$A = S\Lambda S^{-1}$ 对于$Ax = \lambda x$:

  1. 如果A矩阵加减m个单位阵,有$(A+mE)x = Ax+mx = \lambda x +mx = (\lambda+m)x$

特征值的改变与加减的m有关

  1. 如果A矩阵变为$A^2$,即可以通过两种方式
  • $A^2x = \lambda Ax = \lambda^2 x$
  • $A^2x = S\Lambda S^{-1}S\Lambda S^{-1} = S\Lambda^2S^{-1}$

特征向量没有改变,但是特征值变成了平方 特征值的应用十分的广泛,后面会争取写一些实际运用的案例。