目录索引
- 一 矩阵
- 1.线性代数的应用(以SVD为例)
- 2.方阵的行列式
- (1)方阵的行列式
- (2)代数余子式
- (3)行列式计算
- (4)范德蒙行列式
- 3.矩阵乘法和状态转移矩阵
- (1)矩阵乘法
- (2)概率转移矩阵
- (3)矩阵和向量的乘法
- 二 特征值和特征向量
- 1.对称阵,正交阵和正定阵
- (1)正交阵
- (2)特征值和特征向量
- (3)正定阵
- 三 矩阵求导
一 矩阵
1.线性代数的应用(以SVD为例)
SVD是在机器学习中广泛使用的算法,不光可以用于降维算法的特征分解,也可以用于推荐系统,以及自然语言处理等领域,是很多机器学习算法的基石。
奇异值分解是一种重要的矩阵分解方法,可以看作方阵在任意矩阵上的推广。
假设A是一个阶实矩阵,则存在一个分解使得
求解如下
其中,对角线上的元素称为矩阵A的奇异值
的第列称为A的关于的右奇异向量
的第列称为A的关于的左奇异向量
2.方阵的行列式
(1)方阵的行列式
一阶方阵的行列式为元素的本身;
阶方阵的行列式等于它的任一行(或列)的各元素与其对应的代数余子式和。
(2)代数余子式
阶行列式A中,把元素所在的第i行和第j列划去后,留下的n-1阶方阵的行列式叫做的余子式,记作,代数余子式为。
(3)行列式计算
(4)范德蒙行列式
举例:
3.矩阵乘法和状态转移矩阵
(1)矩阵乘法
为阶矩阵,为阶矩阵,那么是阶矩阵,其中
(2)概率转移矩阵
,它的状态有个,用表示。记在当前时刻时位于状态,它在 时刻位于状态的概率为,即状态转移概率只依赖于前一个概率。
举例,假定按照经济状况将人群分成上、中、下三个阶乘,用1、2、3表示。假定当前处于某阶层只和上一代有关,即:考虑父代为第阶层,则子代为第阶层的概率。如果一个人的收入属于下层类别,则它的孩子属于下层收入的概率为0.65,属于中层收入的概率为0.28,属于上层收入的概率为0.07。从父代到子代,有如下转移概率矩阵:
转移状态图为
第代中处于第个阶层的概率为
因此,矩阵为(条件)概率转移矩阵,第行元素表示为在上一个状态为时的分布概率,即每一行元素概率和为1。
思考:初始概率分布对最终分布的影响?
探索1:初始概率分布为迭代结果
探索2:初始概率分布为迭代结果
可以看出,初始概率不同,但经过若干次迭代,将最终稳定到某个分布上,这是概率转移矩阵的性值,事实上P矩阵的n次幂最终也会收敛。具体原因以及深入的研究会在马尔可夫模型中继续探讨,本次暂不深入探讨。
(3)矩阵和向量的乘法
的矩阵,x为的列向量,则Ax为的列向量,记为
由于维向量和维空间上的点一一对应,上式实际上给出了从n维空间上的点到m维空间上的点的线性变换。特殊地,若,则Ax完成了n维空间内的线性变换,比如旋转或者平移等。
4.矩阵和向量组
(1)矩阵的秩
设在矩阵A中有一个不等于零的r阶子式D,且所有r+1阶子式(若存在)为0,那么D为矩阵A的最高阶非零子式,r称为矩阵A的秩,记为。
可逆矩阵秩为n;
可逆矩阵又称为满秩矩阵;
矩阵的秩等于它行(列)向量组的秩。
(2)秩和线性方程组解的关系
无解的充要条件是:;
有唯一解的充要条件是:;
有无穷多解的充要条件是:;
有非零解的充要条件是。
(3)向量组等价
向量可由向量组:线性表出的充要条件是矩阵的秩等于矩阵的秩。
设有两个向量组和,若向量组A和向量组B能够相互表出,则称向量组A和向量组B等价。
若向量组B可以由向量组A线性表出,则对于每个向量,存在,使得
从而得到系数矩阵K
二 特征值和特征向量
1.对称阵,正交阵和正定阵
(1)正交阵
阶矩阵满足,则称A为正交矩阵,简称为正交阵。A是正交阵的充要条件是A的列(行)向量都是单位向量,且两两正交。若A为正交阵,则为正交变换,正交变换不改变向量长度。
(2)特征值和特征向量
是阶矩阵,若数和维非0列向量满足,则称为A的特征值,为A的对应于特征值的特征向量。
根据定义,立刻可以得到,令关于的多项式为0,方程的根是特征值;将根带入方程组求解到的非零解,即对应的特征向量。
特征值的性质:
设n阶矩阵的特征值为,则有
;
。
另外,已知是方阵A的特征值,则有
是的特征值;
A可逆时,是的特征值(定义很容易证明)。
不同特征值对应的特征向量性质:
设是方阵A的特征值,是依次与之对应的特征向量,若各不相等,则线性无关。
实对称矩阵引理:
实对称矩阵的特征值是实数;
实对称矩阵的特征向量可以取实向量;
实对称矩阵不同特征值的特征向量正交
结果证明:令实对称矩阵为A,其两个不同特征值分别,对应的特征向量分别为
得证。
最终结论:设A为实对称n阶矩阵,则必有正交阵P使得
其中,是以A的特征值为对角元的对角阵,该变换也成为合同变换,A和互为合同矩阵。
(3)正定阵
都有,则称矩阵A为正定矩阵。若条件改为,则称A为半正定。任意给定,一定是半正定矩阵。
正定判定:
对称阵A为正定阵;
A的特征值都为正;
A的顺序主子式都大于0;
以上三命题等价。
4.QR分解
对于列满秩矩阵,必有
其中,,即列正交矩阵,R为非奇异上三角矩阵。当要求R的对角元素为正时,该分解唯一。可用于求解A的逆矩阵以及A的特征值。
QR分解计算特征值(A为n阶方阵)
三 矩阵求导
1.向量对向量求导
A为矩阵,为的列向量,则为的列向量,记,则
公式推导
结论推广:
2.标量对向量求导
A为矩阵,为列向量,记。
公式推导
若A为对称矩阵,则
3.标量对矩阵求导
A为方阵,|A| 为A的行列式,则