目录索引

  • 一 矩阵
  • 1.线性代数的应用(以SVD为例)
  • 2.方阵的行列式
  • (1)方阵的行列式
  • (2)代数余子式
  • (3)行列式计算
  • (4)范德蒙行列式
  • 3.矩阵乘法和状态转移矩阵
  • (1)矩阵乘法
  • (2)概率转移矩阵
  • (3)矩阵和向量的乘法
  • 二 特征值和特征向量
  • 1.对称阵,正交阵和正定阵
  • (1)正交阵
  • (2)特征值和特征向量
  • (3)正定阵
  • 三 矩阵求导


一 矩阵

1.线性代数的应用(以SVD为例)

  SVD是在机器学习中广泛使用的算法,不光可以用于降维算法的特征分解,也可以用于推荐系统,以及自然语言处理等领域,是很多机器学习算法的基石。
  奇异值分解是一种重要的矩阵分解方法,可以看作方阵在任意矩阵上的推广。
  假设A是一个机器学习中的线性代数 线性代数在机械的应用_机器学习中的线性代数阶实矩阵,则存在一个分解使得
机器学习中的线性代数 线性代数在机械的应用_特征值_02
  求解如下机器学习中的线性代数 线性代数在机械的应用_机器学习中的线性代数_03
  其中,机器学习中的线性代数 线性代数在机械的应用_矩阵乘法_04对角线上的元素称为矩阵A的奇异值
    机器学习中的线性代数 线性代数在机械的应用_线性代数_05的第机器学习中的线性代数 线性代数在机械的应用_机器学习中的线性代数_06列称为A的关于机器学习中的线性代数 线性代数在机械的应用_矩阵乘法_07的右奇异向量
    机器学习中的线性代数 线性代数在机械的应用_矩阵乘法_08的第机器学习中的线性代数 线性代数在机械的应用_机器学习中的线性代数_06列称为A的关于机器学习中的线性代数 线性代数在机械的应用_矩阵乘法_07的左奇异向量

2.方阵的行列式

(1)方阵的行列式

   一阶方阵的行列式为元素的本身;
   机器学习中的线性代数 线性代数在机械的应用_特征值_11阶方阵的行列式等于它的任一行(或列)的各元素与其对应的代数余子式和。

(2)代数余子式

机器学习中的线性代数 线性代数在机械的应用_特征值_11阶行列式A中,把机器学习中的线性代数 线性代数在机械的应用_矩阵乘法_13元素机器学习中的线性代数 线性代数在机械的应用_特征值_14所在的第i行和第j列划去后,留下的n-1阶方阵的行列式叫做机器学习中的线性代数 线性代数在机械的应用_特征值_14的余子式,记作机器学习中的线性代数 线性代数在机械的应用_线性代数_16,代数余子式为机器学习中的线性代数 线性代数在机械的应用_特征值_17

(3)行列式计算

机器学习中的线性代数 线性代数在机械的应用_特征值_18
机器学习中的线性代数 线性代数在机械的应用_矩阵乘法_19

(4)范德蒙行列式

机器学习中的线性代数 线性代数在机械的应用_矩阵乘法_20
   举例:
机器学习中的线性代数 线性代数在机械的应用_线性代数_21

3.矩阵乘法和状态转移矩阵

(1)矩阵乘法

机器学习中的线性代数 线性代数在机械的应用_特征值_22机器学习中的线性代数 线性代数在机械的应用_机器学习中的线性代数_23阶矩阵,机器学习中的线性代数 线性代数在机械的应用_特征值_24机器学习中的线性代数 线性代数在机械的应用_线性代数_25阶矩阵,那么机器学习中的线性代数 线性代数在机械的应用_矩阵乘法_26机器学习中的线性代数 线性代数在机械的应用_机器学习中的线性代数阶矩阵,其中
机器学习中的线性代数 线性代数在机械的应用_特征值_28

(2)概率转移矩阵

机器学习中的线性代数 线性代数在机械的应用_矩阵乘法_29,它的状态有机器学习中的线性代数 线性代数在机械的应用_特征值_11个,用机器学习中的线性代数 线性代数在机械的应用_特征值_31表示。记在当前时刻机器学习中的线性代数 线性代数在机械的应用_矩阵乘法_32时位于机器学习中的线性代数 线性代数在机械的应用_机器学习中的线性代数_06状态,它在 机器学习中的线性代数 线性代数在机械的应用_特征值_34时刻位于机器学习中的线性代数 线性代数在机械的应用_机器学习中的线性代数_35状态的概率为机器学习中的线性代数 线性代数在机械的应用_矩阵乘法_36,即状态转移概率只依赖于前一个概率。

机器学习中的线性代数 线性代数在机械的应用_特征值_37


   举例,假定按照经济状况将人群分成上、中、下三个阶乘,用1、2、3表示。假定当前处于某阶层只和上一代有关,即:考虑父代为第机器学习中的线性代数 线性代数在机械的应用_机器学习中的线性代数_06阶层,则子代为第机器学习中的线性代数 线性代数在机械的应用_机器学习中的线性代数_35阶层的概率。如果一个人的收入属于下层类别,则它的孩子属于下层收入的概率为0.65,属于中层收入的概率为0.28,属于上层收入的概率为0.07。从父代到子代,有如下转移概率矩阵:

机器学习中的线性代数 线性代数在机械的应用_特征值_40


转移状态图为

机器学习中的线性代数 线性代数在机械的应用_线性代数_41


   第机器学习中的线性代数 线性代数在机械的应用_矩阵乘法_42代中处于第机器学习中的线性代数 线性代数在机械的应用_机器学习中的线性代数_35个阶层的概率为

机器学习中的线性代数 线性代数在机械的应用_矩阵乘法_44

机器学习中的线性代数 线性代数在机械的应用_特征值_45

   因此,矩阵机器学习中的线性代数 线性代数在机械的应用_矩阵乘法_46为(条件)概率转移矩阵,第机器学习中的线性代数 线性代数在机械的应用_机器学习中的线性代数_06行元素表示为在上一个状态为机器学习中的线性代数 线性代数在机械的应用_机器学习中的线性代数_06时的分布概率,即每一行元素概率和为1。

   思考:初始概率分布机器学习中的线性代数 线性代数在机械的应用_矩阵乘法_29对最终分布的影响?

   探索1:初始概率分布为机器学习中的线性代数 线性代数在机械的应用_线性代数_50迭代结果

机器学习中的线性代数 线性代数在机械的应用_机器学习中的线性代数_51


   探索2:初始概率分布为机器学习中的线性代数 线性代数在机械的应用_矩阵乘法_52迭代结果

机器学习中的线性代数 线性代数在机械的应用_矩阵乘法_53


   可以看出,初始概率不同,但经过若干次迭代,机器学习中的线性代数 线性代数在机械的应用_矩阵乘法_29将最终稳定到某个分布上,这是概率转移矩阵的性值,事实上P矩阵的n次幂最终也会收敛。具体原因以及深入的研究会在马尔可夫模型中继续探讨,本次暂不深入探讨。

(3)矩阵和向量的乘法

机器学习中的线性代数 线性代数在机械的应用_线性代数_55的矩阵,x机器学习中的线性代数 线性代数在机械的应用_矩阵乘法_56的列向量,则Ax机器学习中的线性代数 线性代数在机械的应用_特征值_57的列向量,记为机器学习中的线性代数 线性代数在机械的应用_线性代数_58
   由于机器学习中的线性代数 线性代数在机械的应用_特征值_11维向量和机器学习中的线性代数 线性代数在机械的应用_特征值_11维空间上的点一一对应,上式实际上给出了从n维空间上的点到m维空间上的点的线性变换。特殊地,若机器学习中的线性代数 线性代数在机械的应用_线性代数_61,则Ax完成了n维空间内的线性变换,比如旋转或者平移等。
  4.矩阵和向量组
  (1)矩阵的秩
   设在矩阵A中有一个不等于零的r阶子式D,且所有r+1阶子式(若存在)为0,那么D为矩阵A的最高阶非零子式,r称为矩阵A的秩,记为机器学习中的线性代数 线性代数在机械的应用_矩阵乘法_62
   机器学习中的线性代数 线性代数在机械的应用_机器学习中的线性代数_63可逆矩阵秩为n;
   可逆矩阵又称为满秩矩阵;
   矩阵的秩等于它行(列)向量组的秩。
  (2)秩和线性方程组解的关系
机器学习中的线性代数 线性代数在机械的应用_机器学习中的线性代数_64
   无解的充要条件是:机器学习中的线性代数 线性代数在机械的应用_特征值_65
   有唯一解的充要条件是:机器学习中的线性代数 线性代数在机械的应用_机器学习中的线性代数_66
   有无穷多解的充要条件是:机器学习中的线性代数 线性代数在机械的应用_线性代数_67
   机器学习中的线性代数 线性代数在机械的应用_特征值_68有非零解的充要条件是机器学习中的线性代数 线性代数在机械的应用_矩阵乘法_69
  (3)向量组等价
   向量机器学习中的线性代数 线性代数在机械的应用_特征值_70可由向量组:机器学习中的线性代数 线性代数在机械的应用_矩阵乘法_71线性表出的充要条件是矩阵机器学习中的线性代数 线性代数在机械的应用_线性代数_72的秩等于矩阵机器学习中的线性代数 线性代数在机械的应用_机器学习中的线性代数_73的秩。
   设有两个向量组机器学习中的线性代数 线性代数在机械的应用_机器学习中的线性代数_74机器学习中的线性代数 线性代数在机械的应用_机器学习中的线性代数_75,若向量组A和向量组B能够相互表出,则称向量组A和向量组B等价。
   若向量组B可以由向量组A线性表出,则对于每个向量机器学习中的线性代数 线性代数在机械的应用_矩阵乘法_76,存在机器学习中的线性代数 线性代数在机械的应用_线性代数_77,使得
机器学习中的线性代数 线性代数在机械的应用_机器学习中的线性代数_78
   从而得到系数矩阵K
机器学习中的线性代数 线性代数在机械的应用_矩阵乘法_79

二 特征值和特征向量

1.对称阵,正交阵和正定阵

(1)正交阵

机器学习中的线性代数 线性代数在机械的应用_特征值_11阶矩阵机器学习中的线性代数 线性代数在机械的应用_特征值_22满足机器学习中的线性代数 线性代数在机械的应用_特征值_82,则称A为正交矩阵,简称为正交阵。A是正交阵的充要条件是A的列(行)向量都是单位向量,且两两正交。若A为正交阵,则机器学习中的线性代数 线性代数在机械的应用_特征值_83为正交变换,正交变换不改变向量长度。

(2)特征值和特征向量

机器学习中的线性代数 线性代数在机械的应用_特征值_22机器学习中的线性代数 线性代数在机械的应用_特征值_11阶矩阵,若数机器学习中的线性代数 线性代数在机械的应用_矩阵乘法_86机器学习中的线性代数 线性代数在机械的应用_特征值_11维非0列向量机器学习中的线性代数 线性代数在机械的应用_线性代数_88满足机器学习中的线性代数 线性代数在机械的应用_矩阵乘法_89,则称机器学习中的线性代数 线性代数在机械的应用_矩阵乘法_86为A的特征值,机器学习中的线性代数 线性代数在机械的应用_线性代数_88为A的对应于特征值机器学习中的线性代数 线性代数在机械的应用_矩阵乘法_86的特征向量。
   根据定义,立刻可以得到机器学习中的线性代数 线性代数在机械的应用_线性代数_93,令关于机器学习中的线性代数 线性代数在机械的应用_矩阵乘法_86的多项式机器学习中的线性代数 线性代数在机械的应用_矩阵乘法_95为0,方程机器学习中的线性代数 线性代数在机械的应用_线性代数_96的根是特征值;将根机器学习中的线性代数 线性代数在机械的应用_矩阵乘法_97带入方程组机器学习中的线性代数 线性代数在机械的应用_线性代数_93求解到的非零解,即机器学习中的线性代数 线性代数在机械的应用_矩阵乘法_97对应的特征向量。
   特征值的性质:
     设n阶矩阵机器学习中的线性代数 线性代数在机械的应用_矩阵乘法_100的特征值为机器学习中的线性代数 线性代数在机械的应用_线性代数_101,则有
     机器学习中的线性代数 线性代数在机械的应用_线性代数_102
     机器学习中的线性代数 线性代数在机械的应用_矩阵乘法_103
   另外,已知机器学习中的线性代数 线性代数在机械的应用_矩阵乘法_86是方阵A的特征值,则有
     机器学习中的线性代数 线性代数在机械的应用_机器学习中的线性代数_105机器学习中的线性代数 线性代数在机械的应用_特征值_106的特征值;
     A可逆时,机器学习中的线性代数 线性代数在机械的应用_机器学习中的线性代数_107机器学习中的线性代数 线性代数在机械的应用_矩阵乘法_108的特征值(定义很容易证明)。
   不同特征值对应的特征向量性质:
     设机器学习中的线性代数 线性代数在机械的应用_矩阵乘法_109是方阵A的特征值,机器学习中的线性代数 线性代数在机械的应用_矩阵乘法_110是依次与之对应的特征向量,若机器学习中的线性代数 线性代数在机械的应用_矩阵乘法_109各不相等,则机器学习中的线性代数 线性代数在机械的应用_矩阵乘法_110线性无关。
   实对称矩阵引理:
     实对称矩阵的特征值是实数;
     实对称矩阵的特征向量可以取实向量;
     实对称矩阵不同特征值的特征向量正交
       结果证明:令实对称矩阵为A,其两个不同特征值分别机器学习中的线性代数 线性代数在机械的应用_特征值_113,对应的特征向量分别为机器学习中的线性代数 线性代数在机械的应用_矩阵乘法_114
机器学习中的线性代数 线性代数在机械的应用_特征值_115
机器学习中的线性代数 线性代数在机械的应用_机器学习中的线性代数_116
机器学习中的线性代数 线性代数在机械的应用_矩阵乘法_117
机器学习中的线性代数 线性代数在机械的应用_机器学习中的线性代数_118
       得证。
   最终结论:设A为实对称n阶矩阵,则必有正交阵P使得
机器学习中的线性代数 线性代数在机械的应用_机器学习中的线性代数_119
     其中,机器学习中的线性代数 线性代数在机械的应用_特征值_120是以A的特征值为对角元的对角阵,该变换也成为合同变换,A和机器学习中的线性代数 线性代数在机械的应用_特征值_120互为合同矩阵。

(3)正定阵

机器学习中的线性代数 线性代数在机械的应用_线性代数_88都有机器学习中的线性代数 线性代数在机械的应用_线性代数_123,则称矩阵A为正定矩阵。若条件改为机器学习中的线性代数 线性代数在机械的应用_特征值_124,则称A为半正定。任意给定机器学习中的线性代数 线性代数在机械的应用_矩阵乘法_125,一定是半正定矩阵。
    正定判定:
     对称阵A为正定阵;
     A的特征值都为正;
     A的顺序主子式都大于0;
     以上三命题等价。
  4.QR分解
    对于机器学习中的线性代数 线性代数在机械的应用_线性代数_55列满秩矩阵,必有机器学习中的线性代数 线性代数在机械的应用_特征值_127
    其中,机器学习中的线性代数 线性代数在机械的应用_机器学习中的线性代数_128,即列正交矩阵,R为非奇异上三角矩阵。当要求R的对角元素为正时,该分解唯一。可用于求解A的逆矩阵以及A的特征值。
    QR分解计算特征值(A为n阶方阵)
机器学习中的线性代数 线性代数在机械的应用_线性代数_129
机器学习中的线性代数 线性代数在机械的应用_机器学习中的线性代数_130
机器学习中的线性代数 线性代数在机械的应用_特征值_131
机器学习中的线性代数 线性代数在机械的应用_机器学习中的线性代数_130
机器学习中的线性代数 线性代数在机械的应用_线性代数_133

三 矩阵求导

  1.向量对向量求导
   A为机器学习中的线性代数 线性代数在机械的应用_机器学习中的线性代数矩阵,机器学习中的线性代数 线性代数在机械的应用_线性代数_88机器学习中的线性代数 线性代数在机械的应用_线性代数_136的列向量,则机器学习中的线性代数 线性代数在机械的应用_特征值_83机器学习中的线性代数 线性代数在机械的应用_机器学习中的线性代数_138的列向量,记机器学习中的线性代数 线性代数在机械的应用_机器学习中的线性代数_139,则机器学习中的线性代数 线性代数在机械的应用_特征值_140
   公式推导
机器学习中的线性代数 线性代数在机械的应用_机器学习中的线性代数_141
机器学习中的线性代数 线性代数在机械的应用_机器学习中的线性代数_142
     结论推广:机器学习中的线性代数 线性代数在机械的应用_机器学习中的线性代数_143
机器学习中的线性代数 线性代数在机械的应用_矩阵乘法_144
  2.标量对向量求导
   A为机器学习中的线性代数 线性代数在机械的应用_线性代数_55矩阵,机器学习中的线性代数 线性代数在机械的应用_线性代数_88机器学习中的线性代数 线性代数在机械的应用_矩阵乘法_56列向量,记机器学习中的线性代数 线性代数在机械的应用_特征值_148
机器学习中的线性代数 线性代数在机械的应用_线性代数_149
   公式推导
机器学习中的线性代数 线性代数在机械的应用_矩阵乘法_150
机器学习中的线性代数 线性代数在机械的应用_矩阵乘法_151
机器学习中的线性代数 线性代数在机械的应用_特征值_152
机器学习中的线性代数 线性代数在机械的应用_机器学习中的线性代数_153
   若A为对称矩阵,则机器学习中的线性代数 线性代数在机械的应用_特征值_154
  3.标量对矩阵求导
   A为机器学习中的线性代数 线性代数在机械的应用_矩阵乘法_155方阵,|A| 为A的行列式,则机器学习中的线性代数 线性代数在机械的应用_机器学习中的线性代数_156