线性代数之矩阵偏导续

矩阵偏导

针对y或者f(x)是元素,x是矩阵的情况,则元素对矩阵的求导形式如下:

线性代数之矩阵偏导续_转置

那么由这个定义则有:

线性代数之矩阵偏导续_矩阵_02

证明有两种方法:一种来源于矩阵偏导的定义,一种是借助矩阵迹的性质。

 借助定义

通过多变量矩阵偏导的定义来阐述,这里因为是对X的转置求偏导,所以定义里的偏导的每个分量都相应的做了转置,即是相当于对X求偏导时转置了。进而由矩阵偏导的定义得最终的结果a的转置。

 借助矩阵迹

矩阵迹的性质

矩阵的迹即矩阵主对角线之和,而且它有如下的性质:

线性代数之矩阵偏导续_线性代数_03

因为这里f(x)是个标量,其定义是

线性代数之矩阵偏导续_线性代数_04

这与矩阵的迹

线性代数之矩阵偏导续_标量_05

不谋而合。

矩阵偏导结论

结论,这里不难发现:

针对多变量的标量函数

线性代数之矩阵偏导续_线性代数_06


线性代数之矩阵偏导续_矩阵_07

这里A和x可以都是矩阵。

完整证明

所以上述的证明将借助矩阵迹的性质,完整的证明见下:

Step 1 定义

线性代数之矩阵偏导续_标量_08

Step 2 带入f     

线性代数之矩阵偏导续_转置_09

Step 3 f是标量,直接转为矩阵迹             

线性代数之矩阵偏导续_标量_10

Step 4 由矩阵性质3(矩阵乘交换迹不变)                  

线性代数之矩阵偏导续_矩阵_11

Step 5 由矩阵性质6(矩阵转置迹不变)  

线性代数之矩阵偏导续_矩阵_12

注: 这里应用到矩阵乘和转置的性质:

线性代数之矩阵偏导续_线性代数_13

Step 6 由矩阵转置的性质,则有        

线性代数之矩阵偏导续_矩阵_14

  Step 7  此时Step6的形式是否和一般式 

线性代数之矩阵偏导续_线性代数_06

神似?而

线性代数之矩阵偏导续_矩阵_07


:这里表达式整理成了标准形式(只不过这里的“x”是线性代数之矩阵偏导续_标量_17)。

所以最终得到结果

线性代数之矩阵偏导续_矩阵_18