线性代数之矩阵偏导续
矩阵偏导
针对y或者f(x)是元素,x是矩阵的情况,则元素对矩阵的求导形式如下:
那么由这个定义则有:
证明有两种方法:一种来源于矩阵偏导的定义,一种是借助矩阵迹的性质。
借助定义
通过多变量矩阵偏导的定义来阐述,这里因为是对X的转置求偏导,所以定义里的偏导的每个分量都相应的做了转置,即是相当于对X求偏导时转置了。进而由矩阵偏导的定义得最终的结果a的转置。
借助矩阵迹
矩阵迹的性质
矩阵的迹即矩阵主对角线之和,而且它有如下的性质:
因为这里f(x)是个标量,其定义是
这与矩阵的迹
不谋而合。
矩阵偏导结论
结论,这里不难发现:
针对多变量的标量函数
则
这里A和x可以都是矩阵。
完整证明
所以上述的证明将借助矩阵迹的性质,完整的证明见下:
Step 1 定义
Step 2 带入f
Step 3 f是标量,直接转为矩阵迹
Step 4 由矩阵性质3(矩阵乘交换迹不变)
Step 5 由矩阵性质6(矩阵转置迹不变)
注: 这里应用到矩阵乘和转置的性质:
Step 6 由矩阵转置的性质,则有
Step 7 此时Step6的形式是否和一般式
神似?而
。
注:这里表达式整理成了标准形式(只不过这里的“x”是)。
所以最终得到结果