关于最小二乘问题的求解,之前已有梯度下降法,还有比较快速的牛顿迭代。今天来介绍一种方法,是基于

矩阵求导来计算的,它的计算方式更加简洁高效,不需要大量迭代,只需解一个正规方程组

 

在开始之前,首先来认识一个概念和一些用到的定理。矩阵的迹定义如下

 

一个

矩阵求导解最小二乘问题_矩阵求导

的矩阵

矩阵求导解最小二乘问题_最小二乘_02

的迹是指

矩阵求导解最小二乘问题_最小二乘_03

的主对角线上各元素的总和,记作

矩阵求导解最小二乘问题_矩阵求导_04

。即

 

           

矩阵求导解最小二乘问题_矩阵求导_05

 

矩阵求导解最小二乘问题_最小二乘_06

 

                        

矩阵求导解最小二乘问题_矩阵求导_07

矩阵求导解最小二乘问题_最小二乘_08

             

矩阵求导解最小二乘问题_方程组_09

 

好了,有了上述7个定理,就可以来求最小二乘解了。设

 

  

矩阵求导解最小二乘问题_矩阵求导_10

 

那么进一步得到

 

    

矩阵求导解最小二乘问题_方程组_11

 

接下来会涉及到矩阵求导,因为

 

    

矩阵求导解最小二乘问题_最小二乘_12

 

那么进一步利用矩阵求导并利用上述定理,得到

 

    

矩阵求导解最小二乘问题_矩阵求导_13

 

我们知道在极值点处梯度值为零,即

 

    

矩阵求导解最小二乘问题_矩阵求导_14

 

上述得到的方程组叫做正规方程组,那么最终得到

 

    

矩阵求导解最小二乘问题_最小二乘_15

 

这样最小二乘问题只需解一个线性方程组即可,不再需要像梯度下降那样迭代了。

 

既然说到了正规方程组,在介绍一种方程组,叫做超定方程组,它的定义为:把方程个数大于未知量个数的方

程组叫做超定方程组。通常来说,对于一个超定方程组

矩阵求导解最小二乘问题_方程组_16

来说,求最小二乘解只需要两边同时乘

矩阵求导解最小二乘问题_矩阵求导_17

的转置,然后得到正规方程组

矩阵求导解最小二乘问题_方程组_18

,然后解这个方程就得到了最小二乘解。