5.4 加权最小二乘法

最小二乘法是使 最小二乘 权重 最小二乘加权_线性代数 最小,这表明每次测量的重要性一样,但实际中有时存在某些测量更重要,某些更不重要。以第一个例子为例说明,假设测量直径,用了两个精度不同的设备各测一次,分别为 最小二乘 权重 最小二乘加权_方差_02 ,设备的测量精度即方差分别为 最小二乘 权重 最小二乘加权_线性代数_03 ,设备精度越高方差越小。如何综合这两个测量结果来获得比仅用高精度设备更好的结果?如果设备精度相同,则结果为 最小二乘 权重 最小二乘加权_线性代数_04 ,即这两个测量权重相同。如果精度不同,则显然精度高的权重要大,权重要与精度成正比,所以测量结果应该为 最小二乘 权重 最小二乘加权_权重_05 ,该估计值方差为 最小二乘 权重 最小二乘加权_权重_06 ,此值小于 最小二乘 权重 最小二乘加权_线性代数_07 ,这说明估计值的精度高于 最小二乘 权重 最小二乘加权_最小二乘 权重_08

假设每次测量精度不同,方差为 最小二乘 权重 最小二乘加权_线性代数_09 ,则此时应该使 最小二乘 权重 最小二乘加权_权重_10 最小,即精度高的测量权重要大。根据前面结果知 最小二乘 权重 最小二乘加权_矩阵_11 即向量 最小二乘 权重 最小二乘加权_权重_12 的内积,也就是向量 最小二乘 权重 最小二乘加权_矩阵_13 到子空间 最小二乘 权重 最小二乘加权_方差_14 的距离平方。现在要求加权距离平方的最小值,加权距离平方可以通过矩阵获得!令对角阵为:最小二乘 权重 最小二乘加权_最小二乘 权重_15最小二乘 权重 最小二乘加权_矩阵_16 ,则 最小二乘 权重 最小二乘加权_权重_17

最小二乘 权重 最小二乘加权_最小二乘 权重_18

最小二乘 权重 最小二乘加权_最小二乘 权重_19最小二乘 权重 最小二乘加权_权重_20 ,则上式为 最小二乘 权重 最小二乘加权_矩阵_21

最小二乘 权重 最小二乘加权_矩阵_22

这就是加权最小二乘法的解!

我们还可以进行推广,上式是 最小二乘 权重 最小二乘加权_最小二乘 权重_23 最小解,其中 最小二乘 权重 最小二乘加权_线性代数_24 是对角阵,其实对称阵 最小二乘 权重 最小二乘加权_方差_25 也可以。只要对称阵满足对任意非零向量 最小二乘 权重 最小二乘加权_矩阵_26 ,有 最小二乘 权重 最小二乘加权_最小二乘 权重_27 成立,最小二乘 权重 最小二乘加权_线性代数_28 称为广义距离,即保证广义距离非负,此时对称阵 最小二乘 权重 最小二乘加权_方差_25

定义 正定矩阵 对称阵 最小二乘 权重 最小二乘加权_方差_25 对应的广义距离 最小二乘 权重 最小二乘加权_线性代数_28

根据对称阵的 最小二乘 权重 最小二乘加权_权重_32 分解,有 最小二乘 权重 最小二乘加权_权重_33 ,令 最小二乘 权重 最小二乘加权_方差_34 ,则 最小二乘 权重 最小二乘加权_方差_35 ,与对角阵 最小二乘 权重 最小二乘加权_权重_17 分解一致,所以最优解为 最小二乘 权重 最小二乘加权_最小二乘 权重_37

如何确定对角阵或对称阵元素的值,这是一个困难的问题。有时可以根据先验知识来人为指定对角阵元素值,比如根据测量精度。但指定对称阵元素的值十分困难,在机器学习中,这称为度量学习。