贝叶斯线性回归推导

转载

mob64ca1417b0c6 2024-08-01 08:10:37

文章标签 贝叶斯线性回归推导人工智能机器学习深度学习算法 文章分类 机器学习人工智能

一、概述

线性回归的数据如下所示：

$贝叶斯线性回归推导_人工智能$

对于线性回归问题，假设：

$贝叶斯线性回归推导_机器学习_02$

其中 $贝叶斯线性回归推导_深度学习_03$ 是参数， $贝叶斯线性回归推导_贝叶斯线性回归推导_04$ 是噪声。以二维的数据为例，其图像如下：

贝叶斯线性回归推导_深度学习_05

从几何角度出发求解线性回归问题，可以使用最小二乘估计（Least Square Estimate，LSE），而从概率角度来看也就是噪声为高斯分布的极大似然估计（Maximum Likelihood Estimate，MLE），公式为：

$贝叶斯线性回归推导_算法_06$

为了防止过拟合的问题，采用了正则化的最小二乘估计的方法，包括Lasso正则化和Ridge正则化两种方式，这种方法从概率角度来看也就是最大后验估计（Maximum a Posteriori Estimation，MAP），其噪声也是高斯分布，这里参数 $贝叶斯线性回归推导_深度学习_03$ 的后验满足：

$贝叶斯线性回归推导_深度学习_08$

因此最大后验估计的公式也就是：

$贝叶斯线性回归推导_算法_09$

这里的 $贝叶斯线性回归推导_深度学习_10$ 也就是参数 $贝叶斯线性回归推导_深度学习_03$ 的先验，如果 $贝叶斯线性回归推导_深度学习_10$ 服从高斯分布，则对应Lasso正则化，如果 $贝叶斯线性回归推导_深度学习_10$ 服从拉普拉斯分布，则对应Ridge正则化。

对于上述方法的详细解释，可以参考链接：线性回归|机器学习推导系列（三）。

上述方法都是点估计方法，而在贝叶斯线性回归中我们希望利用贝叶斯学派的方法来求解出后验概率分布 $贝叶斯线性回归推导_贝叶斯线性回归推导_14$ 。

二、推断与预测

推断

贝叶斯线性回归的推断（Inference）任务也就是求解参数 $贝叶斯线性回归推导_深度学习_03$ 的后验分布 $贝叶斯线性回归推导_贝叶斯线性回归推导_14$ 。首先，进行以下变换：

$贝叶斯线性回归推导_机器学习_17$

对于上面得到的式子，分子中 $贝叶斯线性回归推导_贝叶斯线性回归推导_18$ 相当于似然， $贝叶斯线性回归推导_机器学习_19$ 也就是先验 $贝叶斯线性回归推导_深度学习_10$ （因为 $贝叶斯线性回归推导_深度学习_03$ 和 $贝叶斯线性回归推导_人工智能_22$ 没有关系），另外分母是一个常数，因此我们可以得到：

$贝叶斯线性回归推导_贝叶斯线性回归推导_23$

对于似然 $贝叶斯线性回归推导_贝叶斯线性回归推导_18$ ，由于之前定义的 $贝叶斯线性回归推导_人工智能_25$ 和 $贝叶斯线性回归推导_人工智能_26$ 之间的关系是一个线性高斯模型，因此可以得到：

$贝叶斯线性回归推导_人工智能_27$

对于先验 $贝叶斯线性回归推导_深度学习_10$ ，是人为指定的，只要合理就可以任意给定这个分布，通常我们选择高斯分布，注意这里是一个多维的高斯分布，我们选择的高斯分布均值为 $贝叶斯线性回归推导_算法_29$ ，方差矩阵用 $贝叶斯线性回归推导_人工智能_30$ 来表示：

$贝叶斯线性回归推导_人工智能_31$

因此也就得到：

$贝叶斯线性回归推导_机器学习_32$

由于似然 $贝叶斯线性回归推导_贝叶斯线性回归推导_18$ 和先验 $贝叶斯线性回归推导_深度学习_10$ 都是高斯分布，利用共轭的知识（高斯分布是自共轭的），我们也可以得到 $贝叶斯线性回归推导_贝叶斯线性回归推导_14$ 也是一个高斯分布，推断任务也就是求解这个高斯分布的均值和方差，我们用 $贝叶斯线性回归推导_深度学习_36$ 和 $贝叶斯线性回归推导_贝叶斯线性回归推导_37$ 来表示这个高斯分布的均值和方差：

$贝叶斯线性回归推导_深度学习_38$

将似然 $贝叶斯线性回归推导_贝叶斯线性回归推导_18$ 做进一步的变换，我们可以得到这个概率的均值和方差：

$贝叶斯线性回归推导_算法_40$

上式中红色的部分可以写成矩阵相乘的形式：

$贝叶斯线性回归推导_算法_41$

因此也就有：

$贝叶斯线性回归推导_深度学习_42$

至此似然 $贝叶斯线性回归推导_贝叶斯线性回归推导_18$ 就表示成了标准的高斯分布的形式，代入后验中我们可以得到：

$贝叶斯线性回归推导_深度学习_44$

对于上面的式子我们可以写出它的指数的关于 $贝叶斯线性回归推导_深度学习_03$ 的二次项和一次项：

$贝叶斯线性回归推导_算法_46$

对于一个多维的高斯分布的指数部分，将其展开可以得到：

$贝叶斯线性回归推导_机器学习_47$

而这里的有关于 $贝叶斯线性回归推导_人工智能_22$ 的二次项和一次项为：

$贝叶斯线性回归推导_机器学习_49$

通过二次项也就可以得到后验 $贝叶斯线性回归推导_贝叶斯线性回归推导_14$ 的精度矩阵 $贝叶斯线性回归推导_贝叶斯线性回归推导_51$ （这是一个对称矩阵）：

$贝叶斯线性回归推导_贝叶斯线性回归推导_52$

由一次项可以得出：

$贝叶斯线性回归推导_机器学习_53$

如此我们最终就求得了后验 $贝叶斯线性回归推导_贝叶斯线性回归推导_14$ 的均值和方差：

$贝叶斯线性回归推导_贝叶斯线性回归推导_55$

预测

预测（Prediction）问题是利用已经求解出来的贝叶斯线性回归模型，在给定 $贝叶斯线性回归推导_贝叶斯线性回归推导_56$ 的前提下，求解 $贝叶斯线性回归推导_深度学习_57$ 。要注意，由于这里的 $贝叶斯线性回归推导_深度学习_03$ 服从后验分布 $贝叶斯线性回归推导_贝叶斯线性回归推导_14$ ，因此需要求解的是分布 $贝叶斯线性回归推导_机器学习_60$ 。