贝叶斯岭回归pycharm 贝叶斯岭回归先验分布

转载

mob64ca1415f0ab 2024-04-18 14:49:40

文章标签 贝叶斯岭回归pycharm 机器学习人工智能深度学习直方图 文章分类 机器学习人工智能

三、先验分布的确定

主观概率（离散型）

利用对立事件的比较确定主观概率，例如成功的概率比失败高一倍
利用专家意见确定主观概率
利用多位专家确定主观概率
利用历史资料，考虑现有信息加以修正

利用先验信息确定先验分布（连续型）：

直方图法：

将参数空间分成小区间
在每个小区间上决定主观概率或依据历史数据确定其频率
绘制频率直方图
在直方图上做一条光滑曲线，即为先验分布

选定先验密度函数形式再估计超参数

根据先验信息选定 $贝叶斯岭回归pycharm 贝叶斯岭回归先验分布_直方图$ 的先验密度函数 $贝叶斯岭回归pycharm 贝叶斯岭回归先验分布_人工智能_02$ 形式
对分布中的超参数给出估计值，使最接近先验信息

定分度法与变分度法

定分度法：长度一样，概率不同的小区间，给出每个小区间的主观概率
变分度法：概率一样，长度不同的小区间，给区间进行划分

利用边缘分布确定先验密度，就是极大似然法

边缘分布m(x)

传统用 $贝叶斯岭回归pycharm 贝叶斯岭回归先验分布_深度学习_03$
贝叶斯用边缘分布 $贝叶斯岭回归pycharm 贝叶斯岭回归先验分布_贝叶斯岭回归pycharm_04$

$贝叶斯岭回归pycharm 贝叶斯岭回归先验分布_人工智能_05$
当先验分布有未知数的时候，例如 $贝叶斯岭回归pycharm 贝叶斯岭回归先验分布_深度学习_06$ ，那么被积分之后m(x)变为与 $贝叶斯岭回归pycharm 贝叶斯岭回归先验分布_直方图_07$ 相关的函数，可记为 $贝叶斯岭回归pycharm 贝叶斯岭回归先验分布_直方图_08$

我们所需要做的就是求使 $贝叶斯岭回归pycharm 贝叶斯岭回归先验分布_深度学习_09$ 达到最大的 $贝叶斯岭回归pycharm 贝叶斯岭回归先验分布_直方图_10$ ，也就是最大似然估计（最大似然二型估计）

混合分布：

变量x依概率 $贝叶斯岭回归pycharm 贝叶斯岭回归先验分布_机器学习_11$ 在总体 $贝叶斯岭回归pycharm 贝叶斯岭回归先验分布_人工智能_12$ 中取值，以 $贝叶斯岭回归pycharm 贝叶斯岭回归先验分布_人工智能_13$ 在总体 $贝叶斯岭回归pycharm 贝叶斯岭回归先验分布_直方图_14$ 中取值，若 $贝叶斯岭回归pycharm 贝叶斯岭回归先验分布_贝叶斯岭回归pycharm_15$ 分别是两个总体的分布函数，则x的分布函数为两个分布函数的加权相加： $贝叶斯岭回归pycharm 贝叶斯岭回归先验分布_深度学习_16$
F(x)可以看做 $贝叶斯岭回归pycharm 贝叶斯岭回归先验分布_贝叶斯岭回归pycharm_15$ 的混合分布
$贝叶斯岭回归pycharm 贝叶斯岭回归先验分布_机器学习_11$ 和 $贝叶斯岭回归pycharm 贝叶斯岭回归先验分布_人工智能_13$ 看做一个新的随机变量 $贝叶斯岭回归pycharm 贝叶斯岭回归先验分布_深度学习_20$ 的分布
$贝叶斯岭回归pycharm 贝叶斯岭回归先验分布_直方图_21$
从 $贝叶斯岭回归pycharm 贝叶斯岭回归先验分布_机器学习_22$ 中抽取一个x，相当于进行两次抽样

从 $贝叶斯岭回归pycharm 贝叶斯岭回归先验分布_机器学习_23$ 中抽取一个样本 $贝叶斯岭回归pycharm 贝叶斯岭回归先验分布_人工智能_24$
根据 $贝叶斯岭回归pycharm 贝叶斯岭回归先验分布_人工智能_24$ 判定是从哪个总体中抽取样本x

混合样本：从混合分布中抽取出来的样本，大约有 $贝叶斯岭回归pycharm 贝叶斯岭回归先验分布_机器学习_26$ 个来自总体1，其余的来自总体2

先验选择的ML-II（极大似然估计方法）

设 $贝叶斯岭回归pycharm 贝叶斯岭回归先验分布_机器学习_27$ 为所考虑的先验类，且 $贝叶斯岭回归pycharm 贝叶斯岭回归先验分布_机器学习_28$ 是来自 $贝叶斯岭回归pycharm 贝叶斯岭回归先验分布_贝叶斯岭回归pycharm_29$ 中某一分布的样本，若存在 $贝叶斯岭回归pycharm 贝叶斯岭回归先验分布_贝叶斯岭回归pycharm_30$ 满足
$贝叶斯岭回归pycharm 贝叶斯岭回归先验分布_机器学习_31$
其中 $贝叶斯岭回归pycharm 贝叶斯岭回归先验分布_深度学习_32$ 称为II型极大似然先验，或简称为ML-II先验
这里将m(x)看成似然函数，找一个 $贝叶斯岭回归pycharm 贝叶斯岭回归先验分布_人工智能_33$ 使 $贝叶斯岭回归pycharm 贝叶斯岭回归先验分布_贝叶斯岭回归pycharm_34$ 达到最大，也是一种最大化似然函数的方法

先验选择的矩方法

样本均值=总体均值
样本方差=总体方差
先计算总体的分布 $贝叶斯岭回归pycharm 贝叶斯岭回归先验分布_深度学习_03$ 的期望 $贝叶斯岭回归pycharm 贝叶斯岭回归先验分布_深度学习_36$ 和方差 $贝叶斯岭回归pycharm 贝叶斯岭回归先验分布_直方图_37$
即 $贝叶斯岭回归pycharm 贝叶斯岭回归先验分布_贝叶斯岭回归pycharm_38$

先验选择的矩方法

有大数定理
$贝叶斯岭回归pycharm 贝叶斯岭回归先验分布_直方图_39$
矩估计：已知统计结果或取样结果估算总体均值和总体方差

无信息先验分布

贝叶斯假设：无信息先验分布应该取 $贝叶斯岭回归pycharm 贝叶斯岭回归先验分布_人工智能_40$ 取值范围内的均匀分布
$贝叶斯岭回归pycharm 贝叶斯岭回归先验分布_深度学习_41$
广义先验密度：当 $贝叶斯岭回归pycharm 贝叶斯岭回归先验分布_人工智能_40$ 的取值范围是无穷的时候，无法给出一个均匀分布，所以设置 $贝叶斯岭回归pycharm 贝叶斯岭回归先验分布_人工智能_40$ 的先验分布为

$贝叶斯岭回归pycharm 贝叶斯岭回归先验分布_贝叶斯岭回归pycharm_44$
由此决定的后验密度 $贝叶斯岭回归pycharm 贝叶斯岭回归先验分布_机器学习_45$ 是正常的密度函数
设密度参数中有两个参数 $贝叶斯岭回归pycharm 贝叶斯岭回归先验分布_深度学习_46$ ，且密度函数具有如下形式：
$贝叶斯岭回归pycharm 贝叶斯岭回归先验分布_深度学习_47$
其中f(x)是完全确定的函数，它对应于 $贝叶斯岭回归pycharm 贝叶斯岭回归先验分布_深度学习_48$ 时的密度， $贝叶斯岭回归pycharm 贝叶斯岭回归先验分布_贝叶斯岭回归pycharm_49$ 称为未知参数， $贝叶斯岭回归pycharm 贝叶斯岭回归先验分布_深度学习_50$ 称为尺度参数，这类分布族称为位置-尺度参数族，如正态分布、指数分布、均匀分布等
当 $贝叶斯岭回归pycharm 贝叶斯岭回归先验分布_直方图_51$ 时称为位置参数族， $贝叶斯岭回归pycharm 贝叶斯岭回归先验分布_人工智能_52$ 时称为尺度参数族
位置参数的无信息先验：
位置参数族的先验分布可用贝叶斯假设为无信息先验分布。
尺度参数的无信息先验：
设总体X的密度函数具有形式：
$贝叶斯岭回归pycharm 贝叶斯岭回归先验分布_贝叶斯岭回归pycharm_53$
则参数 $贝叶斯岭回归pycharm 贝叶斯岭回归先验分布_深度学习_50$ 的无信息先验分布为 $贝叶斯岭回归pycharm 贝叶斯岭回归先验分布_机器学习_55$