机器学习笔记之高斯过程——高斯过程回归[基于函数空间角度的预测任务求解]
- 引言
- 回顾:基于函数空间视角的表达
- 场景构建
- 权重空间视角(Weight-Space)观察预测任务
- 从权重空间视角(Weight-Space)到函数空间视角(Function-Space)的过渡
- 基于函数空间角度的预测任务求解
引言
上一节介绍了高斯过程回归从权重空间(Weight-Space)视角向函数空间(Function-Space)视角的转化过程。本节将介绍基于函数空间视角,对预测任务(Prediction)进行求解。
回顾:基于函数空间视角的表达
场景构建
给定数据集合,其中样本集合,标签集合表示如下:
具体任务是非线性回归,需要将样本的特征空间由当前的低维空间通过非线性转换转移至高维空间:
权重空间视角(Weight-Space)观察预测任务
权重空间视角的本质是模型学习模型参数本身,基于的后验概率分布来求解给定未知样本的预测标签结果:具体推导过程详见
贝叶斯线性回归——推断任务推导过程
- 其中表示线性模型中高斯噪声的方差(一维随机变量);
- 表示的先验概率分布的协方差矩阵。
此时,如果针对非线性回归任务,基于,对应的后验概率分布跟着发生变化:注意的点:先验分布的协方差矩阵
也跟着变化为
.
当后验概率分布求解结束后,对给定未知样本进行预测:该公式相关参考:
高斯分布相关定理
从权重空间视角(Weight-Space)到函数空间视角(Function-Space)的过渡
首先,引入非线性转换函数本身求解是非常复杂的,并且上述公式中的均以内积的形式出现。因而尝试找到一款函数,使其 直接表示的内积结果,从而减少大量运算:
并且是核函数(Kernal Function)。从函数空间视角观察,可以将核函数表示为如下形式:
-
关于
是核函数的充分性证明见
高斯过程回归——权重空间角度、必要性证明见
高斯过程回归——函数空间角度 是因为
,因而
发现,核函数是的协方差结果。因此一个想法是:直接将看作随机变量,用来表示后验概率分布和预测分布。
但并不是一个随机变量,而是基于维实数域的随机变量集合:
因而基于的预测任务表达式如下:
基于函数空间角度的预测任务求解
随机变量集合是一个高斯过程,并且它服从高斯分布:
其中表示均值函数(Mean-Function),并非表示某一项,而是整个核矩阵(Kernal Matrix):
因而对应标签向量表示如下:
此时,已知一个新样本集合,那么预测标签。首先,针对标签集合与无高斯噪声结果的联合概率分布表示如下:
此时就变成了已知联合概率分布,求解条件概率分布的形式。这里用到了
基于高斯分布的推断任务——已知联合概率分布求解条件概率分布的相关内容,这里就不推导了。
假设条件概率分布的高斯分布形式为:,那么分别表示如下:
此时的条件/后验概率分布已经求解,但此时是无高斯噪声状态,需要将高斯噪声加回去。那么关于的后验可表示为:
实际上,使用函数空间角度求解预测任务相比于权重空间角度求解要简单一些。由于将随机变量集合设定为高斯过程,自然不会受到的影响;并且它不需要求解模型参数的后验概率,只需要通过推断对预测任务进行处理即可。
至此,高斯过程部分介绍结束,在后续会将高斯过程与贝叶斯线性回归相关符号进行检查和修正。