机器学习笔记之高斯过程——高斯过程回归[基于函数空间角度的预测任务求解]

  • 引言
  • 回顾:基于函数空间视角的表达
  • 场景构建
  • 权重空间视角(Weight-Space)观察预测任务
  • 从权重空间视角(Weight-Space)到函数空间视角(Function-Space)的过渡
  • 基于函数空间角度的预测任务求解


引言

上一节介绍了高斯过程回归从权重空间(Weight-Space)视角向函数空间(Function-Space)视角的转化过程。本节将介绍基于函数空间视角,对预测任务(Prediction)进行求解。

回顾:基于函数空间视角的表达

场景构建

给定数据集合spss做高斯回归模型 高斯过程回归预测案例_机器学习,其中样本集合spss做高斯回归模型 高斯过程回归预测案例_spss做高斯回归模型_02标签集合spss做高斯回归模型 高斯过程回归预测案例_函数空间视角VS权重空间视角_03表示如下:
spss做高斯回归模型 高斯过程回归预测案例_高斯分布推断_04
具体任务是非线性回归,需要将样本的特征空间由当前的低维空间spss做高斯回归模型 高斯过程回归预测案例_函数空间视角VS权重空间视角_05通过非线性转换转移至高维空间spss做高斯回归模型 高斯过程回归预测案例_函数空间视角VS权重空间视角_06
spss做高斯回归模型 高斯过程回归预测案例_机器学习_07

权重空间视角(Weight-Space)观察预测任务

权重空间视角的本质是模型学习模型参数spss做高斯回归模型 高斯过程回归预测案例_spss做高斯回归模型_08本身,基于spss做高斯回归模型 高斯过程回归预测案例_spss做高斯回归模型_08后验概率分布spss做高斯回归模型 高斯过程回归预测案例_高斯分布推断_10来求解给定未知样本spss做高斯回归模型 高斯过程回归预测案例_高斯分布推断_11预测标签结果spss做高斯回归模型 高斯过程回归预测案例_函数空间视角VS权重空间视角_12
具体推导过程详见贝叶斯线性回归——推断任务推导过程spss做高斯回归模型 高斯过程回归预测案例_spss做高斯回归模型_13

  • 其中spss做高斯回归模型 高斯过程回归预测案例_高斯过程_14表示线性模型spss做高斯回归模型 高斯过程回归预测案例_spss做高斯回归模型_15高斯噪声spss做高斯回归模型 高斯过程回归预测案例_函数空间视角VS权重空间视角_16方差(一维随机变量);
  • spss做高斯回归模型 高斯过程回归预测案例_高斯过程_17表示spss做高斯回归模型 高斯过程回归预测案例_函数空间视角VS权重空间视角_18先验概率分布spss做高斯回归模型 高斯过程回归预测案例_函数空间视角VS权重空间视角_19协方差矩阵

此时,如果针对非线性回归任务,基于spss做高斯回归模型 高斯过程回归预测案例_函数空间视角VS权重空间视角_20,对应的后验概率分布跟着发生变化:
注意的点:先验分布的协方差矩阵spss做高斯回归模型 高斯过程回归预测案例_机器学习_21也跟着变化为spss做高斯回归模型 高斯过程回归预测案例_spss做高斯回归模型_22.
spss做高斯回归模型 高斯过程回归预测案例_spss做高斯回归模型_23
后验概率分布spss做高斯回归模型 高斯过程回归预测案例_高斯分布推断_10求解结束后,对给定未知样本spss做高斯回归模型 高斯过程回归预测案例_高斯分布推断_11进行预测:
该公式相关参考:高斯分布相关定理spss做高斯回归模型 高斯过程回归预测案例_spss做高斯回归模型_26

从权重空间视角(Weight-Space)到函数空间视角(Function-Space)的过渡

首先,引入非线性转换函数spss做高斯回归模型 高斯过程回归预测案例_机器学习_27本身求解是非常复杂的,并且上述公式中的spss做高斯回归模型 高斯过程回归预测案例_机器学习_27均以内积的形式出现。因而尝试找到一款函数,使其 直接表示spss做高斯回归模型 高斯过程回归预测案例_高斯过程_29的内积结果,从而减少大量运算:
spss做高斯回归模型 高斯过程回归预测案例_高斯分布推断_30
并且spss做高斯回归模型 高斯过程回归预测案例_高斯过程_31核函数(Kernal Function)。从函数空间视角观察,可以将核函数表示为如下形式:

spss做高斯回归模型 高斯过程回归预测案例_函数空间视角VS权重空间视角_36
发现,核函数spss做高斯回归模型 高斯过程回归预测案例_高斯过程_31spss做高斯回归模型 高斯过程回归预测案例_高斯分布推断_38协方差结果。因此一个想法是:直接将spss做高斯回归模型 高斯过程回归预测案例_高斯分布推断_39看作随机变量,用spss做高斯回归模型 高斯过程回归预测案例_函数空间视角VS权重空间视角_40来表示后验概率分布和预测分布
spss做高斯回归模型 高斯过程回归预测案例_函数空间视角VS权重空间视角_40并不是一个随机变量,而是基于spss做高斯回归模型 高斯过程回归预测案例_高斯分布推断_42维实数域的随机变量集合
spss做高斯回归模型 高斯过程回归预测案例_spss做高斯回归模型_43
因而基于spss做高斯回归模型 高斯过程回归预测案例_函数空间视角VS权重空间视角_40预测任务表达式如下:
spss做高斯回归模型 高斯过程回归预测案例_spss做高斯回归模型_45

基于函数空间角度的预测任务求解

随机变量集合spss做高斯回归模型 高斯过程回归预测案例_机器学习_46是一个高斯过程,并且它服从高斯分布
spss做高斯回归模型 高斯过程回归预测案例_高斯分布推断_47
其中spss做高斯回归模型 高斯过程回归预测案例_函数空间视角VS权重空间视角_48表示均值函数(Mean-Function),spss做高斯回归模型 高斯过程回归预测案例_函数空间视角VS权重空间视角_49并非表示某一项,而是整个核矩阵(Kernal Matrix):
spss做高斯回归模型 高斯过程回归预测案例_高斯过程_50
因而对应标签向量spss做高斯回归模型 高斯过程回归预测案例_函数空间视角VS权重空间视角_03表示如下:
spss做高斯回归模型 高斯过程回归预测案例_函数空间视角VS权重空间视角_52

此时,已知一个新样本集合spss做高斯回归模型 高斯过程回归预测案例_机器学习_53,那么预测标签spss做高斯回归模型 高斯过程回归预测案例_函数空间视角VS权重空间视角_54。首先,针对标签集合spss做高斯回归模型 高斯过程回归预测案例_函数空间视角VS权重空间视角_03无高斯噪声结果spss做高斯回归模型 高斯过程回归预测案例_机器学习_56联合概率分布spss做高斯回归模型 高斯过程回归预测案例_函数空间视角VS权重空间视角_57表示如下:
spss做高斯回归模型 高斯过程回归预测案例_高斯分布推断_58

此时就变成了已知联合概率分布,求解条件概率分布spss做高斯回归模型 高斯过程回归预测案例_机器学习_59的形式。
这里用到了基于高斯分布的推断任务——已知联合概率分布求解条件概率分布的相关内容,这里就不推导了。

假设条件概率分布高斯分布形式为:spss做高斯回归模型 高斯过程回归预测案例_spss做高斯回归模型_60,那么spss做高斯回归模型 高斯过程回归预测案例_spss做高斯回归模型_61分别表示如下:
spss做高斯回归模型 高斯过程回归预测案例_函数空间视角VS权重空间视角_62

此时spss做高斯回归模型 高斯过程回归预测案例_机器学习_56条件/后验概率分布已经求解,但此时是无高斯噪声状态,需要将高斯噪声加回去。那么关于spss做高斯回归模型 高斯过程回归预测案例_高斯过程_64后验spss做高斯回归模型 高斯过程回归预测案例_函数空间视角VS权重空间视角_65可表示为:
spss做高斯回归模型 高斯过程回归预测案例_spss做高斯回归模型_66

实际上,使用函数空间角度求解预测任务相比于权重空间角度求解要简单一些。由于将随机变量集合设定为高斯过程,自然不会受到spss做高斯回归模型 高斯过程回归预测案例_机器学习_27的影响;并且它不需要求解模型参数spss做高斯回归模型 高斯过程回归预测案例_spss做高斯回归模型_08的后验概率,只需要通过推断预测任务进行处理即可。

至此,高斯过程部分介绍结束,在后续会将高斯过程贝叶斯线性回归相关符号进行检查和修正。