机器学习笔记之高斯过程——基本介绍

  • 引言
  • 高斯过程简单介绍
  • 高斯过程的参数描述


引言

从本节开始,将介绍高斯过程

高斯过程简单介绍

高斯过程(Gaussian Process),从名字中很明显,它是一种和高斯分布相关的随机过程(Stochastic Process)。
一维高斯分布开始,此时只有一个一维随机变量python 高斯分布求概率 高斯分布计算_高斯过程,它服从的高斯分布可表示为:
python 高斯分布求概率 高斯分布计算_高斯过程_02
如果样本并不是一个特征,而是多个特征,并且这些特征均服从高斯分布。假设对应的随机变量集合python 高斯分布求概率 高斯分布计算_高斯过程_03,那么python 高斯分布求概率 高斯分布计算_高斯过程_04服从的是一个多元高斯分布
python 高斯分布求概率 高斯分布计算_随机过程_05
在高斯网络基本介绍中,这个多元高斯分布描述了python 高斯分布求概率 高斯分布计算_高斯过程_04内部各随机变量之间的条件独立性,并且这些条件独立性信息由精度矩阵(Precision Matrix)记录。
很明显,这是一个静态概率图模型,高斯网络中的节点数量与python 高斯分布求概率 高斯分布计算_高斯过程_04中随机变量的数量相关

高斯过程可以理解为联合正态分布的无限维广义延伸。但这里的无限维是指从时间、空间等连续域中产生的维度。以时间为例,一段连续时间内,可能包含若干个状态,而每个状态的随机变量均服从高斯分布。并且每个状态的随机变量不一定是一维的,也可能是高维的

因此,可以将高斯过程其理解为:在连续域上的无限多个高维随机变量组成的随机过程。和之前介绍的马尔可夫链相似,这里的连续域通常指时间、空间,或者是指抽象的时间,例如序列。

对场景进行如下构建:

  • 假设时间python 高斯分布求概率 高斯分布计算_多元高斯分布_08表示某个连续域,而python 高斯分布求概率 高斯分布计算_随机过程_09表示连续域python 高斯分布求概率 高斯分布计算_多元高斯分布_08中的某个时刻。
    python 高斯分布求概率 高斯分布计算_随机过程_09是对连续域python 高斯分布求概率 高斯分布计算_多元高斯分布_08宏观时刻的一种表示。
  • 这个连续域python 高斯分布求概率 高斯分布计算_多元高斯分布_08中可能包含很多时刻,用python 高斯分布求概率 高斯分布计算_高斯过程_14表示不同时刻。
  • 每个时刻python 高斯分布求概率 高斯分布计算_高斯过程_15对应一个随机变量,这个随机变量有可能是一维的,有可能是高维的。记作python 高斯分布求概率 高斯分布计算_高斯过程_16

连续域python 高斯分布求概率 高斯分布计算_高斯过程_17随机变量集合表示为python 高斯分布求概率 高斯分布计算_多元高斯分布_18高斯过程可定义为:
如果python 高斯分布求概率 高斯分布计算_高斯过程_19,满足随机变量集合python 高斯分布求概率 高斯分布计算_随机过程_20,那么称python 高斯分布求概率 高斯分布计算_随机过程_21是一个高斯过程

高斯过程的参数描述

已知高斯过程python 高斯分布求概率 高斯分布计算_基本介绍_22,其中python 高斯分布求概率 高斯分布计算_高斯过程_17表示某连续域python 高斯分布求概率 高斯分布计算_python 高斯分布求概率_24表示连续域中的时刻。假设python 高斯分布求概率 高斯分布计算_python 高斯分布求概率_24时刻的随机变量python 高斯分布求概率 高斯分布计算_多元高斯分布_26,那么python 高斯分布求概率 高斯分布计算_多元高斯分布_26表示(Representation)如下:
python 高斯分布求概率 高斯分布计算_基本介绍_28
假设这个连续域python 高斯分布求概率 高斯分布计算_高斯过程_17中包含python 高斯分布求概率 高斯分布计算_python 高斯分布求概率_30个时刻:python 高斯分布求概率 高斯分布计算_多元高斯分布_31,因而我们会得到python 高斯分布求概率 高斯分布计算_python 高斯分布求概率_30个随机变量:
python 高斯分布求概率 高斯分布计算_多元高斯分布_33
继续假设,每一时刻的期望结果python 高斯分布求概率 高斯分布计算_高斯过程_34方差结果python 高斯分布求概率 高斯分布计算_随机过程_35均是给定的。此时对python 高斯分布求概率 高斯分布计算_高斯过程_36时刻的高斯分布进行随机采样,采到的结果记作python 高斯分布求概率 高斯分布计算_python 高斯分布求概率_37
需要注意的是,这个采样采的不是‘概率密度函数的概率结果’,而是概率密度函数对应特征描述的结果。python 高斯分布求概率 高斯分布计算_高斯过程_38
同理,其他时刻同样进行随机采样,并构成一个样本集合
python 高斯分布求概率 高斯分布计算_多元高斯分布_39
将这个有序的样本集合在以连续域、特征描述结果所构成的的空间中手尾相连,得到一条曲线;而这条曲线就是高斯过程的一个样本
这里需要解释一下:由于python 高斯分布求概率 高斯分布计算_高斯过程_17是连续的,真实条件下可能存在无穷多个时刻。因此这个样本序列必然不可能是对所有时刻进行采样。仅通过‘实际问题’中重要的时刻进行采样。

至此,根据上述定义,高斯过程python 高斯分布求概率 高斯分布计算_基本介绍_22中不仅每个时刻python 高斯分布求概率 高斯分布计算_多元高斯分布_42的随机变量python 高斯分布求概率 高斯分布计算_高斯过程_43服从高斯分布,并且python 高斯分布求概率 高斯分布计算_高斯过程_17中任意连续时刻python 高斯分布求概率 高斯分布计算_python 高斯分布求概率_45同样服从多元高斯分布

因此,一个高斯过程具体由两个函数决定:

  • 均值函数(Mean Function):具体表示为 某时刻随机变量的期望结果
    python 高斯分布求概率 高斯分布计算_高斯过程_46
  • 协方差函数(Covariance Function),也称作核函数(Kernal Function):具体表示为 两时刻随机变量的协方差信息(协方差标准定义)
    python 高斯分布求概率 高斯分布计算_python 高斯分布求概率_47