它的历史不知道,如何推导出来的,没管啊,不过我很有兴趣看看啊,但没有看。高斯函数的用处太多了;

首先说明一点哦:正态分布是高斯函数的积分为1的情况;

 

一维情况下:

一维高斯高斯函数的公式:

一维高斯核 平滑python 一维高斯函数_一维高斯核 平滑python

而正态分布的公式表示为:

一维高斯核 平滑python 一维高斯函数_一维高斯核 平滑python_02

它们的区别仅仅在于前面的系数不一样;正态分布之所以需要这样的系数是为了在区间

一维高斯核 平滑python 一维高斯函数_正态分布_03

的积分为1;由此也可以看出:

一维高斯核 平滑python 一维高斯函数_一维高斯核 平滑python_04

的在区间

一维高斯核 平滑python 一维高斯函数_一维高斯核 平滑python_05

的积分为

一维高斯核 平滑python 一维高斯函数_概率密度_06

所以呢,高斯函数的关键就是那个指数函数形式;

另外:一维高斯核 平滑python 一维高斯函数_维基百科_07指明了锋值的位置;一维高斯核 平滑python 一维高斯函数_正态分布_08控制着曲线的形状,一维高斯核 平滑python 一维高斯函数_维基百科_09越小,曲线越陡峭;

 

注意1:在正态分布中,经常用于标准的正态分布;即服从N(0,1)的正态分布;对于通用的形式:

一维高斯核 平滑python 一维高斯函数_概率密度_10

,当

一维高斯核 平滑python 一维高斯函数_概率密度_11

时,可以转化为标准的正态分布;

怎么出来的,这个问题我想了好久,最后我想出了这样的解释(单纯自己想的):

一维高斯核 平滑python 一维高斯函数_正态分布_12

(道理:如果想要知道一个变量服从什么样的分布,应该做的就是计算对什么样的式子以该变量为积分的积分结果为1;

 

注意2:如果两个变量服从正态分布,则(这是有维基百科证明):两个 变量独立情况下:

一维高斯核 平滑python 一维高斯函数_概率密度_13

;            两个变量相关时:

一维高斯核 平滑python 一维高斯函数_概率密度_14

,其中一维高斯核 平滑python 一维高斯函数_一维高斯核 平滑python_15为相关系数;

(它们绝对不是把概率密度单纯的相加,谁这么认为谁是SB)

证明的话,其实可以用卷积或积分来证明的;

 

多元高斯分布:

多元的高斯分布中用到了马氏距离来测量样本偏移中心点的程度;

马氏距离的推导:

 

多元高斯函数的公式:

一维高斯核 平滑python 一维高斯函数_正态分布_16

,其中用到了协方差矩阵的逆;

 

多元正态分布公式:

一维高斯核 平滑python 一维高斯函数_一维高斯核 平滑python_17

 

上面式子中:

一维高斯核 平滑python 一维高斯函数_维基百科_18

的开根号为马氏距离;具体吧,需要时间研究啊;