正态分布被命名为高斯分布,我们也容易认为是高斯发现了正态分布,其实不然,高斯分布最早由棣莫弗在1718年著作的书籍(Doctrine of Change),及1734年发表的一篇关于二项分布文章中提出的,不过高斯对于正态分布历史地位的确立起到了决定性的作用。本篇主要介绍一维高斯分布参数的极大似然估计如何计算。
一维高斯分布
对于一元实值变量,高斯分布被定义为
给定一个数据集,表示变量的次观测,这里假定每个观测值是独立地从高斯分布中抽取的,分布的均值 和方差未知。
因此数据的联合概率为
这里我们使用极大似然估计来估计高斯分布的参数。对数似然函数为
将高斯分布的分布函数代入得对数似然函数
对似然函数求偏导得
由第一式得出的解为
以此代入第二式,得到的解为
分别对和求期望
我们可以看到是的无偏估计,而则是有偏的,经过修正得无偏估计
那么为什么一个有偏一个无偏呢?
我们注意到是关于样本均值的样本方差。这是因为我们要同时关于和最大化函数,但是在高斯分布的情况下,的解和的无关(直接得到了的解),因此我们先估计公式,然后使用这个结果来估计公式,感觉是在这个过程中的估计便产生了偏移。如图
当样本数量增大时,最大似然解的偏移会逐渐变小,当时,
参考:
陈希孺:概率论与数理统计
模式识别与机器学习(PRML)
维基百科