正态分布的由来及推导
- 一、正态分布
- 二、二项分布的近似计算
- 三、De Moivre-Laplace中心极限定理
- 四、最小二乘法与正态分布
- 五、基于独立性和旋转对称性的推导
- 六、Lindeberg-Lévy中心极限定理
- 七、正态分布的相关定理和性质
一、正态分布
正态分布是一个在数学、物理学、天文学、社会统计学、生物学、工程实践中都有很广泛应用的概率分布。一些概率分布的极限分布为正态分布,许多误差的分布服从正态分布,许多随机变量的叠加也服从正态分布。正态分布有着相当好的稳定性,只要数据中正态分布的形式已经形成,累加其他小的扰动,均比较容易继续保持正态分布。正态分布具有十分优美的性质和公式,总是在生活中或理论中自然而然地出现。
下面给出正态分布的密度函数,并且推导出正态分布矩母函数、特征函数、期望及方差:
二、二项分布的近似计算
独立的重复n次的伯努利实验,每次实验只有成功和失败两种结果,每次实验成功的概率为p,n次实验的成功总次数称为二项分布B(n,p)。二项分布在应用数学中有极其重要的作用
根据组合数学的知识,可以得出二项分布的概率分布
由于二项式系数的计算比较复杂,在n很大的时候采用这个公式计算比较繁琐,而求解则更为麻烦,数学家们考虑如何近似计算这个概率。
运用斯特林公式
可以简化单个B(n,p;i)二项式系数的近似计算,但是多个B(n,p;i)的计算还是需要更有效的近似计算方法
不妨设n为偶数,令n=2m,在n趋于无穷大的情况下,考虑如何计算
三、De Moivre-Laplace中心极限定理
四、最小二乘法与正态分布
日常生活中经常会遇到曲线拟合问题,也就是给定若干组观测数据,需要找到一个函数,对这些观测数据进行拟合。
为了比较拟合方法的优劣,我们需要找到一种方法度量拟合的优良性。
有如下几种度量方法:
第一种度量方法有比较复杂的逻辑比较关系,不能用普通的初等分析方法来分析,而且误差分析结果会完全被误差最大的点主导
第二种度量方法依然含有绝对值函数,绝对值函数是不可导的,需要很多种分类讨论的情况
第三种度量方法是初等函数,可以用求导等方法来分析。在各组数据误差间建立了平衡,能充分地考虑所有数据的信息。
第三种方法就是最小二乘法,在曲线拟合优良性评估中有广泛应用。
最小二乘法可以导出测量值的最优估计值是算术平均值。
算术平均值非常优美简洁,等权重地考虑了所有独立重复测量值的情况。而高斯在研究误差分布函数时,假定误差分布导出的极大似然估计=算数平均值,然后作出了如下推导
五、基于独立性和旋转对称性的推导
天文学家John Hershcel和物理学家麦克斯韦(Maxwell)考虑二维的误差分布时,考虑了两个准则:
六、Lindeberg-Lévy中心极限定理
这个定理揭示出了正态分布超乎寻常的稳定性,任意同分布随机变量求和之后极限分布就是正态分布。
七、正态分布的相关定理和性质