这个学期在学概统,正态分布经常会有一些问题,所以本文就三个方面聊一聊正太分布是个怎么样的分布。

  1. μ和σ²在正态分布中的意义及几何演示
  2. 中心极限定理
  3. 普通正态分布如何化为标准正态分布(手写推导)

μ和σ²在正态分布中的意义及几何演示

μ在正态分布中的意思是该正态分布的期望(均值),σ在正太分布的意思是指该正太分布的方差。

这些是书上最基本的概念,但其实当我们画出图之后我们可以深入地理解这两个参数的几何意义。

java算正态分布的算法_正态分布


上图是我将μ设置为0,σ设置为0.1的情况,我们可以看到此时概率密度函数的对称轴为x=0,最高点则是和σ的取值有关,所以我们通过几何演示可以得到μ是我们的位置参数,σ是我们的尺度参数。

中心极限定理

正态分布有一个非常重要的性质:在特定条件下,大量统计独立的随机变量的平均值的分布趋于正态分布,这就是中心极限定理。中心极限定理的重要意义在于,根据这一定理的结论,其他概率分布可以用正态分布作为近似。

举个例子,比如有一个参数为n和p的二项分布,当n相当大并且p趋于0.5时近似于正态分布。

近似正态分布平均数为μ = np且方差为σ² = np (1 - p)

java算正态分布的算法_java算正态分布的算法_02


可以看到此时二项分布的概率密度已经非常近似于正态分布,并且当我们把这个图像当作正态分布看待时,我们可以看到对称轴也确实在x=50附近,符合μ = np。

普通正态分布如何化为标准正态分布(手写推导)

java算正态分布的算法_正态分布_03


这里的推导我并没有按照教科书上直接找出另外一个变量k(大多数教材上用的是z)和x之间的转化关系。而是我想分享一下为什么可以得到k = (x - μ)/σ 这个式子,首先因为标准正态分布长这个样子

java算正态分布的算法_正态分布_04


所以我们可以看到e的指数上是没有x-μ的,所以我的第一个想法是设出

①x = μ + k

这个式子,这样可以顺利的把μ消掉。而我们把μ消掉之后我们也可以看到分母上还有个σ²,所以我继续改进①式,设出了②式

②x = μ + σk

这样一来,我们就可以顺利解决e上指数的问题,那么同时这个时候我们对x求导时,因为变量变成了k,而k前面有一个σ的系数,正好可以和分母上的系数约分,此时就得到了我们的标准正态分布。