上一篇讲了三个典型的离散分布(离散分布概率:几何分布、二项分布和泊松分布),这篇开始进入连续型概率分布,最常用的“正态分布”。
1. 连续型概率分布和离散型概率分布
离散型概率分布:几何分布、二项分布、泊松分布都是离散型概率分布,一般是求事件出现次数的概率,次数是整数,其取值不是连续的。
连续性概率分布:但生活中,还有一类事件,如每个人的身高,其值是连续的,描述这种事件的概率分布就是连续性概率分布,正态分布是最基本是连续型概率分布。
2. 概率密度函数用于描述连续型概率分布
和离散型概率分布不同,连续型概率分布很难说一个确切值的概率(实际上=0),往往是求某一个数值范围的概率,概率值就是概率密度函数在某个数值范围内下方的面积。
概率密度函数下方的总面积必须等于1.
3. 正态分布是连续数据的“理想”模型
正态英文为Normal,就是常见的、典型的意思,在现实生活中,测量值之类的大量连续数据,会期望看到这种形状。
正态分布具有钟形曲线,中间概率密度大,两边概率密度小。形状通过参数μ和σ确定。一个连续随机变量符合均值为μ,标准差为σ的正态分布,记作: X~N(μ,σ^2),
性质如下:
4. 正态分布概率计算三部法
1)确定分布与范围:如果遇到的问题适用于正态分布,则看看能否求出均值和标准差,只有先得知这些信息,才能求出概率,还需要弄清楚要求的是哪一部分的面积。
2)使用标准分算法,Z=(X-μ)/σ将欲求的概率分布范围转化为标准正态分布N~(0,1)范围
3)一旦转化为标准正态分布,就可以利用概率表查找概率
问题举例:
已知男生身高X符合正态分布N(71,20.25), 求男生身高大于64英寸的概率。
1)对正态分布X~N(71,20.25),求P(X>64)
2) 转化为标准分
Z=(X-μ)/σ=(64-71)/20.25^0.5=-1.56, P(X>64)=P(Z>-1.56)
3) 查概率表,可得P(Z<-1.56)=0.0594
则P(X>64)=P(Z>-1.56)=1-P(Z<-1.56)=1-0.0594=0.9406
5. P(Z>a)和P(a<Z<b)概率求解
标准正态分布概率表能查的是P(Z<a)的概率值,如果要求P(Z>a)或者P(a<Z<b),则可以利用以下办法:
P(Z>a)=1-P(Z<a)
P(a<Z<b)=P(Z<b)-P(Z<a)