随机变量
随机变量分为离散型随机变量与连续型随机变量
离散型随机变量的概率计算公式为概率质量函数(PMF),统计图中的形状为离散概率分布
连续型随机变量的概率计算公式为概率密度函数(PDF),统计图中的形状为连续概率分布
常见的离散概率分布(概率质量函数PMF)有四种:
伯努利分布 二项分布 几何分布 泊松分布
学习步骤
- 该分布有什么作用
- 如何检验某随机事件是该分布
- 如何计算该随机事件发生的概率
- 如何使用Python进行实现
一、伯努利分布
在同样的条件下,重复的相互独立的随机事件,其特点是只有两种结果,要么成功,要么失败
使用Python语句求出伯努利分布的概率
arange(start_num,stop_num,step) arange语句生成一个等差数组,如arange(0,3,1),0代表开始的数值,3代表结束的数值,1代表步长,所得的数组即为array([0,1,2]),3不在数组中,类似于数学中的[0,3)
使用Python语句绘制概率分布图
.2f 表示取值两位小数,若该数值不过两位小数,则用0代替
vlines(x坐标,y轴最小值,y值最大值): 绘制竖直线语句
二、二项分布
二项分布即重复N次独立的伯努利分布,二项分布求出的结果即某事件发生x次的概率
求二项分布的概率
使用Python绘制二项分布的概率分布图
%i为十进制整数占位符
三、几何分布
几何分布同样以伯努利分布为基础,即在N次伯努利分布试验中,试验k次才第一次获得成功的概率
求几何分布的概率
使用Python绘制几何分布的概率分布图
四、泊松分布
泊松分布多应用于单位时间或单位空间内出现的事件个数这种场合,可以看做是二项分布的极限,若n足够大,而p足够小,且np=λ不太大时,X的分布接近于泊松分布
求泊松分布的概率
使用Python绘制泊松分布的概率分布图
正态分布
正态分布属于连续型随机变量,若随机变量X服从一个数学期望为μ、方差为σ^2的正态分布,记为N(μ,σ^2)。其概率密度函数为正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。当μ = 0,σ = 1时的正态分布是标准正态分布。
因为是连续性随机变量,求概率函数为概率密度函数(PDF)
公式总结:
- 伯努利分布:stats.bernoulli.pmf(随机变量X,单次概率p)
- 二项分布:stats.binom.pmf(随机变量X,做事情的次数n,单次概率p)
- 几何分布:stats.geom.pmf(随机变量X,单次概率p)
- 泊松分布:stats.poisson.pmf(随机变量X,平均发生次数mu)
- 正态分布:stats.norm.pdf(随机变量X,平均值mu,标准差sigma)