随机变量

随机变量分为离散型随机变量连续型随机变量

离散型随机变量的概率计算公式为概率质量函数(PMF),统计图中的形状为离散概率分布

连续型随机变量的概率计算公式为概率密度函数(PDF),统计图中的形状为连续概率分布

常见的离散概率分布(概率质量函数PMF)有四种:

伯努利分布 二项分布 几何分布 泊松分布

学习步骤

  1. 该分布有什么作用
  2. 如何检验某随机事件是该分布
  3. 如何计算该随机事件发生的概率
  4. 如何使用Python进行实现

一、伯努利分布

在同样的条件下,重复的相互独立的随机事件,其特点是只有两种结果,要么成功,要么失败

使用Python语句求出伯努利分布的概率




python 一列np数组的平均值_二项分布


arange(start_num,stop_num,step) arange语句生成一个等差数组,如arange(0,3,1),0代表开始的数值,3代表结束的数值,1代表步长,所得的数组即为array([0,1,2]),3不在数组中,类似于数学中的[0,3)

使用Python语句绘制概率分布图


python 一列np数组的平均值_正态分布_02


.2f 表示取值两位小数,若该数值不过两位小数,则用0代替

vlines(x坐标,y轴最小值,y值最大值): 绘制竖直线语句

二、二项分布

二项分布即重复N次独立的伯努利分布,二项分布求出的结果即某事件发生x次的概率

求二项分布的概率


python 一列np数组的平均值_正态分布_03


使用Python绘制二项分布的概率分布图


python 一列np数组的平均值_二项分布_04


%i为十进制整数占位符

三、几何分布

几何分布同样以伯努利分布为基础,即在N次伯努利分布试验中,试验k次才第一次获得成功的概率

求几何分布的概率


python 一列np数组的平均值_python 求n个数组的均值_05


使用Python绘制几何分布的概率分布图


python 一列np数组的平均值_python 求n个数组的均值_06


四、泊松分布

泊松分布多应用于单位时间或单位空间内出现的事件个数这种场合,可以看做是二项分布的极限,若n足够大,而p足够小,且np=λ不太大时,X的分布接近于泊松分布

求泊松分布的概率


python 一列np数组的平均值_概率分布_07


使用Python绘制泊松分布的概率分布图


python 一列np数组的平均值_python 求n个数组的均值_08


正态分布

正态分布属于连续型随机变量,若随机变量X服从一个数学期望为μ、方差为σ^2的正态分布,记为N(μ,σ^2)。其概率密度函数为正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。当μ = 0,σ = 1时的正态分布是标准正态分布。

因为是连续性随机变量,求概率函数为概率密度函数(PDF)


python 一列np数组的平均值_二项分布_09


公式总结:

  1. 伯努利分布:stats.bernoulli.pmf(随机变量X,单次概率p)
  2. 二项分布:stats.binom.pmf(随机变量X,做事情的次数n,单次概率p)
  3. 几何分布:stats.geom.pmf(随机变量X,单次概率p)
  4. 泊松分布:stats.poisson.pmf(随机变量X,平均发生次数mu)
  5. 正态分布:stats.norm.pdf(随机变量X,平均值mu,标准差sigma)