正态分布(Normal distribution)
正态分布(Normal distribution),又名高斯分布(Gaussian distribution),正态曲线呈钟型,两头低,中间高,左右对称,中央部位的概率密度最大。越偏离均值,其概率密度减小。
若随机变量X服从一个数学期望为μ、方差为σ2的正态分布,记为N(μ,σ2)。其概率密度函数为正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。当μ = 0,σ = 1时的正态分布是标准正态分布。
概率密度函数f(x):通过它可以求出一个数据范围内的某个连续变量的概率,可以指出该概率分布的形状。
概率密度:通过面积指出各种范围内的概率大小,通过概率密度函数进行描述。
求解正态分布概率步骤:
(1)确定分布和范围,即算出均值和标准差;
(2)将分布标准化,求出标准分;
Python 实践正态分布的代码:
def Norm(mu,sigma):
"""
mu:正态分布的均值
sigma:标准差
"""
import numpy as np
import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif'] = ['SimHei'] #正常显示中文
plt.rcParams['axes.unicode_minus'] = False #正常显示负号
#正态分布的概率密度函数。可以理解成 x 是 mu(均值)和 sigma(标准差)的函数
def Norm_PDF(x,mu,sigma):
pdf = np.exp(-((x - mu)**2)/(2*sigma**2)) / (sigma * np.sqrt(2*np.pi))
return pdf
X = np.arange(mu - sigma * 5,mu + sigma * 5, 0.1) #模拟的是5sigma 原则
y = Norm_PDF(X,mu,sigma)
plt.plot(X5,y)
plt.xlabel('随机变量:x')
plt.ylabel('概率:y')
plt.title('正态分布:mu=%.1f,sigma=%.1f' % (mu5,sigma))
plt.grid()
plt.show()
泊松分布
一个服从泊松分布的随机变量X,表示在具有比率参数(rate parameter)λ的一段固定时间间隔内,事件发生的次数。参数λ告诉你该事件发生的比率。随机变量X的平均值和方差都是λ。
E(X) = λ, Var(X) = λ
泊松分布的例子:已知某路口发生事故的比率是每天2次,那么在此处一天内发生4次事故的概率是多少?
具体的代码实现可以参考:
参考文献
贾俊平 中国人民大学出版社 统计学第七版
百度百科