作者:长行

时间:2019.03.09


标准误差:标准误差是用以衡量统计量的可靠性的统计量;统计量(通常是参数的估计)的标准误差(stand error,SE)是其抽样分布的标准差或该标准差的估计值;如果它衡量的统计量为均值,则该标准误差称为均值的标准误差(standard error of the mean,SEM)。

统计学解释

总体均值的标准误差的计算公式:

KaTeX parse error: Got function '\overline' with no arguments as subscript at position 13: SEM=\sigma_\̲o̲v̲e̲r̲l̲i̲n̲e̲{x}=\frac{\sigm…

其中 σ \sigma σ为总体标准差, n n n为样本量

但是因为在实际测测量中总体标准差很难获得,所以在实际操作中,我们通常用样本标准差代替总体标准差来估计总体均值的标准误差。于是又总体均值的标准误差的估计公式:

KaTeX parse error: Got function '\overline' with no arguments as subscript at position 13: SEM=\sigma_\̲o̲v̲e̲r̲l̲i̲n̲e̲{X}\approx\frac…

其中 S S S为样本标准差, n n n为样本量

样本均值的标准误差的计算公式:

KaTeX parse error: Got function '\overline' with no arguments as subscript at position 4: S_\̲o̲v̲e̲r̲l̲i̲n̲e̲{X}=\frac{S}{\s…

其中 S S S为样本标准差, n n n为样本量

我们也可以尝试从另外一个角度来理解均值的标准误差。当我们在一组数据中随机抽取一个数作为样本的时候,样本均值的离散程度服从总体的标准差;但是当我们从这一组数据中抽取多个数作为样本的时候,样本均值的离散程度就会小于总体的标准差,而均值的标准误差就是衡量这组样本均值此时标准差的统计量。

实现代码

计算总体均值的标准误差

import numpy
import math
data_test=[1,1,2,2,3,4,4,5,5]
SD_P=numpy.std(data_test,ddof=0)
n=len(data_test)
print(SD_P/math.sqrt(n))

结果

0.49690399499995325

估计总体均值的标准误差 + 计算样本均值的标准误差

import numpy
import math
data_test=[1,1,2,2,3,4,4,5,5]
SD_S=numpy.std(data_test,ddof=1)
n=len(data_test)
print(SD_S/math.sqrt(n))

结果

0.5270462766947299