统计学的Python实现-008：标准误差

原创

Changxing长行 2022-02-14 16:34:27 博主文章分类：统计学的Python实现 ©著作权

©著作权归作者所有：来自51CTO博客作者Changxing长行的原创作品，请联系作者获取转载授权，否则将追究法律责任

作者：长行
时间：2019.03.09

标准误差：标准误差是用以衡量统计量的可靠性的统计量；统计量（通常是参数的估计）的标准误差（stand error，SE）是其抽样分布的标准差或该标准差的估计值；如果它衡量的统计量为均值，则该标准误差称为均值的标准误差（standard error of the mean，SEM）。

统计学解释

总体均值的标准误差的计算公式：

KaTeX parse error: Got function '\overline' with no arguments as subscript at position 13: SEM=\sigma_\̲o̲v̲e̲r̲l̲i̲n̲e̲{x}=\frac{\sigm…

其中 σ \sigma σ为总体标准差， n n n为样本量

但是因为在实际测测量中总体标准差很难获得，所以在实际操作中，我们通常用样本标准差代替总体标准差来估计总体均值的标准误差。于是又总体均值的标准误差的估计公式：

KaTeX parse error: Got function '\overline' with no arguments as subscript at position 13: SEM=\sigma_\̲o̲v̲e̲r̲l̲i̲n̲e̲{X}\approx\frac…

其中 S S S为样本标准差， n n n为样本量

样本均值的标准误差的计算公式：

KaTeX parse error: Got function '\overline' with no arguments as subscript at position 4: S_\̲o̲v̲e̲r̲l̲i̲n̲e̲{X}=\frac{S}{\s…

其中 S S S为样本标准差， n n n为样本量

我们也可以尝试从另外一个角度来理解均值的标准误差。当我们在一组数据中随机抽取一个数作为样本的时候，样本均值的离散程度服从总体的标准差；但是当我们从这一组数据中抽取多个数作为样本的时候，样本均值的离散程度就会小于总体的标准差，而均值的标准误差就是衡量这组样本均值此时标准差的统计量。

import numpy
import math
data_test=[1,1,2,2,3,4,4,5,5]
SD_P=numpy.std(data_test,ddof=0)
n=len(data_test)
print(SD_P/math.sqrt(n))

结果

0.49690399499995325

import numpy
import math
data_test=[1,1,2,2,3,4,4,5,5]
SD_S=numpy.std(data_test,ddof=1)
n=len(data_test)
print(SD_S/math.sqrt(n))

结果

0.5270462766947299

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯