R语言正态分布 R语言正态分布抽样

转载

小鱼儿 2023-06-21 20:32:14

文章标签 R语言正态分布概率密度 hapi 标准差 文章分类 R语言后端开发

什么是正太分布检验？
判断一样本所代表的背景总体与理论正态分布是否没有显著差异的检验。

方法一 概率密度曲线比较法
看样本与正太分布概率密度曲线的拟合程度，R代码如下：

norm_expression <- function(x) (1/sqrt(2*pi))*exp(-0.5*x^2)
#curve(norm_expression, -4, 4, col="red") #标准正太分布概率密度曲线

#画样本概率密度图
s <- rnorm(100) #产生样本
d <- density(s)
plot(d, col="green", ylim=c(0, 0.5))

#添加正太分布概率密度图
s2 <- seq(from=-4, to=4, length.out=100)
lines(s2, norm_expression(s2), col="red")

画图结果如下：

R语言正态分布 R语言正态分布抽样_概率密度

方法二 正太Q-Q图法

使用Q-Q图来判断数据是否服从正太分布，R代码如下：

s <- rnorm(100) #产生样本
qqnorm(s)
qqline(s)

画图结果如下，可见数据分布集中在对角线上，可以认为总体服从正太分布：

R语言正态分布 R语言正态分布抽样_hapi_02

方法三经验法则

约68.3%数值分布在距离平均值有1个标准差之内的范围，约95.4%数值分布在距离平均值有2个标准差之内的范围，以及约99.7%数值分布在距离平均值有3个标准差之内的范围。称为“68-95-99.7法则”或“经验法则”。

使用R的验证代码如下：

s <- rnorm(10000) #产生样本
sum(abs(s - mean(s)) < sd(s)) / length(s)
sum(abs(s - mean(s)) < 2*sd(s)) / length(s)

程序结果：

> s <- rnorm(10000) #产生样本
 > sum(abs(s - mean(s)) < sd(s)) / length(s)
 [1] 0.6871
 > sum(abs(s - mean(s)) < 2*sd(s)) / length(s)
 [1] 0.9538

方法四 统计检验方法

使用样本偏度和样本峰度来估计总体偏度和峰度，在正太分布的假定下，样本偏度和峰度均服从均值为零、方差分别为6/T和24/T的正太分布，可以分别检验偏度和峰度，也可以将两个统计量结合起来生成一个服从自由度为2的卡方分布的统计量，再进行检验【参见《金融时间序列分析》第三版P8~P9】。理论方面的东西略...

可以使用夏皮罗-威尔克（Shapiro-Wilk）检验，代码如下：

s <- rnorm(1000) #产生样本
shapiro.test(s)

检验结果:

> shapiro.test(s)


         Shapiro-Wilk normality test


 data:  s
 W = 0.9987, p-value = 0.6716

shapiro.test函数输出一个p值，照惯例，p<0.05说明总体不太可能是正太分布，否则不能提供这么个证据，也就是说这个检验比较保守，倾向于错误的过分证明正态性。

R的nortest包能提供其他正太检验方法【参见《R语言经典实例》P221】。

方法五经验法

见智库百科，使用R实现一遍感觉有误，仅作参考。

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

上一篇：Excel是不是用Java写的 excel和java

下一篇：java rsa cpu过高 rsa java实现

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

R语言 正态分布 R语言正态分布抽样

R语言 正态分布 R语言正态分布抽样

51CTO博客

R语言正态分布 R语言正态分布抽样

R语言正态分布 R语言正态分布抽样