假设检验
- 总体均值的检验
- 一个总体
均值
的检验 - 大样本的检验
z.test(table$PM2.5.,mu=81,sigma.x = sd(table$PM2.5.),alternative = "less",conf.level = 0.95)
- 小样本的检验
t.test(table$厚度,mu=5)
- 检验效应量
library(lsr)
cohensD(table$厚度,mu=5)
- 两个总体均值之差的检验
- 独立大样本
library(BSDA)
z.test(table$男生上网时间,table$女生上网时间,sigma.x = sd(table$男生上网时间),sigma.y = sd(table$女生上网时间),alternative = "two.sided")
- 独立小样本
#假设方差相等
t.test(table$甲企业,table$乙企业,var.equal = TRUE)
#假设方差不相等
t.test(table$甲企业,table$乙企业,var.equal = FALSE)
- 检验效应量
library(lsr)
cohensD(table$甲企业,table$乙企业)
- 配对的检验
t.test(table$旧款,table$新款,paired = TRUE)
- 总体
比例
的检验 - 一个总体比例的检验
> n<-2000
> p<-450/2000
> pi0<-0.25
> z<-(p-pi0)/sqrt(pi0*(1-pi0)/n)
> p_value<-1-pnorm(z)
> data.frame(z,p_value)
- 两个总体比例之差的检验
> n1<-200
> n2<-200
> p1<-0.27
> p2<-0.35
> p<-(p1*n1+p2*n2)/(n1+n2)
> z<-(p1-p2)/sqrt(p*(1-p)*(1/n1+1/n2))
> p_value<-pnorm(z)
> data.frame(z,p_value)
- 总体
方差
的检验 - 一个总体方差的检验
library(TeachingDemos)
sigma.test(table$填装量,sigmasq = 16,alternative = "greater")
- 两个总体方差比的检验
table<-read.csv("/Users/zhourui/Documents/example6_6.csv")
var.test(table[,1],table[,2])
- 检验效应量
library(lsr)
cohensD(table$旧款,table$新款,method = "paired")
- 非参数检验
- 正态性检验的图示法 (QQ图)
qqnorm(table$绝对误差,xlab="lilunfenweishu",ylab = "yangbenfenweishu")
qqline(table$绝对误差,col="lightblue",lwd=2)
- Shapiro-Wilk正态性检验
shapiro.test(table$厚度)
- K-S检验
ks.test(table$厚度,"pnorm",mean(table$厚度),sd(table$厚度))
- 总体比例的检验
- 一个总体比例的检验
> n<-2000
> p<-450/2000
> pi0<-0.25
> z<-(p-pi0)/sqrt(pi0*(1-pi0)/n)
> p_value<-1-pnorm(z)
> data.frame(z,p_value)
- 两个总体比例之差的检验
> n1<-200
> n2<-200
> p1<-0.27
> p2<-0.35
> p<-(p1*n1+p2*n2)/(n1+n2)
> z<-(p1-p2)/sqrt(p*(1-p)*(1/n1+1/n2))
> p_value<-pnorm(z)
> data.frame(z,p_value)
- 总体方差的检验
- 一个总体方差的检验
library(TeachingDemos)
sigma.test(table$填装量,sigmasq = 16,alternative = "greater")
- 两个总体方差比的检验
table<-read.csv("/Users/zhourui/Documents/example6_6.csv")
var.test(table[,1],table[,2])
文章目录
- 假设检验
- 一、假设检验的原理
- 1.1 提出假设
- 1.2做出决策
- 两类错误于显著性水平
- 决策的依据
- 效应量
- 二、总体均值的检验
- 2.1一个总体均值的检验
- 大样本的检验
- 小样本的检验
- 2.2两个总体均值之差的检验
- 独立大样本
- 独立小样本
- 2.3 配对的检验
- 三、总体比例的检验
- 3.1 一个总体比例的检验
- 3.2 两个总体比例之差的检验
- 四、总体方差的检验
- 4.1 一个总体方差的检验
- 4.2 两个总体方差比的检验
- 五、非参数检验
- 5.1 总体分布的检验
- 正态性检验的图示法 (QQ图)
- 5.2 Shapiro-Wilk正态性检验
- 5.3 K-S检验
一、假设检验的原理
参数检验:总体分布特征为正态分布
非参数检验:不依赖于总体分布特征
1.1 提出假设
假设:对总体的某种看法
假设检验H0:利用样本信息判断假设是否成立的统计方法(=)
原假设H1:希望推翻的假设
针对视角不同,会产生不同结果
备择假设:希望予以支持的假设
双侧检验、双尾检验:备择假设中含有不等号
左侧检验:备择假设中含有小于号
右侧检验:备择假设中含有小大号
1.2做出决策
两类错误于显著性水平
第一类错误α:原假设是正确的却拒绝了它
第二类错误β:原假设是错误的却没有拒绝它
减小α就会增大β
显著性水平:犯第一类错误的概率(第一类错误可控)
决策的依据
P值:犯第一类错误的概率
拒绝H0时,表示有足够的证据证明H0是错误的
不拒绝H0时,表示没有足够的证据证明H0是错误的
效应量
效应量:度量差异大小的统计量,描述了差异程度是大、中、小
二、总体均值的检验
2.1一个总体均值的检验
大样本的检验
> z.test(table$PM2.5.,mu=81,sigma.x = sd(table$PM2.5.),alternative = "less",conf.level = 0.95)
One-sample z-Test
data: table$PM2.5.
z = -1.1856, p-value = 0.1179
alternative hypothesis: true mean is less than 81
95 percent confidence interval:
NA 81.56174
sample estimates:
mean of x
79.55
小样本的检验
> t.test(table$厚度,mu=5)
One Sample t-test
data: table$厚度
t = -5.6273, df = 19, p-value = 1.998e-05
alternative hypothesis: true mean is not equal to 5
95 percent confidence interval:
4.725612 4.874388
sample estimates:
mean of x
4.8
# 检验效应量
> library(lsr)
> cohensD(table$厚度,mu=5)
[1] 1.258306
2.2两个总体均值之差的检验
独立大样本
> library(BSDA)
> z.test(table$男生上网时间,table$女生上网时间,sigma.x = sd(table$男生上网时间),sigma.y = sd(table$女生上网时间),alternative = "two.sided")
Two-sample z-Test
data: table$男生上网时间 and table$女生上网时间
z = 1.1188, p-value = 0.2632
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-0.1712448 0.6268003
sample estimates:
mean of x mean of y
3.058333 2.830556
独立小样本
#假设方差相等
> t.test(table$甲企业,table$乙企业,var.equal = TRUE)
Two Sample t-test
data: table$甲企业 and table$乙企业
t = 3.4943, df = 38, p-value = 0.001225
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
135.24 507.76
sample estimates:
mean of x mean of y
8487.5 8166.0
#假设方差不相等
> t.test(table$甲企业,table$乙企业,var.equal = FALSE)
Welch Two Sample t-test
data: table$甲企业 and table$乙企业
t = 3.4943, df = 33.683, p-value = 0.001353
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
134.4528 508.5472
sample estimates:
mean of x mean of y
8487.5 8166.0
> library(lsr)
> cohensD(table$甲企业,table$乙企业)
[1] 1.104985
2.3 配对的检验
> t.test(table$旧款,table$新款,paired = TRUE)
Paired t-test
data: table$旧款 and table$新款
t = -2.7508, df = 9, p-value = 0.02245
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-2.3690538 -0.2309462
sample estimates:
mean of the differences
-1.3
> library(lsr)
> cohensD(table$旧款,table$新款,method = "paired")
[1] 0.8698945
三、总体比例的检验
3.1 一个总体比例的检验
> n<-2000
> p<-450/2000
> pi0<-0.25
> z<-(p-pi0)/sqrt(pi0*(1-pi0)/n)
> p_value<-1-pnorm(z)
> data.frame(z,p_value)
z p_value
1 -2.581989 0.9950884
3.2 两个总体比例之差的检验
> n1<-200
> n2<-200
> p1<-0.27
> p2<-0.35
> p<-(p1*n1+p2*n2)/(n1+n2)
> z<-(p1-p2)/sqrt(p*(1-p)*(1/n1+1/n2))
> p_value<-pnorm(z)
> data.frame(z,p_value)
z p_value
1 -1.729755 0.04183703
> n1<-300
> n2<-300
> p1<-33/300
> p2<-84/300
> d0<-0.08
> z<-((p1-p2)-d0)/sqrt(p1*(1-p1)/n1+p2*(1-p2)/n2)
> p_value<-pnorm(z)
> data.frame(z,p_value)
z p_value
1 -7.91229 1.26348e-15
四、总体方差的检验
4.1 一个总体方差的检验
> library(TeachingDemos)
> sigma.test(table$填装量,sigmasq = 16,alternative = "greater")
One sample Chi-squared test for variance
data: table$填装量
X-squared = 2.9741, df = 9, p-value = 0.9653
alternative hypothesis: true variance is greater than 16
95 percent confidence interval:
2.812522 Inf
sample estimates:
var of table$填装量
5.287222
4.2 两个总体方差比的检验
> table<-read.csv("/Users/zhourui/Documents/example6_6.csv")
> var.test(table[,1],table[,2])
F test to compare two variances
data: table[, 1] and table[, 2]
F = 0.47273, num df = 19, denom df = 19, p-value = 0.111
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
0.1871127 1.1943320
sample estimates:
ratio of variances
0.4727311
五、非参数检验
5.1 总体分布的检验
正态性检验的图示法 (QQ图)
> table<-read.csv("/Users/zhourui/Documents/exercise6_1.csv")
> par(mai=c(0.6,0.6,0.2,0.2),cex=0.7)
> qqnorm(table$绝对误差,xlab="lilunfenweishu",ylab = "yangbenfenweishu")
> qqline(table$绝对误差,col="lightblue",lwd=2)
5.2 Shapiro-Wilk正态性检验
> shapiro.test(table$厚度)
Shapiro-Wilk normality test
data: table$厚度
W = 0.91377, p-value = 0.07522
5.3 K-S检验
> ks.test(table$厚度,"pnorm",mean(table$厚度),sd(table$厚度))
One-sample Kolmogorov-Smirnov test
data: table$厚度
D = 0.23538, p-value = 0.2178
alternative hypothesis: two-sided