假设检验

  • 总体均值的检验
  • 一个总体均值的检验
  • 大样本的检验
z.test(table$PM2.5.,mu=81,sigma.x = sd(table$PM2.5.),alternative = "less",conf.level = 0.95)
  • 小样本的检验
t.test(table$厚度,mu=5)
  • 检验效应量
library(lsr)
cohensD(table$厚度,mu=5)
  • 两个总体均值之差的检验
  • 独立大样本
library(BSDA)
z.test(table$男生上网时间,table$女生上网时间,sigma.x = sd(table$男生上网时间),sigma.y = sd(table$女生上网时间),alternative = "two.sided")
  • 独立小样本
#假设方差相等
t.test(table$甲企业,table$乙企业,var.equal = TRUE)
#假设方差不相等
t.test(table$甲企业,table$乙企业,var.equal = FALSE)
  • 检验效应量
library(lsr)
cohensD(table$甲企业,table$乙企业)
  • 配对的检验
t.test(table$旧款,table$新款,paired = TRUE)
  • 总体比例的检验
  • 一个总体比例的检验
> n<-2000
> p<-450/2000
> pi0<-0.25
> z<-(p-pi0)/sqrt(pi0*(1-pi0)/n)
> p_value<-1-pnorm(z)
> data.frame(z,p_value)
  • 两个总体比例之差的检验
> n1<-200
> n2<-200
> p1<-0.27
> p2<-0.35
> p<-(p1*n1+p2*n2)/(n1+n2)
> z<-(p1-p2)/sqrt(p*(1-p)*(1/n1+1/n2))
> p_value<-pnorm(z)
> data.frame(z,p_value)
  • 总体方差的检验
  • 一个总体方差的检验
library(TeachingDemos)
sigma.test(table$填装量,sigmasq = 16,alternative = "greater")
  • 两个总体方差比的检验
table<-read.csv("/Users/zhourui/Documents/example6_6.csv")
var.test(table[,1],table[,2])
  • 检验效应量
library(lsr)
cohensD(table$旧款,table$新款,method = "paired")
  • 非参数检验
  • 正态性检验的图示法 (QQ图)
qqnorm(table$绝对误差,xlab="lilunfenweishu",ylab = "yangbenfenweishu")
qqline(table$绝对误差,col="lightblue",lwd=2)
  • Shapiro-Wilk正态性检验
shapiro.test(table$厚度)
  • K-S检验
ks.test(table$厚度,"pnorm",mean(table$厚度),sd(table$厚度))
  • 总体比例的检验
  • 一个总体比例的检验
> n<-2000
> p<-450/2000
> pi0<-0.25
> z<-(p-pi0)/sqrt(pi0*(1-pi0)/n)
> p_value<-1-pnorm(z)
> data.frame(z,p_value)
  • 两个总体比例之差的检验
> n1<-200
> n2<-200
> p1<-0.27
> p2<-0.35
> p<-(p1*n1+p2*n2)/(n1+n2)
> z<-(p1-p2)/sqrt(p*(1-p)*(1/n1+1/n2))
> p_value<-pnorm(z)
> data.frame(z,p_value)
  • 总体方差的检验
  • 一个总体方差的检验
library(TeachingDemos)
sigma.test(table$填装量,sigmasq = 16,alternative = "greater")
  • 两个总体方差比的检验
table<-read.csv("/Users/zhourui/Documents/example6_6.csv")
var.test(table[,1],table[,2])






文章目录

  • 假设检验
  • 一、假设检验的原理
  • 1.1 提出假设
  • 1.2做出决策
  • 两类错误于显著性水平
  • 决策的依据
  • 效应量
  • 二、总体均值的检验
  • 2.1一个总体均值的检验
  • 大样本的检验
  • 小样本的检验
  • 2.2两个总体均值之差的检验
  • 独立大样本
  • 独立小样本
  • 2.3 配对的检验
  • 三、总体比例的检验
  • 3.1 一个总体比例的检验
  • 3.2 两个总体比例之差的检验
  • 四、总体方差的检验
  • 4.1 一个总体方差的检验
  • 4.2 两个总体方差比的检验
  • 五、非参数检验
  • 5.1 总体分布的检验
  • 正态性检验的图示法 (QQ图)
  • 5.2 Shapiro-Wilk正态性检验
  • 5.3 K-S检验



一、假设检验的原理

参数检验:总体分布特征为正态分布
非参数检验:不依赖于总体分布特征

1.1 提出假设

假设:对总体的某种看法
假设检验H0:利用样本信息判断假设是否成立的统计方法(=)
原假设H1:希望推翻的假设
针对视角不同,会产生不同结果
备择假设:希望予以支持的假设
双侧检验、双尾检验:备择假设中含有不等号
左侧检验:备择假设中含有小于号
右侧检验:备择假设中含有小大号

1.2做出决策

两类错误于显著性水平

第一类错误α:原假设是正确的却拒绝了它
第二类错误β:原假设是错误的却没有拒绝它

减小α就会增大β

显著性水平:犯第一类错误的概率(第一类错误可控)

决策的依据

P值:犯第一类错误的概率

r语言实现 r语言实现BH检验_r语言实现

r语言实现 r语言实现BH检验_方差_02


拒绝H0时,表示有足够的证据证明H0是错误的


不拒绝H0时,表示没有足够的证据证明H0是错误的

效应量

效应量:度量差异大小的统计量,描述了差异程度是大、中、小

r语言实现 r语言实现BH检验_r语言_03

二、总体均值的检验

2.1一个总体均值的检验

r语言实现 r语言实现BH检验_r语言_04

大样本的检验

r语言实现 r语言实现BH检验_ide_05


r语言实现 r语言实现BH检验_方差_06

> z.test(table$PM2.5.,mu=81,sigma.x = sd(table$PM2.5.),alternative = "less",conf.level = 0.95)

	One-sample z-Test

data:  table$PM2.5.
z = -1.1856, p-value = 0.1179
alternative hypothesis: true mean is less than 81
95 percent confidence interval:
       NA 81.56174
sample estimates:
mean of x 
    79.55

r语言实现 r语言实现BH检验_r语言实现_07

小样本的检验

r语言实现 r语言实现BH检验_ide_08


r语言实现 r语言实现BH检验_方差_09

> t.test(table$厚度,mu=5)

	One Sample t-test

data:  table$厚度
t = -5.6273, df = 19, p-value = 1.998e-05
alternative hypothesis: true mean is not equal to 5
95 percent confidence interval:
 4.725612 4.874388
sample estimates:
mean of x 
      4.8

r语言实现 r语言实现BH检验_r语言_10

# 检验效应量
> library(lsr)
> cohensD(table$厚度,mu=5)
[1] 1.258306

2.2两个总体均值之差的检验

独立大样本

r语言实现 r语言实现BH检验_ide_11


r语言实现 r语言实现BH检验_ide_12

> library(BSDA)
> z.test(table$男生上网时间,table$女生上网时间,sigma.x = sd(table$男生上网时间),sigma.y = sd(table$女生上网时间),alternative = "two.sided")

	Two-sample z-Test

data:  table$男生上网时间 and table$女生上网时间
z = 1.1188, p-value = 0.2632
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -0.1712448  0.6268003
sample estimates:
mean of x mean of y 
 3.058333  2.830556

r语言实现 r语言实现BH检验_方差_13

独立小样本

r语言实现 r语言实现BH检验_r语言实现_14


r语言实现 r语言实现BH检验_方差_15

#假设方差相等
> t.test(table$甲企业,table$乙企业,var.equal = TRUE)

	Two Sample t-test

data:  table$甲企业 and table$乙企业
t = 3.4943, df = 38, p-value = 0.001225
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 135.24 507.76
sample estimates:
mean of x mean of y 
   8487.5    8166.0 


#假设方差不相等
> t.test(table$甲企业,table$乙企业,var.equal = FALSE)

	Welch Two Sample t-test

data:  table$甲企业 and table$乙企业
t = 3.4943, df = 33.683, p-value = 0.001353
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 134.4528 508.5472
sample estimates:
mean of x mean of y 
   8487.5    8166.0

r语言实现 r语言实现BH检验_r语言实现_16


> library(lsr)
> cohensD(table$甲企业,table$乙企业)
[1] 1.104985

r语言实现 r语言实现BH检验_方差_17

2.3 配对的检验

r语言实现 r语言实现BH检验_hapi_18


r语言实现 r语言实现BH检验_方差_19

> t.test(table$旧款,table$新款,paired = TRUE)

	Paired t-test

data:  table$旧款 and table$新款
t = -2.7508, df = 9, p-value = 0.02245
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -2.3690538 -0.2309462
sample estimates:
mean of the differences 
                   -1.3

r语言实现 r语言实现BH检验_r语言实现_20

> library(lsr)
> cohensD(table$旧款,table$新款,method = "paired")
[1] 0.8698945

r语言实现 r语言实现BH检验_hapi_21

三、总体比例的检验

r语言实现 r语言实现BH检验_r语言实现_22

3.1 一个总体比例的检验

r语言实现 r语言实现BH检验_r语言_23


r语言实现 r语言实现BH检验_ide_24


r语言实现 r语言实现BH检验_ide_25

> n<-2000
> p<-450/2000
> pi0<-0.25
> z<-(p-pi0)/sqrt(pi0*(1-pi0)/n)
> p_value<-1-pnorm(z)
> data.frame(z,p_value)
          z   p_value
1 -2.581989 0.9950884

r语言实现 r语言实现BH检验_方差_26

3.2 两个总体比例之差的检验

r语言实现 r语言实现BH检验_方差_27


r语言实现 r语言实现BH检验_方差_28

> n1<-200
> n2<-200
> p1<-0.27
> p2<-0.35
> p<-(p1*n1+p2*n2)/(n1+n2)
> z<-(p1-p2)/sqrt(p*(1-p)*(1/n1+1/n2))
> p_value<-pnorm(z)
> data.frame(z,p_value)
          z    p_value
1 -1.729755 0.04183703

r语言实现 r语言实现BH检验_hapi_29


r语言实现 r语言实现BH检验_hapi_30


r语言实现 r语言实现BH检验_r语言实现_31


r语言实现 r语言实现BH检验_hapi_32

> n1<-300
> n2<-300
> p1<-33/300
> p2<-84/300
> d0<-0.08
> z<-((p1-p2)-d0)/sqrt(p1*(1-p1)/n1+p2*(1-p2)/n2)
> p_value<-pnorm(z)
> data.frame(z,p_value)
         z     p_value
1 -7.91229 1.26348e-15

r语言实现 r语言实现BH检验_方差_33

四、总体方差的检验

r语言实现 r语言实现BH检验_hapi_34

4.1 一个总体方差的检验

r语言实现 r语言实现BH检验_方差_35


r语言实现 r语言实现BH检验_方差_36

> library(TeachingDemos)
> sigma.test(table$填装量,sigmasq = 16,alternative = "greater")

	One sample Chi-squared test for variance

data:  table$填装量
X-squared = 2.9741, df = 9, p-value = 0.9653
alternative hypothesis: true variance is greater than 16
95 percent confidence interval:
 2.812522      Inf
sample estimates:
var of table$填装量 
           5.287222

r语言实现 r语言实现BH检验_方差_37

4.2 两个总体方差比的检验

r语言实现 r语言实现BH检验_方差_38


r语言实现 r语言实现BH检验_方差_39

> table<-read.csv("/Users/zhourui/Documents/example6_6.csv")
> var.test(table[,1],table[,2])

	F test to compare two variances

data:  table[, 1] and table[, 2]
F = 0.47273, num df = 19, denom df = 19, p-value = 0.111
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
 0.1871127 1.1943320
sample estimates:
ratio of variances 
         0.4727311

r语言实现 r语言实现BH检验_hapi_40

五、非参数检验

5.1 总体分布的检验

正态性检验的图示法 (QQ图)

r语言实现 r语言实现BH检验_r语言实现_41

> table<-read.csv("/Users/zhourui/Documents/exercise6_1.csv")
> par(mai=c(0.6,0.6,0.2,0.2),cex=0.7)
> qqnorm(table$绝对误差,xlab="lilunfenweishu",ylab = "yangbenfenweishu")
> qqline(table$绝对误差,col="lightblue",lwd=2)

r语言实现 r语言实现BH检验_hapi_42

5.2 Shapiro-Wilk正态性检验

r语言实现 r语言实现BH检验_方差_43


r语言实现 r语言实现BH检验_hapi_44

> shapiro.test(table$厚度)

	Shapiro-Wilk normality test

data:  table$厚度
W = 0.91377, p-value = 0.07522

r语言实现 r语言实现BH检验_方差_45

5.3 K-S检验

r语言实现 r语言实现BH检验_ide_46


r语言实现 r语言实现BH检验_ide_47

> ks.test(table$厚度,"pnorm",mean(table$厚度),sd(table$厚度))

	One-sample Kolmogorov-Smirnov test

data:  table$厚度
D = 0.23538, p-value = 0.2178
alternative hypothesis: two-sided

r语言实现 r语言实现BH检验_r语言_48