文章目录

  • 学习目标
  • 学习内容
  • 总体均值的区间估计
  • 置信水平--基于R的模拟
  • 中心极限定理
  • 内容小结



学习目标

我们所采用的学习内容来自B站的Lizongzhang老师的R语言的学习分享
今天学习的主要内容是关于
置信水平的理解总体均值的区间估计

学习内容

下面是学习的主要内容
首先第一部分是对t.test函数的应用

总体均值的区间估计

首先先对总体均值的区间估计有一定的了解

在推断总体参数时,还需要根据统计量的抽样分布特征,估计出总体参数的一个区间范围,并同时给出总体参数落在这一区间范围的可能性大小的判断。 常用方法有矩估计法和最大似然估计法

图像上的简单理解,就是给出一条数轴,我对其落在某一点的附近的可能性有多大

R语言 判断是否为空格 r语言判断是否在区间内_r语言为我们所求的中心点所在位置,若大部分的样本待在R语言 判断是否为空格 r语言判断是否在区间内_中心极限定理_02的范围内,那么就表明大部分的样本点就在R语言 判断是否为空格 r语言判断是否在区间内_r语言这个点的附近,然后就可以根据我们题目的需要对其进行判断

R语言 判断是否为空格 r语言判断是否在区间内_中心极限定理_04

#总体均值的区间估计
x<-rnorm(10,20,2)
#number of observation(观测次数):10
#mean(均值):20
#标准差:2
t.test(x)
n<-10
margin_of_error<-qt(0.975,9)*sd(x)/sqrt(n)
ll<-mean(x)-margin_of_error#lower limit最低下限
up<-mean(x)+margin_of_error#最高上限
ci<-c(ll,up)
ci
t.test(x,conf=0.90)#进行区间估计,90%可以根据需要进行更改

首先常看t.test(x)的运行结果(默认是R语言 判断是否为空格 r语言判断是否在区间内_开发语言_05)

> t.test(x)

	One Sample t-test
	#单样本检验
data:  x
t = 40.466, df = 9, p-value = 1.711e-11
alternative hypothesis: true mean is not equal to 0
95 percent confidence interval:
 17.85042 19.96434
sample estimates:
mean of x 
 18.90738

R语言 判断是否为空格 r语言判断是否在区间内_中心极限定理_06所表示的值如下

> ci
[1] 18.80898 21.54841

接下来看在R语言 判断是否为空格 r语言判断是否在区间内_r语言_07的区间估计

> t.test(x,conf=0.90)

   One Sample t-test

data:  x
t = 33.326, df = 9, p-value = 9.715e-11
alternative hypothesis: true mean is not equal to 0
90 percent confidence interval:
19.06876 21.28862
sample estimates:
mean of x 
20.17869

置信水平–基于R的模拟

再对置信水平进行一个简单的介绍
首先要提出一个假设的检验,令假设检验的命题为是否R语言 判断是否为空格 r语言判断是否在区间内_r语言_08进行讨论,下面是具体步骤

  • 制定原假设:R语言 判断是否为空格 r语言判断是否在区间内_开发语言_09和备择假设R语言 判断是否为空格 r语言判断是否在区间内_中心极限定理_10,这里在选择检验方法的时候有一个小方法帮助大家选择:
    –如果是R语言 判断是否为空格 r语言判断是否在区间内_R语言 判断是否为空格_11,那么选择的就是右侧检验
    –如果R语言 判断是否为空格 r语言判断是否在区间内_ci_12,那么选择的检验就是左侧检验
    –如果R语言 判断是否为空格 r语言判断是否在区间内_R语言 判断是否为空格_13,那么假设检验就是选择使用双侧检验
  • 在原假设R语言 判断是否为空格 r语言判断是否在区间内_开发语言_14成立的情况下构造分布,可以有R语言 判断是否为空格 r语言判断是否在区间内_中心极限定理_15分布,正态分布,R语言 判断是否为空格 r语言判断是否在区间内_r语言_16分布等
  • 画出该分布下的概率密度图,常见使用到的函数是R语言 判断是否为空格 r语言判断是否在区间内_r语言_17
  • 制定一个置信区间R语言 判断是否为空格 r语言判断是否在区间内_R语言 判断是否为空格_18(即认为R语言 判断是否为空格 r语言判断是否在区间内_开发语言_14成立的概率),一般情况下是取R语言 判断是否为空格 r语言判断是否在区间内_开发语言_20以上的(一般是R语言 判断是否为空格 r语言判断是否在区间内_开发语言_20,R语言 判断是否为空格 r语言判断是否在区间内_R语言 判断是否为空格_22,R语言 判断是否为空格 r语言判断是否在区间内_开发语言_23),在这里我们取R语言 判断是否为空格 r语言判断是否在区间内_R语言 判断是否为空格_22
  • 可以根据不同的检测方法画出对应的图像,这里简单绘制一下双侧检验对应的图像,可能不是很好看
  • 得出结果:若给出的结果是若给出的值落在了拒绝域上,那就说明在R语言 判断是否为空格 r语言判断是否在区间内_ci_25的置信水平上拒绝原假设(可以理解为我们我们有R语言 判断是否为空格 r语言判断是否在区间内_R语言 判断是否为空格_22的自信可以拒绝原假设,置信区间只是对自信这样一个概念写得更加富有数学逻辑),反之,在在R语言 判断是否为空格 r语言判断是否在区间内_ci_25的置信水平上,接受原假设
  • 下面使用R语言进行实现
#置信水平
x<-rnorm(10,20,2)
#number of observation(观测次数):10
#mean(均值):20
#标准差:2
t.test(x)#单边检验
str(t.test(x))#提取结构string

t.test(x)$[1]#在R语言当中$表示提取上下限
t.test(x)$[2]
ci<-array(0,dim=c(1000,2))
#定义初始值,有1000行,有两列
for(i in 1:1000){
  x<-rnorm(10,20,2)
  #生成样本数据
  ci[i,]<-c(t.test(x)$[1],t.test(x)$[2])
}
#head(ci)#查看前面的几个值的信息
mean(1*((ci[,1]<20)&(ci[,2]>20)))#逻辑运算的判断
#查看是否逼近95%

中心极限定理

首先先对中心极限定理做一个简单的解释
现象由大量相互独立的因素影响
大量独立同分布的变量和的极限分布是正态分布
定理:R语言 判断是否为空格 r语言判断是否在区间内_开发语言_28独立同分布,R语言 判断是否为空格 r语言判断是否在区间内_中心极限定理_29 R语言 判断是否为空格 r语言判断是否在区间内_r语言_30 其中 R语言 判断是否为空格 r语言判断是否在区间内_ci_31
R语言 判断是否为空格 r语言判断是否在区间内_开发语言_32
R语言 判断是否为空格 r语言判断是否在区间内_开发语言_33R语言 判断是否为空格 r语言判断是否在区间内_r语言_34
可以得到R语言 判断是否为空格 r语言判断是否在区间内_开发语言_35
可以看出其分布的情况如下
R语言 判断是否为空格 r语言判断是否在区间内_开发语言_36

#Central limit Theorem
#中心极限定理
#关注样本均值的分布状态
#(dim表示的是维度)
sample_mean<-array(0,dim=5000)
for(i in 1:5000)#rchisq表示k方分布随机数生成器
{
  x<-rchisq(30,5)
  sample_mean[i]<-mean(x)
}
hist(sample_mean,prob=T,ylim=c(0,1))
#prob=T表示纵轴概率分布,ylim是y轴取值区间
lines(density(sample_mean),col=2,lwd=3)
#增加一条概率密度曲线

画出对应的概率分布和增加概率分布密度曲线之后的图像

R语言 判断是否为空格 r语言判断是否在区间内_ci_37

#总体服从自由度为5的卡方分布
par(mfrow=c(2,2),mai=c(0.6,0.6,0.2,0.1),cex=0.6)
#进行图像的分布
sample_size<-c(1,4,36,100)
for(j in 1:4){
  sample_mean<-array(0,dim=5000)
  for(i in 1:5000){
    x<-rchisq(sample_size[j],5)
    #sample_size[j]表示在sample_size当中
    #进行取相应位置的操作
    sample_mean[i]<-mean(x)
  }
  hist(sample_mean,freq=F,
       xlim=c(0,15),
       ylim=c(0,1.4),
       main=paste("sample size=",sample_size[j]))
  lines(density(sample_mean),col=2,lwd=2)
}

画出自由度为5,样本容量分别为1,4,36,100时的图像

R语言 判断是否为空格 r语言判断是否在区间内_r语言_38

内容小结

这一部分的内容由于本人在概率论里没有进行系统的学习,所以有讲得不明白的地方还希望大家可以理解,也希望大家可以再多看一些不同的内容