R语言假设检验:binom.test函数进行符号检验(binomial 检验,二项分布检验)、检验80分是否可以作为学生成绩的3/4分位数?在显著性水平为0.01的情况下

目录

R语言假设检验:binom.test函数进行符号检验(binomial 检验,二项分布检验)、检验80分是否可以作为学生成绩的3/4分位数?在显著性水平为0.01的情况下

假设检验

假设检验的应用

仿真数据

R语言假设检验:binom.test函数进行符号检验(binomial 检验,二项分布检验)、检验80分是否可以作为学生成绩的3/4分位数?在显著性水平为0.01的情况下


假设检验

假设检验使用统计学中的概念来确定给定假设有效的概率。通过假设检验,我们可以通过分析样本统计量来推断样本对应的总体的参数。

统计假设检验可以分为以下两类:

无效假设(Null Hypothesis):假设检验是为了检验关于更大人群(总体,population)的主张或假设的有效性而进行的。零假设检验用H0表示。

备则假设(Alternative Hypothesis):如果无效假设是谬误的,一个备则假设将被认为是有效的。备则假设检验用H1或Ha表示。

让我们以抛硬币为例。我们想断定一枚硬币是不是无偏的。由于零假设是指一个事件的自然状态,因此,根据零假设,如果一枚硬币被抛几次,那么正面和反面出现的次数将是相等的。另一方面,备则假设否定了零假设,指出正面和方面的出现在数量上会有显著的差异。

统计学家使用假设检验来正式检查假设是否被接受或拒绝。假设检验以下列方式进行:陈述假设、制定分析计划、分析样本数据、解释结果;

假设检验最终使用p值来衡量证据的强弱程度,或者换句话说,关于总体(population)的实际数据是什么。p值的范围在0到1之间。可以这样解释:

一个小的p值(通常≤0.05)表明有强有力的证据反对零假设,所以你拒绝它。

较大的p值(>0.05)表明反对无效假设的证据很微弱弱,所以你不能拒绝它。

非常接近临界值(0.05)的P值被认为是边缘的,可以走任何一条路。

通常来讲,假设检验从关于总体参数的假设(Hypothesis)或断言(Assertation)开始。例如,我们可能有兴趣验证飞利浦的号称,他们的某款LED灯泡的平均寿命为10年,我们可以采集数据通过假设检验来判别一切是毫无根据的夸大吹嘘还是实事求是。

假设检验的应用

当我们想比较样本均值和总体均值时。例如,我们想确定X品牌灯泡的平均寿命是否为10年。在这种情况下,当你想检查样本均值是否代表总体均值时,你应该运行单样本t检验(One Sample t-test)。

当我们要比较两个自变量的均值时。其中之一可以是类别变量。在这种情况下,我们运行双样本t检验(Two sample t-test)。

当我们想比较实验或治疗的前后效果时。然后,在这种情况下,我们运行配对的t检验,或者成对的t检验(Paired t-test)。

当我们要比较两个以上的自变量(independent variables)时;在这种情况下,我们运行方差分析(ANOVA)测试

在以上所有的应用中,我们都假设变量是数值的(numeric)。然而,当你想比较两个类别变量(categorical variables)时,我们运行卡方检验(Chi-square test)。

R语言 bins r语言 binom.test参数conf.level_数据分析

仿真数据

#
spamail <- c(310,350,370,377,380,400,415,425,440,295,325,296,250,340,298,365,375,360,385)

R语言 bins r语言 binom.test参数conf.level_R语言 bins_02

R语言假设检验:binom.test函数进行符号检验(binomial 检验,二项分布检验)、检验80分是否可以作为学生成绩的3/4分位数?在显著性水平为0.01的情况下

binom.test():调用格式

binom.test(x, n, p = 0.5,alternative = c("two.sided", "less", "greater"),conf.level = 0.95)

其中x是成功的次数;n是试验总数,P是原假设的概率。

binom.test(),又称符号检验,binomial 检验,二项分布检验。
binomial 二项分布,原理:如果两个配对样本实际没有差别,则样本数据相减所得的差值应当大致一半为正一半为负。
binom.test(观测值,样本总量,检验的比率)
完整函数格式:binom.test(x, n, p = 0.5 , alternative = c(“two.sided”, “less”, “greater”) , conf.level = 0.95)
零假设:观测值的分布=检验的比率。
这个函数是对分布的概率值进行检验,因此不像prop函数应用那么广泛,在医学临床研究中也用的不多。binom.test并不能进行向量计算,所以不能用于两个及以上独立样本。它只是用来检测概率值的p值,这个概率值在一般情况下是0.5,它使用的时候稍微注意下是单侧检验还是双侧检验。

#

# 采用非参数检验中的符号检验
 x <- c(95,89,68,90,88,60,81,67,60,60,60,63,60,92,60,88,88,87,60,73,60,97,91,60,83,87,81,90)
 binom.test(min(sum(x>80),sum(x<80)),sum(x!=80), 0.75)
> x <- c(95,89,68,90,88,60,81,67,60,60,60,63,60,92,60,88,88,87,60,73,60,97,91,60,83,87,81,90)
 > binom.test(min(sum(x>80),sum(x<80)),sum(x!=80), 0.75)    Exact binomial test
data:  min(sum(x > 80), sum(x < 80)) and sum(x != 80)
 number of successes = 13, number of trials = 28, p-value = 0.001436
 alternative hypothesis: true probability of success is not equal to 0.75
 95 percent confidence interval:
  0.2751086 0.6613009
 sample estimates:
 probability of success 
              0.4642857 >

参考:R