文章目录

  • 一、基本概念
  • 1.1 区间估计
  • 1.2 置信水平(置信度)
  • 1.3 置信系数
  • 1.4 置信区间
  • 1.5 单侧置信限
  • 1.6 置信域
  • 二、枢轴量法
  • 2.1 上侧 预测区间python 预测区间估计_方差 α分位数
  • 2.2 小样本情况下的步骤
  • 2.3 大样本情况下
  • 2.4 单个正态总体参数的置信水平为 预测区间python 预测区间估计_概率论_02 1−α的置信区间
  • 三、两个正态总体的置信区间
  • 3.1 预测区间python 预测区间估计_方差_03 δ=μ2−μ1的置信区间
  • 3.1.1 预测区间python 预测区间估计_预测区间python_04 σ12=σ22=σ2未知时
  • 3.1.2 预测区间python 预测区间估计_方差_05 θ=σ22/σ12已知时

3.1.3 m = n m=n m=n

3.1.4 当 m , n m, n m,n都充分大时

3.2 方差比预测区间python 预测区间估计_机器学习_06的置信区间


数理统计复习笔记三——点估计介绍了若干点估计的方法和准则,本文介绍区间估计。

区间估计是介于估计和检验之间的内容,且区间估计与检验紧密相连,因此有的也把区间估计看作是检验的一种。

一、基本概念

1.1 区间估计

预测区间python 预测区间估计_方差_07为来自分布族预测区间python 预测区间估计_算法_08的样本,预测区间python 预测区间估计_算法_09一维未知参数。如果预测区间python 预测区间估计_预测区间python_10预测区间python 预测区间估计_概率论_11为两个统计量,且预测区间python 预测区间估计_预测区间python_12,则称随机区间预测区间python 预测区间估计_预测区间python_13预测区间python 预测区间估计_算法_09的一个区间估计

1.2 置信水平(置信度)

既然是估计,就应该有一个好坏的衡量指标。

当参数的真值为预测区间python 预测区间估计_算法_09时,随机区间预测区间python 预测区间估计_预测区间python_13包含预测区间python 预测区间估计_算法_09的概率预测区间python 预测区间估计_方差_18就称为置信水平或置信度

对于一个区间估计来说,肯定希望置信水平或置信度越大越好。由于这个置信水平依赖于参数真值,故我们自然希望对于参数空间预测区间python 预测区间估计_算法_19中的每一个预测区间python 预测区间估计_算法_09,其置信水平都很大。

1.3 置信系数

设随机区间预测区间python 预测区间估计_预测区间python_13预测区间python 预测区间估计_算法_09的一个区间估计,则称预测区间python 预测区间估计_方差_23为该区间估计的置信系数。

  1. 区间估计有时要用开区间或半开半闭区间,但从置信水平的角度看,这几种区间估计没有本质的区别
  2. 在计算某区间估计的置信水平时,我们应该知道预测区间python 预测区间估计_概率论_24预测区间python 预测区间估计_机器学习_25的联合分布。如果不知道其联合分布,则很难求得其置信系数,这就是构造置信区间的技巧所在

1.4 置信区间

预测区间python 预测区间估计_预测区间python_13是参数预测区间python 预测区间估计_算法_09的一个区间估计,如果对给定的预测区间python 预测区间估计_预测区间python_28,有预测区间python 预测区间估计_概率论_29
则称预测区间python 预测区间估计_预测区间python_13预测区间python 预测区间估计_算法_09的置信水平为预测区间python 预测区间估计_概率论_32置信区间预测区间python 预测区间估计_预测区间python_10预测区间python 预测区间估计_概率论_11分别称为置信下限和置信上限。

实际中也称满足预测区间python 预测区间估计_概率论_35的区间估计为置信区间

详见杂记——贝叶斯可信区间与频率置信区间的区别

1.5 单侧置信限

有时人们感兴趣的指标是望大或望小指标(指标越大/小越好)。

预测区间python 预测区间估计_预测区间python_10预测区间python 预测区间估计_概率论_11为两个统计量,对给定的预测区间python 预测区间估计_预测区间python_28,有预测区间python 预测区间估计_算法_39
预测区间python 预测区间估计_机器学习_40
则分别称预测区间python 预测区间估计_预测区间python_10预测区间python 预测区间估计_概率论_11预测区间python 预测区间估计_算法_09的置信水平为预测区间python 预测区间估计_概率论_32的单侧置信下限和单侧置信上限。

与双侧置信限的关系

预测区间python 预测区间估计_方差_45预测区间python 预测区间估计_算法_46预测区间python 预测区间估计_机器学习_47的置信水平为预测区间python 预测区间估计_预测区间python_48预测区间python 预测区间估计_算法_49的单侧置信下限和单侧置信上限,且预测区间python 预测区间估计_预测区间python_50,则预测区间python 预测区间估计_算法_51预测区间python 预测区间估计_机器学习_47的置信水平为预测区间python 预测区间估计_算法_53的置信区间。

1.6 置信域

预测区间python 预测区间估计_方差_07为来自分布族预测区间python 预测区间估计_概率论_55的样本,预测区间python 预测区间估计_算法_56,如果统计量预测区间python 预测区间估计_概率论_57满足

  • 对任一样本观测值预测区间python 预测区间估计_预测区间python_58预测区间python 预测区间估计_预测区间python_59预测区间python 预测区间估计_机器学习_60的一个子集;
  • 对给定的预测区间python 预测区间估计_预测区间python_61预测区间python 预测区间估计_概率论_62
    则称预测区间python 预测区间估计_机器学习_63预测区间python 预测区间估计_机器学习_47的置信水平为预测区间python 预测区间估计_机器学习_65的置信域,而概率预测区间python 预测区间估计_预测区间python_66预测区间python 预测区间估计_机器学习_60上的下确界就称为置信系数

二、枢轴量法

求取参数的置信区间的方法有很多,本文主要介绍最常用的枢轴量法,尤其是对于连续型分布族。

2.1 上侧预测区间python 预测区间估计_概率论_68分位数

预测区间python 预测区间估计_机器学习_69预测区间python 预测区间估计_方差_70分别表示标准正态分布预测区间python 预测区间估计_方差_71预测区间python 预测区间估计_机器学习_72预测区间python 预测区间估计_机器学习_73,且用满足方程预测区间python 预测区间估计_算法_74预测区间python 预测区间估计_机器学习_75表示标准正态分布的上侧预测区间python 预测区间估计_概率论_76分位数,如下图

预测区间python 预测区间估计_机器学习_77


类似的,用预测区间python 预测区间估计_算法_78预测区间python 预测区间估计_方差_79预测区间python 预测区间估计_概率论_80表示预测区间python 预测区间估计_方差_81预测区间python 预测区间估计_预测区间python_82预测区间python 预测区间估计_算法_83的上侧预测区间python 预测区间估计_概率论_68分位数。

2.2 小样本情况下的步骤

  1. 找一个与待估参数预测区间python 预测区间估计_方差_85无关的统计量预测区间python 预测区间估计_预测区间python_86,一般是它的一个很好的点估计
  2. 设法找出预测区间python 预测区间估计_预测区间python_86预测区间python 预测区间估计_方差_85的某函数预测区间python 预测区间估计_概率论_89,使得预测区间python 预测区间估计_概率论_89的分布预测区间python 预测区间估计_预测区间python_91预测区间python 预测区间估计_机器学习_47无关,预测区间python 预测区间估计_预测区间python_93就称为枢轴量,一般令分布为正态分布、预测区间python 预测区间估计_算法_94分布、预测区间python 预测区间估计_预测区间python_95分布或预测区间python 预测区间估计_预测区间python_96分布
  3. 适当的选取两个常数预测区间python 预测区间估计_方差_97,使对给定的预测区间python 预测区间估计_预测区间python_98,有预测区间python 预测区间估计_方差_99预测区间python 预测区间估计_概率论_100,一般取预测区间python 预测区间估计_算法_101预测区间python 预测区间估计_机器学习_102
  4. 如果能把预测区间python 预测区间估计_预测区间python_103式中的不等式预测区间python 预测区间估计_方差_104等价的改写成预测区间python 预测区间估计_算法_105,其中预测区间python 预测区间估计_方差_45预测区间python 预测区间估计_算法_46只与预测区间python 预测区间估计_方差_97预测区间python 预测区间估计_预测区间python_86有关,而与预测区间python 预测区间估计_机器学习_47无关,则预测区间python 预测区间估计_算法_51预测区间python 预测区间估计_方差_85的置信水平为预测区间python 预测区间估计_机器学习_65置信区间

第2步寻找枢轴量最关键

例子

预测区间python 预测区间估计_方差_07为来自正态总体预测区间python 预测区间估计_机器学习_115预测区间python 预测区间估计_方差_116样本,预测区间python 预测区间估计_机器学习_117均未知,试求预测区间python 预测区间估计_概率论_118的置信水平为预测区间python 预测区间估计_概率论_32的置信区间。

  1. 由于预测区间python 预测区间估计_算法_120预测区间python 预测区间估计_预测区间python_121的一个很好的点估计,故我们在第一步取预测区间python 预测区间估计_机器学习_122
  2. 虽然预测区间python 预测区间估计_方差_123,但预测区间python 预测区间估计_算法_124未知,所以想到用预测区间python 预测区间估计_算法_125来代替,而预测区间python 预测区间估计_机器学习_126,所以可取枢轴量预测区间python 预测区间估计_算法_127
  3. 由于预测区间python 预测区间估计_概率论_128,所以可取预测区间python 预测区间估计_预测区间python_129预测区间python 预测区间估计_概率论_130
  4. 因为预测区间python 预测区间估计_机器学习_131
    所以预测区间python 预测区间估计_概率论_132
    所以预测区间python 预测区间估计_预测区间python_121的置信水平为预测区间python 预测区间估计_机器学习_65的置信区间为预测区间python 预测区间估计_预测区间python_135

2.3 大样本情况下

枢轴量法更适用于连续性随机变量,对于离散型随机变量,并不容易操作,其原因在于给定的预测区间python 预测区间估计_概率论_76,一般不存在确切的分位点

例子

预测区间python 预测区间估计_概率论_137为来自伯努利分布预测区间python 预测区间估计_方差_138预测区间python 预测区间估计_方差_116样本,试求预测区间python 预测区间估计_机器学习_140的置信水平为预测区间python 预测区间估计_概率论_32的置信区间。

关键还是找枢轴量。

我们知道预测区间python 预测区间估计_方差_142预测区间python 预测区间估计_方差_143的一个很好的估计,那么枢轴量应该与预测区间python 预测区间估计_预测区间python_144有关。而预测区间python 预测区间估计_预测区间python_145,其分布与预测区间python 预测区间估计_方差_143有关,所以不能直接把预测区间python 预测区间估计_概率论_147作为枢轴量。

但由中心极限定理可知,当预测区间python 预测区间估计_预测区间python_148时,预测区间python 预测区间估计_预测区间python_149 即当预测区间python 预测区间估计_概率论_150充分大时,我们有预测区间python 预测区间估计_方差_151 且与预测区间python 预测区间估计_方差_143无关,所以可将预测区间python 预测区间估计_概率论_153当作枢轴量。
所以当预测区间python 预测区间估计_概率论_150充分大时,有预测区间python 预测区间估计_预测区间python_155
再进行化简即可

预测区间python 预测区间估计_算法_156充分大时,上述方法求得的置信区间非常接近水平为预测区间python 预测区间估计_概率论_32的置信区间。在实际中,当预测区间python 预测区间估计_概率论_158时,就可以认为是充分大了。

由上述例子可知,对于离散型的随机变量,我们可以通过中心极限定理转化为正态分布来求解置信区间。

2.4 单个正态总体参数的置信水平为预测区间python 预测区间估计_概率论_32的置信区间

预测区间python 预测区间估计_概率论_137为来自正态分布预测区间python 预测区间估计_预测区间python_161预测区间python 预测区间估计_方差_116样本

参数情况

枢轴量

置信区间

已知,估计

未知,估计

已知,估计

未知,估计

预测区间python 预测区间估计_机器学习_177

预测区间python 预测区间估计_机器学习_177

三、两个正态总体的置信区间

预测区间python 预测区间估计_机器学习_177预测区间python 预测区间估计_算法_180分别为来自正态总体预测区间python 预测区间估计_概率论_181预测区间python 预测区间估计_概率论_182的样本,且全样本独立,其中预测区间python 预测区间估计_预测区间python_183为参数。样本均值为预测区间python 预测区间估计_概率论_184预测区间python 预测区间估计_方差_185,样本方差为预测区间python 预测区间估计_方差_186预测区间python 预测区间估计_预测区间python_187

3.1 预测区间python 预测区间估计_算法_188的置信区间

3.1.1 预测区间python 预测区间估计_概率论_189未知时

数理统计复习笔记一——统计中常用的抽样分布(卡方分布,t分布,F分布)可知预测区间python 预测区间估计_概率论_190
所以可令其为枢轴量,进而可得预测区间python 预测区间估计_方差_191的置信水平为预测区间python 预测区间估计_概率论_32的置信区间为预测区间python 预测区间估计_概率论_193

3.1.2 预测区间python 预测区间估计_算法_194已知时

因为预测区间python 预测区间估计_方差_195
所以可令其为枢轴量,进而可得预测区间python 预测区间估计_方差_191的置信水平为预测区间python 预测区间估计_概率论_32的置信区间为预测区间python 预测区间估计_预测区间python_198

3.1.3 预测区间python 预测区间估计_算法_199

此时预测区间python 预测区间估计_概率论_200预测区间python 预测区间估计_算法_201且相互独立,于是可知预测区间python 预测区间估计_机器学习_202预测区间python 预测区间估计_算法_203,所以有预测区间python 预测区间估计_预测区间python_204
所以可得预测区间python 预测区间估计_方差_191的置信水平为预测区间python 预测区间估计_概率论_32的置信区间为预测区间python 预测区间估计_算法_207

3.1.4 当预测区间python 预测区间估计_概率论_208都充分大时

因为预测区间python 预测区间估计_预测区间python_209预测区间python 预测区间估计_算法_210,且预测区间python 预测区间估计_算法_211,所以预测区间python 预测区间估计_机器学习_212

所以可得预测区间python 预测区间估计_方差_191的置信水平为预测区间python 预测区间估计_概率论_32的置信区间为预测区间python 预测区间估计_算法_215

3.2 方差比预测区间python 预测区间估计_算法_216的置信区间

因为预测区间python 预测区间估计_方差_217预测区间python 预测区间估计_算法_218,且二者是独立的,于是预测区间python 预测区间估计_方差_219
可以作为枢轴量,并且预测区间python 预测区间估计_预测区间python_220
进而可得置信区间为预测区间python 预测区间估计_机器学习_221