预测区间python 预测区间估计

转载

mob64ca140dc73b 2024-05-15 21:11:27

文章标签 预测区间python 概率论机器学习算法方差 文章分类 Python 后端开发

文章目录

一、基本概念

1.1 区间估计
1.2 置信水平（置信度）
1.3 置信系数
1.4 置信区间
1.5 单侧置信限
1.6 置信域

二、枢轴量法

2.1 上侧 $预测区间python 预测区间估计_方差$ 分位数
2.2 小样本情况下的步骤
2.3 大样本情况下
2.4 单个正态总体参数的置信水平为 $预测区间python 预测区间估计_概率论_02$ 的置信区间

三、两个正态总体的置信区间

3.1 $预测区间python 预测区间估计_方差_03$ 的置信区间

3.1.1 $预测区间python 预测区间估计_预测区间python_04$ 未知时
3.1.2 $预测区间python 预测区间估计_方差_05$ 已知时

3.1.3 $m=n$ 时

3.1.4 当 $m,n$ 都充分大时

3.2 方差比 $预测区间python 预测区间估计_机器学习_06$ 的置信区间

数理统计复习笔记三——点估计介绍了若干点估计的方法和准则，本文介绍区间估计。

区间估计是介于估计和检验之间的内容，且区间估计与检验紧密相连，因此有的也把区间估计看作是检验的一种。

一、基本概念

1.1 区间估计

设 $预测区间python 预测区间估计_方差_07$ 为来自分布族 $预测区间python 预测区间估计_算法_08$ 的样本， $预测区间python 预测区间估计_算法_09$ 为一维未知参数。如果 $预测区间python 预测区间估计_预测区间python_10$ ， $预测区间python 预测区间估计_概率论_11$ 为两个统计量，且 $预测区间python 预测区间估计_预测区间python_12$ ，则称随机区间 $预测区间python 预测区间估计_预测区间python_13$ 为 $预测区间python 预测区间估计_算法_09$ 的一个区间估计。

1.2 置信水平（置信度）

既然是估计，就应该有一个好坏的衡量指标。

当参数的真值为 $预测区间python 预测区间估计_算法_09$ 时，随机区间 $预测区间python 预测区间估计_预测区间python_13$ 包含 $预测区间python 预测区间估计_算法_09$ 的概率 $预测区间python 预测区间估计_方差_18$ 就称为置信水平或置信度。

对于一个区间估计来说，肯定希望置信水平或置信度越大越好。由于这个置信水平依赖于参数真值，故我们自然希望对于参数空间 $预测区间python 预测区间估计_算法_19$ 中的每一个 $预测区间python 预测区间估计_算法_09$ ，其置信水平都很大。

1.3 置信系数

设随机区间 $预测区间python 预测区间估计_预测区间python_13$ 为 $预测区间python 预测区间估计_算法_09$ 的一个区间估计，则称 $预测区间python 预测区间估计_方差_23$ 为该区间估计的置信系数。

区间估计有时要用开区间或半开半闭区间，但从置信水平的角度看，这几种区间估计没有本质的区别
在计算某区间估计的置信水平时，我们应该知道 $预测区间python 预测区间估计_概率论_24$ ， $预测区间python 预测区间估计_机器学习_25$ 的联合分布。如果不知道其联合分布，则很难求得其置信系数，这就是构造置信区间的技巧所在

1.4 置信区间

设 $预测区间python 预测区间估计_预测区间python_13$ 是参数 $预测区间python 预测区间估计_算法_09$ 的一个区间估计，如果对给定的 $预测区间python 预测区间估计_预测区间python_28$ ，有 $预测区间python 预测区间估计_概率论_29$
则称 $预测区间python 预测区间估计_预测区间python_13$ 为 $预测区间python 预测区间估计_算法_09$ 的置信水平为 $预测区间python 预测区间估计_概率论_32$ 的置信区间， $预测区间python 预测区间估计_预测区间python_10$ ， $预测区间python 预测区间估计_概率论_11$ 分别称为置信下限和置信上限。

实际中也称满足 $预测区间python 预测区间估计_概率论_35$ 的区间估计为置信区间

详见杂记——贝叶斯可信区间与频率置信区间的区别

1.5 单侧置信限

有时人们感兴趣的指标是望大或望小指标（指标越大/小越好）。

设 $预测区间python 预测区间估计_预测区间python_10$ ， $预测区间python 预测区间估计_概率论_11$ 为两个统计量，对给定的 $预测区间python 预测区间估计_预测区间python_28$ ，有 $预测区间python 预测区间估计_算法_39$
$预测区间python 预测区间估计_机器学习_40$
则分别称 $预测区间python 预测区间估计_预测区间python_10$ 与 $预测区间python 预测区间估计_概率论_11$ 为 $预测区间python 预测区间估计_算法_09$ 的置信水平为 $预测区间python 预测区间估计_概率论_32$ 的单侧置信下限和单侧置信上限。

与双侧置信限的关系：

设 $预测区间python 预测区间估计_方差_45$ 与 $预测区间python 预测区间估计_算法_46$ 为 $预测区间python 预测区间估计_机器学习_47$ 的置信水平为 $预测区间python 预测区间估计_预测区间python_48$ 和 $预测区间python 预测区间估计_算法_49$ 的单侧置信下限和单侧置信上限，且 $预测区间python 预测区间估计_预测区间python_50$ ，则 $预测区间python 预测区间估计_算法_51$ 是 $预测区间python 预测区间估计_机器学习_47$ 的置信水平为 $预测区间python 预测区间估计_算法_53$ 的置信区间。

1.6 置信域

设 $预测区间python 预测区间估计_方差_07$ 为来自分布族 $预测区间python 预测区间估计_概率论_55$ 的样本， $预测区间python 预测区间估计_算法_56$ ，如果统计量 $预测区间python 预测区间估计_概率论_57$ 满足

对任一样本观测值 $预测区间python 预测区间估计_预测区间python_58$ ， $预测区间python 预测区间估计_预测区间python_59$ 是 $预测区间python 预测区间估计_机器学习_60$ 的一个子集；
对给定的 $预测区间python 预测区间估计_预测区间python_61$ ， $预测区间python 预测区间估计_概率论_62$
则称 $预测区间python 预测区间估计_机器学习_63$ 是 $预测区间python 预测区间估计_机器学习_47$ 的置信水平为 $预测区间python 预测区间估计_机器学习_65$ 的置信域，而概率 $预测区间python 预测区间估计_预测区间python_66$ 在 $预测区间python 预测区间估计_机器学习_60$ 上的下确界就称为置信系数

二、枢轴量法

求取参数的置信区间的方法有很多，本文主要介绍最常用的枢轴量法，尤其是对于连续型分布族。

2.1 上侧 $预测区间python 预测区间估计_概率论_68$ 分位数

记 $预测区间python 预测区间估计_机器学习_69$ 和 $预测区间python 预测区间估计_方差_70$ 分别表示标准正态分布 $预测区间python 预测区间估计_方差_71$ 的 $预测区间python 预测区间估计_机器学习_72$ 和 $预测区间python 预测区间估计_机器学习_73$ ，且用满足方程 $预测区间python 预测区间估计_算法_74$ 的 $预测区间python 预测区间估计_机器学习_75$ 表示标准正态分布的上侧 $预测区间python 预测区间估计_概率论_76$ 分位数，如下图

预测区间python 预测区间估计_机器学习_77

类似的，用 $预测区间python 预测区间估计_算法_78$ ， $预测区间python 预测区间估计_方差_79$ ， $预测区间python 预测区间估计_概率论_80$ 表示 $预测区间python 预测区间估计_方差_81$ ， $预测区间python 预测区间估计_预测区间python_82$ ， $预测区间python 预测区间估计_算法_83$ 的上侧 $预测区间python 预测区间估计_概率论_68$ 分位数。

2.2 小样本情况下的步骤

找一个与待估参数 $预测区间python 预测区间估计_方差_85$ 无关的统计量 $预测区间python 预测区间估计_预测区间python_86$ ，一般是它的一个很好的点估计
设法找出 $预测区间python 预测区间估计_预测区间python_86$ 与 $预测区间python 预测区间估计_方差_85$ 的某函数 $预测区间python 预测区间估计_概率论_89$ ，使得 $预测区间python 预测区间估计_概率论_89$ 的分布 $预测区间python 预测区间估计_预测区间python_91$ 与 $预测区间python 预测区间估计_机器学习_47$ 无关， $预测区间python 预测区间估计_预测区间python_93$ 就称为枢轴量，一般令分布为正态分布、 $预测区间python 预测区间估计_算法_94$ 分布、 $预测区间python 预测区间估计_预测区间python_95$ 分布或 $预测区间python 预测区间估计_预测区间python_96$ 分布
适当的选取两个常数 $预测区间python 预测区间估计_方差_97$ ，使对给定的 $预测区间python 预测区间估计_预测区间python_98$ ，有 $预测区间python 预测区间估计_方差_99$ 即 $预测区间python 预测区间估计_概率论_100$ ，一般取 $预测区间python 预测区间估计_算法_101$ ， $预测区间python 预测区间估计_机器学习_102$
如果能把 $预测区间python 预测区间估计_预测区间python_103$ 式中的不等式 $预测区间python 预测区间估计_方差_104$ 等价的改写成 $预测区间python 预测区间估计_算法_105$ ，其中 $预测区间python 预测区间估计_方差_45$ ， $预测区间python 预测区间估计_算法_46$ 只与 $预测区间python 预测区间估计_方差_97$ 和 $预测区间python 预测区间估计_预测区间python_86$ 有关，而与 $预测区间python 预测区间估计_机器学习_47$ 无关，则 $预测区间python 预测区间估计_算法_51$ 为 $预测区间python 预测区间估计_方差_85$ 的置信水平为 $预测区间python 预测区间估计_机器学习_65$ 的置信区间

第2步寻找枢轴量最关键

例子：

设 $预测区间python 预测区间估计_方差_07$ 为来自正态总体 $预测区间python 预测区间估计_机器学习_115$ 的 $预测区间python 预测区间估计_方差_116$ 样本， $预测区间python 预测区间估计_机器学习_117$ 均未知，试求 $预测区间python 预测区间估计_概率论_118$ 的置信水平为 $预测区间python 预测区间估计_概率论_32$ 的置信区间。

由于 $预测区间python 预测区间估计_算法_120$ 是 $预测区间python 预测区间估计_预测区间python_121$ 的一个很好的点估计，故我们在第一步取 $预测区间python 预测区间估计_机器学习_122$
虽然 $预测区间python 预测区间估计_方差_123$ ，但 $预测区间python 预测区间估计_算法_124$ 未知，所以想到用 $预测区间python 预测区间估计_算法_125$ 来代替，而 $预测区间python 预测区间估计_机器学习_126$ ，所以可取枢轴量 $预测区间python 预测区间估计_算法_127$
由于 $预测区间python 预测区间估计_概率论_128$ ，所以可取 $预测区间python 预测区间估计_预测区间python_129$ ， $预测区间python 预测区间估计_概率论_130$
因为 $预测区间python 预测区间估计_机器学习_131$
所以 $预测区间python 预测区间估计_概率论_132$
所以 $预测区间python 预测区间估计_预测区间python_121$ 的置信水平为 $预测区间python 预测区间估计_机器学习_65$ 的置信区间为 $预测区间python 预测区间估计_预测区间python_135$

2.3 大样本情况下

枢轴量法更适用于连续性随机变量，对于离散型随机变量，并不容易操作，其原因在于给定的 $预测区间python 预测区间估计_概率论_76$ ，一般不存在确切的分位点。

例子：

设 $预测区间python 预测区间估计_概率论_137$ 为来自伯努利分布 $预测区间python 预测区间估计_方差_138$ 的 $预测区间python 预测区间估计_方差_116$ 样本，试求 $预测区间python 预测区间估计_机器学习_140$ 的置信水平为 $预测区间python 预测区间估计_概率论_32$ 的置信区间。

关键还是找枢轴量。

我们知道 $预测区间python 预测区间估计_方差_142$ 是 $预测区间python 预测区间估计_方差_143$ 的一个很好的估计，那么枢轴量应该与 $预测区间python 预测区间估计_预测区间python_144$ 有关。而 $预测区间python 预测区间估计_预测区间python_145$ ，其分布与 $预测区间python 预测区间估计_方差_143$ 有关，所以不能直接把 $预测区间python 预测区间估计_概率论_147$ 作为枢轴量。
但由中心极限定理可知，当 $预测区间python 预测区间估计_预测区间python_148$ 时， $预测区间python 预测区间估计_预测区间python_149$ 即当 $预测区间python 预测区间估计_概率论_150$ 充分大时，我们有 $预测区间python 预测区间估计_方差_151$ 且与 $预测区间python 预测区间估计_方差_143$ 无关，所以可将 $预测区间python 预测区间估计_概率论_153$ 当作枢轴量。
所以当 $预测区间python 预测区间估计_概率论_150$ 充分大时，有 $预测区间python 预测区间估计_预测区间python_155$
再进行化简即可

当 $预测区间python 预测区间估计_算法_156$ 充分大时，上述方法求得的置信区间非常接近水平为 $预测区间python 预测区间估计_概率论_32$ 的置信区间。在实际中，当 $预测区间python 预测区间估计_概率论_158$ 时，就可以认为是充分大了。

由上述例子可知，对于离散型的随机变量，我们可以通过中心极限定理转化为正态分布来求解置信区间。

2.4 单个正态总体参数的置信水平为 $预测区间python 预测区间估计_概率论_32$ 的置信区间

$预测区间python 预测区间估计_概率论_137$ 为来自正态分布 $预测区间python 预测区间估计_预测区间python_161$ 的 $预测区间python 预测区间估计_方差_116$ 样本

参数情况	枢轴量	置信区间
已知，估计
未知，估计
已知，估计
未知，估计	$预测区间python 预测区间估计_机器学习_177$	$预测区间python 预测区间估计_机器学习_177$

三、两个正态总体的置信区间

设 $预测区间python 预测区间估计_机器学习_177$ 和 $预测区间python 预测区间估计_算法_180$ 分别为来自正态总体 $预测区间python 预测区间估计_概率论_181$ 和 $预测区间python 预测区间估计_概率论_182$ 的样本，且全样本独立，其中 $预测区间python 预测区间估计_预测区间python_183$ 为参数。样本均值为 $预测区间python 预测区间估计_概率论_184$ ， $预测区间python 预测区间估计_方差_185$ ，样本方差为 $预测区间python 预测区间估计_方差_186$ ， $预测区间python 预测区间估计_预测区间python_187$

3.1 $预测区间python 预测区间估计_算法_188$ 的置信区间

3.1.1 $预测区间python 预测区间估计_概率论_189$ 未知时

由数理统计复习笔记一——统计中常用的抽样分布(卡方分布，t分布，F分布)可知 $预测区间python 预测区间估计_概率论_190$
所以可令其为枢轴量，进而可得 $预测区间python 预测区间估计_方差_191$ 的置信水平为 $预测区间python 预测区间估计_概率论_32$ 的置信区间为 $预测区间python 预测区间估计_概率论_193$

3.1.2 $预测区间python 预测区间估计_算法_194$ 已知时

因为 $预测区间python 预测区间估计_方差_195$
所以可令其为枢轴量，进而可得 $预测区间python 预测区间估计_方差_191$ 的置信水平为 $预测区间python 预测区间估计_概率论_32$ 的置信区间为 $预测区间python 预测区间估计_预测区间python_198$

3.1.3 $预测区间python 预测区间估计_算法_199$ 时

此时 $预测区间python 预测区间估计_概率论_200$ ， $预测区间python 预测区间估计_算法_201$ 且相互独立，于是可知 $预测区间python 预测区间估计_机器学习_202$ ， $预测区间python 预测区间估计_算法_203$ ，所以有 $预测区间python 预测区间估计_预测区间python_204$
所以可得 $预测区间python 预测区间估计_方差_191$ 的置信水平为 $预测区间python 预测区间估计_概率论_32$ 的置信区间为 $预测区间python 预测区间估计_算法_207$

3.1.4 当 $预测区间python 预测区间估计_概率论_208$ 都充分大时

因为 $预测区间python 预测区间估计_预测区间python_209$ ， $预测区间python 预测区间估计_算法_210$ ，且 $预测区间python 预测区间估计_算法_211$ ，所以 $预测区间python 预测区间估计_机器学习_212$

所以可得 $预测区间python 预测区间估计_方差_191$ 的置信水平为 $预测区间python 预测区间估计_概率论_32$ 的置信区间为 $预测区间python 预测区间估计_算法_215$

3.2 方差比 $预测区间python 预测区间估计_算法_216$ 的置信区间

因为 $预测区间python 预测区间估计_方差_217$ ， $预测区间python 预测区间估计_算法_218$ ，且二者是独立的，于是 $预测区间python 预测区间估计_方差_219$
可以作为枢轴量，并且 $预测区间python 预测区间估计_预测区间python_220$
进而可得置信区间为 $预测区间python 预测区间估计_机器学习_221$

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

上一篇：模型的权重参数表怎么看数学建模权重系数确定

下一篇：java 打印链路设计 java如何连接打印机

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯