lines 加置信区间置信区间怎么建立

转载

新新人类 2024-04-07 21:44:40

文章标签 lines 加置信区间统计学正态分布标准差方差 文章分类 架构后端开发

t分布

假设一个情境：我们想知道糖球的典型重量。但由于只有一家糖果店提出要求，因此只抽取了包含10颗具有代表性的样本，然后称了每一粒糖球的重量。这个样本的 $lines 加置信区间置信区间怎么建立_统计学$ 。

老样子：

第1步：选择总体统计量

我们需要为糖球重量均值构建一个置信区间，也就是要为总体均值 $lines 加置信区间置信区间怎么建立_统计学_02$ 构建置信区间。由于需要求 $lines 加置信区间置信区间怎么建立_统计学_02$ 的置信区间，于是下一步就是求 $lines 加置信区间置信区间怎么建立_统计学_02$ 的抽样分布—— $lines 加置信区间置信区间怎么建立_lines 加置信区间_05$ 的分布。

第2步：求 $lines 加置信区间置信区间怎么建立_方差_06$ 的概率分布

这里我们碰到问题，从上面的快捷运算表可以得知，当总体分布 $lines 加置信区间置信区间怎么建立_方差_07$ 本身符合正态分布时，我们未知总体方差 $lines 加置信区间置信区间怎么建立_统计学_08$ ，需要用点估计量 $lines 加置信区间置信区间怎么建立_正态分布_09$ 代替，但是条件是n很大（至少30），这条路走不通了❌

另一个问题是，样本太小了，估计值很可能出现较大误差——比使用大样本的误差要大得多。这些潜在的误差意味着使用正态分布无法得出足够精确的 $lines 加置信区间置信区间怎么建立_lines 加置信区间_05$ 的概率，那样就无法得出精确的置信区间。

那么， $lines 加置信区间置信区间怎么建立_lines 加置信区间_05$ 符合哪种分布呢？实际上，它符合t分布。

当样本很小时， $lines 加置信区间置信区间怎么建立_方差_06$ 符合t分布

当总体分布符合正态分布， $lines 加置信区间置信区间怎么建立_统计学_08$ 未知，且可供支配的样本很小时， $lines 加置信区间置信区间怎么建立_lines 加置信区间_05$ 符合t分布。

t分布是外形光滑、对称的曲线，确切形状取决于样本大小。当样本很大时，t分布外形很像正态分布；当样本很小时，曲线较为扁平，有两条粗粗的尾巴。它只有一个参数——v，v=n-1。n为样本的大小，v被称为自由度。

下面这张图，对应了各种v对应的t分布。

lines 加置信区间置信区间怎么建立_方差_15

“T符合t分布且自由度为v”的简明表示方法为：
$lines 加置信区间置信区间怎么建立_标准差_16$
（T为检验统计量，计算方法见下；t(v)表示：我们正在使用自由度为v的t分布；v=n-1）

t分布的使用方法与正态分布相似——先将概率区间的上下限转化为标准分，然后用概率表求出所需要的结果。

求t分布的标准分

t分布的标准分的计算方法与正态分布的标准分的计算方法相同。像处理正态分布一样，我们先减去抽样分布的期望，然后用所得到的差除以标准差。唯一的差别是，我们用T而不是Z代表结果，这是为了配合t分布的使用。

我们需要求出 $lines 加置信区间置信区间怎么建立_lines 加置信区间_05$ 的分布（详细见：上章，样本均值的概率），于是要用到 $lines 加置信区间置信区间怎么建立_lines 加置信区间_05$ 的期望和标准差。 $lines 加置信区间置信区间怎么建立_lines 加置信区间_05$ 的期望为 $lines 加置信区间置信区间怎么建立_统计学_02$ ，标准差为 $lines 加置信区间置信区间怎么建立_正态分布_21$ 。由于需要用s估计 $lines 加置信区间置信区间怎么建立_标准差_22$ 的数值，于是t分布的标准分的算式如下：