文章目录
- 极大似然估计
- 矩估计
- 区间估计
写在前面
这次总结一下数理统计中的参数估计,即**点估计(矩估计、极大似然估计)和区间估计(置信区间)**部分的R
语言实现,由于这部分内容没有相应的R语言内置函数,所以需要编程的地方比较多,篇幅也相应地比较长。
- 在计算非线性方程组的根时,采用了自定义函数
Newtons()
,运用Newton法进行求根。
点估计
极大似然估计
极大似然估计(Maximum Likelihood Estimate, MLE),最早由统计学家Fisher提出,是一种充分利用总体分布函数信息的估计方式,方法是寻找使似然函数达到最大的参数。
- 定义:设总体X的概率密度函数或分布律为是未知参数,为来自总体的样本,称
为的极大似然函数(likelihood function)。 - 定义:设总体X的概率密度函数或分布律为是未知参数,为来自总体的样本,为的似然函数, 若是一个统计量,且满足:
则称为的最大似然估计。
下面介绍几种常见分布的似然函数及其推导。
- 均匀分布
显然得到. - 指数分布
服从指数分布的最大似然估计函数为
取对数并求导得到
即. - 正态分布
正态分布的似然函数为
对数似然函数为
令
解此似然方程组得到:
进一步验证,对于对数似然函数的二阶Hesse矩阵
为负定矩阵,所以是的极大值点。故的最大似然估计为
下面分两种情况进行极大似然估计中参数的计算。
可求出解析解
首先采用Newton法实现:
下面介绍一个简单的方法,需要调用rootSolve
外部包的multiroot()
函数,求解有个方程、个未知量的非线性方程组。
不易或无法求出解析解
采用数值解法
以Cauchy分布的最大似然估计为例
- 采用
uniroot()
函数
- 采用
optimize()
函数,可以达到与uniroot()
函数一致的结果。
矩估计
使用矩估计进行参数估计的方法称为矩法(method of moments),由英国统计学家K · Pearson提出,思想是用样本矩去估计总体矩,总体矩与总体的参数有关,从而得到总体参数的估计。
利用矩法估计总体的均值和方差,就等价于用样本的一阶原点矩估计均值,用样本的二阶中心矩估计方差。
下面介绍一些常用分布的矩估计推导。
- 均匀分布
分为两种情况,第一种只需要求解一阶原点矩,而第二种(一般情况)还需要计算二阶中心矩。
- 情形一(特殊情况)
所以其矩估计为. - 情形二(一般情况)
令
解得
- 指数分布
因此其矩估计为. - 正态分布
算总体的一阶、二阶原点矩
以及样本的一阶、二阶原点矩
所以得到方程组
解上述方程,得均值和方差的矩估计
区间估计
这部分的内容比较多,因为涉及到的情况分类多。不过编程不难,直接根据公式与对应的适应情况进行编程即可,主要用到了if-else
条件分支语句。
一个正态总体的置信区间
已知时,的区间估计
未知时,的区间估计
方差的区间估计
两个正态总体的置信区间
- 使用函数
t.test()
进行检验的一部分结果即为置信区间
均值差的置信区间
配对数据情形均值差的置信区间
配对数据作差,然后做单样本t检验,其中含有差的变化的区间估计
方差比的区间估计
已知
非正态总体的区间估计
采用中心极限定理进行推导
首先进行数据标准化,当充分大时,有
参数的区间估计(已知)
参数的区间估计(未知)
编程得到
单侧置信区间
单个总体均值的单侧置信区间
单个总体方差的单侧置信区间
两个总体均值差的单侧置信区间
两个总体方差的置信区间