1.矩估计
矩估计是什么呢?简单的说,就是用样本矩代替总体矩进行统计推断的方法。
一个最基础的例子是正态总体的参数估计问题。如果,如何估计和呢? 统计学一般会介绍两种估计方法:极大似然估计和矩估计。
总体矩条件:
样本矩条件:
= Op(1) ;
1.1 OLS估计
OLS估计是矩估计的一个特例。OLS估计的公式为:
由于和无关,则
其中是总体矩条件,对应的样本矩条件为:,得到:
另一种推导方法:
1.2 IV估计
满足条件:,因此总体矩条件为:,对应的样本矩条件为:,得到: 另一种推导方法:
2.广义矩估计
2.1 为什么要使用广义矩估计
GMM 是矩估计(MM)的推广。在恰好识别情况下(待估参数个数等于矩条件个数),目标函数的最小值等于 0,GMM 估计量与 MM 估计量等价;然而在过度识别情况下(待估参数个数小于矩条件个数),MM 不再适用,GMM 可以有效地组合矩条件,使 GMM 比 MM 更有效。
在估计正态分布和的例子中,我们只使用了两个矩条件。然而我们知道,正态分布的矩是有无穷多个可以用的,那么我们是不是可以使用更多的矩条件呢(更多的矩条件意味着更多的信息)?但是有个问题不好解决。在这个例子里面,我们有两个未知参数,如果只使用一阶矩,那么只有一个方程解两个未知数,显然是不可能的。像上面一样,我们用两个矩条件解两个未知数,就解出来了。然而,当我们用一到三阶矩,总共三个方程求解的时候,三个方程求解两个未知数,可能无解。方程数多了,反而没有解了,为什么呢?其实很简单,用三个方程中的任意两个方程,都可以求出一组解,那么三个方程我们就可以求出三组解。所以应该如何把这些矩条件都用上呢?到这里我们不妨引入一些记号。
我们可以得到一个3*1的列向量,并且:
用样本矩代替总体矩:
解这个方程应该就可以得到参数θ的估计。但是正如上面所说的,三个方程两个未知数,并不能确保这个方程有解,所以必须想一些其他办法。由于上面的g函数是一个3*1的列向量,我们可以使用一个权重矩阵W来赋予每个矩条件以不同的权重:
只要这个W是一个正定矩阵,那么仍然可以保证每个样本矩都足够贴近于0。那么问题来了,既然对W的要求只要求正定矩阵,那么使用不同的权重矩阵就有可能得到不同的结果。问题是,有没有一个最优的权重矩阵呢?当然是有的。可以证明,最优的权重矩阵应该是:
2.2 IV估计
总体矩条件:,代入上面的公式,最优权重矩阵(的逆)为:
把最优权重矩阵代入1式:
对上式左右两边同时乘以:
对2式求一阶导得:
矩阵求导公式 参考
由3式子得到:
令,则,正是两阶段最小二乘的第二步。
,其中,正是两阶段最小二乘的第一步
两阶段最小二乘的推导:
阶段一:
工具变量Z回归X,得到X拟合值。
阶段二: X拟合值回归Y,得到与用广义矩估计得到的4式相同
附录
一、矩阵形式表示线性回归
线性回归表达形式:
用矩阵形式表达为:;
或者,两种矩阵表示形式的X不一样
其中:
二、参考资料
GMM估计内生性工具变量与GMM估计 如何用简单的例子解释什么是 Generalized Method of Moments (GMM)?GMM-简介及实现范例