文章目录
- @[toc]
- 1 什么是自相关
- 1.1 自相关概念
- 1.2 自相关产生的原因
- 1.3 自相关表现形式
- 2 自相关后果
- 2.1 对估计参数的影响
- 2.2 对模型检验的影响
- 3自相关检验
- 3.1相关图示法
- 3.2 DW检验
- 3.3 DW检验局限
- 4 自相关补救
- 4.1 广义差分法
- 4.2 Cochrane—Orcutt迭代法
- 4.3 差分法
- 4.4 德宾两步法
1 什么是自相关
1.1 自相关概念
自相关(auto correlation)又称序列相关(serial correlation),即总体回归模型的随机扰动项之间存在相关关系。在经典线性回归模型中,无自相关假定为
如果该假定不能满足,就称与存在自相关,即不同观测点上的误差项彼此相关。随机误差项与滞后一期的的自相关系数为
其中,称为一阶自相关系数。
- 当,与为正相关;
- 当,与为负相关;
- 当,与不相关。
1.2 自相关产生的原因
- 经济系统的惯性,例如通货膨胀不仅受到货币供给的影响,还受到过去通货膨胀的影响
- 经济活动的滞后效应。例如经济学中蛛网模型
- 数据处理造成的相关。
- 模型设定偏误。
1.3 自相关表现形式
样本观测期为的时间序列数据,总体回归模型的随机误差项为,自相关形式为
其中为自相关系数,满足古典假设,即,,。上述模型包含与形式,故称(1)为一阶自回归模型,记作。若中包含的成分,则需要从中提取,得到
式中为一阶自相关系数,为二阶自相关系数,满足古典假设误差项。并将称为误差项的二阶自回归,记作。一般地,若满足
其中为古典假设误差项,为阶自回归系数。
2 自相关后果
自相关与异方差均不服从球形扰动项假设,故自相关的的后果与异方差相同。以一元回归模型为例
其中存在一阶自相关,即,其中,,。在大样本条件下,的估计量为
在大样本条件下,与的相关系数为
由(1)式迭代得
式表明,误差项可以由服从独立同分布()的随机误差序列表示,其中权重为。当时表明权数为几何递减,当时表明权数为震荡交错衰减。的期望与方差为
当存在自相关时,扰动项的期望值为0,同方差。但方差协方差矩阵非对角线元素,即扰动项的协方差为
当时称为扰动项一阶协方差,称为扰动项的阶协方差。
2.1 对估计参数的影响
一元线性回归模型在满足经典假设条件下,斜率估计量为
存在自相关时,估量的期望,即无偏。但估量的方差推导过程利用了无自相关假设,即,于是
可以证明,当随机扰动项存在一阶自相关时,估计量的方差为
当,此时。不难看出,(5)的方差大于(4)式的方差,故在自相关条件下,估计量不再是最小的。方差增大,回归系数的标准误增大。当存在自相关时,容易证明,
当与为正相关时,(6)式与相比降低,进而低估了真实的,最终低估了(4)式的方差。
2.2 对模型检验的影响
自相关问题将低估参数的方差((5)与(6)表现),根据系数检验统计量,统计量被夸大,显著性夸大。类似的,模型显著性检验以及拟合优度也是不可靠的。模型预测方面,其预测精度降低,预测置信区间扩大。
3自相关检验
3.1相关图示法
- 与散点图:根据残差 与的走势判断正相关还是负相关
- 与散点图:如果随着时间的变化频繁地变化符号,说明存在负自相关;几个正的跟着几个负的,表明存在正相关。
3.2 DW检验
DW检验是J.Durbin(杜宾)和G.S.Watson(沃特森)于1951 年提出的一种适用于小样本的检验方法。DW检验的条件为
- 自变量非随机
- 随机误差仅为一阶自相关,即(不能处理高阶自相关情形)
- 线性模型不包含被解释变量滞后项(不能处理动态模型情形)
- 模型必须存在截距项
- 数据无缺失项
定义DW统计量
其中,将DW统计量展开,在大样本条件下,则
同理,在条件下,
从而有
由于,故。根据样本容量、解释变量个数(不包括常数),查DW分布表可得临界值,然后依据以下规则考察值
- ,误差项存在正相关
- ,无法判断
- ,无自相关
- ,无法判断
- ,误差项存在负相关
显然,当DW值接近0时,存在正相关,接近4时存在负相关,接近2时,不存在相关。注意:DW存在无法判断区域。
3.3 DW检验局限
- DW统计量具有前置条件
- DW检验上下界要求样本容量
- DW检验不适用于随机误差的高阶相关
- DW检验存在两个未知区域不能判定
4 自相关补救
4.1 广义差分法
一元线性回归模型
随机扰动项,,满足经典假设条件。将(7)滞后一期为
将(8)乘以相关系数并用(7)减之,得
其中满足经典假设条件,无自相关。令 ,, ,,得到
对(9)使用OLS得到参数最佳线性无偏估计量。由于广义差分失去了第一个观测值,一般使用与作为相应得补充。
4.2 Cochrane—Orcutt迭代法
一般未知,最简单得方法时通过DW计算,即
但该方法较为粗略。一种精确度较高得方法是Cochrane—Orcutt迭代法。步骤如下
- 使用OLS估计模型,并计算残差
- 利用残差作如下回归
- 利用上步计算的对模型作广义差分,令, , ,从而得到样本回归函数
- 利用与,将代入原回归模型得新的残差
- 利用残差作回归
用 OLS法估计的是对的第二轮估计值。给定误差项,当时,停止迭代。
4.3 差分法
使用条件:完全正自相关,即。设一阶线性回归模型,。将模型滞后一期并作差分得到
此时扰动项满足经典假设条件。从而消除自相关。但这种方法假定了扰动项存在完全正自相关,不具有推广性。
4.4 德宾两步法
自相关系数未知,可用德宾两步法消除自相关。将广义差分模型变形得到
- 将上式视为多元线性回归模型,利用ols法得到,视为参数得估计,但却时有偏但一致得估计。
- 利用进行广义差分求出序列 ,, 然后使用olsOLS对广义差分进行估计,求得最佳线性无偏估计。
-END-
参考文献
庞皓. 计量经济学[M].科学出版社