下面介绍的是用G-Q检验法检验异方差是否存在,以及如何在Eviews中操作,借ESDN这个平台记录自己的学习心得,同时希望各路大佬批评指正。

##残差
在回归分析中,除了回归模型设立的解释变量(自变量)之外,还有许多影响被解释变量(因变量)的其他因素,同时在测量过程中也有可能产生误差。我们将上述原因产生的误差称为随机误差。
以ei=yi—yi^作为随机误差的无偏估计量

##OLS参数估计的基本假定
1、解释变量之间相互独立,即a1x1+a2x2+……anxn=0,不存在不全为0的数a1,a2……使得等式为0(多重共线性问题)
2、随机误差项具有零均值和同方差(异方差)
3、随机误差项在不同的样本点之间是不相关(在正态假定下相互独立)
4、随机误差项均服从标准正态分布
5、随机误差项与解释变量之间也相互独立(异方差)

异方差

###产生原因
~异方差既有可能存在于截面数据中,也有可能出现在时间序列中。每一个解释变量都有可能造成异方差。
1、由于测量误差引起的异方差常出现于时间序列中。随着时间的推移,测量误差常常在一定时间内逐渐积累,误差趋于增加,而抽样技术的改进又会使测量误差减少。
2、异方差更常出现于截面数据中。由于测量主体单位的规模,结构不同,随机误差项有随着解释变量变化而变化的趋势。(随机误差项与自变量间具有相关性)

###后果
1、使用OLS得到的参数估计量仍具有线性无偏性,一致性,但不具有有效性。(即使得样本预测值波动较大,接近真实值的概率不是最大)
2、t值失真
3、预测结果失去意义
4、异方差模型中的方差不再具有最小方差性

##G-Q检验法检验异方差存在
原理:

  • 一元线性回归分析中,先对自变量x进行排序(默认为由小到大排序ascending)
  • 删除中间的1/4个样本,对前后两个子样本分别作线性回归,得到残差平方和sum of squares residuals
  • 因为异方差模型中,ei服从(0,σi2)的正态分布,因此构建F统计量(∑e1^2/n1-1)/(∑e2²/n2-1)。
  • 原假设H0:不存在异方差
  • 备择假设H1:存在异方差
    若计算得到的F>Fα,则拒绝原假设,表明存在异方差

#Eviews中用G-Q检验法实现异方差检验

gls回归模型 gls回归eviews_方差


应先检验是否符合线性回归模型的基本假设(异方差,多差共线性,自相关)

先导入数据

data y x1 x2 x3 x4 x5

每一个解释变量都有可能会造成异方差,这里我们选择x2进行排序将样本分为两个子样本

gls回归模型 gls回归eviews_时间序列_02


在对x2排序之后,会带来一个问题,就是序号会随着排序的变化而发生变化

gls回归模型 gls回归eviews_gls回归模型_03

笔者目前只想出了重新构造一个新的序列去保存x2’和y’的笨拙方法

gls回归模型 gls回归eviews_时间序列_04


gls回归模型 gls回归eviews_gls回归模型_05


之后就可以对x2分成的两个子样本和y作回归分析,得到相对应的残差平方和并构造F统计量

在菜单中,选择Quick->equation estimation

y2 c series
ls-(least squares)
sample(1-4)
sample(8-12)

gls回归模型 gls回归eviews_时间序列_06


sum squared residual=10355.33

gls回归模型 gls回归eviews_gls回归模型_07


sum squared residual=613.3505F=(613.3505/2)/(10355.33/3)=0.059

因为F<Fα,因此接受同方差原假设,我们用x2-ei或者x2-ei²关系图来验证

gls回归模型 gls回归eviews_大数据_08


gls回归模型 gls回归eviews_大数据_09


xi与residual关系图主要看的是密度,而ei²代表var(ei),所以xi与ei²关系图看ei²的变化趋势

由图,确实可以证明,x2并不会导致异方差的发生