下面介绍的是用G-Q检验法检验异方差是否存在,以及如何在Eviews中操作,借ESDN这个平台记录自己的学习心得,同时希望各路大佬批评指正。
##残差
在回归分析中,除了回归模型设立的解释变量(自变量)之外,还有许多影响被解释变量(因变量)的其他因素,同时在测量过程中也有可能产生误差。我们将上述原因产生的误差称为随机误差。
以ei=yi—yi^作为随机误差的无偏估计量
##OLS参数估计的基本假定
1、解释变量之间相互独立,即a1x1+a2x2+……anxn=0,不存在不全为0的数a1,a2……使得等式为0(多重共线性问题)
2、随机误差项具有零均值和同方差(异方差)
3、随机误差项在不同的样本点之间是不相关(在正态假定下相互独立)
4、随机误差项均服从标准正态分布
5、随机误差项与解释变量之间也相互独立(异方差)
异方差
###产生原因
~异方差既有可能存在于截面数据中,也有可能出现在时间序列中。每一个解释变量都有可能造成异方差。
1、由于测量误差引起的异方差常出现于时间序列中。随着时间的推移,测量误差常常在一定时间内逐渐积累,误差趋于增加,而抽样技术的改进又会使测量误差减少。
2、异方差更常出现于截面数据中。由于测量主体单位的规模,结构不同,随机误差项有随着解释变量变化而变化的趋势。(随机误差项与自变量间具有相关性)
###后果
1、使用OLS得到的参数估计量仍具有线性无偏性,一致性,但不具有有效性。(即使得样本预测值波动较大,接近真实值的概率不是最大)
2、t值失真
3、预测结果失去意义
4、异方差模型中的方差不再具有最小方差性
##G-Q检验法检验异方差存在
原理:
- 一元线性回归分析中,先对自变量x进行排序(默认为由小到大排序ascending)
- 删除中间的1/4个样本,对前后两个子样本分别作线性回归,得到残差平方和sum of squares residuals
- 因为异方差模型中,ei服从(0,σi2)的正态分布,因此构建F统计量(∑e1^2/n1-1)/(∑e2²/n2-1)。
- 原假设H0:不存在异方差
- 备择假设H1:存在异方差
若计算得到的F>Fα,则拒绝原假设,表明存在异方差
#Eviews中用G-Q检验法实现异方差检验
应先检验是否符合线性回归模型的基本假设(异方差,多差共线性,自相关)
先导入数据
data y x1 x2 x3 x4 x5
每一个解释变量都有可能会造成异方差,这里我们选择x2进行排序将样本分为两个子样本
在对x2排序之后,会带来一个问题,就是序号会随着排序的变化而发生变化
笔者目前只想出了重新构造一个新的序列去保存x2’和y’的笨拙方法
之后就可以对x2分成的两个子样本和y作回归分析,得到相对应的残差平方和并构造F统计量
在菜单中,选择Quick->equation estimation
y2 c series
ls-(least squares)
sample(1-4)
sample(8-12)
sum squared residual=10355.33
sum squared residual=613.3505F=(613.3505/2)/(10355.33/3)=0.059
因为F<Fα,因此接受同方差原假设,我们用x2-ei或者x2-ei²关系图来验证
xi与residual关系图主要看的是密度,而ei²代表var(ei),所以xi与ei²关系图看ei²的变化趋势
由图,确实可以证明,x2并不会导致异方差的发生