VAR向量自回归模型学习笔记2

向量自回归模型

今天的你 和昨天的你 和前天的你,是否具有相关性。

1. 定义

向量自回归(VAR,Vector Auto regression)分析联合内生变量间的动态关系
联合:n个变量间的相互影响
动态:p期滞后
没有任何约束条件,因此又称为无约束向量自回归模型

  • VAR方法通过把系统中每一个内生变量,作为系统中所有内生变量的滞后值的函数来构造模型,从而回避了结构化模型的要求。Engle和Granger(1987a)指出两个或多个非平稳时间序列的线性组合可能是平稳的。假如这样一种平稳的或的线性组合存在,这些非平稳(有单位根)时间序列之间被认为是具有协整关系的。这种平稳的线性组合被称为协整方程且可被解释为变量之间的长期均衡关系。
  • VAR模型对于相互联系的时间序列变量系统是有效的预测模型,同时,向量自回归模型也被频繁地用于分析不同类型的随机误差项对系统变量的动态影响。如果变量之间不仅存在滞后影响,而不存在同期影响关系,则适合建立VAR模型,因为VAR模型实际上是把当期关系隐含到了随机扰动项之中

1.1 p阶VAR

\(Y_{t}=C+\Phi_{1} Y_{t-1}+\Phi_{2} Y_{t-2}+\cdots+\Phi_{p} Y_{t-p}+\varepsilon_{t}\)

其中\(Y_{t}=\left[\begin{array}{c}{y_{1 t}} \\ {y_{2 t}} \\ {\vdots} \\ {y_{n t}}\end{array}\right]\)
\(ε_t\)是n×1维的白噪声向量

VAR模型除了研究自身滞后项的影响之外,还研究其他相关因素对未来值产生的影响

\(y_{t}=\beta_{1} \cdot y_{t-1}+\alpha_{1} \cdot x_{t-1}+\beta_{2} \cdot y_{t-2}+\alpha_{2} \cdot x_{t-2}+\ldots\)


其中\(x_{t-1}\)就是其他因素的滞后项。
【详细推导】 因此VAR模型结合了多元时间序列的以及多元回归模型的优点

2 特点

VAR模型不以严格的经济理论为依据因此建模的时候只需要明确两件事
1.哪些变量应该进入模型,变量间应该具有相关关系——格兰杰因果检验
2.滞后阶数p的确定,保证残差刚好不存在自相关
3.var模型对参数不施加零约束(这个不懂)
4.var模型需要估计的参数比较多,当有3个变量,最大滞后阶数p=2时,则有\(2*3^2\)=18个需要估计
5.需要大样本
6.VAR模型的解释变量中不含t期变量
7.没有强制要求所有的变量均为内生变量

补充一个内生变量和外生变量的解释因此VAR模型结合了多元时间序列的以及多元回归模型的优点

3 步骤

3.1 平稳性检验

  • 先检验序列的平稳性,看序列是否平稳,或者一阶单整,或者更高阶;
  • VAR模型要求所有因子数据同阶协整,也就是N个因子里面如果有一个因子数据不平稳,就要全体做差分,一直到平稳为止

3.2 判断滞后阶数

根据AIC SBC等准则选择Var模型的滞后阶数

在VAR模型中解释变量的最大滞后阶数p太小,残差可能存在自相关,并导致参数估计非一致性,适当加大p值。也就是增加滞后变量个数,可消除残差的存在的自相关,但是P值又不能太大,p值过大,直接影响模型参数参数估计的有效性

AIC 最小信息准则和SC施瓦茨准则确定p值,确定p值的方法与原则就是在p值增加的过程中,AIC和SC同时最小

\(\mathrm{AlC}(\mathrm{p})=\operatorname{lndet}\left(\hat{\Sigma}_{p}\right)+\frac{2 n^{2} p}{T}\)
\(\mathrm{BIC}(\mathrm{p})=\operatorname{lndet}\left(\hat{\Sigma}_{p}\right)+\frac{n^{2} p \ln T}{T}\)

n是向量维数,T是样本长度,ph滞后长度,ln表示自然对数,det表示对矩阵求行列式,\((\hat{\Sigma}_{p}\)是当滞后长度为p时,残差向量白噪声协方差矩阵估计

因此对于年度,基督数据,一般比较到p=4,分别建立VAR(1),VAR(2)...VAR(4)模型比较AIC,SC,使它们同时取得最小的p值
对于月度数据一般取到p=12

当AIC,SC的最小值对应不同的p值时,只能用LR检验(这个查下)

定阶完成后就是参数估计,看参数的显著性

1.AR检验,VAR模型特征方程的绝对值的倒数要在单位园里面
2,cusum检验,模型残差积累和在一个区间内波动,不超出区间(不懂)

cusum检验的原假设,系数平稳,北泽假设是不平稳,所以cusum结果是无法拒绝原假设才算通过,只有通过参数稳定性检验的模型才具有预测能力,进行脉冲响应和方差分解才有意义

3.3 VAR模型稳定的条件

对于VAR(1)模型

\(Y_{t}=c+\Pi_{1} Y_{t-1}+u_{t}\)


模型稳定的条件是特征方程\(|\Pi_{1}-{\lambda}I|=0\)的根都在单位圆以内,或者相反的特征方程\(|I-L{\Pi_{1}}|=0\)的根都在单位圆外

对于K>1的VAR模型,可以通过矩阵变化写成分块矩阵的VAR(1)模型

\(Y_{t}=\mathbf{C}+\mathbf{A} Y_{t-1}+\mathbf{U}_{t}\)


模型稳定的条件是特征方程\(|A-{\lambda}I|=0\)在单位圆内,或者与其相反的特征方程在全部根在单位圆外

3.4 协整检验

3.5 格兰杰因果检验

3.6 脉冲响应

看变量对外界的冲击
在实际应用中,由于VAR模型是一种非理论性的模型,它无需对变量做任何先验性的约束,因此在分析VAR模型的时候,往往不分析一个变量的变化对另一个变量的影响如何,而是分析一个误差项发生的变化,或者说模型受到某种冲击时对系统的动态影响

3.7 方差分解

通过分析每一个结构冲击对内生变量变化(通常用方差来衡量)的贡献度,进一步评价不同结构冲击的重要性,因此方差分解给出对VAR模型中的变量产生影响的每个随机扰动的相对重要信息。

VAR模型不是为了回归系数,而是为了方差分解和脉冲响应分析

4 伪回归

若是所建立的回归模型在经济意义上没有因果关系,那么这个就是伪回归,例如路边小树年增长率和国民经济年增长率之间存在很大的相关系数,但是建立的模型却是伪回归。如果你直接用数据回归,那肯定存在正相关,而其实这个是没有意义的回归

5 平稳性检验

单位根检验是序列的平稳性检验,如果不检验序列的平稳性直接OLS容易导致伪回归
因此当检验的数据是平稳的(即不存在单位根),即意思是单位根检验的原假设是存在单位根,存在单位根,则不平稳,等价关系!
要想进一步考察变量的因果联系,可以采用格兰杰因果检验。

5.1 平稳性检验的三个作用

1)检验平稳性,若平稳,做格兰杰检验,非平稳,作协正检验。
2)协整检验中要用到每个序列的单整阶数
3)当检验的数据是非平稳(即存在单位根),并且各个序列是同阶单整(协整检验的前提),想进一步确定变量之间是否存在协整关系,可以进行协整检验,协整检验主要有EG两步法和JJ检验 (1)、EG两步法是基于回归残差的检验,可以通过建立OLS模型检验其残差平稳性 (2)、JJ检验是基于回归系数的检验

单位根检验在R里面需要用到adf.test()函数

5.2 单位根检验

单位根检验是检验数据的平稳性,或是说单整阶数
协整是说两个或多个变量之间具有长期的稳定关系,但变量间协整的必要条件是它们之间是同阶单整,也就是说在进行协整检验之前必须进行单位根检验

协整说的是变量之间存在长期的稳定关系,这只是从数量上得到的结论,但不能确定谁是因,谁是果。而因果关系检验解决的就是这个问题。

单位根检验是检验时间序列是否平稳,协整是在时间序列平稳性的基础上做长期趋势的分析,而格兰杰检验一般是在建立误差修正模型后,所建立的短期的因果关系。故顺序自然是先做单位根检验,再过协整检验,最后是格兰杰因果检验。

单位根检验是对时间序列平稳性的检验,只有平稳的时间序列,才能进行计量分析,否则会出现伪回归现象;
协整是考察两个或者多个变量之间的长期平稳关系;
格兰杰因果检验是考察变量之间的因果关系,协整说明长期稳定关系不一定是因果关系,所以需要在通过格兰杰因果检验确定两者的因果关系。
顺序一般是单位根检验,通过后如果同阶单整,在进行协整,然后在进行因果检验。要特别注意的是:只有同阶单整才能进行协整

6 协整

协整检验是用来分析变量之间的长期均衡关系,在协整分析两变量的过程中,如果自变量和因变量是协整的,我们就可以确信这两变量不会产生伪回归结果并且这两个变量存在长期稳定的关系。

协整的要求或前提是同阶单整

就是说,单整阶数不同的两个或以上的非平稳序列如果一起进行协整检验,必然有某些低阶单整的,即波动相对高阶序列的波动甚微弱(有可能波动幅度也不同)的序列,对协整结果的影响不大,因此包不包含的重要性不大。而相对处于最高阶序列,由于其波动较大,对回归残差的平稳性带来极大的影响,所以如果协整是包含有某些高阶单整序列的话(但如果所有变量都是阶数相同的高阶,此时也被称作同阶单整,这样的话另当别论),一定不能将其纳入协整检验。

7 格兰杰因果

1.格兰杰因果检验是检验统计上的时间先后顺序,并不表示而这真正存在因果关系,是否呈因果关系需要根据理论、经验和模型来判定。

2.关于格兰杰因果检验若X都不是Y的格兰杰原因,这并不是说X与Y之间毫无关系。格兰杰因果检验本身也不是真实意义上检验变量的因果关系,而只是检验变量在统计上的时间先后顺序。

3.格兰杰检验只能用于平稳序列!这是格兰杰检验的前提,而其因果关系并非我们通常理解的因与果的关系,而是说x的前期变化能有效地解释y的变化,所以称其为“格兰杰原因”。