本文主要介绍了协整分析的基本方法和误差修正模型的应用。

目录

  • 协整与误差修正模型
  • 长期均衡与协整分析
  • 协整的定义
  • 协整的检验
  • 两变量 Engle-Granger 检验
  • 多变量协整关系检验
  • 一般差分模型的问题
  • 误差修正模型
  • 格兰杰表述定理
  • 建立误差修正模型的步骤
  • EG 两步法
  • 直接估计法

协整与误差修正模型

长期均衡与协整分析

经典回归模型是建立在平稳数据变量基础上的。许多经济变量是非平稳的,使用经典回归模型会出现伪回归等诸多问题。但是如果变量之间有着长期的稳定关系,即它们之间是协整的,则可以使用经典回归模型。

长期均衡意味着经济系统不存在破坏均衡的内在机制,如果变量在某时期受到干扰后偏离其长期均衡点,则均衡机制将会在下一期进行调整以使其重新回到均衡状态。

假设 \(X\) 与 \(Y\)

\[Y_t=\alpha_0+\alpha_1X_t+\mu_t \ . \]

这个式子对均衡关系的解释为:给定 \(X\) 的一个值,\(Y\) 相应的均衡值也随之确定为 \(\alpha_0+\alpha_1X\)

这个式子隐含了一个重要的假设:\(\mu_t\)

如果假设不成立,即 \(\mu_t\) 有上升或下降的随机性趋势。会导致 \(Y\)

在这个假设的基础上,我们称 \(\mu_t\) 为非均衡误差,它是变量 \(X\) 和 \(Y\)

\[\mu_t=Y_t-\alpha_0-\alpha_1X_t \ . \]

如果 \(X\) 与 \(Y\) 之间具有长期均衡关系,则 \(\mu_t\) 应是一零均值平稳时间序列,即零均值 \({\rm I}(0)\)

另一方面,非平稳的时间序列 \(X\) 和 \(Y\) 的线性组合可能成为平稳时间序列,我们称 \(X\) 和 \(Y\)

协整的定义

如果时间序列 \(Y_{t1},Y_{t2},...,Y_{tk}\) 都是 \(d\) 阶单整的,存在向量 \(\boldsymbol\alpha=(\alpha_1,\alpha_2,...,\alpha_k)\),使得


误差修正模型VEC python 误差修正模型系数解释_差分


则称序列 \(Y_{t1},Y_{t2},...,Y_{tk}\) 是 \((d,\,b)\) 阶协整,记为 \({\rm CI}(d,\,b)\)

如果两个变量都是单整变量,只有当它们的单整阶数相同时,才可能协整;如果它们的单整阶数不相同,就不可能协整。

如果存在三个以上的单整变量且具有不同的单整阶数,有可能经过线性组合构成低阶单整变量。

例如:\(W_t\sim{\rm I}(1)\) ,\(V_t\sim{\rm I}(2)\) ,\(U_t\sim{\rm I}(2)\)

若进行以下的线性变换并满足以下条件:


\[P_t=aV_t+bU_t\sim{\rm I}(1) \ , \]



\[Q_t=cW_t+dP_t\sim{\rm I}(0) \ , \]


则有结论:


\[V_t,\,U_t\sim{\rm CI}(2,\,1) \ , \]



\[W_t,\,P_t\sim{\rm CI}(1,\,1) \ . \]


\({\rm CI}(d,\,d)\) 的经济意义:两个变量虽然它们具有各自的长期波动规律,但是如果它们是 \((d,d)\)

协整的检验

两变量 Engle-Granger 检验

检验两个呈现 \({\rm I}(1)\) 的变量 \(y_t,\,x_t\)

step.1 用 OLS 估计如下方程并计算非均衡误差(该回归又被称为协整回归、静态回归):

\[y_t=\alpha_0+\alpha_1x_t+\mu_t \ , \]

得到

\[e_t=y_t-\hat{y}_t=y_t-\hat{\alpha}_0+\hat{\alpha}_1x_t \ . \]

step.2 检验 \(e_t\)

如果 \(e_t\) 是平稳序列 \({\rm I}(0)\) ,则 \(y_t,x_t\sim {\rm CI}(1,1)\), \(x_t\) 与 \(y_t\)

如果 \(e_t\) 是非平稳的,则 \(x_t\) 与 \(y_t\)

检验方法:DF 检验或 ADF 检验

\[\Delta e_t=\delta e_{t-1}+\sum_{i=1}^p\theta_i\Delta e_{t-i}+\varepsilon_t \ . \]

注意:这里的检验对象是协整回归计算出的误差项,并非真正的非均衡误差。而 OLS 法采用了最小残差平方和的原理,因此估计量 \(\delta\) 是向下偏倚的,这将导致拒绝零假设的机会比实际情形大。因此对于 \(e_t\)

多变量协整关系检验

扩展的 EG 检验

为什么多变量协整关系的检验比双变量复杂?——协整变量间可能存在多种稳定的线性组合。

例如:假设有4个 \({\rm I}(1)\) 的变量 \(Z,X,Y,W\)


\[Z_t=\alpha_0+\alpha_1W_t+\alpha_2X_t+\alpha_3Y_t+\mu_t \ , \]


得到非均衡误差 \(\mu_t\) 是 \({\rm I}(0)\)


\[\mu_t=Z_t-\alpha_0-\alpha_1W_t-\alpha_2X_t-\alpha_3Y_t\sim{\rm I}(0) \ . \]


但存在另一种情况,假设 \(Z\) 与 \(W\) ,\(X\) 与 \(Y\)


\[Z_t=\beta_0+\beta_1W_t+u_t \ , \]



\[X_t=\gamma_0+\gamma_1Y_t+v_t \ , \]


则非均衡误差项 \(u_t\) 和 \(v_t\) 一定是平稳序列 \({\rm I}(0)\)


\[w_t=u_t+v_t=Z_t-\beta_0-\gamma_0-\beta_1W_t+X_t-\gamma_1Y_t\sim{\rm I}(0) \ . \]


因此存在多组协整向量。

多变量的协整检验步骤:

  • 与双变量基本相同,需要检验变量是否具有同阶单整性,以及是否存在稳定的线性组合
  • 在检验是否存在稳定的线性组合时,需要通过设置一个变量为被解释变量,其他变量为解释变量,进行 OLS 估计并检验残差序列是否为平稳序列。如果不平稳则需更换被解释变量,进行同样的 OLS 估计和相应的残差序列的平稳性检验。
  • 当所有的变量都被作为被解释变量检验之后,仍不能得到平稳的残差项序列,则认为这些变量间不存在 \((1,\,1)\)

一般差分模型的问题

对于非平稳时间序列,可以通过差分的方法将其化为稳定序列。

\[Y_t=\alpha_0+\alpha_1X_t+\mu_t \ , \]

\[\Delta Y_t=\alpha_1\Delta X_t+v_t \ , \]

\[v_t=\mu_t-\mu_{t-1} \ . \]

但是这种做法会引起两个问题:

  • 如果 \(X\) 与 \(Y\) 之间存在长期稳定的均衡关系,且误差项 \(\mu_t\) 不存在序列相关性,则差分式中的 \(v_t\)
  • 如果采用差分形式进行估计,则关于变量水平值的重要信息将被忽略,这时的模型只表达了 \(X\) 和 \(Y\)

例如,当我们使用 \(\Delta Y_t=\alpha_1\Delta X_t+v_t\) 进行回归分析时,容易出现截距项显著不为 \(0\)


\[\Delta Y_t=\hat\alpha_0+\hat\alpha_1\Delta X_t+\hat{v}_t\ , \ \ \ \ \hat\alpha_0\neq0 \ . \]


此时即使保持 \(X\) 不变, \(Y\) 也会出于长期的上升或下降的过程中,这意味着 \(X\) 与 \(Y\)

误差修正模型

假设 \(X_t\) 与 \(Y_t\)

\[Y_t=\alpha_0+\alpha_1X_t+u_t \ , \]

由于现实经济中 \(X\) 与 \(Y\) 很少处在均衡点上,因此实际观测到的只是 \(X\) 与 \(Y\) 之间的短期或非均衡的关系。假设 \(X\) 与 \(Y\) 之间的非均衡关系体现为如下 \((1,\,1)\) 阶分布滞后模型的形式:

\[Y_t=\beta_0+\beta_1X_t+\beta_2X_{t-1}+\delta Y_{t-1}+u_t \ , \]

该模型显示出 \(t\) 期的 \(Y\) 不仅与 \(X\) 的变化有关,而且与 \(t-1\) 期的 \(X\) 与 \(Y\)

差分变形得

\[\begin{aligned} \Delta Y_t & = \beta_0+\beta_1\Delta X_t+(\beta_1+\beta_2)X_{t-1}-(1-\delta)Y_{t-1}+u_t \\ \\ &=\beta_1\Delta X_t-(1-\delta)\left(Y_{t-1}-\dfrac{\beta_0}{1-\delta}-\dfrac{\beta_1+\beta_2}{1-\delta}X_{t-1}\right)+u_t \\ \\ &\triangleq \beta_1\Delta X_t-\lambda(Y_{t-1}-\alpha_0-\alpha_1X_{t-1})+u_t \ . \end{aligned} \]

将上式中的参数与 \(Y_t=\alpha_0+\alpha_1X_t+u_t\) 中的相应参数视为相等,则上式中参数 \(\lambda\) 之后的项为 \(t-1\) 期的非均衡误差项。这表明 \(Y\) 的短期变化 \(\Delta Y_t\) 不仅受 \(X\) 的短期变化 \(\Delta X_t\) 影响,而且根据前一时期的非均衡程度 \({\rm ecm}_{t-1}\)

误差修正项 \({\rm ecm}\)

\[{\rm ecm}_{t-1}=Y_{t-1}-(\alpha_0+\alpha_1X_{t-1}) \ , \]

一阶误差修正模型

\[\Delta Y_t=\beta_1\Delta X_t-\lambda \cdot {\rm ecm}_{t-1}+u_t \ , \]

一般情况下 \(|\delta|<1\),有 \(0<\lambda<1\)

据此分析 ECM 模型的修正作用:

  • 若上期的实际值大于长期均衡值,即 \(Y_{t-1}>\alpha_0+\alpha_1X_{t-1}\),则 \({\rm ecm}\) 为正,当期的短期变动 \(\Delta Y_t\)
  • 若上期的实际值小于长期均衡值,即 \(Y_{t-1}<\alpha_0+\alpha_1X_{t-1}\),则 \({\rm ecm}\) 为负,当期的短期变动 \(\Delta Y_t\)

参数的经济意义:

  • 长期均衡模型 \(Y_t=\alpha_0+\alpha_1X_t+u_t\) 中的 \(\alpha_1\) 可视为 \(Y\) 关于 \(X\)
  • 短期非均衡模型 \(Y_t=\beta_0+\beta_1X_t+\beta_2X_{t-1}+\delta Y_{t-1}+u_t\) 中的 \(\beta_1\) 可视为 \(Y\) 关于 \(X\)

格兰杰表述定理

问题:是否变量间的关系都可以通过 ECM 来表述?

Granger 表述定理:如果变量 \(X\) 与 \(Y\)

\[\Delta Y_t={\rm lagged}(\Delta Y,\,\Delta X)-\lambda\cdot{\rm ecm}_{t-1}+u_t \ , \ \ \ \ 0<\lambda<1 \ . \]

其中,\({\rm ecm}\) 是非均衡误差项(长期均衡偏差项),\(\lambda\) 是短期调整参数。该模型没有明确指出 \(Y\) 和 \(X\) 的滞后阶数,可以包含多阶滞后项。由于一阶差分项是 \({\rm I}(0)\) 变量,因此模型中允许采用 \(X\) 的非滞后差分项 \(\Delta X_t\)

建立误差修正模型的步骤

首先,对经济系统进行观察和分析,提出长期均衡关系假设。

然后,对变量进行协整分析,以发现变量之间的协整关系,即检验长期均衡关系假设,并以这种关系构成误差修正项。

最后,建立短期模型,将误差修正项看作一个解释变量,连同其他反映短期波动的解释变量一起,建立短期模型,即误差修正模型。

EG 两步法

step.1 利用 OLS 进行协整回归,检验变量间的协整关系,估计协整向量(长期均衡关系参数)

误差修正模型VEC python 误差修正模型系数解释_差分_02

step.2 若协整性存在,则以第一步求得的残差作为非均衡误差项 \({\rm ecm}\)

误差修正模型VEC python 误差修正模型系数解释_时间序列_03

在确定 ECM 模型滞后项阶数时,需要先对模型进行回归,之后检验 ECM 模型的残差是否具有自相关性,或者采用 \(Q\)

注意:在进行变量间的协整检验时,如有必要可在协整回归式中加入趋势项,这时对残差项的稳定性检验就无须设置趋势项。另外,第二步中变量的差分滞后期数,可以通过残差项序列是否存在自相关性来判断,如果存在自相关,则应加入变量差分后的滞后项。

注意:在实际应用研究中,如果 ECM 中误差修正项参数估计值为正,模型设定肯定是错误的。在实际分析的模型设定中,变量常以对数的形式出现,原因在于变量对数的差分近似地等于该变量的变化率,而经济变量的变化率常常是平稳序列。

直接估计法

打开误差修正模型中非均衡误差项的括号,直接用 OLS 估计模型,以双变量为例

误差修正模型VEC python 误差修正模型系数解释_误差修正模型VEC python_04

误差修正模型VEC python 误差修正模型系数解释_时间序列_05

这时可以一并获得短期弹性和长期弹性的参数估计值,但仍然需要事先对变量间的协整关系进行检验。