主要介绍时间序列模型的基本概念和基本假设,重点在于一般时间序列模型的趋势项和季节项的分解。

目录

  • 时间序列模型
  • 时间序列介绍
  • 模型设定
  • 模型假设
  • 趋势和季节性
  • 描述有趋势的时间序列
  • 含时间趋势的回归
  • 描述有季节性的时间序列
  • 含季节性的回归

时间序列模型

时间序列介绍

在介绍随机误差项的序列相关问题的时候,我们简单引入了时间序列的相关概念,但在本质上,序列相关问题仍然是基于计量经济学经典假设的条件下所展开的研究内容,并没有体现出时间序列数据所独有的一系列特征。从这一节开始,我们进入时间序列模型的讨论。

时间序列数据指的是一系列以时间为顺序的随机变量 \(\{\cdots,X_1,X_2,\cdots,X_t,\cdots\}\) ,即 \(\{X_t,\,t\in T\}\)

任何时间序列经过合理的函数变换后都可以被认为是由三个部分叠加而成的:趋势项部分、周期项部分和随机噪声项部分。

\[X_t=T_t+S_t+R_t \ , \ \ \ \ t=1,2,\cdots
\]

时间序列在适当的去掉趋势项和季节项后,剩下的随机部分通常会有某种平稳性。带有平稳性的时间序列是时间序列分析研究的重点。

模型设定

我们先将截面数据模型“改造”为时间序列模型。在截面数据中,我们认为每一个下角标 \(i\) 都表示一次样本观测。事实上,只要我们按照时间的顺序观测得到样本,并用时间 \(t\) 代替下角标 \(i\)

静态模型:

\[Y_t=\beta_0+\beta_1X_{t1}+...+\beta_kX_{tk}+u_t \ ,
\]

有限分布滞后模型 (FDL) :

单个解释变量的情况

\[Y_t=\beta_0+\delta_0X_t+\delta_1X_{t-1}+...+\delta_kX_{t-k}+u_t \ ,
\]

多个解释变量的情况(以二元为例)

\[Y_t=\beta_0+\delta_0X_{t,1}+...+\delta_kX_{t-k,1}+\gamma_0X_{t2}+...+\gamma_kX_{t-k,2}+u_t \ .
\]

模型假设

由于时间序列数据在小样本下容易表现出一些和截面数据不同的特征,所以我们需要对截面分析中所做的假定加以修改。

TS.1 线性于参数

随机过程 \(\{(X_{t1},X_{t2},\cdots,X_{tk},Y_t):t=1,2,\cdots,T\}\)

\[Y_t=\beta_0+\beta_1X_{t1}+\beta_2X_{t2}+...+\beta_kX_{tk}+u_t \ ,
\]



其中 \(\{u_t:t=1,2,\cdots,T\}\) 是随机误差项,\(T\)

本质上,假定 TS.1 等同于假定 MLR.1 ,但是在时间序列数据中,我们可以将某个解释变量或被解释变量的滞后项作为模型的解释变量,例如: \(X_{t1}=Z_t,\,X_{t2}=Z_{t-1},\,X_{t3}=Z_{t-2}\)

TS.2 不存在完全共线性

在样本中(时间序列过程中),没有任何自变量是恒定不变的,或者是其他自变量的一个完全线性组合。

不存在完全共线性的问题对时间序列数据而言在本质上和截面数据是一样的。事实上,时间序列的解释变量之间产生统计意义上的相关性是很常见的,但我们的底线是保证 OLS 能够正常估计,因此不容许样本中出现完全相关。

TS.3 零条件均值

对每一个 \(t\) ,给定所有时期的解释变量,误差项 \(u_t\) 的期望值为 \(0\)

\[{\rm E}(u_t|\boldsymbol{X})=0 \ , \ \ \ \  t=1,2,\cdots,T \ ,
\]


\[\boldsymbol{X}=\left(X_{t1},X_{t2},...,X_{tk}\right)\big|_{\,t=1}^{\,T}\ .
\]



这里的 \(\boldsymbol{X}\) 是一个 \(T\times k\)

  • 严格外生:\(t\) 时期的误差项 \(u_t\)
  • 同期外生:\({\rm E}(u_t|X_{t1},...,X_{tk})=0\)

假定 TS.3 不仅仅要求同期外生,解释变量必须是严格外生的。在统计性质上,同期外生条件下,OLS 估计量一致;严格外生条件下,OLS 估计量无偏。这一点我们不作证明。

TS.4 同方差性

以 \(\boldsymbol{X}\) 为条件,在所有时期 \(t\) ,\(u_t\)

\[{\rm Var}(u_t|\boldsymbol{X})={\rm Var}(u_t)=\sigma^2 \ , \ \ \ \ t=1,2,\cdots,T \ ,
\]


\[\boldsymbol{X}=\left(X_{t1},X_{t2},...,X_{tk}\right)\big|_{\,t=1}^{\,T}\ .
\]



这个假定意味着 \({\rm Var}(u_t|\boldsymbol{X})\) 不能依赖于 \(\boldsymbol{X}\) ,而且 \({\rm Var}(u_t)\)

TS.5 无序列相关

以 \(\boldsymbol{X}\)

\[{\rm Corr}(u_t,\,u_s|\boldsymbol{X})=0 \ , \ \ \ \ \forall t\neq s \ .
\]



事实上,当这个假定不成立时的情况我们已经在上一节笔记中讨论过。但我们需要思考一个这样一个问题:为什么在截面数据中不假定随机误差项是序列无关的呢?答案在于随机抽样的假定:当抽样时随机的时候,对于任意两次观测 \(i\) 和 \(j\) ,\(u_i\) 和 \(u_j\)

TS.6 正态性

误差 \(u_t\) 独立于 \(\boldsymbol{X}\)

\[u_t\sim N(0,\,\sigma^2) \ .
\]



在正态性假定下,我们可以进行统计推断。

定理总结

在假定 TS.1 至 TS.3 下,以 \(\boldsymbol{X}\)

\[{\rm E}(\hat\beta_j)=\beta_j \ , \ \ \ \ j=0,1,2,\cdots,k \ .
\]

在时间序列高斯-马尔科夫假定 TS.1 至 TS.5 下,以 \(\boldsymbol{X}\) 为条件,\(\hat\beta_j\)

\[{\rm Var}(\hat\beta_j|\boldsymbol{X})=\frac{\sigma^2}{{\rm SST}_j(1-R_j^2)}  \ ,
\]

其中,\({\rm SST}_j\) 是 \(X_{tj}\) 的总平方和,\(R_j^2\) 是 \(X_j\)

在时间序列高斯-马尔科夫假定 TS.1 至 TS.5 下,以 \(\boldsymbol{X}\)

趋势和季节性

之前我们提到过,时间序列数据可以被认为是由趋势项部分、周期项部分和随机噪声项部分叠加而成。接下来我们讨论一下带有趋势项和季节项的时间序列如何处理。

描述有趋势的时间序列

很多经济时间序列都有随着时间而上升的共同趋势,为了能用时间序列数据做出正确的因果推断,我们必须将包含时间趋势的部分分离出来,从而避免认为一个变量的趋势性变化是由另一个变量的变化所致。以简单回归模型为例,我们常见的描述有趋势行为的统计模型如下所示:

线性时间趋势

\[Y_t=\alpha_0+\alpha_1t+\varepsilon_t \ ,
\]

其中,\(\varepsilon_t\) 是独立同分布序列且 \({\rm E}(\varepsilon_t)=0,\,{\rm Var}(\varepsilon_t)=\sigma^2\)

二次时间趋势

\[Y_t=\alpha_0+\alpha_1t+\alpha_2t^2+\varepsilon_t \ ,
\]

指数时间趋势

\[\log(Y_t)=\beta_0+\beta_1t+\varepsilon_t \ .
\]

含时间趋势的回归

在回归分析中引入有趋势的解释变量并不困难,因为趋势变量并不一定违背经典假设。很多时候,某些无法观测的趋势因素有可能既影响被解释变量 \(Y_t\) ,又影响解释变量 \(X_t\)

直接回归

第一种方法是直接将趋势项 \(t\)

\[Y_t=\beta_0+\beta_1X_{t1}+\beta_2X_{t2}+\beta_3t+u_t \ ,
\]

这里可以理解为解释变量 \(X_{t3}=t\) 的多元线性回归。这里的趋势项 \(t\) 的系数可以解释被解释变量 \(Y_t\) 中与 \(X_{t1}\) 和 \(X_{t2}\)

除趋势 (detrending)

第二种方法是将被解释变量 \(Y_t\) 和解释变量 \(X_{t1},\,X_{t2}\)

step.1 将 \(Y_t,\,X_{t1},\,X_{t2}\) 分别对常数项和时间趋势 \(t\) 回归,并记录残差为 \(\dot{Y}_t,\,\dot{X}_{t2},\,\dot{X}_{t2}\)

\[Y_t=\alpha_0+\alpha_1t+\varepsilon_t  \ ,
\]
\[\hat{Y}_t=\hat\alpha_0+\hat\alpha_1t \ ,
\]
\[\dot{Y}_t=Y_t-\hat{Y}_t \ .
\]

step.2 做 \(\dot{Y}_t\) 对 \(\dot{X}_{t1},\,\dot{X}_{t2}\)

\[\dot{Y}_t=\hat\beta_1\dot{X}_{t1}+\hat\beta_2\dot{X}_{t2} \ ,
\]

估计结果 \(\hat\beta_1\) 和 \(\hat\beta_2\) 与直接回归得到的结果相同。在这里截距项不是必要的,即使在第二步的回归中保留了截距项,估计出来的结果也将是 \(0\)

描述有季节性的时间序列

如果一个时间序列是每月或者每季度(甚至每周或每天)观测得到的,它就有可能表现出季节性变化。一般地,处理回归模型中季节性的简单办法就是引入季节虚拟变量。

假设我们有 \(s\)

无截距项的情况

\[Y_t=\sum_{i=1}^s\gamma_iD_i+\varepsilon_t \ ,
\]
\(\gamma_i\) 描述了第 \(i\)

含截距项的情况

\[Y_t=c+\sum_{i=1}^{s-1}\gamma_iD_i+\varepsilon_t \ ,
\]
\(\gamma_i\) 描述了第 \(i\) 个季节相对于第 \(s\)

含季节性的回归

直接回归

类似于含趋势项的回归,我们将解释变量 \(X_t\)

\[Y_t=\sum_{i=1}^s\gamma_iD_i+\beta_1X_t+\varepsilon_t \ ,
\]
\[Y_t=c+\sum_{i=1}^{s-1}\gamma_iD_i+\beta_1X_t+\varepsilon_t \ .
\]

一般地,我们选择带有截距项的回归模型。

除季节性 (deseasonalizing)

我们以引入含截距项的季节虚拟变量为例,除季节性回归的步骤如下:

step.1 将 \(Y_t,\,X_{t}\) 分别对常数项和季节项回归,并记录残差为 \(\dot{Y}_t,\,\dot{X}_{t}\)

\[Y_t=c+\sum_{i=1}^{s-1}\gamma_iD_i+\varepsilon_t \ ,
\]
\[\hat{Y}_t=\hat{c}+\sum_{i=1}^{s-1}\hat\gamma_iD_i \ ,
\]
\[\dot{Y}_t=Y_t-\hat{Y}_t \ .
\]
step.2 做 \(\dot{Y}_t\) 对 \(\dot{X}_{t}\)
\[\dot{Y}_t=\beta_1\dot{X}_{t}+\varepsilon_t \ ,
\]
估计结果 \(\hat\beta_1\)