前言:在分析时间序列数据的ARIMA模型中,最重要的一步便是模型参数的判定。存在两种选定模型参数的方法,一是,借助ACF、PACF图的截尾、拖尾的阶数以及AIC、BIC等信息准则;二是,迭代p、q的值,并结合信息准则

拖尾和截尾

截尾:自相关函数(ACF)或偏自相关函数(PACF) 在某阶后突趋于0。

出现以下情况,通常视为(偏)自相关系数d阶截尾:

  1. 在最初的d阶明显大于2倍标准差范围
  2. 之后几乎95%的(偏)自相关系数都落在2倍标准差范围以内
  3. 且由非零自相关系数衰减为在零附近小值波动的过程非常突然

ARIMA 数据分析 arima数据要求_标准差

拖尾:ACF或PACF始终有非零取值,某阶后在0附近波动没有趋于0的趋势

出现以下情况,通常视为(偏)自相关系数拖尾:

  1. 如果有超过5%的样本(偏)自相关系数都落入2倍标准差范围之外
  2. 或者是由显著非0的(偏)自相关系数衰减为小值波动的过程比较缓慢或非常连续。

ARIMA 数据分析 arima数据要求_ARIMA_02

实例:拖尾和截尾阶数判断

ARIMA 数据分析 arima数据要求_时间序列分析_03

4阶后截尾:ACF图在第4阶后衰减,并在标准差2倍范围内,在0附近波动

ARIMA 数据分析 arima数据要求_时间序列_04

3阶后拖尾:PACF图在第2阶后衰减,不趋于0

ARMA模型的定阶级及参数估计

人工判断

根据ACF、PACF图像是否截尾或拖尾及其结束判断合适的参数

模型

ACF

PACF

AR§

拖尾

p阶后截尾

MA(q)

q阶后截尾

拖尾

ARMA(p, q)

q阶后截尾

p阶后截尾

注:

  1. 拖尾包含了k阶后拖尾
  2. AMIMA和ARMA的区别:前者包含了后者,前者多一步差分操作

循环迭代

当ARMA模型的阶数越高,其描述对象样本的能力就越强。但是阶数越高,参数也就越多,容易造成过拟合的现象。因此我们需要找一个度量工具,来确定最佳的阶数。用的较为广泛的工具为赤池信息量准则(Akaike information criterion,简称AIC)以及贝叶斯信息量准则(Bayesian information criterion,简称BIC)。