前言:在分析时间序列数据的ARIMA模型中,最重要的一步便是模型参数的判定。存在两种选定模型参数的方法,一是,借助ACF、PACF图的截尾、拖尾的阶数以及AIC、BIC等信息准则;二是,迭代p、q的值,并结合信息准则
拖尾和截尾
截尾:自相关函数(ACF)或偏自相关函数(PACF) 在某阶后突趋于0。
出现以下情况,通常视为(偏)自相关系数d阶截尾:
- 在最初的d阶明显大于2倍标准差范围
- 之后几乎95%的(偏)自相关系数都落在2倍标准差范围以内
- 且由非零自相关系数衰减为在零附近小值波动的过程非常突然
拖尾:ACF或PACF始终有非零取值,某阶后在0附近波动没有趋于0的趋势
出现以下情况,通常视为(偏)自相关系数拖尾:
- 如果有超过5%的样本(偏)自相关系数都落入2倍标准差范围之外
- 或者是由显著非0的(偏)自相关系数衰减为小值波动的过程比较缓慢或非常连续。
实例:拖尾和截尾阶数判断
4阶后截尾:ACF图在第4阶后衰减,并在标准差2倍范围内,在0附近波动
3阶后拖尾:PACF图在第2阶后衰减,不趋于0
ARMA模型的定阶级及参数估计
人工判断
根据ACF、PACF图像是否截尾或拖尾及其结束判断合适的参数
模型 | ACF | PACF |
AR§ | 拖尾 | p阶后截尾 |
MA(q) | q阶后截尾 | 拖尾 |
ARMA(p, q) | q阶后截尾 | p阶后截尾 |
注:
- 拖尾包含了k阶后拖尾
- AMIMA和ARMA的区别:前者包含了后者,前者多一步差分操作
循环迭代
当ARMA模型的阶数越高,其描述对象样本的能力就越强。但是阶数越高,参数也就越多,容易造成过拟合的现象。因此我们需要找一个度量工具,来确定最佳的阶数。用的较为广泛的工具为赤池信息量准则(Akaike information criterion,简称AIC)以及贝叶斯信息量准则(Bayesian information criterion,简称BIC)。