时间序列预测——Prophet模型
SPSS软件实操——ARIMA时间序列预测模型
ARIMA模型
ARIMA(p,i,q)模型全称为差分自回归移动平均模型(Autoregressive Integrated Moving Average Model)
基本原理:将非平稳时间序列转化为平稳时间序列然后将因变量仅对它的滞后值以及随机误差项的现值和滞后值进行回归所建立的模型。
ARIMA模型本质上由三部分组成,AR(p阶自回归模型)+I(i阶差分)+MA(q阶移动平均模型)。
AR的公式为:
MA的公式为:
其中是白噪声,均值为0,方差为1。
ARIMA首先要确定差分阶数i,以确保数据在i阶差分后平稳;接着,再确定是AR(q=0)、MA(p=0)还是ARMA(p、q均不为0)。
参数p、q可以通过ACF图与PACF图选定。
1、平稳性
平稳性就是要求经由样本时间序列所得到的拟合曲线在未来的一段时期内仍然顺着现有的形态“惯性”地延续下去。
平稳性要求序列的均值和方差不发生明显变化。
2、差分法(求i)
差分法:时间序列在t与t-1时刻的差值。
3、自回归模型 (AR)
描述当前值与历史值之间的关系,用变量自身的历史时间数据对自身进行预测。自回归模型必须满足平稳性的要求。
P阶自回归过程的公式定义:
其中yt是当前值、是常数项、P是阶数、ri是自相关系数、是误差
自回归模型的限制:
- 自回归模型是用自身的数据进行预测
- 必须具有平稳性
- 必须具有自相关性,如果自相关系数()小于0.5,则不宜采用。
4、移动平均模型 (MA)
移动平均模型关注的是自回归模型中的误差项的累加。移动平均模型能够有效的消除预测中的随机波动。
q阶段自动回归过程的公式定义:
5、自相关函数ACF(Autocorrelation Function)
有序的随机变量序列及其自身比较。自相关函数反应了同一序列在不同时序的取值之间的相关性。
公式:
的取值范围为[-1,1]
6、偏自相关函数(PACF)(Partial Autocorrelation Function)
对于一个平稳的AR(q)模型,求出滞后k自相关系数p(k)时,实际上得到的并不是x(t)与x(t-k)之间的单纯的相关关系。x(t)同时还会受到k-1个随机变量x(t-1)、x(t-2)、…x(t-k-1)的影响,而这k-1个随机变量又都和x(t-k)具有相关关系,所以自相关系数p(k)里实际掺杂了其他变量对x(t)与x(t-k)的影响
偏自相关函数(PACK)剔除了中间k-1个随机变量的干扰。ACF还包含了其他变量的影响,而偏自相关系数PACF是严格这两个变量的相关性。
7、ARIMA(p,i,d)阶数确定
模型 | ACF | PACF |
AR(p) | 衰减趋于零(几何型或振荡型) | p阶后截尾 |
MA(q) | q阶后截尾 | 衰减趋于零(几何型或振荡型) |
ARMA(p,q) | q阶后衰减趋于零(几何型或振荡型) | p阶衰减趋于零(几何型或振荡型) |
截尾:落在置信区间内(95%的点都符合该规则)
ARIMA建模流程总结:
- 收集数据
- 时序图和检验平稳性
- 对非平稳序列进行平稳化处理,差分次数d的确定
- 根据差分次数d,建立差分序列
- 模型识别和定阶,p阶和q阶确定:ACF和PACF
- 模型的参数估计
- 模型的适应性检验
- 利用ARIMA(p,d,q)模型进行预测