时间序列的预测问题

时间序列数据

数据特性

常用模型

预测方法

论文实例

什么是时间序列?

时间序列是按照一定的时间间隔取得的一系列观测值,是同一对象在不同时间点所表现出的特征。不同于横截面数据,是同一时间点不同地点,不同事件所表现的特征,关注的维度不同。

时间序列分析是干什么?

时间序列分析有两个目标: 1.对时间序列的结构进行识别和建模 2.预测时间序列未来的值

时间序列有什么特性? 趋势,季节效应,周期, 随机性 趋势:指时间序列中的长期移动,它表示观测值是否随着变化增加或降低。 季节效应:观测数据在时间上的固定的周期性波动,如,年内的月度销量因天气和假期的因素而波动。 周期:也可是为周期性波动,但不像季节效应那样固定,如,零售时间序列可能常常遵循经济繁荣和萧条的周期。 随机性:由于特殊原因对于时间序列随机扰动。

时间序列的相关性如何衡量的? 自相关系数 偏自相关系数

我们要研究的时间序列?平稳的时间序列: 1.存在固定的均值,换句话说,前100个数字串和前1000个数字串他们的均值是一样的,或者说,统计学上可以容忍为一样的。

2.存在固定的方差。所谓固定,和前面的均值含义一样。

3.滞后序列之间的协方差是固定的,所谓固定含义与前面一样,但是并不是说,每一阶滞后项与别的滞后项之间的协方差都是固定的,他们之间的协方差,由他们自身滞后的阶数决定。

为什么要这么要求呢?其实说白了,就要求时不变性,当一个系统是时变的,往往会很麻烦。大家只要记住,平稳时间序列才有统计意义,才能用时间序列分析的方法与预测未来。

如何衡量一个时间序列是平稳的?

(1)做时序图

(2)单根检验

时间序列预测 informer和transformer的pytorch 时间序列预测优缺点_时间序列

时间序列预测 informer和transformer的pytorch 时间序列预测优缺点_数据_02

如何衡量序列的相关性:

自相关系数(ACF):

时间序列预测 informer和transformer的pytorch 时间序列预测优缺点_数据_03

自相关(英语:Autocorrelation),也叫序列相关,是一个信号于其自身在不同时间点的互相关。

她就是用来表达一组数据前后数据 (自己和自己) 的相关性的。

时间序列预测 informer和transformer的pytorch 时间序列预测优缺点_时间序列_04

偏自相关系数(PACF)

自相关系数ρ(t,s)并不是只有两个点t和s的数据决定的。而是还包含了t-1 ~ s+1时间段值的影响。而PACF是严格这两个变量之间的相关性。

可以看到偏自相关系数就是去掉一些变量的影响后再来考察自相关系数。

几种时间序列模型

白噪声序列:服从均值为0,方差为σ²的正态分布,具有:无序列相关性,无趋势性,随机性的特点。无规律可循,在均值处反复震荡。

时间序列预测 informer和transformer的pytorch 时间序列预测优缺点_建模_05

自回归模型(AR):

自回归模型:通过过去观测值的特点来预测当前值,如通过过去几个月的消费情况来预测本月的消费。当前时刻的时序值可由过去值的线性组合加上一个白噪声。

时间序列预测 informer和transformer的pytorch 时间序列预测优缺点_建模_06

一阶自回归模型:

时间序列预测 informer和transformer的pytorch 时间序列预测优缺点_时间序列_07

移动平均模型(MA)

通过白噪声序列的线性组合也即扰动项的线性组合来预测当前值,

时间序列预测 informer和transformer的pytorch 时间序列预测优缺点_时间序列_08

一阶移动平均模型

时间序列预测 informer和transformer的pytorch 时间序列预测优缺点_数据_09

自回归移动平均模型(ARMA)

ARMA(p,q)模型就是AR§和MA(q)模型的组合

时间序列预测 informer和transformer的pytorch 时间序列预测优缺点_时间序列_10

一阶ARMA模型

时间序列预测 informer和transformer的pytorch 时间序列预测优缺点_数据_11

ARIMA

前面四个模型都是对平稳序列的拟合,ARIMA则是对非平稳序列的拟合。ARIMA 是在 ARMA 基础上发展而来的更加综合性的模型,其特征包括: 趋势性, 序列相关性和随机性

对于ARIMA模型,我们可以进行差分处理。一般来说,ARIMA(p,d,q)经过d次差分后的序列就是一个平稳的ARMA(p,q)序列

时间序列预测 informer和transformer的pytorch 时间序列预测优缺点_时间序列_12

ARIMA建模流程:

时间序列预测 informer和transformer的pytorch 时间序列预测优缺点_数据_13

以论文为例

文章讲述了某停车场实时需求预测模型的建模过程,对该停车场一天进行了进出车辆调查,从7:00到22:00每隔15min统计一次数据,获取15h60个时间段的车辆进出情况。以前52个观测量为样本训练模型,以后8个观测量为检测量检验模型。

时间序列预测 informer和transformer的pytorch 时间序列预测优缺点_时间序列_14

1.数据平稳性检查

通过对进出车辆数据ADF检验,发现其为非平稳序列。进行一阶差分之后满足平稳序列特征。

时间序列预测 informer和transformer的pytorch 时间序列预测优缺点_建模_15

2.模型定阶与白噪声检验

通过序列特征pan

时间序列预测 informer和transformer的pytorch 时间序列预测优缺点_数据_16

时间序列预测 informer和transformer的pytorch 时间序列预测优缺点_时间序列_17