时间序列指由有时间先后顺序组成的一组时间变量。分析时间序列的前提假设是,时间序列具有自相关性, 通过这种自相关性,从而通过过去推测未来,如果某个时间序列没有自相关性,那么根据过去推测未来就毫无意义。

自协方差

随机变量python 时间序列相关性分析 时间序列的相关性_机器学习,在时间点python 时间序列相关性分析 时间序列的相关性_协方差_02,取之分别为python 时间序列相关性分析 时间序列的相关性_时间序列_03, python 时间序列相关性分析 时间序列的相关性_时间序列_04阶自协方差的表达式:
python 时间序列相关性分析 时间序列的相关性_python 时间序列相关性分析_05

自相关系数

python 时间序列相关性分析 时间序列的相关性_机器学习_06

偏自相关系数

在计算昨天对今天的影响的时候,其实前天对昨天的影响也间接影响了今天,大前天对前天和昨天的影响也间接影响了今天。以此类推,计算t和t-1期的相关性时,不单纯是昨天的影响,也包含了之前所有各期的信息对今天的间接影响。所以为了衡量过去单期(一天)对今天的影响,我们引入偏相关性的概念,用于剔除更早之前的信息对现在的影响。

python 时间序列相关性分析 时间序列的相关性_机器学习_07

平稳性

如果时间序列的基本特性保持不变,我们就称该时间序列是平稳的。

强平稳

python 时间序列相关性分析 时间序列的相关性_python 时间序列相关性分析_08为一时间序列,对于任意正整数n,任取python 时间序列相关性分析 时间序列的相关性_python 时间序列相关性分析_09, 对任意python 时间序列相关性分析 时间序列的相关性_协方差_10

python 时间序列相关性分析 时间序列的相关性_协方差_11

即时间序列中任何时段的联合分布都是相同的,则称这个时间序列是请平稳的。这个条件过于苛刻,实际中很难应用。

弱平稳

假设python 时间序列相关性分析 时间序列的相关性_python 时间序列相关性分析_08是一个时间序列,如果python 时间序列相关性分析 时间序列的相关性_python 时间序列相关性分析_08满足如下三个条件:
(1) 任取python 时间序列相关性分析 时间序列的相关性_时间序列_14,有python 时间序列相关性分析 时间序列的相关性_python 时间序列相关性分析_15,即序列的均值为常数
(2) 任取python 时间序列相关性分析 时间序列的相关性_时间序列_14,有python 时间序列相关性分析 时间序列的相关性_协方差_17
(3) 任取python 时间序列相关性分析 时间序列的相关性_时间序列_14,对任意整数h,任意阶数l,有python 时间序列相关性分析 时间序列的相关性_机器学习_19,即t时点的自协方差与t+h时点的自协方差相等。也就是说,l阶自协方差不随t值改变。

一般说树间序列平稳,都是指弱平稳性。

单位根检验

如果一个序列是非平稳的,经过d次差分,可以将其转换成平稳序列,则称此序列为python 时间序列相关性分析 时间序列的相关性_协方差_20,其中I指整合(Integrated),d为整合阶数。比如:
python 时间序列相关性分析 时间序列的相关性_时间序列_21
其中python 时间序列相关性分析 时间序列的相关性_时间序列_22
可以根据计算得到:
python 时间序列相关性分析 时间序列的相关性_时间序列_23
python 时间序列相关性分析 时间序列的相关性_协方差_24
因为python 时间序列相关性分析 时间序列的相关性_机器学习_25的方差会随和时间t发生改变,因此该时间序列是非平稳。不过python 时间序列相关性分析 时间序列的相关性_机器学习_25经过一阶差分后python 时间序列相关性分析 时间序列的相关性_协方差_27,因此python 时间序列相关性分析 时间序列的相关性_机器学习_25为非平稳的I(1)序列。
一个时间序列是否平稳可以借助之后蒜子多项式方差的根来判断。滞后算子L,比如对时间序列{x_t}运用滞后算子可得python 时间序列相关性分析 时间序列的相关性_时间序列_29

将一个序列python 时间序列相关性分析 时间序列的相关性_python 时间序列相关性分析_30一般化的表示为
python 时间序列相关性分析 时间序列的相关性_时间序列_31
python 时间序列相关性分析 时间序列的相关性_协方差_32
借助滞后算子,将上面的模型改写成:
python 时间序列相关性分析 时间序列的相关性_协方差_33
python 时间序列相关性分析 时间序列的相关性_时间序列_34
对应的滞后算子多项式方程为:
python 时间序列相关性分析 时间序列的相关性_协方差_35

如果python 时间序列相关性分析 时间序列的相关性_机器学习_36所有根的绝对值都大于1,那么时间序列python 时间序列相关性分析 时间序列的相关性_时间序列_37为平稳的时间序列。如果python 时间序列相关性分析 时间序列的相关性_机器学习_36存在单位根,即L=1,那么时间序列python 时间序列相关性分析 时间序列的相关性_时间序列_37就是非平稳,对该时间序列的未来值的预测就难以进行

常见的单位根检验的方法有DF(Dickey-Fuller Test)检验,ADF检验(Augmented Dickey_Fuller Test),PP检验(Phillips-Perron test)。

白噪声

如果一个随机过程中任意时点t的变量python 时间序列相关性分析 时间序列的相关性_机器学习的均值和方差,协方差分别满足以下公式:
python 时间序列相关性分析 时间序列的相关性_机器学习_41
python 时间序列相关性分析 时间序列的相关性_协方差_42
python 时间序列相关性分析 时间序列的相关性_python 时间序列相关性分析_43
则称这个随机过程为白噪声过程。白噪声过程中各期变量之间的协方差为0,也就是白噪声过程是没有相关性的。这种时间序列也可以称为纯随机序列。
如果白噪声过程中的个变量独立同分布,且都服从正态分布,则该序列被称为高斯白噪声过程。根据定义,高斯白噪声过程是强平稳的时间序列,而且各期之间不仅不相关,而且互相独立。

白噪声检验

通常使用Ljung-Box检验,检验的原假设为所检验的序列是纯随机序列,Q统计量为:
python 时间序列相关性分析 时间序列的相关性_时间序列_44
其中,python 时间序列相关性分析 时间序列的相关性_协方差_45是序列的k阶自相关系数,n是整个序列中观测值的个数,m是设定的滞后阶数。
在检验一个时间序列在m界内是否是白噪声,只有当Q(1),Q(2),…,Q(m)这m个Q统计量都小于对应的python 时间序列相关性分析 时间序列的相关性_python 时间序列相关性分析_46分布的临界值时,才说嘛这个序列在所检验的m阶内是纯随机序列。