平稳时间序列建模方法



一般用Box-Jenkins建模方法,但Pandit-Wu建模方法更简单。



一. 样本序列中均值处理方法



  1. 用样本的均值作为过程均值的估计,建模前先用样本数据减去这个均值,然后对所得的序列进行建模
  2. 把样本均值作为模型的一个未知参数进行估计



二. 模型识别







三类平稳序列的自相关函数和偏自相关函数具有如下统计特性,用作判断序列模型的依据





模型

AR(p)

MA(q)

ARMA(p,q)

自相关函数

拖尾

截尾

拖尾

偏自相关函数

截尾

拖尾

拖尾





1) 如果序列的自相关函数在q步截尾( k>q时,\(\rho_k=0\) ),而偏自相关函数被负指数函数控制收敛到零,则可判断序列为MA(q)序列.




可以证明, 当 k>n时, \(\phi_k\) 渐近于正态分布,即深度学习中的时间序列数据建模流程示例 时间序列建模思路_差分 对于每一个k>0,分别考察 深度学习中的时间序列数据建模流程示例 时间序列建模思路_r语言_02 中满足 深度学习中的时间序列数据建模流程示例 时间序列建模思路_方差_03



(M一般取 N/10或 \(\sqrt{N})\)



的比例是否达到了68.3%, 若k=1,2,...,m-1,都未达到,而在k=m达到了,我们就说\(\rho_k\)在m步截尾. 





2) 如果序列的偏自相关函数在p步截尾,并且自相关函数被负指数函数控制收敛到零,则可判断序列为AR(p)序列.



可以证明,当k>n时, \(\phi_{kk}\)的分布渐进于 深度学习中的时间序列数据建模流程示例 时间序列建模思路_r语言_04




3) 如果序列的自相关函数和偏自相关函数均不截尾,但都被负指数函数控制收敛到零,则序列很可能是ARMA(p,q)序列





三. 模型定阶方法



1. 残差方差图定阶方法





残差的方差\(\hat{\sigma}^2={残差平方和}/{(实际观测值个数-模型参数个数)}\), 故从残差方差图中可以估计出模型阶数(参数个数)





AR(p)模型:  \(\hat{\sigma}^2\) =残差平方和/[(N-p)-(p+1)] = 残差平方和/(N-2p+1)



MA(q)模型:  \(\hat{\sigma}^2\) =残差平方和/(n-q-1)



ARMA(p,q)模型:  \(\hat{\sigma}^2\) =残差平方和/(N-2p-q-1)






判断原则: 残差方差小, 相应的模型阶数合理






2. F检验定阶法



ARMA(p,q)模型的残差平方和 Q0, ARMA(p-1,q-1)模型的残差平方和Q1. 用F检验来确定两个模型是否有显著性差异.



H0:   两个模型没有显著性差异



统计量深度学习中的时间序列数据建模流程示例 时间序列建模思路_建模_05



 



3. 准则函数定阶法



即确定一个准则函数,建模时按照该准则函数的取值大小确定模型的优劣,使准则函数达到极小值的就是最佳模型阶数.



  • AIC
  • BIC



四. 模型参数估计



  • 矩估计法 - 相对简单,计算量小,但精度低,只宜作为初估计
  • 最小二乘估计法 - 精度高,计算量大,计算复杂
  • 极大似然估计法



五. 模型的适应性检验



主要是残差序列的独立性检验





1. 相关函数法



深度学习中的时间序列数据建模流程示例 时间序列建模思路_建模_06,就可以在5%的显著水平下接受\(\rho_k=0\)






2. \(\chi^2\)检验法



Box-Pierce统计量 \[Q=N\sum_{k=1}^{M}\hat{\rho}_k^2,M=N/10 或 \sqrt{N}\] 



如果\(Q \le \chi^2_{1-\alpha}(M-p-q)\)就认为模型是合适的.



Ljung-Box-Pierce统计量 \[Q=N(N+2) \sum_{k=1}^{M}\hat{\rho}_k^2/(N-k)\]

 


六. Pandit-Wu建模方法



从一阶开始,逐渐增加模型阶数,拟合AR(2n,2n-1)模型,即二阶地增加模型阶数,直到F检验表明增加模型阶数而残差平方和不再显著减小为止,也即模型没有差异性.





七. 含有趋势模型



时间序列x(t)可能有趋势因素,有季节因素,有异常因素,有异方差情形。如有趋势因素,要得到平稳的序列有如下方法



 



1. Box-Jenkins建模方法是差分,再用ADF检验,不行就再差分,再用ADF检验,直到通过ADF检验。



2. Pandit-Wu建模方法样本减去平均值,



   如有季节因素,就用HEGY检验,在季节差分。得到平稳的序列



   如有异常因素,就就用异常值检验。



   如有异方差(用Ljung-Box Q统计量检验),就用ARCH,或GARCH模型