文章目录
- 前言
- 1 随机性时间序列模型
- 1.1 基本概念
- 1.1.1 随机过程概念
- 1.1.2 几个重要的平稳随机过程
- 白噪声(纯随机过程)
- 独立增量随机过程
- 二阶矩过程与宽平稳过程
- 严平稳随机过程
- 正态过程
- 1.1.3 动态性
- 2 算子
- 2.1 差分算子
- 2.2 格林函数
- 2.3 后移算子
- 2.4 逆函数
- 2.5 格林函数与逆函数的对偶转换
- 3 平稳性与可逆性
- 3.1 平稳性条件
- 3.1.1 ARMA(1,m)
- 3.1.2 ARMA(2,m)
- 3.2 可逆性条件
- 3.2.1 ARMA(n,1)
- 3.2.2 ARMA(n,2)
- 4 分解
- 4.1 Wold分解
- 5 模型识别
- 5.1 Box-Jenkins法
- 6.1.1 矩估计
- 6.1.2 极大似然估计
- 6.1.3 条件最小二乘估计
- 6.2 数值法
- 6.2.1 线性迭代法
- 6.2.2 牛顿-拉普森(Newton-Raphson)算法
前言
1 随机性时间序列模型
时间序列分析方法是通过对样本观测值的观察分析,将时间序列的趋势项、周期项和随机项分解出来。
其中,对于趋势性或周期性变化,常用确定性时序分析,而对于余下的随机项,可用随机时序模型拟合,属于随机时序分析。确定和随机两部分组合起来共同描述一个时间序列。
随机性时间序列模型最早由G.E.P.Box和G.M.Jenkins提出。
1.1 基本概念
1.1.1 随机过程概念
设是负无穷到正无穷的子集,如果,都有一个随机变量与之对应,就称为随机变量的集合为随机过程。
当是全体整数或全体非负整数时,称相应的随机过程为离散随机过程。把随机序列的指标集合看成时间指标时,这个随机序列就是离散时间序列。
当是全体实数或全体非负实数时,称相应的随机过程为连续随机过程。把随机序列的指标集合看成时间指标时,这个随机序列就是连续时间序列。
1.1.2 几个重要的平稳随机过程
白噪声(纯随机过程)
设为平稳序列,对于,都有
独立增量随机过程
对于,随机变量都相互独立,则称随机过程为独立增量随机过程
二阶矩过程与宽平稳过程
对于的均值和方差存在,则称此过程为二阶矩过程。
若随机过程是一个二阶矩过程,且满足:
则称为宽平稳随机过程。
注意:白噪声为宽平稳随机过程,平稳时间序列中讨论的都为宽平稳随机序列。
严平稳随机过程
对于和任意实数,随机过程的维分布函数满足关系式,即为严平稳随机过程:二阶矩存在的严平稳随机过程一定是宽平稳随机过程,反之不成立。
正态过程
若的有限维分布都是正态分布,则称为正态随机过程。
1.1.3 动态性
动态性:系统现在的行为与其历史行为的相关性,也就是系统的记忆性,具体地,就是在某一时刻进入系统的输入对系统后续行为的影响,如果该输入只影响系统下一时刻的行为,而对下一时刻以后的行为不发生作用,那么系统就有一阶动态或一期记忆性。
那么以此类推,如果该输入对系统之后的个时刻的行为都有影响,那么就说系统具有阶动态性。例如,阶自回归模型()为:基本假设:Xt仅与X_{t-1}、X_{t-2}、X_{t-3}等有线性关系,a_{t}为独立同分布的正态序列
一种有意思的理解:n阶自回归模型就是将Xt中依赖于X_{t-1}、X_{t-2}、X_{t-3}等与过去相关的成分剥离掉,得到一个独立的时间序列a_{t}
而a_{t}作为白噪声序列,对过去没有记忆性
与模型对比来看,模型描述的是系统对过去时刻进入系统的噪声的记忆:基本假设:Xt仅与a_{t-1}、a_{t-2}、a_{t-3}等有线性关系,a_{t}为独立同分布的正态序列
该系统在t时刻的响应Xt与过去时刻的响应X_{t-1}、X_{t-2}、X_{t-3}等无关,而与过去t-1、t-2等时刻进入系统的扰动a_{t-1}、a_{t-2}、a_{t-3}存在着一定的相关关系,于是去掉这种相关关系以后,得到一个独立序列a_{t}
综合来看,描述的是系统对过去自身状态以及各时刻进入的噪声的记忆。注意:
(1) AR(n)、MA(n)、ARMA(n,m)模型都是ARMA(n,n-1)的特殊情形
(2) 对于平稳系统,都可以用一个ARMA(n,n-1)模型近似得到想要得到的任意程度
(3) 对于n阶自回归部分,移动平均部分的阶数应当为n-1
而对于一般ARMA(n,m)模型中m!=n-1的情形,实际上是ARMA(n,n-1)模型的\phi或\theta为0的特殊情形
从连续系统的离散化过程来看,ARMA(n,n-1)模型也是合理的
2 算子
2.1 差分算子
以模型为例:即随机游走模型,该系统对过去有很强的惯性,与过去强相关,当Xt从t时刻移至t-1时刻时,若没有随机项a_{t},则Xt的值保持不变(完全的记忆性),但是就是因为这个a_{t},Xt的值才不确定。由于随机项a_{t}主宰X的增量大小,所以才称为随机游走模型
即有下式,其中表示差分算子:
除此之外,我们称叫做关于的一阶差分,记为:
由此递归,则称叫做关于的一阶差分,也是关于的二阶差分,记为:
类似地,设地第次差分为,则称为的阶差分。
注意:k阶差分不是简单的$X_t - X_{t-k}$,而是叠加差分。
2.2 格林函数
同样以模型为例:
对应的齐次差分方程的通解为:
由右边的形式可知,模型的特解可能是序列的线性组合:
则的通解为:当|\varphi_{t}|<1时,t趋近于正无穷,则c\varphi_1^{t}趋近于0,则Xt完全被特解部分决定,也就是独立序列a_{t-j}部分确定
若|\varphi_{t}|>1时,则通解部分与特解部分均发散,这样的话就没有接下来的统计学意义了
(个人理解:第一,统计学预测意义角度,之后是将时间序列用于预测,如果发散,则并没有找到时间序列中的统计学规律,那么这样预测也是无意义的,故需要施加一个平稳性条件,之后的所有时间序列分析也是建立在平稳性假设条件基础上的预测;第二,遍历性角度。由于之后许多处理需要对不同t时刻进行期望方差计算,如果不同时刻的期望不同那么就非常麻烦了,就需要整个序列先平稳,也就是收敛到同一期望值,那么就方便了遍历计算)
而其中系数函数客观地描述了该系数地动态性,故称此系数为格林函数,用表示:
的特解也可以改写为:
或:
2.3 后移算子
后移算子表示后移的期数,如:
具有如下性质:
- 对和无关的随机变量有:
- 对整数,常数有:
- 对整数有:
- 对多项式,有:
- 对多项式和的乘积,有:
- 对时间序列而言,多项式和随机变量U,V,W,有:
2.4 逆函数
在一定条件下,所有模型也可以转化为无限阶的AR模型,即:
或:
上式被称为的逆转形式,其中称为逆函数。一个过程是否具有逆转形式,称为过程是否具有可逆性,或是否可逆。
2.5 格林函数与逆函数的对偶转换
利用对偶性求得一种模型的格林函数或逆函数,就可以直接得到与其对偶的模型的逆函数或格林函数。
具体做法为,在ARMA(n,m)的格林函数中用代替,和相互代替:
例如,ARMA(1,2)的格林函数为:
ARMA(2,1)的逆函数为:
3 平稳性与可逆性
对于ARMA模型来说,只有平稳且可逆才是有意义的,一般总是假定模型既平稳又可逆。
3.1 平稳性条件
对于ARMA(n,n-1)模型平稳性条件的参数形式,一般是先求得模型格林函数的显性表达式,然后看收敛时,特征根需要达到的要求是什么,特征根与参数关系转换后,即为是由参数构成的n+1个不等式。
平稳性仅与自回归参数有关,而与移动平均参数无关。
3.1.1 ARMA(1,m)
平稳性条件:
3.1.2 ARMA(2,m)
平稳性条件:
3.2 可逆性条件
可逆性与移动平均参数有关,而与自回归参数无关。
3.2.1 ARMA(n,1)
平稳性条件:
3.2.2 ARMA(n,2)
平稳性条件:
4 分解
4.1 Wold分解
回顾模型的特解为下式,下式也被成为Wold分解式,也叫Wold系数:
由于为相互独立的(模型假设),所以可以看作线性空间的基,可由进行线性表示。其系数是对于的坐标投影,是的正交向量和。
也就是说,用线性空间来审视上式,即为wold分解。
5 模型识别
5.1 Box-Jenkins法
即根据样本自相关、偏自相关函数的截尾性和拖尾性初步判断序列所适合的模型类型。
- 零均值化
- 样本自相关函数
- 样本偏自相关函数
- 根据截尾和拖尾判断模型
自相关函数 | 偏自相关函数 | 选择模型 |
拖尾 | p阶截尾 | AR(p) |
q阶截尾 | 拖尾 | MA(q) |
拖尾 | 拖尾 | ARMA(p,q) |
# 6 参数估计 ## 6.1 直接估计法 常用的参数估计方法:
6.1.1 矩估计
6.1.2 极大似然估计
6.1.3 条件最小二乘估计
条件最小二乘估计是实际中最常用的参数估计方法,假设条件为:
残差平方和方程为:
解法:迭代法
优缺点:
- OLS估计充分应用每一个观察值提供的信息,因而估计精度高
- 条件OLS估计使用率较高
- 但是需要假定总体分布(缺点)
6.2 数值法
都是用迭代
6.2.1 线性迭代法
给出初始值,根据式子进行迭代计算,直至相邻两次迭代值相差不大时停止迭代,最后迭代结果作为近似解
6.2.2 牛顿-拉普森(Newton-Raphson)算法