看《实用极值统计方法》-----史道济所得。
前言
上一节中,我们讨论了通过观测超过阈值
的观测值,并用超阈值分布或超出量分布函数来描述,以充分利用观测值数列中的信息。但是,在一般情况下,观测值序列的底分布
我们并不知道。于是,我们就要考虑它们的极限分布,就像GEV分布描述最大值的极限分布一样,我们也希望能够找到超出量的极限分布。
一、广义Pareto分布
定义:如果随机变量X的分布函数为
则称X服从广义Pareto分布,简记为GPD或GP分布。其中
是位置参数,
为尺度参数,
为形状参数。
另一种表示方法:
ParetoⅠ型分布:
ParetoⅡ型分布:
ParetoⅢ型分布:
当\(\mu=0,\delta=1\)时,称为标准GPD。可以看出,当\(\ln H_{i}>-1\)时,有\(G_{i}=1+\ln H_{i}\)。可见,广义极值分布和广义Pareto分布之间有着非常密切的关系。当\(\mu = 0,\delta>0\)时,分布函数\(G(x;0,\delta,\varepsilon )\)有重要作用,称为二参的广义Pareto分布,简记为\(G(x;\delta,\varepsilon )\)。
不难求出,其密度函数为:
\(g(x;\mu,\delta,\varepsilon )=\frac{1}{\delta}(1+\varepsilon \frac{x-\mu}{\delta})^{-1/\varepsilon -1},x\geq \mu,1+\varepsilon (x-\mu)/\delta>0\)
另一种表示方法:
\(g_{1}(x;\mu,\delta)=\frac{1}{\delta}e^{-\frac{x-\mu}{\delta}},x\geq \mu\)
二、广义Pareto分布的性质
同极值分布一样,根据Gamma函数的性质,可以很方便地求出广义Pareto分布地数字特征。这里,只给出二参广义Pareto分布\(G(x;\delta,\varepsilon )\)的数字特征。
性质:设随机变量X服从广义Pareto分布\(G(x;\delta,\varepsilon )\),则当\(\varepsilon <1/k\)时,
\(E(X^{k})=\frac{\delta^{k}F(\varepsilon ^{-1}-k)}{\varepsilon ^{k+1}F(1+\varepsilon ^{-1})}k!\),其中F(x)为Gamma函数。
定义:对于给定的分布函数\(F(x)\),如果存在常数\(a_{n},b_{n}\),使得对任何实数\(x\),都有
\(F_{\mu}(a_{n}x+b_{n})=F(x)\)
其中\(F_{\mu}(y)=P_{r}(X-\mu\leq y|X>\mu)\)是超出量分布函数,则称分布函数\(F(x)\)具有POT稳定性,或称分布函数\(F(x)\)是POT稳定分布。
性质:广义Pareto是POT稳定分布。
性质:广义Pareto分布的超出量分布函数仍然是GP分布,且形状参数不变。
定义:设随机变量X的分布函数为\(F(x)\),\(x^{*}\)为\(F(x)\)支撑的上端点,X超过阈值\(\mu\)的超出量分布为\(F_{u}(x)\),如果存在广义Pareto分布\(G(x)\),使得
\(\lim_{\mu\rightarrow x^{*}}F_{u}(x)=G(x)\)
则称X(或分布函数\(F(x)\))属于广义Pareto分布的POT吸引场。
性质:广义极值分布属于广义Pareto分布的POT吸引场。
性质:广义Pareto分布属于广义极值分布的最大值吸引场。
定理:设\(X_{1},X_{2},\cdot \cdot \cdot\)为独立同分布随机变量,分布函数为\(F(x)\)。令\(M_{n}=\max \{ X_{1},\cdot \cdot \cdot ,X_{n} \}\),如果存在规范化数列\(\{ a_{n}>0 \},\{ b_{n} \}\),使得对足够大的n,有
\(P_{r}(M_{n}\leq a_{n}x+b_{n})\approx H(x;\mu,\delta,\varepsilon )\)
其中\(H(x;\mu,\delta,\varepsilon )\)是广义极值分布,则对于足够大的阈值\(u\),在\(X>\mu\)的条件下,\(X-u\)的分布近似于GP分布
\(G(y;\delta',\varepsilon )=1-(1+\varepsilon y/\delta)^{-1/\varepsilon },y>0;1+\varepsilon y/\delta'>0\)
其中\(\delta'=\delta+\varepsilon (u-\mu)\)。
性质:GP分布的平均超出量函数为
\(e(u)=\frac{\delta+\varepsilon (u-\mu)}{1-\varepsilon }\)。
定义:设随机变量X的分布函数为\(F(x)\),对应的密度函数为\(f(x)\),\(x^{*}\)是\(F(x)\)支撑的上端点,对于给定的\(t<x^{*}\)称
\(q(t)=\frac{f(t)}{1-F(t)}\)
为随机变量X(或分布F)的危险率函数。