看《实用极值统计方法》-----史道济所得。

前言

上一节中,我们讨论了通过观测超过阈值

的观测值,并用超阈值分布或超出量分布函数来描述,以充分利用观测值数列中的信息。但是,在一般情况下,观测值序列的底分布

我们并不知道。于是,我们就要考虑它们的极限分布,就像GEV分布描述最大值的极限分布一样,我们也希望能够找到超出量的极限分布。

一、广义Pareto分布

定义:如果随机变量X的分布函数为

则称X服从广义Pareto分布,简记为GPD或GP分布。其中

是位置参数,

为尺度参数,

为形状参数。

另一种表示方法:

ParetoⅠ型分布:

R语言中二项分布的密度 pareto分布的密度函数r语言_极值

ParetoⅡ型分布:

R语言中二项分布的密度 pareto分布的密度函数r语言_极值_02

ParetoⅢ型分布:

R语言中二项分布的密度 pareto分布的密度函数r语言_极值_03

当\(\mu=0,\delta=1\)时,称为标准GPD。可以看出,当\(\ln H_{i}>-1\)时,有\(G_{i}=1+\ln H_{i}\)。可见,广义极值分布和广义Pareto分布之间有着非常密切的关系。当\(\mu = 0,\delta>0\)时,分布函数\(G(x;0,\delta,\varepsilon )\)有重要作用,称为二参的广义Pareto分布,简记为\(G(x;\delta,\varepsilon )\)。


不难求出,其密度函数为:


\(g(x;\mu,\delta,\varepsilon )=\frac{1}{\delta}(1+\varepsilon \frac{x-\mu}{\delta})^{-1/\varepsilon -1},x\geq \mu,1+\varepsilon (x-\mu)/\delta>0\)


另一种表示方法:


\(g_{1}(x;\mu,\delta)=\frac{1}{\delta}e^{-\frac{x-\mu}{\delta}},x\geq \mu\)


R语言中二项分布的密度 pareto分布的密度函数r语言_R语言中二项分布的密度_04

R语言中二项分布的密度 pareto分布的密度函数r语言_极值_05

R语言中二项分布的密度 pareto分布的密度函数r语言_R语言中二项分布的密度_06

二、广义Pareto分布的性质

同极值分布一样,根据Gamma函数的性质,可以很方便地求出广义Pareto分布地数字特征。这里,只给出二参广义Pareto分布\(G(x;\delta,\varepsilon )\)的数字特征。


性质:设随机变量X服从广义Pareto分布\(G(x;\delta,\varepsilon )\),则当\(\varepsilon <1/k\)时,


\(E(X^{k})=\frac{\delta^{k}F(\varepsilon ^{-1}-k)}{\varepsilon ^{k+1}F(1+\varepsilon ^{-1})}k!\),其中F(x)为Gamma函数。


定义:对于给定的分布函数\(F(x)\),如果存在常数\(a_{n},b_{n}\),使得对任何实数\(x\),都有


\(F_{\mu}(a_{n}x+b_{n})=F(x)\)


其中\(F_{\mu}(y)=P_{r}(X-\mu\leq y|X>\mu)\)是超出量分布函数,则称分布函数\(F(x)\)具有POT稳定性,或称分布函数\(F(x)\)是POT稳定分布。


性质:广义Pareto是POT稳定分布。


性质:广义Pareto分布的超出量分布函数仍然是GP分布,且形状参数不变。


定义:设随机变量X的分布函数为\(F(x)\),\(x^{*}\)为\(F(x)\)支撑的上端点,X超过阈值\(\mu\)的超出量分布为\(F_{u}(x)\),如果存在广义Pareto分布\(G(x)\),使得


\(\lim_{\mu\rightarrow x^{*}}F_{u}(x)=G(x)\)


则称X(或分布函数\(F(x)\))属于广义Pareto分布的POT吸引场。


性质:广义极值分布属于广义Pareto分布的POT吸引场。


性质:广义Pareto分布属于广义极值分布的最大值吸引场。


定理:设\(X_{1},X_{2},\cdot \cdot \cdot\)为独立同分布随机变量,分布函数为\(F(x)\)。令\(M_{n}=\max \{ X_{1},\cdot \cdot \cdot ,X_{n} \}\),如果存在规范化数列\(\{ a_{n}>0 \},\{ b_{n} \}\),使得对足够大的n,有


\(P_{r}(M_{n}\leq a_{n}x+b_{n})\approx H(x;\mu,\delta,\varepsilon )\)


其中\(H(x;\mu,\delta,\varepsilon )\)是广义极值分布,则对于足够大的阈值\(u\),在\(X>\mu\)的条件下,\(X-u\)的分布近似于GP分布


\(G(y;\delta',\varepsilon )=1-(1+\varepsilon y/\delta)^{-1/\varepsilon },y>0;1+\varepsilon y/\delta'>0\)


其中\(\delta'=\delta+\varepsilon (u-\mu)\)。


性质:GP分布的平均超出量函数为


\(e(u)=\frac{\delta+\varepsilon (u-\mu)}{1-\varepsilon }\)。


定义:设随机变量X的分布函数为\(F(x)\),对应的密度函数为\(f(x)\),\(x^{*}\)是\(F(x)\)支撑的上端点,对于给定的\(t<x^{*}\)称


\(q(t)=\frac{f(t)}{1-F(t)}\)


为随机变量X(或分布F)的危险率函数。