文章目录
- 二、多元正态分布
- 1.多元正态分布的定义
- 2.多元正态分布分量独立性
- 3.多元正态分布的条件分布
- 4.最佳预测
- 回顾总结
二、多元正态分布
1.多元正态分布的定义
由大数定律,自然界中许多随机现象都服从正态分布,因此在统计中正态分布是最重要的一类分布,在多元统计中也是如此,现在我们先对多元正态分布作出定义。值得注意的是,有很多种定义方式都可以定义出一个多元正态分布,我们将从不同角度进行定义。
第一种定义从标准正态分布随机向量的线性变换入手。
多元正态分布定义一:设是随机向量且相互独立,服从标准正态分布即分布。对维常数向量和常数矩阵,记
则称的分布为元正态分布,称为维正态随机向量,记作。
在第一种定义中,多元正态分布被表示为一些相互独立的标准正态随机变量的一些线性组合构成的随机向量的分布。显然,所以,也就是说多元正态分布中两个参数分别是随机向量的均值向量与自协方差矩阵。
在一元统计中,随机变量的分布能与其特征函数唯一相互确定。在多元统计也是这样,且多元统计中的特征函数,是一组数到一个数的映射,即的特征函数为。因此,我们如果能求出的特征函数形式,就可以从特征函数的角度定义多元正态分布,现在我们求如定义一定义的的的特征函数,如下。
这里第三行到第四行是因为相互独立,第四行到第五行是因为标准正态分布的特征函数为,第六行到第七行运用了内积的性质。
因为标准正态分布的两个参数分别是均值向量和自协方差矩阵,对比在特征函数中的形式,我们可以从特征函数的角度定义元正态分布:
多元正态分布定义二:若维随机向量的特征函数为
则称服从维正态分布,这里分别是均值向量和自协方差矩阵。
这说明,如果服从维正态分布,则的分布仅由两个参数决定——均值向量、自协方差矩阵。如果,则,由定义一,。如果对作线性变换,即用一个常数矩阵和维常数向量进行处理:,则
所以,即对正态随机向量作线性变换得到的仍然是正态随机向量。特别取时,推出正态随机向量的边缘分布仍然是正态随机向量(变量)。
第三种定义由正态随机变量的线性变换定义,这里注重的是随机向量的内部结构。
多元正态分布定义三:若维随机向量的任意线性组合均服从一元正态分布,则称为维正态随机向量。
因为我们已经证明了,以前两种方式定义的多元随机向量的任意线性变换,得到的一维随机变量服从正态分布(只需取是向量,即可),所以要证明这个定义与前两种定义的等价性,需要证明,对任意随机向量和实向量,是正态随机变量,能推出是由前两种方式定义的维正态随机向量。
既然是一元正态分布,则必然存在,这样,,且的特征函数是
所以
这就说明服从维正态分布(定义二)。
最后一种定义则由联合密度入手,计算由前三种定义导出的的联合密度,这样,服从此联合密度的随机向量就应该是维随机向量。
不妨设如定义一所示,则的变换雅克比行列式为
此时要求。因为为标准独立正态随机变量构成的随机向量,所以的联合密度函数为:
这样就得到
多元正态分布定义四:如果维随机向量的联合密度函数为
这里是维实向量,是阶正定矩阵,则称服从维正态分布,即。
纵观多元正态分布的四种定义,分别从独立标准正态分布、特征函数、随机向量自身结构、联合密度函数入手,表示同一种分布类型。也就是说,正态随机向量只需要两个参数——均值向量、自协方差矩阵就能够得到很多信息。
2.多元正态分布分量独立性
要讨论正态随机向量的独立性,就要将正态向量的分量分为两个部分,我们不妨将两组分量集中放置,即将维随机向量分成维的一组与维的一组,这样就是
既然将分量分成了两组,我们可以研究这两组分量之间的关系。最直接的关系就是独立性,如果独立的,那么有。接下来的定理给出了独立性的条件:
正态随机向量的独立性:独立,等价于不相关,即
对于一般的随机向量,独立涵盖不相关,但不相关不意味着独立,而在正态约束下独立与不相关是等价的,因为
也就是说,如果将进行分块,得到的分块自协方差阵只要是分块对角阵,则按照此分块方式,的分量各组合是不相关的,也就是相互独立的。特别当本身是对角阵的时候,的每一个分量之间都相互独立,结合是实对称矩阵可以正交对角化的特点,就可以用一个正交变换,将变成等量独立正态变量组成的随机向量。
3.多元正态分布的条件分布
但是,当不独立时,求条件分布就比较繁琐。比较基础的问题是,给定时,的条件分布还是不是一个元正态分布?如果是,它的均值、自协方差矩阵分别是多少?以下定理给出了解答。
正态分布的条件分布:设,被分组成为,则给定时的条件分布是
其中
也就是说,多元正态分布的条件分布仍然是一个正态分布。
要证明这个定理,作一个非奇异线性变换:
做这个非奇异线性变化的意义,其实是在中,扣掉在方向上的那部分,也就相当于把向与正交的方向做一个映射,我们接下来将证明是相互独立的,也就是在这样的处理后,将与变成相互正交的。所以这个事实上是很重要的一个量,在方向上投影的大小,要想构造出来,就要找到一个使得与相互独立,最后能够得到。
现在我们要证明是相互独立的,由于在线性变换下是一个多元正态分布,所以只需要计算其均值、方差即可确定其分布,那么
这就证明的不相关性,即独立,于是的联合密度函数很容易写出,且。又因为,所以
也就是,证明了结论。
在结论的证明过程中,我们注意到是一个很重要的量,它消除了对的关联部分,我们称是对的回归系数,类似地,就是对的回归系数;同时,在扣除其对的回归部分后,与是独立的;在扣除其对的回归部分后与是独立的,这些都是在证明中得到的结论。
在给定时的条件期望称为对的回归。记,则给定时的“条件相关系数”称为偏相关系数,即
4.最佳预测
在实际生活中,我们可能会用某个对象的若干个属性,对一个属性进行预测。其中,若干个属性是可以测量的,需要预测的属性是不可测量需要估计的。如何将这个属性最好地估计出来是一个需要考虑的问题,因此我们在多元正态分布的分块中,将分量分成(待估的)个一组和(可测的)个一组,讨论这类特殊情况。
如果将正态随机向量拆分为个分量与个分量构成的两组,也就是
如果给定,则一维随机正态变量的方差为,期望为。称与的全相关系数为
可以看到,满足,所以给定的情况下,的方差与的测定值无关,只与自身的方差与全相关系数有关,且全相关系数越大,的方差就越小。
另外,条件期望,实际上是在均方误差最小的准则下,对的最佳预测函数,因为对任何其他元函数,都有
回顾总结
- 多元正态分布有四种定义方式,除了第一种从独立标准正态分布的线性变换入手外,另外三种都从随机向量自身的性质入手,分别是特征函数、正态性结构、密度函数。其中特征函数与密度函数(要求正定协方差阵)如下:
- 对正态随机向量,不相关与独立等价,从而分量组独立,则分组协方差阵是分块对角阵。特别当每个分量都独立时,协方差阵是对角阵。
- 对于正态随机向量的分量组,对的回归系数为,如果从中扣掉回归部分,则剩余部分与独立。在给定的情况下,
这里,条件期望称为对的回归。 - 对于正态随机向量分出的与维分量,称是已知时的最佳预测,全相关系数为
全相关系数越大,最佳预测的精确度就越高,方差越小。