和其它问题一样,概率也可能同时受到多个条件的影响,例如考察某地区中学生的身体素质,随机地选取一名学生,观察学生的身高 X,体重 Y 和肺活量 Z 等指标。随机变量 X,Y,Z 来自同一样本空间,它们的取值可能相互影响。像这样同时考虑的多个随机变量,称为多维随机变量。本章以二维随机变量为例,介绍多维随机变量的相关概念。

联合分布

  和一维变量的概率分布类似,联合分布把舞台扩展到了多维,这里的“联合”就是多个随机变量的意思。

  假设一个事件受到两个变量x和y的影响,它的联合分布定义为:

概率笔记6——多维随机变量_概率

  其中X表示具体的取值,x表示变量。

  上一章提到过,分布是指概率的累加,是把事件映射为数字,一个二维联合分布的变量取值范围是整个二维平面,但F(x,y)的取值范围是0~1。

离散型

联合概率

  联合概率指的是包含多个条件且所有条件同时成立的概率,也叫联合分布率。

  用xi和yj的两个随机变量所有可能的取值,P(X=xi, Y=yj)表示在X=xi和Y=yj下事件发生的概率。设P(X=xi, Y=yj)=pij,则下表是二维离散型随机变量(X, Y)的联合概率:

概率笔记6——多维随机变量_概率_02

  联合分布率实际上是一个矩阵。既然是概率,联合概率也满足下面两个条件:

概率笔记6——多维随机变量_概率_03

联合分布

  一维随机变量的分布函数:

概率笔记6——多维随机变量_概率笔记_04

  二维随机变量的分布函数:

概率笔记6——多维随机变量_概率笔记_05

  其中:

概率笔记6——多维随机变量_概率_06

  分布函数和分布略有区别,“分布”是指累加概率,“分布函数”是将累加概率函数化。F(x,y)=P{X≤x,Y≤y}是分布函数,它的值是所有在X≤x,Y≤y下的概率分布。

边缘分布

  先看表1的第一行,它固定了x=x1,此时在表格右侧加入一列:

概率笔记6——多维随机变量_概率笔记_07

  p1·表示x的取值固定,y取任意值时的概率分布,即:

概率笔记6——多维随机变量_概率笔记_08

  由于p1·是写在表格的边缘,所以称为x=x1的边缘分布。对于任意行来说:

概率笔记6——多维随机变量_概率_09

  这实际上是在表示X= xi时事件发生的概率。类似的,y=yj的边缘分布是:

概率笔记6——多维随机变量_概率笔记_10

条件概率

  条件概率是指在A事件发生的条件下,事件B发生的概率,表示为P(B|A),它有一个重要公式:

概率笔记6——多维随机变量_概率笔记_11

  多维随机变量的条件概率公式与此类似,在Y=yj 条件下X=xi的概率:

概率笔记6——多维随机变量_概率_12

独立性

  对于二维离散型随机变量(X, Y)来说,如果满足:

概率笔记6——多维随机变量_概率_13

  那么这两个随机变量之间是没有相互影响的,称X和Y之间互相独立。反过来也一样,如果满足了独立性,那么必然有上式的关系。

连续型

  由于是连续型变量,所以无法像离散型变量那样简单地计算在某一点的概率(概率可以表示为几何度量,点的度量是0,因此算某一点的概率也是0,或者说计算点的概率没有意义),只能计算某一取值范围内的概率,也就是概率分布(概率的累加)。

联合概率密度函数和联合分布

  某个地区的人口密度越大,这个地区的人口越多。同样的,概率密度越大,说明这个区域的发生某件事的概率越大。

  设F(x,y)是二维连续型随机变量(X,Y)的联合分布函数,如果存在一个非负函数f(x,y),对于任意实数x,y,有:

概率笔记6——多维随机变量_概率_14

  则称f(x,y)是二维连续型随机变量(X,Y)的联合概率密度函数。

  u和v在计算后定积分后会被x和y代替。可以对比上一章中一维随机变量的分布函数来理解F(x,y)。概率分布是概率的累加,而累加正好是积分的定义。在几何上,F(x,y)表示了曲面柱体的体积:

概率笔记6——多维随机变量_概率_15

  假设在R区域上,x1<x<x2, y1<y<y2,那么该区域上的概率分布是:

概率笔记6——多维随机变量_概率_16

  dydx是R上的面积积元,它是面积无限接近0的小矩形,但不是0。至此,概率和多重积分联系到一起。上式中没有u和v,这是由于已经确定了x和y的取值范围,且f本来就是关于x和y的函数,因此没必要再引入u和v。如果非要使用u和v,那么上式等价于:

概率笔记6——多维随机变量_概率笔记_17

  由于F是分布函数,因此在整个定义域上满足:

概率笔记6——多维随机变量_概率笔记_18

边缘分布和边缘密度函数

  联合分布表达的是二维随机变量(X, Y)的整体分布,同时X和Y也有各自的边缘分布。与离散型类似,连续型随机变量的边缘分布是只认为有一个变量,其它变量都看作常量。

  X的边缘分布,表示将x看作常量,不管Y的取值:

概率笔记6——多维随机变量_概率笔记_19

  Y的边缘分布,表示将y看作常量,不管x的取值:

概率笔记6——多维随机变量_概率_20

  设(X, Y)的联合密度函数是f(x,y),那么(X, Y)的联合分布可以表示为:

概率笔记6——多维随机变量_概率_21

  X的边缘分布限定了X的取值是X≤x,y可以取任意值,此时X的边缘分布可以写成:

概率笔记6——多维随机变量_概率笔记_22

  分布代表了累加,连续型分布是用积分表示的,FX(x)表示P{X≤x, Y<∞}的累加,是对dx的积分,因此X的边缘分布的密度函数是上式的内积分:

概率笔记6——多维随机变量_概率笔记_23

  把u,v换成x,y,X的边缘分布的密度函数是:

概率笔记6——多维随机变量_概率笔记_24

  类似的,Y的边缘分布的密度函数是:

概率笔记6——多维随机变量_概率_25

条件分布和条件密度函数

  条件概率公式:

概率笔记6——多维随机变量_概率笔记_26

  对于连续型变量来说,单点的概率没有意义,因此将上式推广到连续型随机变量后就变成了“分布”,比如给定Y值的条件下X的概率分布。

  设(X, Y)的联合密度函数是f(x,y),边缘密度函数是fX(x)和fY(y),如果固定x,则称下式为X=x条件下Y的概率密度:

概率笔记6——多维随机变量_概率_27

  同样,Y=y条件下X的概率密度:

概率笔记6——多维随机变量_概率笔记_28

  有了概率密度,自然可以求得相应的分布,给定Y值的条件下X的概率分布:

概率笔记6——多维随机变量_概率笔记_29

独立性

  对于二维连续型随机变量(X, Y)来说,如果满足:

概率笔记6——多维随机变量_概率_30

  那么这两个随机变量之间是没有相互影响的,称X和Y之间互相独立。反过来也一样,如果满足了独立性,那么必然有上式的关系。

二维均匀分布

  设R是平面上的有界区域,面积为A,若二维随机变量(X,Y)具有概率密度:

概率笔记6——多维随机变量_概率笔记_31

  则称(X, Y)在R上服从均匀分布。

  如果在R区域上x在x1<x<x2上服从均匀分布,那么X在x1<x<x2的边缘分布的密度函数是:

概率笔记6——多维随机变量_概率笔记_32

  若(X, Y) 服从R区域上的均匀分布,则对于R上的任一子区域D,都有:

概率笔记6——多维随机变量_概率笔记_33

  上式实际上是在说,如果(X,Y)在某个区域内服从均匀分布,则意味着(X,Y)在该区域内具有“等可能”性。

二维正态分布

  若二维随机变量(X,Y)具有概率密度:

概率笔记6——多维随机变量_概率笔记_34

  则称(X,Y)服从参数为 的二维正态分布,记作:

概率笔记6——多维随机变量_概率_35

  f(x,y)的是一个倒钟型曲面:

概率笔记6——多维随机变量_概率_36

示例

示例1

  X服从(0,1)上的均匀分布,在X=x(0<x<1)的条件下,Y在(0,x)内服从均匀分布,f(x,y)=?, 2. fY(y)=?

  先看1,X服从某一个区域的边缘分布意味着:

概率笔记6——多维随机变量_概率_37

  X服从(0,1)上的均匀分布,则x1 = 0, x2 = 1:

概率笔记6——多维随机变量_概率笔记_38

  “Y在(0,x)内服从均匀分布”:

概率笔记6——多维随机变量_概率_39

  

  2. Y的边缘分布的密度函数是:

概率笔记6——多维随机变量_概率笔记_40

  现在只需要确定的积分域即可,由0<y<x<1可知,积分上限是1,下限是y:

概率笔记6——多维随机变量_概率笔记_41

示例2

  设二维随机变量(X, Y)的联合概率密度是:

概率笔记6——多维随机变量_概率笔记_42

  1. A=? 2.求分布函数F(x,y) 3.求概率P{Y≤X}

  

  1. 整个定义域上分布函数满足:

概率笔记6——多维随机变量_概率笔记_43

概率笔记6——多维随机变量_概率_44


  作者:我是8位的

  出处:http://www.cnblogs.com/bigmonkey

  本文以学习、研究和分享为主,如需转载,请联系本人,标明作者和出处,非商业用途! 

  扫描二维码关注公众号“我是8位的”

概率笔记6——多维随机变量_概率_45