随机变量的分布函数可以全面地描述该随机变量的统计规律,但是再许多实际问题中,要确定一个随机变量的分布往往并不容易;另一方面,有些问题也无需知道随机变量的精确分布,只要知道该随机变量的某些特征即可。
例如:测量某零件的长度,一般指关系这批零件的平均长度以及测量结果的精确程度,也就是测量结果对平均值的偏差程度;刻画随机变量某些方面的特征的数值称为:<u>随机变量的数字特征</u>。
1 随机变量的数学期望
1.1 离散型随机变量的数学期望
引用一个例子:某次考试全班30人参加,得5分的由8人,得4分的有12人,得3分和2分的各有5人,则全班30人的平均分为:
$\frac{2\cp 5 + 3\cp 5 + 4\cp 12 + 5\cp 8}{30} = \frac{113}{30} = 3.77$分;
如果将得分记为随机变量$X$,则$X$的取值为$x_k,\ (x_k = 2,3,4,5,\ \ k=1,2,3,4)$ 的频数分别为$m_k, (m_k=5,5,12,8)$;总人数为$n=30$,取值为$x_k$的频率为:$\frac{m_k}{n},\ (\frac{m_k}{n} = \frac{5}{30}, \frac{5}{30},\frac{12}{30},\frac{8}{30})$,平均分是与随机变量的取值和频率密切相关的,但由于频率是随着人数$n$的变化而不同的,所以整个数值具有波动性,其中$\frac{m_k}{n}$是事件${X = x_k}$发生的频率,由频率稳定性(会在第五章中介绍)知,当$n$很大时,频率$\frac{m_k}{n}$将在一定意义下接近于事件${X=x_k}$的概率$p_k$,用概率$p_k$代替频率$\frac{m_k}{n}$,称$\sum_{k=1}^{n} x_k p_k$为随机<u>变量$X$的数学期望</u>,简称<u>期望</u>或者<u>均值</u>。
**定义1:**设离散型随机变量$X$的分布律为:
$P{X=x_k} = p_k,\ \ \ \ k=1,2,...$
若级数$\sum_{k=1}^{n} x_k p_k$绝对收敛(即:级数$\sum_{k=1}^{\infty} |x_k| p_k \lt +\infty$),则称级数$\sum_{k=1}^{n} x_k p_k$的和为随机变量$X$的<u>数学期望</u>,简称期望,记作$E(X)$,即:$E(X) = \sum_{k=1}^{n} x_k p_k$。
例1:设随机变量$X$的分布律为:
| X | -1 | 1 | 2 | |
|---|---|---|---|---|
| P | 0.1 | 0.2 | 0.3 | 0.4 |
求$E(x)$。
解:$E(X) = (-1)\cp 0.1 + 0\cp 0.2 + 1\cp 0.3 + 2\cp 0.4 = 1$
例2:甲乙两名射手在一次射击中的得分为$X,Y$,其分布律分别为:
| X | 1 | 2 | 3 |
|---|---|---|---|
| P | 0.4 | 0.1 | 0.5 |
| Y | 1 | 2 | 3 |
|---|---|---|---|
| P | 0.1 | 0.6 | 0.3 |
试比较甲乙两射手的技术。
解:分别计算$X$和$Y$的数学期望:
$E(X) = 1\cp 0.4 + 2\cp 0.1 + 3\cp 0.5 = 2.1$
$E(Y) = 1\cp 0.1 + 2\cp 0.6 + 3\cp 0.3 = 2.2$
据此,可认为乙的技术更好。
几种常见的离散性随机变量的数学期望如下:
(1)$0-1$分布
设随机变量$X$的分布律为:$P{X=1} = p,\ P{X=0}=1-p,\ \ \ \ 0 \le p \le 1$,则:$E(X) = 1\cp p + 0\cp (1-0) = p$
(2)二项分布
设随机变量$X \sim B(n,p)$,即:$p_k = P{X=k} = C_n^k p^k (1-p)^{n-k},\ \ \ \ k=0,1,2,...,\ \ 0 \le p \le 1$则: $$ \begin{align} E(X) = \sum_{k=0}^{n} x_k p_k &= \sum_{k=0}^{n} k \cdot C_n^k p^k (1-p)^{n-k} \ &= \sum_{k=1}^{n} k \cdot \frac{n!}{k! (n-k)!} \cdot p^k (1-p)^{n-k} \ \ \ \ \ \ # k=0是该项等于0,直接可以舍去\ &= np \cdot \sum_{k=1}^{\infty} \frac{(n-1)!}{(k-1)! (n-k)!} \cdot p^{k-1} (1-p)^{n-k} \ &= np \cdot \sum_{k=1}^{\infty} C_{n-1}^{k-1} \cdot p^{k-1} (1-p)^{n-k} \ \ \ \ \ \ # 令i=k-1\ &= np \cdot \sum_{i=0}^{\infty} C_{n-1}^{i} \cdot p^{i} (1-p)^{n-1-i} \ &= np \cdot [p+(1-p)]^{n-1} \ &= np \end{align} $$
二项分布的数学期望$np$有明显的概率意义,比如:掷硬币试验,进行1000次试验则可以<u>期望</u>出现$1000 \cp \frac{1}{2} = 500$次正面向上的结果;再比如:掷骰子,若进行1000次试验则可以期望出现$1000 \cp \frac{1}{6} = 166.67$次出现1点。
(3)泊松分布
设随机变量$X \sim P(\lambda)$,其分布律为:$p_k = P{X=k} = \frac{\lambda^k}{k!} e^{-\lambda},\ \ \ k=0,1,2,...$则: $$ \begin{align} E(X) = \sum_{k=0}^{\infty} k \cdot p_k &= \sum_{k=0}^{\infty} k \cdot \frac{\lambda^k}{k!}e^{-\lambda} \ &= \lambda e^{-\lambda} \cdot \sum_{k=1}^{\infty} \frac{\lambda^{k-1}}{(k-1)!} \ \ \ \ \ \ \ \ \ # k=0时该项为0,直接舍弃\ &\xlongequal {i=k-1} \lambda e^{-\lambda} \cdot \sum_{i=0}^{\infty} \frac{\lambda^i}{i!} \ &= \lambda e^{-\lambda} e^{\lambda} \ &= \lambda \end{align} $$
比如:服从泊松分布的随机变量$X$表示某个时间段你交通事故的次数,则平均次数为参数$\lambda$。
例3:设随机变量$X \sim B(n,0.08)$,已知$E(X)=1.2$,求参数$n$。
解:$E(X) = np = n \cp 0.08 = 1.2$得:$n=15$
例4:已知随机变量$X$的取值为$2$和$a$,且$P{X=2} = 0.8$,$E(X) = 1.2$,求$a$的值。
解:$E(X) = 2\cp 0.8 + a \cp 0.2 = 1.2$得:$a=-2$。
<u>以下介绍一个定理,不用刻意去寻找$Y$的分布也能计算出$Y$的数学期望$E(Y)$:</u>
**定理1:**设$X$为离散型随机变量,其分布律为:$P{X=x_k} = p_k,\ \ k=1,2,...$;令$Y=g(X)$,若级数$\sum_{k=1}^{\infty} g(x_k) p_k$绝对收敛,则$Y = g(X)$的数学期望存在,且有:$E(Y) = E[g(X)] = \sum_{k=1}^{\infty} g(x_k) p_k$。
例5:设随机变量$X$的分布律为:
| X | -1 | 2 | 3 | |
|---|---|---|---|---|
| P | $\frac{1}{8}$ | $\frac{1}{4}$ | $\frac{3}{8}$ | $\frac{1}{4}$ |
求:$E(X),\ E(X^2),\ E(-2X+1)$。
解:(1)$E(X) = -1 \cp \frac{1}{8} + 0 \cp \frac{1}{4} + 2 \cp \frac{3}{8} + 3 \cp \frac{1}{4} = \frac{11}{8}$
(2)$E(X^2) = (-1)^2 \cp \frac{1}{8} + 0^2 \cp \frac{1}{4} + 2^2 \cp \frac{3}{8} + 3^2 \cp \frac{1}{4} = \frac{31}{8}$
(3)$E(-2X+1) = 3 \cp \frac{1}{8} + 1 \cp \frac{1}{4} + (-3) \cp \frac{3}{8} + (-5) \cp \frac{1}{4} = -\frac{4}{7}$
例6:测量一个正方形的边长(cm),结果时一个随机变量$X$,其分布律为:
| X | 9 | 10 | 11 | 12 |
|---|---|---|---|---|
| P | 0.2 | 0.3 | 0.4 | 0.1 |
求:周长$L$和面积$S$的数学期望。
解:$E(L) = E(4X) = 36 \cp 0.2 + 40 \cp 0.3 + 44 \cp 0.4 + 48 \cp 0.1 = 41.6(cm)$
$E(S) = E(X^2) = 81 \cp 0.2 + 100 \cp 0.3 + 121 \cp 0.4 + 144 \cp 0.1 = 109(cm^2)$
1.2 连续型随机变量的数学期望
对于连续型随机变量的数学期望,可以类似与离散型随机变量的数学期望给予定义,只需将$\sum_{k=1}^{\infty} x_k p_k$中的求和号$\sum_{k=1}^{\infty}$改变为积分号$\int$,取值$x_k$改变为$x$,分布律也就是概率$p_k$改变为$f(x)dx$即可;其中$f(x)$为连续型随机变量$X$的概率密度。
定义2:设连续型随机变量$X$的概率密度为$f(x)$,若广义积分$\int_{-\infty}^{+\infty} x f(x) dx$的值为随机变量$X$的数学期望,简称为期望或均值;记作$E(X)$;即:$E(X) = \int_{-\infty}^{+\infty} x f(x) dx$。
例7:设随机变量$X$的概率密度为: $$ f(x) = \begin{cases} 2-2x,\ \ \ \ & 0\le x \le 1 \ 0, &其他 \end{cases} $$ 求:$E(X)$。
解:根据定义得: $$ \begin{align} E(X) = \int_{-\infty}^{+\infty} x f(x) dx &= \int_{-\infty}^{0} xf(x)dx + \int_{0}^{1} xf(x)dx + \int_{1}^{+\infty} xf(x)dx \ &= 0 + \int_{0}^{1} x(2-2x)dx + 0 \ &= (x^2 -\frac{2}{3}x^3)|_{0}^{1} \ &= \frac{1}{3} \end{align} $$
例8:设随机变量$X$的概率密度为: $$ f(x) = \begin{cases} c \sin^2{x},\ \ \ \ &|x| \le \frac{\pi}{2} \ 0, &其他 \end{cases} $$ 求:(1)常数$c$; (2)数学期望$E(X)$。
解:(1)计算步骤: $$ \begin{align} P{-\infty \lt X \lt +\infty} = 1 = \int_{-\infty}^{+\infty} f(x)dx &= \int_{-\frac{\pi}{2}}^{\frac{\pi}{2}} c\sin^2{x} dx \ &= \int_{-\frac{\pi}{2}}^{\frac{\pi}{2}} c(\frac{1-\cos{2x}}{2}) dx \ &= c(\frac{x}{2} - \frac{1}{4} \sin{2x}) |_{-\frac{\pi}{2}}^{\frac{\pi}{2}} \ &= c \cdot \frac{\pi}{2} \end{align} $$
这里用到了三角函数及其导数等式变换。
因此解得:$c = \frac{2}{\pi}$。
(2)$E(X) = \int_{-\infty}^{+\infty} x f(x) dx = \int_{-\infty}^{+\infty} x \cdot \frac{2}{\pi} \sin^2{x} dx \xlongequal{奇函数} 0 $
$\bigstar \bigstar \bigstar \bigstar \bigstar$
下面介绍几种重要的连续型随机变量的数学期望:
①均匀分布
设随机变量$X$服从区间$[a,b]$上的均匀分布,其概率密度为: $$ f(x) = \begin{cases} \frac{1}{b-a},\ \ \ \ & a \le x \le b \ 0,&其他 \end{cases} $$ 则:$E(X) = \int_{-\infty}^{+\infty} x f(x) dx = \int_{a}^{b} x \frac{1}{b-a} dx = \frac{1}{b-a} \cdot \frac{x^2}{2} |_{a}^{b} = \frac{a+b}{2}$
也就是说在区间$[a,b]$上服从均匀分布的连续型随机变量的数学期望时该区间的中点。
②指数分布
设随机变量$X$服从参数为$\lambda \gt 0$的指数分布,其概率密度为: $$ f(x) = \begin{cases} \lambda e^{-\lambda x},\ \ \ \ &x \gt 0 \ 0,&其他 \end{cases} $$ 则:$E(X) = \int_{-\infty}^{+\infty} x f(x) dx = \int_{0}^{+\infty} x \cdot \lambda e^{-\lambda x} dx = -xe^{-\lambda x} |{0}^{+\infty} + \int{0}^{+\infty} e^{-\lambda x} dx = 0-\frac{1}{\lambda}|_{0}^{+\infty} = \frac{1}{\lambda}$
这里利用到:$(uv)' = u'v + uv'$
③正态分布
设随机变量$X \sim N(\mu, \sigma^2)$,其概率密度为:$f(x) = \frac{1}{\sqrt{2\pi} \sigma} e^{-\frac{(x-\mu)^2}{2\sigma^2}},\ \ \ -\infty \lt x \lt +\infty$ ;则: $$ \begin{align} E(X) = \int_{-\infty}^{+\infty} x f(x) dx &= \int_{-\infty}^{+\infty} x \cdot \frac{1}{\sqrt{2\pi} \sigma} e^{-\frac{(x-\mu)^2}{2\sigma^2}} dx \ &\xlongequal{令z=\frac{x-\mu}{\sigma},则\frac{dz}{dx} = \frac{1}{\sigma}} \frac{1}{\sqrt{2\pi} \sigma} \int_{-\infty}^{+\infty} (\sigma z+\mu) \cdot e^{-\frac{z^2}{2}} \cdot \sigma dz \ &= \frac{\sigma}{\sqrt{2\pi}} \int_{-\infty}^{+\infty} ze^{-\frac{z^2}{2}}dz + \mu \int_{-\infty}^{+\infty} \frac{1}{\sqrt{2\pi}} e^{-\frac{z^2}{2}}dz \ &= 0 + \mu \cp 1 \ &= \mu \end{align} $$ 由此可见$X \sim N(\mu, \sigma^2)$中的$\mu$是其数学期望。
因为$\mu$是正态分布的中心,也是正态变量取值的集中位置,又因正态分布是对称的,所以$\mu$应该是其期望。
**定理2:**设连续型随机变量$X$,其概率密度为$f_X(x)$,又随机变量$Y=g(X)$;则当积分$\int_{-\infty}^{+\infty}g(X) f_X(x) dx$绝对收敛时,$Y = g(X)$数学期望存在,且有:$E(Y) = E(g(X)) = \int_{-\infty}^{+\infty}g(X) f_X(x) dx$;证明略。
例9:对圆的直径做近似测量$(cm)$,设其测量值在区间$(19.9,20.1)$上服从均匀分布,求其面积的均值。
解:设圆的面积为$S = g(X) = \pi(\frac{X}{2})^2 = \frac{\pi}{4} X^2$;已知$X$服从均匀分布,因此其概率密度为: $$ f_X(x) = \begin{cases} \frac{1}{0.2},\ \ \ \ \ & 19.9 \lt x \lt 20.1 \ 0, &其他 \end{cases} $$ 因此,$E(S) = E(g(X)) = E(\frac{\pi}{4} X^2) = \int_{-\infty}^{+\infty} \frac{\pi}{4} x^2 f(x) dx = \int_{19.9}^{20.1} \frac{\pi}{4} x^2 \frac{1}{0.2} dx = 314.16{cm^2}$
例10:设随机变量$X$的概率密度为: $$ f(x) = \begin{cases} x, \ \ \ \ &0 \le x \lt 1 \ 2-x, \ \ \ \ &1 \le x \lt 2 \ 0, &其他 \end{cases} $$ 求:$E[|X - E(X)|]$
解:先计算$E(X)$: $$ \begin{align} E(X) = \int_{-\infty}^{+\infty} x \cdot f(x) &= \int_{0}^{1} x \cdot x dx + \int_{1}^{2} x \cdot (2-x) dx + 0 \ &= \frac{1}{3} x^3 |{0}^{1} + (x^2 -\frac{1}{3}x^3)|{1}^{2} \ &= 1 \end{align} $$ 再计算$E[|X - E(X)|]$: $$ \begin{align} $E[|X - E(X)|]$ = E(|X - 1|) &= \int_{0}^{1} |x-1| \cdot x dx + \int_{1}^{2} |x-1| \cdot (2-x)dx \ &= \int_{0}^{1} (1-x) \cdot x dx + \int_{}^{} (x-1) \cdot (2-x) dx \ &= \int_{0}^{1} (x-x^2)dx + \int_{1}^{2} (-x^2 + 3x -2)dx\ &= (\frac{1}{2}x^2 - \frac{1}{3}x^3) |{0}^{1} + (-\frac{1}{3}x^3 + \frac{3}{2} x^2 -2x) |{1}^{2} \ &= \frac{1}{3} \end{align} $$
例11:设$X \sim N(0,1)$,$Y = e^X$,求$E(Y)$。
解:$X$的概率密度为:$f_X(x) = \frac{1}{\sqrt{2\pi}} e^{-\frac{x^2}{2}},\ \ -\infty \lt x \lt +\infty$ ,则: $$ \begin{align} E(Y) = \int_{-\infty}^{+\infty} e^x \cdot f_X(x) &= \int_{-\infty}^{+\infty} e^x \cdot \frac{1}{\sqrt{2\pi}} e^{-\frac{x^2}{2}} \cdot dx \ &= \int_{-\infty}^{+\infty} \frac{1}{\sqrt{2\pi}} e^{-\frac{x^2}{2} + \frac{2x}{2}} \cdot dx \ &= \int_{-\infty}^{+\infty} \frac{1}{\sqrt{2\pi}} e^{-\frac{x^2 -2x +1 - 1}{2}} \cdot dx \ &= \int_{-\infty}^{+\infty} \frac{1}{\sqrt{2\pi}} e^{-\frac{(x-1)^2 - 1}{2}} \cdot dx \ &= \int_{-\infty}^{+\infty} \frac{1}{\sqrt{2\pi}} e^{-\frac{(x-1)^2}{2} + \frac{1}{2}} \cdot dx \ &= e^{\frac{1}{2}}\int_{-\infty}^{+\infty} \frac{1}{\sqrt{2\pi}} e^{-\frac{(x-1)^2}{2}} \cdot dx \ &= e^{\frac{1}{2}} \end{align} $$
$\int_{-\infty}^{+\infty} e^{-\frac{(x-1)^2}{2}} = \sqrt{2\pi}$
1.3 二维随机变量的数学期望
**定理3:(1)**若$(X,Y)$为二维离散型随机变量,其分布律为:$P{X=x_i, Y=y_j} = p_{ij},\ \ i,j=1,2,...$;边缘分布律为:
$p_{i \cdot} = \sum_{j=1}^{\infty} p_{ij},\ \ \ \ p_{\cdot j} = \sum_{i=1}^{\infty} p_{ij}$ 则:
$E(X) = \sum_{i=1}^{\infty} x_i \cdot p_{i \cdot} = \sum_{i=1}^{\infty} (x_i \cdot \sum_{j=1}^{\infty} p_{ij}) = \sum_{i=1}^{\infty} \sum_{j=1}^{\infty} x_i \cdot p_{ij}$,
$E(Y) = \sum_{j=1}^{\infty} y_j \cdot p_{\cdot j} = \sum_{j=1}^{\infty} (y_j \cdot \sum_{i=1}^{\infty} p_{ij}) = \sum_{i=1}^{\infty} \sum_{j=1}^{\infty} y_j \cdot p_{ij}$。
**(2)**若$(X,Y)$为二维连续型随机变量,其概率密度为$f(x,y)$;$f_X(x),f_Y(y)$分别是关于$X,Y$的边缘概率密度,则:
$E(X) = \int_{-\infty}^{+\infty} x \cdot f_X(x) \cdot dx = \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} x \cdot f(x,y) \cdot dxdy$,
$E(Y) = \int_{-\infty}^{+\infty} y \cdot f_Y(y) \cdot dy = \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} y \cdot f(x,y) \cdot dxdy$,
**定理4:**设$g(x,y)$为连续函数,对于二维随机变量$(X,Y)$的函数$g(X,Y)$:
**(1)**若$(X,Y)$为离散型随机变量,且级数$\sum_{i=1}^{\infty} \sum_{j=1}^{\infty} g(x_i,y_j) \cdot p_{ij}$绝对收敛;则$E[g(X,Y)] = \sum_{i=1}^{\infty} \sum_{j=1}^{\infty} g(x_i,y_j) \cdot p_{ij}$ ;
**(2)**若$(X,Y)$为连续型随机变量,且积分$\int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} g(x,y) \cdot f(x,y) \cdot dxdy$绝对收敛;则$E[g(X,Y)] = \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} g(x,y) \cdot f(x,y) \cdot dxdy$ 。
例12:设二维随机变量$(X,Y)$的分布律为:
| X | Y | Y |
|---|---|---|
| X | 2 | 3 |
| 0.2 | ||
| 1 | 0.3 | 0.5 |
求:(1)$E(X+Y)$ (2)$E(XY)$
解:(1)如下: $$ \begin{align} E(X+Y) &= \sum_{i=1}^{\infty} \sum_{j=1}^{\infty} (x_i + y_j) \cdot p_{ij} \ &= (0+2)\cp 0.2 + (0+3)\cp 0 + (1+2)\cp 0.3 + (1+3)\cp 0.5 \ &= 3.3 \end{align} $$ (2)如下: $$ \begin{align} E(XY) &= \sum_{i=1}^{\infty} \sum_{j=1}^{\infty} (x_i \cdot y_j) \cdot p_{ij} \ &= (0\cp 2)\cp 0.2 + (0\cp 3)\cp 0 + (1\cp 2)\cp 0.3 + (1\cp 3)\cp 0.5 \ &= 2.1 \end{align} $$
例13:设二维随机变量$(X,Y)$的概率密度为: $$ f(x,y) = \begin{cases} c,\ \ \ \ & -1 \le x \le 1,\ 0 \le y \le 2 \ 0, &其他 \end{cases} $$ 求:(1)常数$c$ (2)$E(X+Y)$ (3)$E(XY)$
解:(1)$ \int_{-\infty}^{+\infty} f(x,y) dxdy = 1 = \int_{-1}^{1} \int_{0}^{2} c \cdot dxdy + 0 = 4c$;因此:$c = \frac{1}{4}$
(2)如下: $$ \begin{align} E(X+Y) &= \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} (x+y) \cdot f(x,y)dxdy \ &= \int_{-1}^{1} \int_{0}^{2} (x+y) \cdot \frac{1}{4}dxdy \ &= \frac{1}{4} \int_{-1}^{1} \int_{0}^{2} x \cdot dxdy + \frac{1}{4} \int_{-1}^{1} \int_{0}^{2} y \cdot dxdy \ &= \frac{1}{4} \int_{0}^{2} (\frac{1}{2} x^2 | {-1}^{1}) dy + \frac{1}{4} \int{-1}^{1} (\frac{1}{2} y^2 | {0}^{2}) dx \ &= 0 + \frac{1}{4} (2x|{-1}^{1}) \ &= 1 \end{align} $$ (3)如下: $$ \begin{align} E(XY) &= \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} xy \cdot f(x,y) \cdot dxdy \ &= \int_{-1}^{1} \int_{0}^{2} xy \cdot \frac{1}{4}dxdy \ &= \frac{1}{4} \int_{-1}^{1} xdx \cdot \int_{0}^{2} y dy \ &= 0 \end{align} $$
1.4 数学期望的性质
理解并掌握下列性可以大大地降低计算难度:
**性质1:**设$c$为整数,则$E(c) = c$; # 随机变量的值只能取$c$,即$P{X=c} = 1$;因此均值肯定是$c$。
**性质2:**设$X$为随机变量,$c$是常数,则$E(cX) = cE(X)$;
①若$X$为离散型随机变量:$E(cX) = \sum_{k=1}^{\infty} cx_k \cdot p_k = c\sum_{k=1}^{\infty} x_k \cdot p_k = cE(X)$;
②若$X$为连续型随机变量:$E(cX) = \int_{-\infty}^{+\infty} cx \cdot f(x) dx = c\int_{-\infty}^{+\infty} x \cdot f(x) dx = cE(X)$。
**性质3:**设$X、Y$均为随机变量,则:$E(X+Y) = E(X) + E(Y)$。
以连续型随机变量为例:设$(X,Y)$为二维随机变量,其概率密度为$f(x,y)$,$Z = X+Y$是$(X,Y)$的函数,有:
$E(Z) = E(X+Y) = \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} (x+y) \cdot f(x,y) dxdy = \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} x \cdot f(x,y) dxdy + \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} y \cdot f(x,y) dxdy = E(X) + E(Y)$
**性质4:**设$X$与$Y$为相互独立的随机变量,则$E(XY) = E(X) \cdot E(Y)$。
以连续型随机变量为例:设$(X,Y)$为二维随机变量,其概率密度为$f(x,y)$,由于$X$与$Y$为相互独立的随机变量,因此$f(x,y) = f_X(x) \cdot f_Y(y)$;从而:
$E(XY) = \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} xy \cdot f(x,y) dxdy = \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} xy \cdot f_X(x) \cdot f_Y(y) dxdy = (\int_{-\infty}^{+\infty} x \cdot f_X(x) dx) \cdot (\int_{-\infty}^{+\infty} y \cdot f_Y(y) dy) = E(X) \cdot E(Y)$ 。
例14:设随机变量$X \sim B(n,p)$,利用数学期望的性质求$E(X)$。
解:在$n$重伯努利试验中,令: $$ X_k = \begin{cases} 1,\ \ \ \ & A在第k次试验中出现\ 0,&其他 \end{cases} \ \ \ \ \ \ \ \ ,k=1,2,...,n,... $$ 易知:$X = X_1 + X_2 + ... + X_n + ...$;又因$X_k$是服从$0-1$分布的,因此$P{X_k = 1} = p$;$E(X_k) = p$;再有性质3得:
$E(X) = E(X_1) + E(X_2) + ... + E(X_n) = np$
可见使用性质计算数学期望比使用定义要便利许多。
2 方差
2.1 方差的概念
数学期望反应的是随机变量取值的平均水平。
**定义3:**设$X$为随机变量,若$E[X - E(X)]^2$存在,则称它为随机变量$X$的<u>方差</u>,记为$D(X)$,即$D(X) = E[X - E(X)]^2$,称$\sqrt{D(X)}$为随机变量$X$的<u>标准差</u>。
因此,$D(X)$是$X$的函数$[X-E(X)]^2$数学期望,它描述了$X$与其均值的偏离程度,$D(X)$越小说明$X$取值越集中;反之越分散。即:$D(X)$反应了$X$ 取值的波动性大小。
若$X$为离散型随机变量,其分布律为$P{X=x_k} = p_k,\ \ k=1,2,...$,则有:$D(X) = \sum_{k=1}^{\infty} [x_k - E(X)]^2 \cdot p_k$;
若$X$为连续型随机变量,其概率密度为$f(x)$,则$D(X) = \int_{-\infty}^{+\infty} [x-E(X)]^2 \cdot f(x) dx$。
<u>事实上,无论$X$为离散型随机变量还是连续型随机变量,通常都使用:$D(X) = E(X^2) - [E(X)]^2$来计算方差</u>。
证明:$\bigstar \bigstar \bigstar \bigstar \bigstar $ $$ \begin{align} D(X) = E[X - E(X)]^2 &= E{X^2 - 2X \cdot E(X) + [E(X)]^2} \ &= E{X^2 - 2E(X) \cdot E(X) + [E(X)]^2} \ \ \ \ \ \ \ \ \ #近似地 \ &=E{X^2 -[E(X)]^2} \ &=E(X^2) - [E(X)]^2 \end{align} $$
例1:设随机变量$X$的分布律为:
| X | -1 | 1 | |
|---|---|---|---|
| P | 0.2 | 0.3 | 0.5 |
求:$D(X)$
解:方法1:使用定义
$E(X) = (-1)\cp 0.2 + 0 \cp 0.3 + 1 \cp 0.5 = 0.3$
$D(X) = (-1 - 0.3)^2 + (0 - 0.3)^2 + (1-0.3)^2 = 0.61$
方法2:使用上面的性质
$E(X^2) = (-1)^2 \cp 0.2 + (0)^2 \cp 0.3 + 1^2 \cp 0.5 = 0.7$
$D(X) = E(X^2) - [E(X)]^2 = 0.7 - 0.3^3 = 0.61$
例2:设随机变量$X$的概率密度为: $$ f(x) = \begin{cases} 1,\ \ \ \ \ \ \ \ &0 \le x \le 1 \ 0,&其他 \end{cases} $$ 求:$D(X)$
解:方法1:使用定义
$E(X) = \int_{-\infty}^{+\infty} x \cdot f(x) dx = \int_{0}^{1} xdx = (\frac{1}{2} x^2) | _{0}^{1} = \frac{1}{2}$
$D(X) = \int_{-\infty}^{+\infty} [x - E(X)]^2 \cdot f(x)dx = \int_{0}^{1} (x-\frac{1}{2})^2 \cdot 1dx = \frac{1}{12}$
方法2:使用性质
$E(X^2) = \int_{-\infty}^{+\infty} x^2 \cdot f(x) dx = \int_{0}^{1} x^2 \cdot 1 dx = \frac{1}{3}$
$D(X) = E(X^2) - [E(X)]^2 = \frac{1}{3} - (\frac{1}{2})^2 = \frac{1}{12}$
例3:若随机变量$X$的数学期望$E(X)=-2,D(X)=4$,求$E(X^2)$。
解:$D(X) = 4 = E(X^2) - [E(X)]^2 = E(X^2) - (-2)^2$ ;因此$E(X^2) = 8$。
例4:设随机变量$X$的概率密度为: $$ f(x) = \begin{cases} 1+x,\ \ \ \ \ \ \ \ \ &-1 \le x \lt 0 \ 1-x, & 0 \le x \lt 1 \ 0,&其他 \end{cases} $$ 求$D(X)$
解:$E(X) = \int_{-\infty}^{+\infty} xf(x)dx = \int_{-1}^{0} x(1+x) dx + \int_{0}^{1} x(1-x) dx = (\frac{x^2}{2} + \frac{x^3}{3})|{-1}^{0} + (\frac{x^2}{2} - \frac{x^3}{3})|{0}^{1} = 0$
这里还有个思路:$f(x)$在$[-1,1]$上是偶函数,因此$xf(x)$在$[-1,1]$上是奇函数,因此:$E(X) = \int_{-\infty}^{+\infty} xf(x) dx = \int_{-1}^{1} xf(x) dx = 0$
$E(X^2) = \int_{-\infty}^{+\infty} x^2 f(x) dx = \int_{-1}^{0} x^2 f(x) dx + \int_{0}^{1} x^2 f(x) dx = \int_{-1}^{0} x^2 (1+x) dx + \int_{0}^{1} x^2 (1-x) dx = (\frac{x^3}{3} + \frac{x^4}{4})|{-1}^{0} + (\frac{x^3}{3} - \frac{x^4}{4})|{0}^{1} = \frac{1}{6}$
$D(X) = E(X^2) - [E(X)]^2 = \frac{1}{6} - 0 = \frac{1}{6}$
例5:设随机变量$X$的概率密度为: $$ f(x) = \begin{cases} ax^2 + bx+ c,\ \ \ \ \ \ \ \ &0 \lt x \lt 1 \ 0,&其他
\end{cases} $$ 已知$E(X) = 0.5,\ D(X)=0.15$,求常数$a,b,c$的值。
解:由$\int_{-\infty}^{+\infty} f(x) dx = 1$知:$\int_{0}^{1} (ax^2 + bx + c) dx = 1$,即:$\frac{a}{3} + \frac{b}{2} + c = 1$
由$E(X)= 0.5$知:$\int_{-\infty}^{+\infty} x f(x) dx = \int_{0}^{1} x (ax^2 + bx + c) dx = 0.5$,得:$\frac{a}{4} + \frac{b}{3} + c = 0.5$
由$E(X)=0.5,\ D(X)=0.15$知:$E(X^2) = D(X) + [E(X)]^2 = 0.4$,得:$\int_{-\infty}^{+\infty} x^2 f(x) dx = \int_{0}^{1} x^2 (ax^2 + bx + c) dx =0.4$;得:$\frac{a}{5} + \frac{b}{4} + c = 0$
根据以上解得:$a = 12, b = -12, c = 3$。
2.2 常见随机变量的方差 $\bigstar$
1. $0-1$分布
设随机变量$X$服从$0-1$分布,其分布律为:$P{X=1}=p,\ P{X=0} = 1-p,\ \ 0 \lt p \lt 1$,则$X$的方差:
$D(X) = p(1-p)$
因为:$E(X) = 1\cp p + 0 \cp (1-p) = p$,同样地$E(X^2) = p$;故:$D(X) = E(X^2) - [E(X)]^2 = p-p^2 = p(1-p)$
2.二项分布
设随机变量$X \sim B(n,p)$,其分布律为:$p_k = P{X=k} = C_n^k p^k(1-p)^{n-k},\ k=0,1,...,n\ \ ;0\lt p \lt 1$,则$X$的方差:
$D(X) = np(1-p)$
例6:已知随机变量$X \sim B(n,p)$,且$E(X) = 1.6,\ D(X) = 1.28$,求参数$n,p$的值。
解:$E(X)= 1.6 = np;\ \ \ D(X) = 1.28 = np(1-p)$因此得:$n=8,p=0.2$
3.泊松分布
设随机变量$X \sim P(\lambda)$,其分布律为:$p_k = P{X=k} = \frac{\lambda^k}{k!} e^{-\lambda},\ k=0,1,...$,则$X$的方差:$D(X) = \lambda$。
在$X\sim P(\lambda)$的情况下:$\lambda$既是$X$的数学期望,又是其方差。
例7:设随机变量$X \sim P(\lambda)$,且$P{X=1} = P{X=2}$,求$D(X)$。
解:由已知:$P{X=1} = \frac{\lambda^1}{1!} e^{-\lambda},\ \ P{X=2} = \frac{\lambda^2}{2!} e^{-\lambda}$ 得:$\frac{\lambda e^{-\lambda}}{1} = \frac{\lambda^2 e^{-\lambda}}{2}$
因此:$\lambda = 2$;即$D(X) = 2$
4.均匀分布
设随机变量$X$服从区间$[a,b]$上的均匀分布,其概率密度为: $$ f(x) = \begin{cases} \frac{1}{b-a},\ \ \ \ &a \le x \le b \ 0,&其他 \end{cases} $$ 则$X$的方差为:$D(X) = \frac{(b-a)^2}{12}$
$$ 从而:$P{X \gt 2.5} = \int_{2.5}^{+\infty} f(x) dx = \int_{2.5}^{3} \frac{1}{2} dx = 0.25$
5.指数分布
设随机变量$X$服从参数为$\lambda$的指数分布,其概率密度为: $$ f(x) = \begin{cases} \lambda e^{-\lambda x},\ \ \ \ \ \ \ \ & x \gt 0 \ 0,&其他 \end{cases} $$ 则$X$的方差为:$D(X) = \frac{1}{\lambda^2}$
6.正态分布
设随机变量$X \sim N(\mu, \sigma^2)$,其概率密度为:$f(x) = \frac{1}{\sqrt{2\pi} \sigma} e^{-\frac{(x - \mu)^2}{2 \sigma^2}}, \ \ -\infty \lt x \lt +\infty $ ;则$X$的方差:$D(X) = \sigma^2$。
因为:$X \sim N(\mu, \sigma^2)$,所以$E(X) = \mu$;再根据方差的定义:$D(X) = \int_{-\infty}^{+\infty} [x - E(X)]^2 f(x) dx = \int_{-\infty}^{+\infty} (x-\mu)^2 \cdot \frac{1}{\sqrt{2\pi} \sigma} e^{-\frac{(x - \mu)^2}{2 \sigma^2}} \cdot dx$ ;我们令$t = \frac{x-\mu}{\sigma}$得:
$D(X) = \frac{\sigma^2}{\sqrt{2\pi}} \int_{-\infty}^{+\infty} t^2 e^{-\frac{t^2}{2}} dt = \frac{\sigma^2}{\sqrt{2\pi}} (-te^{-\frac{t}{2}} | {-\infty}^{+\infty} + \int{-\infty}^{+\infty} e^{-\frac{t^2}{2}} dt) = \sigma^2$
例9:设随机变量$X \sim N(0,1)$求$D(|X|)$。
解: $$ \begin{align} E(|X|) &= \int_{-\infty}^{+\infty} |x| \cdot \frac{1}{\sqrt{2\pi}} e^{-\frac{x^2}{2}} \cdot dx \ &= 2 \cp \frac{1}{\sqrt{2\pi}} \int_{0}^{+\infty} x \cdot e^{-\frac{x^2}{2}} \cdot dx \ &= -\frac{2}{\sqrt{2\pi}} \int_{0}^{+\infty} de^{-\frac{x^2}{2}} \ &= -\frac{2}{\sqrt{2\pi}} (e^{-\frac{x^2}{2}})|_{0}^{+\infty} \ &= \sqrt{\frac{2}{\pi}} \end{align} $$ 又有:$E(|X|^2) = E(X^2) = 1 = D(|X|) + [E(|X|)]^2$则:$D(|X|) = E(|X|^2) - [E(|X|)]^2 = 1 - \frac{2}{\pi}$。
例10:设二维随机变量$(X,Y)$得分布律为:
| X | Y | Y | Y |
|---|---|---|---|
| X | $\frac{1}{3}$ | 1 | |
| -1 | $\frac{1}{4}$ | $\frac{1}{3}$ | |
| $\frac{1}{6}$ | |||
| 2 | $\frac{1}{4}$ |
求:$E(X),E(Y),D(X),D(Y)$。
解:$X$的边缘分布律为:
| X | -1 | 2 | |
|---|---|---|---|
| P | $\frac{7}{12}$ | $\frac{1}{6}$ | $\frac{1}{4}$ |
则有:$E(X) = (-1) \cp \frac{7}{12} + 0 \cp \frac{1}{6} + 2 \cp \frac{1}{4} = -\frac{1}{12}$
$E(X^2) = (-1)^2 \cp \frac{7}{12} + 0^2 \cp \frac{1}{6} + 2^2 \cp \frac{1}{4} = -\frac{19}{12}$
$D(X) = E(X^2) - [E(X)]^2 = \frac{227}{144}$
$Y$的边缘分布律为:
| Y | $\frac{1}{3}$ | 1 | |
|---|---|---|---|
| P | $\frac{5}{12}$ | $\frac{1}{4}$ | $\frac{1}{3}$ |
则有:$E(Y) = 0 \cp \frac{5}{12} + \frac{1}{3} cp \frac{1}{4} + 1 \cp \frac{1}{3} = \frac{5}{12}$
$E(Y^2) = 0^2 \cp \frac{5}{12} + (\frac{1}{3})^2 cp \frac{1}{4} + 1^2 \cp \frac{1}{3} = \frac{13}{36}$
$D(Y) = E(Y^2) - [E(Y)]^2 = \frac{27}{144}$
例11:设二维随机变量$(X,Y)$的概率密度为: $$ f(x,y) = \begin{cases} \frac{1}{2},\ \ \ \ & 0 \lt x \lt 1,\ 0 \lt y \lt 2 \ 0,&其他 \end{cases} $$ 求:$E(X),E(Y),D(X),D(Y)$。
解:$X$的概率密度为: $$ f_X(x) = \int_{-\infty}^{+\infty} f(x,y) dy = \begin{cases} 1,\ \ \ \ & 0 \lt x \lt 1 \ 0,&其他 \end{cases} $$ 则有:$E(X) = \int_{-\infty}^{+\infty} x f_X(x) dx = \int_{0}^{1} xdx = \frac{1}{2}$
$E(X^2) = \int_{-\infty}^{+\infty} x^2 f_X(x) dx = \int_{0}^{1} x^2dx = \frac{1}{3}$
$D(X) = E(X^2) - [E(X)]^2 = \frac{1}{12}$
$Y$的概率密度为: $$ f_Y(y) = \int_{-\infty}^{+\infty} f(x,y) dx = \begin{cases} \frac{1}{2},\ \ \ \ & 0 \lt y \lt 2 \ 0,&其他 \end{cases} $$ 则有:$E(Y) = \int_{-\infty}^{+\infty} yf_Y(y) dy = \int_{0}^{2} y \cdot \frac{1}{2} dy = 1$
$E(Y^2) = \int_{-\infty}^{+\infty} y^2 f_Y(y) dy = \int_{0}^{2} y^2 \cdot \frac{1}{2} dy = \frac{4}{3}$
$D(X) = E(X^2) - [E(X)]^2 = \frac{1}{3}$
例12:设二维随机变量$(X,Y)$在$D$上服从均匀分布,其中$D$是由$x$轴,$y$轴以及直线$x+y=1$所围成的平面区域,求$D(X)$。
解:首先画图:

$D$的面积:$S = \frac{1}{2}$;所以$(X,Y)$的概率密度为: $$ f(x,y) = \begin{cases} \frac{1}{S} = 2, \ \ \ \ & x,y \in D \ 0,&其他 \end{cases} $$ 解法一:(先求概率密度)
$X$的概率密度为: $$ \begin{align} f_X(x) = \int_{-\infty}^{+\infty} f(x,y) dy &= \begin{cases} \int_{0}^{1-x} 2 dy , \ \ \ \ &0 \le x \le 1 \ 0,&其他 \ \end{cases} \ &= \begin{cases} 2(1-x) , \ \ \ \ &0 \le x \le 1 \ 0,&其他 \ \end{cases} \ \end{align} $$ 因此:$E(X) = \int_{-\infty}^{+\infty} x \cdot f_X(x) dx = \int_{0}^{1} 2x(1-x) dx = \frac{1}{3}$
$E(X^2) = \int_{-\infty}^{+\infty} x^2 \cdot f_X(x) dx = \int_{0}^{1} 2x^2(1-x) dx = \frac{1}{6}$
$D(X) = E(X^2) - [E(X)]^2 = \frac{1}{18}$
解法二:(不求概率密度)
$E(X) = \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} x \cdot f(x,y) dxdy = \int_{0}^{1}( \int_{0}^{1-x} 2x dy)dx = \int_{0}^{1} 2x(1-x) dx = \frac{1}{3}$
$E(X^2) = \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} x^2 \cdot f(x,y) dxdy = \int_{0}^{1}( \int_{0}^{1-x} 2x^2 dy)dx = \int_{0}^{1} 2x^2(1-x) dx = \frac{1}{6}$
$D(X) = E(X^2) - [E(X)]^2 = \frac{1}{18}$
2.3 方差的性质 $\bigstar \bigstar \bigstar$
**前提:**假设以下所遇到的随机变量的方差都是存在的。
性质1: 设$X$为随机变量,$c$是常数,则: $D(c)=0,\ D(X+c) = D(X)$。
性质2: 设$X$为随机变量,$c$是常数,则: $D(cX) = c^2D(X)$。
性质3: 设$X$ 与$Y$ 是相互独立的随机变量,则:$D(X+Y) = D(X) + D(Y)$。
更一般地:设$X_1,X_2,...,X_n \ \ n\ge 2$为相互独立的随机变量,则: $D(X_1+X_2+...+X_n) = D(X_1) + D(X_2) + ... + D(X_n)$。
例13: 设$X_1,X_2,...,X_n \ \ n\ge 2$ 为相互独立的随机变量,都服从$0-1$ 分布,概率为:$P{X_i = 1} = p,\ \ P{X_i = 0} = 1-p \ \ \ i=1,2,...,n$;设$X = X_1 + X_2 + ... +X_n$,证明:$X \sim B(n,p)$ ,并求$E(X),D(X)$。
解: $X$的可能取值为$0,1,2,...,n$,概率为: $P{X=k} = P{X_1+X_2+...+X_n = k} = P{k个X_i 取1,剩余的取0} \xlongequal{独立} C_n^k p^k(1-p)^{n-k}$ 故$X \sim B(n,p)$
由$E(X_k) = p,\ D(X_k) = p(1-p)$ 且$X_i$ 间相互独立,有:
$E(X) = E(X_1) + E(X_2) + ... + E(X_n) = np$
$D(X) = D(X_1) + D(X_2) + ... + D(X_n) = np(1-p)$
例14:设有随机变量$X, E(X)=\mu, D(X) = \sigma^2$,求$Y = \frac{X-\mu}{\sigma}$ 的数学期望和方差。
解:$E(Y) = E(\frac{X-\mu}{\sigma}) = \frac{1}{\sigma} E(X-\mu) = \frac{1}{\sigma} [E(X) - \mu] = \frac{1}{\sigma} [\mu - \mu] = 0$
$D(Y) = D(\frac{X-\mu}{\sigma}) = \frac{1}{\sigma^2} D(X-\mu) = \frac{1}{\sigma^2} D(X) = 1$
例15:设$X_1,X_2,...,X_n$为相互独立的随机变量,其数学期望和方差分别为$E(X_i) = \mu, D(X_i)= \sigma^2,\ \ i = 1,2,...,n$,令$\overline{X} = \frac{1}{n} \sum_{i=1}^{n} X_i$,求$E(\overline{X}),\ D(\overline{X})$。
解:$E(\overline{X}) = E(\frac{1}{n} \sum_{i=1}^{n} X_i) = \frac{1}{n} \sum_{i=1}^{n} E(X_i) = \frac{1}{n} \cdot n\mu = \mu$
$D(\overline{X}) = D(\frac{1}{n} \sum_{i=1}^{n} X_i) = \frac{1}{n^2} \sum_{i=1}^{n} D(X_i) = \frac{1}{n^2} \cdot n\sigma^2 = \frac{\sigma^2}{n}$
例16:设随机变量$X,Y$表示投掷两骰子的点数,求$X+Y,X-Y$的数学期望和方差。$\bigstar \bigstar \bigstar$
解:$X$的分布律为:$P{X=k} = \frac{1}{6},\ \ k=1,2,...,6$
$E(X) = \sum_{k=1}^{6} x_k \cdot p_k= \sum_{k-1}^{6} k \cdot \frac{1}{6} = \frac{7}{2}$
$E(X^2) = \sum_{k=1}^{6} x_k^2 \cdot p_k= \sum_{k-1}^{6} k^2 \cdot \frac{1}{6} = \frac{91}{6}$
$D(X) = E(X^2) - [E(X)]^2 = \frac{35}{12}$
同理:$E(Y) = \frac{7}{2},\ D(Y) = \frac{35}{12}$,由题目知,$X$与$Y$相互独立,故:
$E(X+Y) = E(X) + E(Y) = 7$
$E(X- Y) = E(X) + E(-Y) = E(X) - E(Y) = 0$
$D(X+Y) = D(X) + D(Y) = \frac{35}{6}$
$D(X-Y) = D(X) + D(-Y) = D(X) + D(Y) = \frac{35}{6}$
小结$\bigstar \bigstar \bigstar \bigstar \bigstar$
| 分布 | 分布律或概率密度 | 数学期望(均值) | 方差 | |
|---|---|---|---|---|
| 离散型 | $X$服从参数为$p$的$0-1$分布 | $P{X=1}=p,P{X=0}=1-p$ | $p$ | $p(1-p)$ |
| 离散型 | 二项分布:$X \sim (n,p)$ | $P{X=k} = C_n^k p^k (1-p)^{n-k},\ \ k=0,1,...n,\ \ 0 \lt p \lt 1$ | $np$ | $np(1-p)$ |
| 离散型 | 泊松分布:$X \sim P(\lambda)$ | $P{X=k} = \frac{\lambda^k}{k!} e^{-\lambda},\ \ k=0,1,...n,\ \ \lambda \gt 0$ | $\lambda$ | $\lambda$ |
| 连续型 | 均匀分布:$X \sim U(a,b)$ | $$f(x) = \begin{cases} \frac{1}{b-a},\ \ &a \le x \le b \ 0,&其他 \end{cases}$$ | $\frac{a+b}{2}$ | $\frac{(b-a)^2}{12}$ |
| 连续型 | 指数分布:$X \sim E(\lambda)$ | $$f(x) = \begin{cases} \lambda e^{-\lambda x},\ \ &x \gt 0 \ 0,& x \le 0 \end{cases},\ \ \ \ \ \ \ \ \lambda \gt 0$$ | $\frac{1}{\lambda}$ | $\frac{1}{\lambda^2}$ |
| 连续型 | 正态分布:$X \sim N(\mu, \sigma^2)$ | $f(x) = \frac{1}{\sqrt{2\pi} \sigma} e^{-\frac{(x-\mu)^2}{2\sigma}},\ \ \ \ \sigma \gt 0$ | $\mu$ | $\sigma^2$ |
3 协方差与相关系数
对于二维随机变量$(X,Y)$而言,$X$和$Y$的数学期望与方差仅仅描述了$X$和$Y$的自身的默写特性,而对于$X$与$Y$之间的关系并未提供任何信息,因此,我们需要引入协方差和相关系数。
3.1 协方差
注意到:$D(X) = E[X- E(X)]^2 = E[(X-E(X)) \times (X-E(X))]$,它反映了一个随机变量与它自身均值的平均偏差,将前面等式右边的第二个$(X-E(X))$换成$Y-E(Y)$就得到了如下协方差的定义。
定义4: 设$(X,Y)$未二维随机变量,且$E(X), E(Y)$存在,若$E[(X-E(X)) \times (Y - E(Y))]$存在,则称其为随机变量$X$与$Y$的<u>协方差</u>,记为:$Cov(X,Y)$,即:$Cov(X,Y) = E[(X-E(X)) \times (Y-E(Y))]$ 。
当$(X,Y)$为二维离散型随机变量是,其分布律为:$p_{ij} = P{X=x_i,Y=y_j},\ \ i,j=1,2,...$ 则:
$Cov(X,Y) = \sum_{i=1}^{\infty} \sum_{j=1}^{\infty} [x_i-E(X)] \cdot [y_j-E(Y)] \cdot p_{ij}$
当(X,Y)为二维连续型随机变量是,其概率密度为:$f(x,y)$ 则:
$Cov(X,Y) = \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} [x_i-E(X)] \cdot [y_j-E(Y)] \cdot f(x,y)dxdy$
计算协方差还有另一个常用公式:$Cov(X,Y) = E(XY) - E(X)E(Y)$
证明: $$ \begin{align} Cov(X,Y) &= E[(X-E(X)) \times (Y-E(Y))] \ &= E[XY - XE(Y) - YE(X) + E(X)E(Y)] \ &= E(XY) -E(X)E(Y) - E(Y)E(X) + E(X)E(Y) \ &= E(XY) -E(X)E(Y) \end{align} $$ 特别是当$X=Y$时:$Cov(X,Y) = D(X) = D(Y)$。
例1:设二维随机变量$(X,Y)$的概率密度为: $$ f(x,y) = \begin{cases} \frac{1}{2}, \ \ \ \ \ & 0 \lt x \lt 1,0 \lt y \lt 2 \ 0,&其他 \end{cases} $$ 求:$Cov(X,Y)$
解:由已知可得:
$E(X) = \int_{0}^{1} \int_{0}^{2} x f(x,y) dxdy = \int_{0}^{1} x dx = \frac{1}{2}$
$E(Y) = \int_{0}^{1} \int_{0}^{2} y f(x,y) dxdy = \int_{0}^{1} 1 dx = 1$
$E(XY) = \int_{0}^{1} \int_{0}^{2} xy f(x,y) dxdy = \int_{0}^{1} x dx = \frac{1}{2}$
则:$Cov(X,Y) = E(XY) - E(X)E(Y) = 0$
例2:设二维随机变量$(X,Y)$在区域$D$上服从均匀分布,其中$D$为$x$轴、$y$轴以及$x+y=1$所围成的平面区域,求$X$与$Y$的协方差$Cov(X,Y)$。
解:先画图
.assets/image-20250105145453111.png)
平面区域的面积$S = \frac{1}{2}$
由题目知$(X,Y)$的概率密度为: $$ f(x,y) = \begin{cases} \frac{1}{S} = 2,\ \ \ \ & (x,y) \in D \ 0,&其他 \end{cases} $$ 分别计算$E(X),E(Y),E(XY)$:
$E(X) = \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} x \cdot f(x,y) dxdy = \int_{0}^{1} \int_{0}^{1-x} 2x dxdy = \int_{0}^{1} 2x(1-x) dx = \frac{1}{3}$
$E(Y) = \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} y \cdot f(x,y) dxdy = \int_{0}^{1} \int_{0}^{1-x} 2y dxdy = \int_{0}^{1} (1-x)^2 dx = \frac{1}{3}$
$E(XY) = \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} xy \cdot f(x,y) dxdy = \int_{0}^{1} \int_{0}^{1-x} 2xy dxdy = \int_{0}^{1} (x - 2x^2 + x^3) dx = \frac{1}{12}$
于是:$Cov(X,Y) = E(XY) - E(X)E(Y) = -\frac{1}{36}$
协方差的性质$\bigstar \bigstar \bigstar$
① $Cov(X,X) = D(X)$
② $Cov(X,c) = 0,\ \ c是常数$
③ $Cov(X,Y) = Cov(Y,X)$
④ $Cov(aX,bY) = abCov(X,Y)$
⑤ $Cov(X+Y,Z) = Cov(X,Z) + Cov(Y,Z)$
⑥ $D(X \pm Y) = D(X) + D(Y) \pm 2Cov(X,Y)$
$D(X + Y) = D(X) + D(Y) + 2Cov(X,Y)$
$D(X - Y) = D(X) + D(Y) - 2Cov(X,Y)$
⑦ 若$X$与$Y$相互独立,则$Cov(X,Y) = 0$
需要注意的是: $Cov(X,Y) = 0$ 并不能代表$X$与$Y$相互独立!若 $Cov(X,Y) \ne 0$ 那么$X$与$Y$肯定不是相互独立的!!!
例3:设二维随机变量$(X,Y)$在圆域$D={(x,y)|x^2 + y^2 \le 1}$上服从均匀分布,求协方差$Cov(X,Y)$,并判断$X,Y$是否相互独立。
解:画图
.assets/image-20250105152836843.png)
区域$D$的面积为$S$,则$(X,Y)$的概率密度为: $$ f(x,y) = \begin{cases} \frac{1}{S} = \frac{1}{\pi}, \ \ \ \ & (x,y) \in D \ 0,&其他 \end{cases} $$ 先分别计算$f_X(x),f_Y(y)$: $$ \begin{align} f_X(x) = \int_{-\infty}^{+\infty} f(x,y) dy &= \begin{cases} \int_{-\sqrt{1-x^2}}^{\sqrt{1-x^2}} \frac{1}{\pi} dy = \frac{2}{\pi} \sqrt{1-x^2},\ \ \ &-1 \le x \le 1 \ 0,&其他 \end{cases} \end{align} $$
$$ \begin{align} f_Y(y) = \int_{-\infty}^{+\infty} f(x,y) dx &= \begin{cases} \int_{-\sqrt{1-y^2}}^{\sqrt{1-y^2}} \frac{1}{\pi} dy = \frac{2}{\pi} \sqrt{1-y^2},\ \ \ &-1 \le y \le 1 \ 0,&其他 \end{cases} \end{align} $$
$$ E(XY) = \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} xy \cdot f(x,y) dxdy = \int_{-1}^{1}( \int_{-\sqrt{1-x^2}}^{\sqrt{1-x^2}} \frac{1}{\pi} xydy)dx = \int_{-1}^{1} 0 dx = 0 $$
$$ E(X) = \int_{-\infty}^{+\infty} x \cdot f_X(x) dx = \int_{-1}^{1} x\cdot \frac{2}{\pi} \sqrt{1-x^2} dx = 0 $$
$$ E(Y) = \int_{-\infty}^{+\infty} y \cdot f_Y(y) dy = \int_{-1}^{1} y\cdot \frac{2}{\pi} \sqrt{1-y^2} dy = 0 $$ 于是:$Cov(X,Y) = E(XY) -E(X)E(Y) = 0$;但是$f(x,y) \ne f_X(x) \cdot f_Y(y)$,所以:$X$与$Y$并非相互独立的。
3.2 相关系数
定义5: 若$D(X) \gt 0,D(Y) \gt 0$,称$\frac{Cov(X,Y)}{\sqrt{D(X)} \sqrt{D(Y)}}$为$X$与$Y$的<u>相关系数</u>,简记:$\rho_{XY}$,即:$\rho_{XY} = \frac{Cov(X,Y)}{\sqrt{D(X)} \sqrt{D(Y)}}$。
例4:设随机变量$X$与$Y$的方差分别为$D(X) = 16,D(Y) = 25$,协方差$Cov(X,Y) = 6$,求相关系数$\rho_{XY}$。
解:$\rho_{XY} = \frac{Cov(X,Y)}{\sqrt{D(X)} \sqrt{D(Y)}} = \frac{6}{4 \times 5} = 0.3$
相关系数具有以下性质$\bigstar \bigstar \bigstar$
设$\rho$为随机变量$X$与$Y$的相关系数,则:
(1) $|\rho| \le 1$;
(2) $|\rho| = 1$的充分必要条件是存在常数$a,b$,使得$P{Y = aX+b} = 1,\ \ a \ne 0$ 。
相关系数是两个随机变量间<u>线性关系</u>强弱的一种度量;其中性质(2)表示随机变量$X$与$Y$之间存在线性关系的概率为$1$。
当$\rho = 1$时,为正线性相关,即$a \gt 0$;
当$\rho = -1$时,为负线性相关,即$a \lt 0$;
当$|\rho| \lt 1$时,$|\rho|$越小,$X$与$Y$的线性相关程度越弱;
直到$\rho=0$时,$X$与$Y$之间就不存在线性相关了。
定义6: 设离散型型随机变量$X$与$Y$的相关系数$\rho_{XY} = 0$,则称随机变量$X$与$Y$不相关。
显然,<u>若$D(X) \gt 0, D(Y) \gt 0$时</u>,随机变量$X$与$Y$<u>不相关</u>的充要条件是:$Cov(X,Y) = 0$。
若$X$与$Y$相互独立,则$Cov(X,Y)=0$,因此$X$与$Y$也不相关;但是反之,$X$与$Y$不相关并不意味着$X$与$Y$相互独立,而只能说明$X$与$Y$之间不存在线性关系,但是还是有可能存在其他非线性关系的。
需要特别指出的是:二维正态分布$N(\mu_1,\mu_2,\sigma_1^2,\sigma_2^2,\rho)$是一个例外;若$(X,Y) \sim N(\mu_1,\mu_2,\sigma_1^2,\sigma_2^2,\rho)$,则$X$与$Y$的相关系数$\rho_{XY} = \rho$;故,$X$与$Y$不相关的充分必要条件是$\rho = 0$,另一方面,$X$与$Y$相互独立的充分必要条件也是$\rho=0$;从而,对于服从二维正态分布的随机变量$(X,Y)$而言,不相关与独立性是一致的。换句话说:在这种情况下,$X$与$Y$相互独立和$X$与$Y$相互独立互为充分必要条件。
$\bigstar \bigstar \bigstar$例5:设二维随机变量$(X,Y)$的分布律为:
| Y | X | X |
|---|---|---|
| Y | -1 | 1 |
| -1 | 0.25 | 0.5 |
| 1 | 0.25 |
求:$E(X),E(Y),D(X),D(Y),Cov(X,Y),\rho_{XY}$
解:先分别计算$X$与$Y$的分布律:
$X$的分布律:
| X | -1 | 1 |
|---|---|---|
| P | 0.25 | 0.75 |
$Y$的分布律:
| Y | -1 | 1 |
|---|---|---|
| P | 0.75 | 0.25 |
则有:
$E(X) = (-1) \times 0.25 + 1 \times 0.75 = 0.5$
$E(X^2) = (-1)^2 \times 0.25 + 1^2 \times 0.75 = 1$
$D(X) = E(X^2) - [E(X)]^2 = 0.75$
$E(Y) = (-1) \times 0.75 + 1 \times 0.25 = -0.5$
$E(Y^2) = (-1)^2 \times 0.75 + 1^2 \times 0.25 = 1$
$D(Y) = E(Y^2) - [E(Y)]^2 = 0.75$
$E(XY) = (-1) \times (-1) \times 0.25 + (-1) \times 1 \times 0.5 + 1 \times (-1) \times 0 + 1 \times 1 \times 0.25 = 0$
$Cov(X,Y) = E(XY) - E(X)E(Y) = 0.25$
$\rho_{XY} = \frac{Cov(X,Y)}{\sqrt{D(X)} \sqrt{D(Y)}} = \frac{1}{3}$
$\bigstar \bigstar \bigstar$例6:设二维随机变量$(X,Y)$的概率密度为: $$ f(x,y) = \begin{cases} 8xy,\ \ \ \ &0 \le y \le x, 0 \le x \le 1 \ 0,&其他 \end{cases} $$ 求:$(1)E(X),E(Y);\ \ \ (2)D(X),D(Y);\ \ \ (3)Cov(X,Y),\rho_{X,Y}$
解:这是一个综合性的题目,接替思路可以先求出$(X,Y)$的关于$X$和关于$Y$的边缘密度函数,再求数学期望及方差;也可以直接由$f(x,y)$求数学期望和方差,接下来我们分别用这两种思路求解:
首先画图:(提醒下:题目没说$(X,Y)$在$D$上服从均匀分布,而是直接给出了概率密度函数。)
.assets/image-20250105170741148.png)
方法1: $$ \begin{align} f_X(x) = \int_{-\infty}^{+\infty} f(x,y) dy &= \begin{cases} \int_{0}^{x} 8xy dy,\ \ \ \ & 0 \le x \le 1 \ 0,&其他 \end{cases} \ &= \begin{cases} 4x^3,\ \ \ \ & 0 \le x \le 1 \ 0,&其他 \end{cases} \end{align} $$
$$ \begin{align} f_Y(y) = \int_{-\infty}^{+\infty} f(x,y) dx &= \begin{cases} \int_{y}^{1} 8xy dx,\ \ \ \ & 0 \le y \le 1 \ 0,&其他 \end{cases} \ &= \begin{cases} 4y(1-y^2),\ \ \ \ & 0 \le y \le 1 \ 0,&其他 \end{cases} \end{align} $$ 则:(1)$E(X) = \int_{-\infty}^{+\infty} x \cdot f_X(x) dx = \int_{0}^{1} x \cdot 4x^3 dx = (\frac{4}{5} x^5)|_{0}^{1} = \frac{4}{5}$
$E(Y) = \int_{-\infty}^{+\infty} y \cdot f_Y(y) dy = \int_{0}^{1} y \cdot 4y(1-y^2) dy = (\frac{4}{3} y^3 - \frac{4}{5} y^5)|_{0}^{1} = \frac{8}{15}$
(2)$E(X^2) = \int_{-\infty}^{+\infty} x^2 \cdot f_X(x) dx = \int_{0}^{1} x^2 \cdot 4x^3 dx = (\frac{4}{6} x^6)|_{0}^{1} = \frac{2}{3}$
$E(Y^2) = \int_{-\infty}^{+\infty} y^2 \cdot f_Y(y) dy = \int_{0}^{1} y^2 \cdot 4y(1-y^2) dy = (y^4 - \frac{2}{3} y^6)|_{0}^{1} = \frac{1}{3}$
$D(X) = E(X^2) - [E(X)]^2 = \frac{2}{75}$
$D(Y) = E(Y^2) - [E(Y)]^2 = \frac{11}{225}$
(3)$E(XY) = \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} xy f(x,y) dxdy = \int_{0}^{1} \int_{0}^{x} xy \cdot 8xy dxdy = \int_{0}^{1} \frac{8}{3} x^5 dx = \frac{4}{9}$
$Cov(X,Y) = E(XY) - E(X)E(Y) = \frac{4}{225}$
$\rho_{XY} = \frac{Cov(X,Y)}{\sqrt{D(X)} \sqrt{D(Y)}} = \frac{2\sqrt{66}}{32}$
方法2:
(1)$E(X) = \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} x \cdot f(x,y) dxdy = \int_{0}^{1} (\int_{0}^{x} x \cdot 8xy dy) dx = \int_{0}^{1} 4x^4 dx = \frac{4}{5}$
$E(Y) = \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} y \cdot f(x,y) dxdy = \int_{0}^{1} (\int_{0}^{x} y \cdot 8xy dy) dx = \int_{0}^{1} \frac{8}{3}x^4 dx = \frac{8}{15}$
(2)$E(X^2) = \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} x^2 \cdot f(x,y) dxdy = \int_{0}^{1} (\int_{0}^{x} x^2 \cdot 8xy dy) dx = \int_{0}^{1} 4x^5 dx = \frac{2}{3}$
$E(Y^2) = \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} y^2 \cdot f(x,y) dxdy = \int_{0}^{1} (\int_{0}^{x} y^2 \cdot 8xy dy) dx = \int_{0}^{1} 2x^5 dx = \frac{1}{3}$
$D(X) = E(X^2) - [E(X)]^2 = \frac{2}{75}$
$D(Y) = E(Y^2) - [E(Y)]^2 = \frac{11}{225}$
(3)$E(XY) = \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} xy f(x,y) dxdy = \int_{0}^{1} \int_{0}^{x} xy \cdot 8xy dxdy = \int_{0}^{1} \frac{8}{3} x^5 dx = \frac{4}{9}$
$Cov(X,Y) = E(XY) - E(X)E(Y) = \frac{4}{225}$
$\rho_{XY} = \frac{Cov(X,Y)}{\sqrt{D(X)} \sqrt{D(Y)}} = \frac{2\sqrt{66}}{32}$
例7:已知$D(X) = 4, D(Y) = 1, \rho_{XY} = 0.6$,求:$D(X+Y),D(3X-2Y)$。
解:$D(X+Y) = D(X) + D(Y) + 2Cov(X,Y) = D(X) + D(Y) + 2\rho_{XY} \sqrt{D(X)} \sqrt{D(Y)} = 7.4$
$D(3X-2Y) = D(3X) + D(2Y) - 2Cov(3X,2Y) = 9D(X) + 4D(Y) - 2 \times \rho_{XY} \sqrt{D(3X)} \sqrt{D(2Y)} $
$= 9D(X) + 4D(Y) - 2 \times \rho_{XY} \sqrt{9D(X)} \sqrt{4D(Y)} = 25.6$
例8:已知某箱中由100件产品,一、二、三等品各80、10、10件,现从中任取一件产品,记: $$ X_i = \begin{cases} 1, \ \ \ \ &该产品属于i等品 \ 0,&该产品不属于i等品 \end{cases} \ \ \ \ \ ,i = 1,2 $$ 求:$\rho_{XY}$。
解:由题意知:
| X_1 | 1 | |
|---|---|---|
| P | 0.2 | 0.8 |
| X_2 | 1 | |
|---|---|---|
| P | 0.9 | 0.1 |
则有:
$E(X_1) = 0.8,\ D(X_1) = 0.16$
$E(X_2) = 0.1,\ D(X_2) = 0.09$
又因为:$P{X_1 X_2 = 1} = P{X_1 =1, X_2 = 1} = 0$
$P{X_1 X_2 = 0} = 1-P{X_1X_2} = 1$
于是:$E(X_1X_2) = 1 \times P{X_1X_2 = 1} + 0 \times P{X_1X-2 = 0} = 0$
$Cov(X_1,X_2) = E(X_1X_2) - E(X_1)E(X_2) = -0.08$
因此:$\rho_{XY} = \frac{Cov(X_1,X_2)}{ \sqrt{D(X_1)} \sqrt{D(X_2)}} = -\frac{2}{3}$
3.3 矩、协方差矩阵
1.矩的定义
随机变量的数学期望和方差乐意纳入一个更一般的概念范畴之中,那就是随机变量的<u>矩</u>。
定义7: 设$X$为随机变量,若$E(X^k)$存在,$k$为正整数,则称它为<u>随机变量$X$的$k$阶原点矩</u>,记为:$\mu_k$,即:$\mu_k = E(X^k)$。
若$E[X- E(X)]^K$存在,则称$E[X - E(X)]^k$为**<u>$X$的$k$阶中心距</u>**,记为:$\nu_k$,即:$\nu_k = E[X- E(X)]^k$。
若$X$为离散型随机变量,其分布律为:$P{X= x_i} = p_i,\ \ i=1,2,...$,则:
$\mu_k = E(X^k) = \sum_{i=1}^{\infty} x_i^k \cdot p_i,\ \ \nu_k = E[X - E(X)]^k = \sum_{i=1}^{\infty} [x-E(X)]^k \cdot p_i$。
若$X$为连续型随机变量,其概率密度为:$f(x)$,则:
$\mu_k = E(X^k) = \int_{-\infty}^{+\infty} x_i^k \cdot f(x)dx,\ \ \nu_k = E[X - E(X)]^k = \int_{-\infty}^{+\infty} [x-E(X)]^k \cdot f(x) dx$。
显然:一阶原点矩是数学期望,即$\mu_1 = E(X)$;二阶中心矩是方差,即$\nu_2 = E[X - E(X)]^2 = D(X)$。
定义8: 设$X、Y$为随机变量,若$E(X^k Y^l),\ \ k,l=1,2,...$存在,则称它为<u>$X$和$Y$的$k+l$阶混合原点矩</u>。
若$E[(X - E(X))^k \times (Y - E(Y))^l]$存在,则称它为**<u>$X$和$Y$的$k+l$阶混合中心距</u>**。
2.协方差矩阵的定义
定义9: 设二维随机变量$(X_1,X_2)$的四个二阶中心矩存在存在,记:
$c_{11} = E[X_1-E(X_1)]^2 = D(X_1) = Cov(X_1,X_1)$
$c_{12} = E[X_1 - E(X_1)] \times E[X_2 - E(X_2)] = Cov(X_1,X_2)$
$c_{21} = E[X_2 - E(X_2)] \times E[X_1 - E(X_1)] = Cov(X_2,X_1)$
$c_{22} = E[X_2-E(X_2)]^2 = D(X_2) = Cov(X_2,X_2)$
则称,矩阵: $$ C=(C_{ij}){2 \times 2} = \begin{pmatrix} c{11} &c_{12} \ c_{21} &c_{22} \ \end{pmatrix} $$ 为二维随机变量$(X_1,X_2)$的<u>协方差矩阵</u>。
定义10: 设$n$为随机变量$(X_1, X_2, ...,X_n)$的二阶中心距:$c_{ij} = E[(X_i - E(X_i)) \times (X_j - E(X_j))] = Cov(X_i, X_j),\ \ i,j=1,2,...$存在,则称矩阵: $$ C=(C_{ij}){n \times n} = \begin{pmatrix} c{11} &c_{12} &... &c_{1n}\ c_{21} &c_{22} &... &c_{2n} \ ... &... &... &... \ c_{n1} &c_{n2} &... &c_{nn} \ \end{pmatrix} $$ 为$n$维随机变量$(X_1, X_2, ...,X_n)$的协方差矩阵。
例9:设$(X,Y)$的协方差矩阵为$C= \begin{pmatrix} 4 &-2\ -2 &9 \ \end{pmatrix}$,求$\rho_{XY}$。
解:由题目知:$D(X) = 4, D(Y)=9, Cov(X,Y) = -2$;因此:
$\rho_{XY} = \frac{Cov(X,Y)}{\sqrt{D(X)} \sqrt{D(Y)}} = -\frac{1}{3}$
















