随机变量的分布函数可以全面地描述该随机变量的统计规律,但是再许多实际问题中,要确定一个随机变量的分布往往并不容易;另一方面,有些问题也无需知道随机变量的精确分布,只要知道该随机变量的某些特征即可。

例如:测量某零件的长度,一般指关系这批零件的平均长度以及测量结果的精确程度,也就是测量结果对平均值的偏差程度;刻画随机变量某些方面的特征的数值称为:<u>随机变量的数字特征</u>。

1 随机变量的数学期望

1.1 离散型随机变量的数学期望

引用一个例子:某次考试全班30人参加,得5分的由8人,得4分的有12人,得3分和2分的各有5人,则全班30人的平均分为:

$\frac{2\cp 5 + 3\cp 5 + 4\cp 12 + 5\cp 8}{30} = \frac{113}{30} = 3.77$分;

如果将得分记为随机变量$X$,则$X$的取值为$x_k,\ (x_k = 2,3,4,5,\ \ k=1,2,3,4)$ 的频数分别为$m_k, (m_k=5,5,12,8)$;总人数为$n=30$,取值为$x_k$的频率为:$\frac{m_k}{n},\ (\frac{m_k}{n} = \frac{5}{30}, \frac{5}{30},\frac{12}{30},\frac{8}{30})$,平均分是与随机变量的取值和频率密切相关的,但由于频率是随着人数$n$的变化而不同的,所以整个数值具有波动性,其中$\frac{m_k}{n}$是事件${X = x_k}$发生的频率,由频率稳定性(会在第五章中介绍)知,当$n$很大时,频率$\frac{m_k}{n}$将在一定意义下接近于事件${X=x_k}$的概率$p_k$,用概率$p_k$代替频率$\frac{m_k}{n}$,称$\sum_{k=1}^{n} x_k p_k$为随机<u>变量$X$的数学期望</u>,简称<u>期望</u>或者<u>均值</u>。

**定义1:**设离散型随机变量$X$的分布律为:

$P{X=x_k} = p_k,\ \ \ \ k=1,2,...$

若级数$\sum_{k=1}^{n} x_k p_k$绝对收敛(即:级数$\sum_{k=1}^{\infty} |x_k| p_k \lt +\infty$),则称级数$\sum_{k=1}^{n} x_k p_k$的和为随机变量$X$的<u>数学期望</u>,简称期望,记作$E(X)$,即:$E(X) = \sum_{k=1}^{n} x_k p_k$。

例1:设随机变量$X$的分布律为:

X -1 1 2
P 0.1 0.2 0.3 0.4

求$E(x)$。

解:$E(X) = (-1)\cp 0.1 + 0\cp 0.2 + 1\cp 0.3 + 2\cp 0.4 = 1$

例2:甲乙两名射手在一次射击中的得分为$X,Y$,其分布律分别为:

X 1 2 3
P 0.4 0.1 0.5
Y 1 2 3
P 0.1 0.6 0.3

试比较甲乙两射手的技术。

解:分别计算$X$和$Y$的数学期望:

$E(X) = 1\cp 0.4 + 2\cp 0.1 + 3\cp 0.5 = 2.1$

$E(Y) = 1\cp 0.1 + 2\cp 0.6 + 3\cp 0.3 = 2.2$

据此,可认为乙的技术更好。

几种常见的离散性随机变量的数学期望如下:

(1)$0-1$分布

设随机变量$X$的分布律为:$P{X=1} = p,\ P{X=0}=1-p,\ \ \ \ 0 \le p \le 1$,则:$E(X) = 1\cp p + 0\cp (1-0) = p$

(2)二项分布

设随机变量$X \sim B(n,p)$,即:$p_k = P{X=k} = C_n^k p^k (1-p)^{n-k},\ \ \ \ k=0,1,2,...,\ \ 0 \le p \le 1$则: $$ \begin{align} E(X) = \sum_{k=0}^{n} x_k p_k &= \sum_{k=0}^{n} k \cdot C_n^k p^k (1-p)^{n-k} \ &= \sum_{k=1}^{n} k \cdot \frac{n!}{k! (n-k)!} \cdot p^k (1-p)^{n-k} \ \ \ \ \ \ # k=0是该项等于0,直接可以舍去\ &= np \cdot \sum_{k=1}^{\infty} \frac{(n-1)!}{(k-1)! (n-k)!} \cdot p^{k-1} (1-p)^{n-k} \ &= np \cdot \sum_{k=1}^{\infty} C_{n-1}^{k-1} \cdot p^{k-1} (1-p)^{n-k} \ \ \ \ \ \ # 令i=k-1\ &= np \cdot \sum_{i=0}^{\infty} C_{n-1}^{i} \cdot p^{i} (1-p)^{n-1-i} \ &= np \cdot [p+(1-p)]^{n-1} \ &= np \end{align} $$

二项分布的数学期望$np$有明显的概率意义,比如:掷硬币试验,进行1000次试验则可以<u>期望</u>出现$1000 \cp \frac{1}{2} = 500$次正面向上的结果;再比如:掷骰子,若进行1000次试验则可以期望出现$1000 \cp \frac{1}{6} = 166.67$次出现1点。

(3)泊松分布

设随机变量$X \sim P(\lambda)$,其分布律为:$p_k = P{X=k} = \frac{\lambda^k}{k!} e^{-\lambda},\ \ \ k=0,1,2,...$则: $$ \begin{align} E(X) = \sum_{k=0}^{\infty} k \cdot p_k &= \sum_{k=0}^{\infty} k \cdot \frac{\lambda^k}{k!}e^{-\lambda} \ &= \lambda e^{-\lambda} \cdot \sum_{k=1}^{\infty} \frac{\lambda^{k-1}}{(k-1)!} \ \ \ \ \ \ \ \ \ # k=0时该项为0,直接舍弃\ &\xlongequal {i=k-1} \lambda e^{-\lambda} \cdot \sum_{i=0}^{\infty} \frac{\lambda^i}{i!} \ &= \lambda e^{-\lambda} e^{\lambda} \ &= \lambda \end{align} $$

比如:服从泊松分布的随机变量$X$表示某个时间段你交通事故的次数,则平均次数为参数$\lambda$。

例3:设随机变量$X \sim B(n,0.08)$,已知$E(X)=1.2$,求参数$n$。

解:$E(X) = np = n \cp 0.08 = 1.2$得:$n=15$

例4:已知随机变量$X$的取值为$2$和$a$,且$P{X=2} = 0.8$,$E(X) = 1.2$,求$a$的值。

解:$E(X) = 2\cp 0.8 + a \cp 0.2 = 1.2$得:$a=-2$。

<u>以下介绍一个定理,不用刻意去寻找$Y$的分布也能计算出$Y$的数学期望$E(Y)$:</u>

**定理1:**设$X$为离散型随机变量,其分布律为:$P{X=x_k} = p_k,\ \ k=1,2,...$;令$Y=g(X)$,若级数$\sum_{k=1}^{\infty} g(x_k) p_k$绝对收敛,则$Y = g(X)$的数学期望存在,且有:$E(Y) = E[g(X)] = \sum_{k=1}^{\infty} g(x_k) p_k$。

例5:设随机变量$X$的分布律为:

X -1 2 3
P $\frac{1}{8}$ $\frac{1}{4}$ $\frac{3}{8}$ $\frac{1}{4}$

求:$E(X),\ E(X^2),\ E(-2X+1)$。

解:(1)$E(X) = -1 \cp \frac{1}{8} + 0 \cp \frac{1}{4} + 2 \cp \frac{3}{8} + 3 \cp \frac{1}{4} = \frac{11}{8}$

(2)$E(X^2) = (-1)^2 \cp \frac{1}{8} + 0^2 \cp \frac{1}{4} + 2^2 \cp \frac{3}{8} + 3^2 \cp \frac{1}{4} = \frac{31}{8}$

(3)$E(-2X+1) = 3 \cp \frac{1}{8} + 1 \cp \frac{1}{4} + (-3) \cp \frac{3}{8} + (-5) \cp \frac{1}{4} = -\frac{4}{7}$

例6:测量一个正方形的边长(cm),结果时一个随机变量$X$,其分布律为:

X 9 10 11 12
P 0.2 0.3 0.4 0.1

求:周长$L$和面积$S$的数学期望。

解:$E(L) = E(4X) = 36 \cp 0.2 + 40 \cp 0.3 + 44 \cp 0.4 + 48 \cp 0.1 = 41.6(cm)$

$E(S) = E(X^2) = 81 \cp 0.2 + 100 \cp 0.3 + 121 \cp 0.4 + 144 \cp 0.1 = 109(cm^2)$

1.2 连续型随机变量的数学期望

对于连续型随机变量的数学期望,可以类似与离散型随机变量的数学期望给予定义,只需将$\sum_{k=1}^{\infty} x_k p_k$中的求和号$\sum_{k=1}^{\infty}$改变为积分号$\int$,取值$x_k$改变为$x$,分布律也就是概率$p_k$改变为$f(x)dx$即可;其中$f(x)$为连续型随机变量$X$的概率密度。

定义2:设连续型随机变量$X$的概率密度为$f(x)$,若广义积分$\int_{-\infty}^{+\infty} x f(x) dx$的值为随机变量$X$的数学期望,简称为期望或均值;记作$E(X)$;即:$E(X) = \int_{-\infty}^{+\infty} x f(x) dx$。

例7:设随机变量$X$的概率密度为: $$ f(x) = \begin{cases} 2-2x,\ \ \ \ & 0\le x \le 1 \ 0, &其他 \end{cases} $$ 求:$E(X)$。

解:根据定义得: $$ \begin{align} E(X) = \int_{-\infty}^{+\infty} x f(x) dx &= \int_{-\infty}^{0} xf(x)dx + \int_{0}^{1} xf(x)dx + \int_{1}^{+\infty} xf(x)dx \ &= 0 + \int_{0}^{1} x(2-2x)dx + 0 \ &= (x^2 -\frac{2}{3}x^3)|_{0}^{1} \ &= \frac{1}{3} \end{align} $$

例8:设随机变量$X$的概率密度为: $$ f(x) = \begin{cases} c \sin^2{x},\ \ \ \ &|x| \le \frac{\pi}{2} \ 0, &其他 \end{cases} $$ 求:(1)常数$c$; (2)数学期望$E(X)$。

解:(1)计算步骤: $$ \begin{align} P{-\infty \lt X \lt +\infty} = 1 = \int_{-\infty}^{+\infty} f(x)dx &= \int_{-\frac{\pi}{2}}^{\frac{\pi}{2}} c\sin^2{x} dx \ &= \int_{-\frac{\pi}{2}}^{\frac{\pi}{2}} c(\frac{1-\cos{2x}}{2}) dx \ &= c(\frac{x}{2} - \frac{1}{4} \sin{2x}) |_{-\frac{\pi}{2}}^{\frac{\pi}{2}} \ &= c \cdot \frac{\pi}{2} \end{align} $$

这里用到了三角函数及其导数等式变换。

因此解得:$c = \frac{2}{\pi}$。

(2)$E(X) = \int_{-\infty}^{+\infty} x f(x) dx = \int_{-\infty}^{+\infty} x \cdot \frac{2}{\pi} \sin^2{x} dx \xlongequal{奇函数} 0 $

$\bigstar \bigstar \bigstar \bigstar \bigstar$

下面介绍几种重要的连续型随机变量的数学期望:

①均匀分布

设随机变量$X$服从区间$[a,b]$上的均匀分布,其概率密度为: $$ f(x) = \begin{cases} \frac{1}{b-a},\ \ \ \ & a \le x \le b \ 0,&其他 \end{cases} $$ 则:$E(X) = \int_{-\infty}^{+\infty} x f(x) dx = \int_{a}^{b} x \frac{1}{b-a} dx = \frac{1}{b-a} \cdot \frac{x^2}{2} |_{a}^{b} = \frac{a+b}{2}$

也就是说在区间$[a,b]$上服从均匀分布的连续型随机变量的数学期望时该区间的中点。

②指数分布

设随机变量$X$服从参数为$\lambda \gt 0$的指数分布,其概率密度为: $$ f(x) = \begin{cases} \lambda e^{-\lambda x},\ \ \ \ &x \gt 0 \ 0,&其他 \end{cases} $$ 则:$E(X) = \int_{-\infty}^{+\infty} x f(x) dx = \int_{0}^{+\infty} x \cdot \lambda e^{-\lambda x} dx = -xe^{-\lambda x} |{0}^{+\infty} + \int{0}^{+\infty} e^{-\lambda x} dx = 0-\frac{1}{\lambda}|_{0}^{+\infty} = \frac{1}{\lambda}$

这里利用到:$(uv)' = u'v + uv'$

③正态分布

设随机变量$X \sim N(\mu, \sigma^2)$,其概率密度为:$f(x) = \frac{1}{\sqrt{2\pi} \sigma} e^{-\frac{(x-\mu)^2}{2\sigma^2}},\ \ \ -\infty \lt x \lt +\infty$ ;则: $$ \begin{align} E(X) = \int_{-\infty}^{+\infty} x f(x) dx &= \int_{-\infty}^{+\infty} x \cdot \frac{1}{\sqrt{2\pi} \sigma} e^{-\frac{(x-\mu)^2}{2\sigma^2}} dx \ &\xlongequal{令z=\frac{x-\mu}{\sigma},则\frac{dz}{dx} = \frac{1}{\sigma}} \frac{1}{\sqrt{2\pi} \sigma} \int_{-\infty}^{+\infty} (\sigma z+\mu) \cdot e^{-\frac{z^2}{2}} \cdot \sigma dz \ &= \frac{\sigma}{\sqrt{2\pi}} \int_{-\infty}^{+\infty} ze^{-\frac{z^2}{2}}dz + \mu \int_{-\infty}^{+\infty} \frac{1}{\sqrt{2\pi}} e^{-\frac{z^2}{2}}dz \ &= 0 + \mu \cp 1 \ &= \mu \end{align} $$ 由此可见$X \sim N(\mu, \sigma^2)$中的$\mu$是其数学期望。

因为$\mu$是正态分布的中心,也是正态变量取值的集中位置,又因正态分布是对称的,所以$\mu$应该是其期望。

**定理2:**设连续型随机变量$X$,其概率密度为$f_X(x)$,又随机变量$Y=g(X)$;则当积分$\int_{-\infty}^{+\infty}g(X) f_X(x) dx$绝对收敛时,$Y = g(X)$数学期望存在,且有:$E(Y) = E(g(X)) = \int_{-\infty}^{+\infty}g(X) f_X(x) dx$;证明略。

例9:对圆的直径做近似测量$(cm)$,设其测量值在区间$(19.9,20.1)$上服从均匀分布,求其面积的均值。

解:设圆的面积为$S = g(X) = \pi(\frac{X}{2})^2 = \frac{\pi}{4} X^2$;已知$X$服从均匀分布,因此其概率密度为: $$ f_X(x) = \begin{cases} \frac{1}{0.2},\ \ \ \ \ & 19.9 \lt x \lt 20.1 \ 0, &其他 \end{cases} $$ 因此,$E(S) = E(g(X)) = E(\frac{\pi}{4} X^2) = \int_{-\infty}^{+\infty} \frac{\pi}{4} x^2 f(x) dx = \int_{19.9}^{20.1} \frac{\pi}{4} x^2 \frac{1}{0.2} dx = 314.16{cm^2}$

例10:设随机变量$X$的概率密度为: $$ f(x) = \begin{cases} x, \ \ \ \ &0 \le x \lt 1 \ 2-x, \ \ \ \ &1 \le x \lt 2 \ 0, &其他 \end{cases} $$ 求:$E[|X - E(X)|]$

解:先计算$E(X)$: $$ \begin{align} E(X) = \int_{-\infty}^{+\infty} x \cdot f(x) &= \int_{0}^{1} x \cdot x dx + \int_{1}^{2} x \cdot (2-x) dx + 0 \ &= \frac{1}{3} x^3 |{0}^{1} + (x^2 -\frac{1}{3}x^3)|{1}^{2} \ &= 1 \end{align} $$ 再计算$E[|X - E(X)|]$: $$ \begin{align} $E[|X - E(X)|]$ = E(|X - 1|) &= \int_{0}^{1} |x-1| \cdot x dx + \int_{1}^{2} |x-1| \cdot (2-x)dx \ &= \int_{0}^{1} (1-x) \cdot x dx + \int_{}^{} (x-1) \cdot (2-x) dx \ &= \int_{0}^{1} (x-x^2)dx + \int_{1}^{2} (-x^2 + 3x -2)dx\ &= (\frac{1}{2}x^2 - \frac{1}{3}x^3) |{0}^{1} + (-\frac{1}{3}x^3 + \frac{3}{2} x^2 -2x) |{1}^{2} \ &= \frac{1}{3} \end{align} $$

例11:设$X \sim N(0,1)$,$Y = e^X$,求$E(Y)$。

解:$X$的概率密度为:$f_X(x) = \frac{1}{\sqrt{2\pi}} e^{-\frac{x^2}{2}},\ \ -\infty \lt x \lt +\infty$ ,则: $$ \begin{align} E(Y) = \int_{-\infty}^{+\infty} e^x \cdot f_X(x) &= \int_{-\infty}^{+\infty} e^x \cdot \frac{1}{\sqrt{2\pi}} e^{-\frac{x^2}{2}} \cdot dx \ &= \int_{-\infty}^{+\infty} \frac{1}{\sqrt{2\pi}} e^{-\frac{x^2}{2} + \frac{2x}{2}} \cdot dx \ &= \int_{-\infty}^{+\infty} \frac{1}{\sqrt{2\pi}} e^{-\frac{x^2 -2x +1 - 1}{2}} \cdot dx \ &= \int_{-\infty}^{+\infty} \frac{1}{\sqrt{2\pi}} e^{-\frac{(x-1)^2 - 1}{2}} \cdot dx \ &= \int_{-\infty}^{+\infty} \frac{1}{\sqrt{2\pi}} e^{-\frac{(x-1)^2}{2} + \frac{1}{2}} \cdot dx \ &= e^{\frac{1}{2}}\int_{-\infty}^{+\infty} \frac{1}{\sqrt{2\pi}} e^{-\frac{(x-1)^2}{2}} \cdot dx \ &= e^{\frac{1}{2}} \end{align} $$

$\int_{-\infty}^{+\infty} e^{-\frac{(x-1)^2}{2}} = \sqrt{2\pi}$

1.3 二维随机变量的数学期望

**定理3:(1)**若$(X,Y)$为二维离散型随机变量,其分布律为:$P{X=x_i, Y=y_j} = p_{ij},\ \ i,j=1,2,...$;边缘分布律为:

$p_{i \cdot} = \sum_{j=1}^{\infty} p_{ij},\ \ \ \ p_{\cdot j} = \sum_{i=1}^{\infty} p_{ij}$ 则:

$E(X) = \sum_{i=1}^{\infty} x_i \cdot p_{i \cdot} = \sum_{i=1}^{\infty} (x_i \cdot \sum_{j=1}^{\infty} p_{ij}) = \sum_{i=1}^{\infty} \sum_{j=1}^{\infty} x_i \cdot p_{ij}$,

$E(Y) = \sum_{j=1}^{\infty} y_j \cdot p_{\cdot j} = \sum_{j=1}^{\infty} (y_j \cdot \sum_{i=1}^{\infty} p_{ij}) = \sum_{i=1}^{\infty} \sum_{j=1}^{\infty} y_j \cdot p_{ij}$。

**(2)**若$(X,Y)$为二维连续型随机变量,其概率密度为$f(x,y)$;$f_X(x),f_Y(y)$分别是关于$X,Y$的边缘概率密度,则:

$E(X) = \int_{-\infty}^{+\infty} x \cdot f_X(x) \cdot dx = \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} x \cdot f(x,y) \cdot dxdy$,

$E(Y) = \int_{-\infty}^{+\infty} y \cdot f_Y(y) \cdot dy = \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} y \cdot f(x,y) \cdot dxdy$,

**定理4:**设$g(x,y)$为连续函数,对于二维随机变量$(X,Y)$的函数$g(X,Y)$:

**(1)**若$(X,Y)$为离散型随机变量,且级数$\sum_{i=1}^{\infty} \sum_{j=1}^{\infty} g(x_i,y_j) \cdot p_{ij}$绝对收敛;则$E[g(X,Y)] = \sum_{i=1}^{\infty} \sum_{j=1}^{\infty} g(x_i,y_j) \cdot p_{ij}$ ;

**(2)**若$(X,Y)$为连续型随机变量,且积分$\int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} g(x,y) \cdot f(x,y) \cdot dxdy$绝对收敛;则$E[g(X,Y)] = \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} g(x,y) \cdot f(x,y) \cdot dxdy$ 。

例12:设二维随机变量$(X,Y)$的分布律为:

X Y Y
X 2 3
0.2
1 0.3 0.5

求:(1)$E(X+Y)$ (2)$E(XY)$

解:(1)如下: $$ \begin{align} E(X+Y) &= \sum_{i=1}^{\infty} \sum_{j=1}^{\infty} (x_i + y_j) \cdot p_{ij} \ &= (0+2)\cp 0.2 + (0+3)\cp 0 + (1+2)\cp 0.3 + (1+3)\cp 0.5 \ &= 3.3 \end{align} $$ (2)如下: $$ \begin{align} E(XY) &= \sum_{i=1}^{\infty} \sum_{j=1}^{\infty} (x_i \cdot y_j) \cdot p_{ij} \ &= (0\cp 2)\cp 0.2 + (0\cp 3)\cp 0 + (1\cp 2)\cp 0.3 + (1\cp 3)\cp 0.5 \ &= 2.1 \end{align} $$

例13:设二维随机变量$(X,Y)$的概率密度为: $$ f(x,y) = \begin{cases} c,\ \ \ \ & -1 \le x \le 1,\ 0 \le y \le 2 \ 0, &其他 \end{cases} $$ 求:(1)常数$c$ (2)$E(X+Y)$ (3)$E(XY)$

解:(1)$ \int_{-\infty}^{+\infty} f(x,y) dxdy = 1 = \int_{-1}^{1} \int_{0}^{2} c \cdot dxdy + 0 = 4c$;因此:$c = \frac{1}{4}$

(2)如下: $$ \begin{align} E(X+Y) &= \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} (x+y) \cdot f(x,y)dxdy \ &= \int_{-1}^{1} \int_{0}^{2} (x+y) \cdot \frac{1}{4}dxdy \ &= \frac{1}{4} \int_{-1}^{1} \int_{0}^{2} x \cdot dxdy + \frac{1}{4} \int_{-1}^{1} \int_{0}^{2} y \cdot dxdy \ &= \frac{1}{4} \int_{0}^{2} (\frac{1}{2} x^2 | {-1}^{1}) dy + \frac{1}{4} \int{-1}^{1} (\frac{1}{2} y^2 | {0}^{2}) dx \ &= 0 + \frac{1}{4} (2x|{-1}^{1}) \ &= 1 \end{align} $$ (3)如下: $$ \begin{align} E(XY) &= \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} xy \cdot f(x,y) \cdot dxdy \ &= \int_{-1}^{1} \int_{0}^{2} xy \cdot \frac{1}{4}dxdy \ &= \frac{1}{4} \int_{-1}^{1} xdx \cdot \int_{0}^{2} y dy \ &= 0 \end{align} $$

1.4 数学期望的性质

理解并掌握下列性可以大大地降低计算难度:

**性质1:**设$c$为整数,则$E(c) = c$; # 随机变量的值只能取$c$,即$P{X=c} = 1$;因此均值肯定是$c$。

**性质2:**设$X$为随机变量,$c$是常数,则$E(cX) = cE(X)$;

①若$X$为离散型随机变量:$E(cX) = \sum_{k=1}^{\infty} cx_k \cdot p_k = c\sum_{k=1}^{\infty} x_k \cdot p_k = cE(X)$;

②若$X$为连续型随机变量:$E(cX) = \int_{-\infty}^{+\infty} cx \cdot f(x) dx = c\int_{-\infty}^{+\infty} x \cdot f(x) dx = cE(X)$。

**性质3:**设$X、Y$均为随机变量,则:$E(X+Y) = E(X) + E(Y)$。

以连续型随机变量为例:设$(X,Y)$为二维随机变量,其概率密度为$f(x,y)$,$Z = X+Y$是$(X,Y)$的函数,有:

$E(Z) = E(X+Y) = \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} (x+y) \cdot f(x,y) dxdy = \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} x \cdot f(x,y) dxdy + \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} y \cdot f(x,y) dxdy = E(X) + E(Y)$

**性质4:**设$X$与$Y$为相互独立的随机变量,则$E(XY) = E(X) \cdot E(Y)$。

以连续型随机变量为例:设$(X,Y)$为二维随机变量,其概率密度为$f(x,y)$,由于$X$与$Y$为相互独立的随机变量,因此$f(x,y) = f_X(x) \cdot f_Y(y)$;从而:

$E(XY) = \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} xy \cdot f(x,y) dxdy = \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} xy \cdot f_X(x) \cdot f_Y(y) dxdy = (\int_{-\infty}^{+\infty} x \cdot f_X(x) dx) \cdot (\int_{-\infty}^{+\infty} y \cdot f_Y(y) dy) = E(X) \cdot E(Y)$ 。

例14:设随机变量$X \sim B(n,p)$,利用数学期望的性质求$E(X)$。

解:在$n$重伯努利试验中,令: $$ X_k = \begin{cases} 1,\ \ \ \ & A在第k次试验中出现\ 0,&其他 \end{cases} \ \ \ \ \ \ \ \ ,k=1,2,...,n,... $$ 易知:$X = X_1 + X_2 + ... + X_n + ...$;又因$X_k$是服从$0-1$分布的,因此$P{X_k = 1} = p$;$E(X_k) = p$;再有性质3得:

$E(X) = E(X_1) + E(X_2) + ... + E(X_n) = np$

可见使用性质计算数学期望比使用定义要便利许多。

2 方差

2.1 方差的概念

数学期望反应的是随机变量取值的平均水平。

**定义3:**设$X$为随机变量,若$E[X - E(X)]^2$存在,则称它为随机变量$X$的<u>方差</u>,记为$D(X)$,即$D(X) = E[X - E(X)]^2$,称$\sqrt{D(X)}$为随机变量$X$的<u>标准差</u>。

因此,$D(X)$是$X$的函数$[X-E(X)]^2$数学期望,它描述了$X$与其均值的偏离程度,$D(X)$越小说明$X$取值越集中;反之越分散。即:$D(X)$反应了$X$ 取值的波动性大小。

若$X$为离散型随机变量,其分布律为$P{X=x_k} = p_k,\ \ k=1,2,...$,则有:$D(X) = \sum_{k=1}^{\infty} [x_k - E(X)]^2 \cdot p_k$;

若$X$为连续型随机变量,其概率密度为$f(x)$,则$D(X) = \int_{-\infty}^{+\infty} [x-E(X)]^2 \cdot f(x) dx$。

<u>事实上,无论$X$为离散型随机变量还是连续型随机变量,通常都使用:$D(X) = E(X^2) - [E(X)]^2$来计算方差</u>。

证明:$\bigstar \bigstar \bigstar \bigstar \bigstar $ $$ \begin{align} D(X) = E[X - E(X)]^2 &= E{X^2 - 2X \cdot E(X) + [E(X)]^2} \ &= E{X^2 - 2E(X) \cdot E(X) + [E(X)]^2} \ \ \ \ \ \ \ \ \ #近似地 \ &=E{X^2 -[E(X)]^2} \ &=E(X^2) - [E(X)]^2 \end{align} $$

例1:设随机变量$X$的分布律为:

X -1 1
P 0.2 0.3 0.5

求:$D(X)$

解:方法1:使用定义

$E(X) = (-1)\cp 0.2 + 0 \cp 0.3 + 1 \cp 0.5 = 0.3$

$D(X) = (-1 - 0.3)^2 + (0 - 0.3)^2 + (1-0.3)^2 = 0.61$

方法2:使用上面的性质

$E(X^2) = (-1)^2 \cp 0.2 + (0)^2 \cp 0.3 + 1^2 \cp 0.5 = 0.7$

$D(X) = E(X^2) - [E(X)]^2 = 0.7 - 0.3^3 = 0.61$

例2:设随机变量$X$的概率密度为: $$ f(x) = \begin{cases} 1,\ \ \ \ \ \ \ \ &0 \le x \le 1 \ 0,&其他 \end{cases} $$ 求:$D(X)$

解:方法1:使用定义

$E(X) = \int_{-\infty}^{+\infty} x \cdot f(x) dx = \int_{0}^{1} xdx = (\frac{1}{2} x^2) | _{0}^{1} = \frac{1}{2}$

$D(X) = \int_{-\infty}^{+\infty} [x - E(X)]^2 \cdot f(x)dx = \int_{0}^{1} (x-\frac{1}{2})^2 \cdot 1dx = \frac{1}{12}$

方法2:使用性质

$E(X^2) = \int_{-\infty}^{+\infty} x^2 \cdot f(x) dx = \int_{0}^{1} x^2 \cdot 1 dx = \frac{1}{3}$

$D(X) = E(X^2) - [E(X)]^2 = \frac{1}{3} - (\frac{1}{2})^2 = \frac{1}{12}$

例3:若随机变量$X$的数学期望$E(X)=-2,D(X)=4$,求$E(X^2)$。

解:$D(X) = 4 = E(X^2) - [E(X)]^2 = E(X^2) - (-2)^2$ ;因此$E(X^2) = 8$。

例4:设随机变量$X$的概率密度为: $$ f(x) = \begin{cases} 1+x,\ \ \ \ \ \ \ \ \ &-1 \le x \lt 0 \ 1-x, & 0 \le x \lt 1 \ 0,&其他 \end{cases} $$ 求$D(X)$

解:$E(X) = \int_{-\infty}^{+\infty} xf(x)dx = \int_{-1}^{0} x(1+x) dx + \int_{0}^{1} x(1-x) dx = (\frac{x^2}{2} + \frac{x^3}{3})|{-1}^{0} + (\frac{x^2}{2} - \frac{x^3}{3})|{0}^{1} = 0$

这里还有个思路:$f(x)$在$[-1,1]$上是偶函数,因此$xf(x)$在$[-1,1]$上是奇函数,因此:$E(X) = \int_{-\infty}^{+\infty} xf(x) dx = \int_{-1}^{1} xf(x) dx = 0$

$E(X^2) = \int_{-\infty}^{+\infty} x^2 f(x) dx = \int_{-1}^{0} x^2 f(x) dx + \int_{0}^{1} x^2 f(x) dx = \int_{-1}^{0} x^2 (1+x) dx + \int_{0}^{1} x^2 (1-x) dx = (\frac{x^3}{3} + \frac{x^4}{4})|{-1}^{0} + (\frac{x^3}{3} - \frac{x^4}{4})|{0}^{1} = \frac{1}{6}$

$D(X) = E(X^2) - [E(X)]^2 = \frac{1}{6} - 0 = \frac{1}{6}$

例5:设随机变量$X$的概率密度为: $$ f(x) = \begin{cases} ax^2 + bx+ c,\ \ \ \ \ \ \ \ &0 \lt x \lt 1 \ 0,&其他

\end{cases} $$ 已知$E(X) = 0.5,\ D(X)=0.15$,求常数$a,b,c$的值。

解:由$\int_{-\infty}^{+\infty} f(x) dx = 1$知:$\int_{0}^{1} (ax^2 + bx + c) dx = 1$,即:$\frac{a}{3} + \frac{b}{2} + c = 1$

由$E(X)= 0.5$知:$\int_{-\infty}^{+\infty} x f(x) dx = \int_{0}^{1} x (ax^2 + bx + c) dx = 0.5$,得:$\frac{a}{4} + \frac{b}{3} + c = 0.5$

由$E(X)=0.5,\ D(X)=0.15$知:$E(X^2) = D(X) + [E(X)]^2 = 0.4$,得:$\int_{-\infty}^{+\infty} x^2 f(x) dx = \int_{0}^{1} x^2 (ax^2 + bx + c) dx =0.4$;得:$\frac{a}{5} + \frac{b}{4} + c = 0$

根据以上解得:$a = 12, b = -12, c = 3$。

2.2 常见随机变量的方差 $\bigstar$

1. $0-1$分布

设随机变量$X$服从$0-1$分布,其分布律为:$P{X=1}=p,\ P{X=0} = 1-p,\ \ 0 \lt p \lt 1$,则$X$的方差:

$D(X) = p(1-p)$

因为:$E(X) = 1\cp p + 0 \cp (1-p) = p$,同样地$E(X^2) = p$;故:$D(X) = E(X^2) - [E(X)]^2 = p-p^2 = p(1-p)$

2.二项分布

设随机变量$X \sim B(n,p)$,其分布律为:$p_k = P{X=k} = C_n^k p^k(1-p)^{n-k},\ k=0,1,...,n\ \ ;0\lt p \lt 1$,则$X$的方差:

$D(X) = np(1-p)$

例6:已知随机变量$X \sim B(n,p)$,且$E(X) = 1.6,\ D(X) = 1.28$,求参数$n,p$的值。

解:$E(X)= 1.6 = np;\ \ \ D(X) = 1.28 = np(1-p)$因此得:$n=8,p=0.2$

3.泊松分布

设随机变量$X \sim P(\lambda)$,其分布律为:$p_k = P{X=k} = \frac{\lambda^k}{k!} e^{-\lambda},\ k=0,1,...$,则$X$的方差:$D(X) = \lambda$。

在$X\sim P(\lambda)$的情况下:$\lambda$既是$X$的数学期望,又是其方差。

例7:设随机变量$X \sim P(\lambda)$,且$P{X=1} = P{X=2}$,求$D(X)$。

解:由已知:$P{X=1} = \frac{\lambda^1}{1!} e^{-\lambda},\ \ P{X=2} = \frac{\lambda^2}{2!} e^{-\lambda}$ 得:$\frac{\lambda e^{-\lambda}}{1} = \frac{\lambda^2 e^{-\lambda}}{2}$

因此:$\lambda = 2$;即$D(X) = 2$

4.均匀分布

设随机变量$X$服从区间$[a,b]$上的均匀分布,其概率密度为: $$ f(x) = \begin{cases} \frac{1}{b-a},\ \ \ \ &a \le x \le b \ 0,&其他 \end{cases} $$ 则$X$的方差为:$D(X) = \frac{(b-a)^2}{12}$

$$ 从而:$P{X \gt 2.5} = \int_{2.5}^{+\infty} f(x) dx = \int_{2.5}^{3} \frac{1}{2} dx = 0.25$

5.指数分布

设随机变量$X$服从参数为$\lambda$的指数分布,其概率密度为: $$ f(x) = \begin{cases} \lambda e^{-\lambda x},\ \ \ \ \ \ \ \ & x \gt 0 \ 0,&其他 \end{cases} $$ 则$X$的方差为:$D(X) = \frac{1}{\lambda^2}$

6.正态分布

设随机变量$X \sim N(\mu, \sigma^2)$,其概率密度为:$f(x) = \frac{1}{\sqrt{2\pi} \sigma} e^{-\frac{(x - \mu)^2}{2 \sigma^2}}, \ \ -\infty \lt x \lt +\infty $ ;则$X$的方差:$D(X) = \sigma^2$。

因为:$X \sim N(\mu, \sigma^2)$,所以$E(X) = \mu$;再根据方差的定义:$D(X) = \int_{-\infty}^{+\infty} [x - E(X)]^2 f(x) dx = \int_{-\infty}^{+\infty} (x-\mu)^2 \cdot \frac{1}{\sqrt{2\pi} \sigma} e^{-\frac{(x - \mu)^2}{2 \sigma^2}} \cdot dx$ ;我们令$t = \frac{x-\mu}{\sigma}$得:

$D(X) = \frac{\sigma^2}{\sqrt{2\pi}} \int_{-\infty}^{+\infty} t^2 e^{-\frac{t^2}{2}} dt = \frac{\sigma^2}{\sqrt{2\pi}} (-te^{-\frac{t}{2}} | {-\infty}^{+\infty} + \int{-\infty}^{+\infty} e^{-\frac{t^2}{2}} dt) = \sigma^2$

例9:设随机变量$X \sim N(0,1)$求$D(|X|)$。

解: $$ \begin{align} E(|X|) &= \int_{-\infty}^{+\infty} |x| \cdot \frac{1}{\sqrt{2\pi}} e^{-\frac{x^2}{2}} \cdot dx \ &= 2 \cp \frac{1}{\sqrt{2\pi}} \int_{0}^{+\infty} x \cdot e^{-\frac{x^2}{2}} \cdot dx \ &= -\frac{2}{\sqrt{2\pi}} \int_{0}^{+\infty} de^{-\frac{x^2}{2}} \ &= -\frac{2}{\sqrt{2\pi}} (e^{-\frac{x^2}{2}})|_{0}^{+\infty} \ &= \sqrt{\frac{2}{\pi}} \end{align} $$ 又有:$E(|X|^2) = E(X^2) = 1 = D(|X|) + [E(|X|)]^2$则:$D(|X|) = E(|X|^2) - [E(|X|)]^2 = 1 - \frac{2}{\pi}$。

例10:设二维随机变量$(X,Y)$得分布律为:

X Y Y Y
X $\frac{1}{3}$ 1
-1 $\frac{1}{4}$ $\frac{1}{3}$
$\frac{1}{6}$
2 $\frac{1}{4}$

求:$E(X),E(Y),D(X),D(Y)$。

解:$X$的边缘分布律为:

X -1 2
P $\frac{7}{12}$ $\frac{1}{6}$ $\frac{1}{4}$

则有:$E(X) = (-1) \cp \frac{7}{12} + 0 \cp \frac{1}{6} + 2 \cp \frac{1}{4} = -\frac{1}{12}$

$E(X^2) = (-1)^2 \cp \frac{7}{12} + 0^2 \cp \frac{1}{6} + 2^2 \cp \frac{1}{4} = -\frac{19}{12}$

$D(X) = E(X^2) - [E(X)]^2 = \frac{227}{144}$

$Y$的边缘分布律为:

Y $\frac{1}{3}$ 1
P $\frac{5}{12}$ $\frac{1}{4}$ $\frac{1}{3}$

则有:$E(Y) = 0 \cp \frac{5}{12} + \frac{1}{3} cp \frac{1}{4} + 1 \cp \frac{1}{3} = \frac{5}{12}$

$E(Y^2) = 0^2 \cp \frac{5}{12} + (\frac{1}{3})^2 cp \frac{1}{4} + 1^2 \cp \frac{1}{3} = \frac{13}{36}$

$D(Y) = E(Y^2) - [E(Y)]^2 = \frac{27}{144}$

例11:设二维随机变量$(X,Y)$的概率密度为: $$ f(x,y) = \begin{cases} \frac{1}{2},\ \ \ \ & 0 \lt x \lt 1,\ 0 \lt y \lt 2 \ 0,&其他 \end{cases} $$ 求:$E(X),E(Y),D(X),D(Y)$。

解:$X$的概率密度为: $$ f_X(x) = \int_{-\infty}^{+\infty} f(x,y) dy = \begin{cases} 1,\ \ \ \ & 0 \lt x \lt 1 \ 0,&其他 \end{cases} $$ 则有:$E(X) = \int_{-\infty}^{+\infty} x f_X(x) dx = \int_{0}^{1} xdx = \frac{1}{2}$

$E(X^2) = \int_{-\infty}^{+\infty} x^2 f_X(x) dx = \int_{0}^{1} x^2dx = \frac{1}{3}$

$D(X) = E(X^2) - [E(X)]^2 = \frac{1}{12}$

$Y$的概率密度为: $$ f_Y(y) = \int_{-\infty}^{+\infty} f(x,y) dx = \begin{cases} \frac{1}{2},\ \ \ \ & 0 \lt y \lt 2 \ 0,&其他 \end{cases} $$ 则有:$E(Y) = \int_{-\infty}^{+\infty} yf_Y(y) dy = \int_{0}^{2} y \cdot \frac{1}{2} dy = 1$

$E(Y^2) = \int_{-\infty}^{+\infty} y^2 f_Y(y) dy = \int_{0}^{2} y^2 \cdot \frac{1}{2} dy = \frac{4}{3}$

$D(X) = E(X^2) - [E(X)]^2 = \frac{1}{3}$

例12:设二维随机变量$(X,Y)$在$D$上服从均匀分布,其中$D$是由$x$轴,$y$轴以及直线$x+y=1$所围成的平面区域,求$D(X)$。

解:首先画图:

image.png

$D$的面积:$S = \frac{1}{2}$;所以$(X,Y)$的概率密度为: $$ f(x,y) = \begin{cases} \frac{1}{S} = 2, \ \ \ \ & x,y \in D \ 0,&其他 \end{cases} $$ 解法一:(先求概率密度)

$X$的概率密度为: $$ \begin{align} f_X(x) = \int_{-\infty}^{+\infty} f(x,y) dy &= \begin{cases} \int_{0}^{1-x} 2 dy , \ \ \ \ &0 \le x \le 1 \ 0,&其他 \ \end{cases} \ &= \begin{cases} 2(1-x) , \ \ \ \ &0 \le x \le 1 \ 0,&其他 \ \end{cases} \ \end{align} $$ 因此:$E(X) = \int_{-\infty}^{+\infty} x \cdot f_X(x) dx = \int_{0}^{1} 2x(1-x) dx = \frac{1}{3}$

$E(X^2) = \int_{-\infty}^{+\infty} x^2 \cdot f_X(x) dx = \int_{0}^{1} 2x^2(1-x) dx = \frac{1}{6}$

$D(X) = E(X^2) - [E(X)]^2 = \frac{1}{18}$

解法二:(不求概率密度)

$E(X) = \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} x \cdot f(x,y) dxdy = \int_{0}^{1}( \int_{0}^{1-x} 2x dy)dx = \int_{0}^{1} 2x(1-x) dx = \frac{1}{3}$

$E(X^2) = \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} x^2 \cdot f(x,y) dxdy = \int_{0}^{1}( \int_{0}^{1-x} 2x^2 dy)dx = \int_{0}^{1} 2x^2(1-x) dx = \frac{1}{6}$

$D(X) = E(X^2) - [E(X)]^2 = \frac{1}{18}$

2.3 方差的性质 $\bigstar \bigstar \bigstar$

**前提:**假设以下所遇到的随机变量的方差都是存在的。

性质1: 设$X$为随机变量,$c$是常数,则: $D(c)=0,\ D(X+c) = D(X)$。

性质2: 设$X$为随机变量,$c$是常数,则: $D(cX) = c^2D(X)$。

性质3: 设$X$ 与$Y$ 是相互独立的随机变量,则:$D(X+Y) = D(X) + D(Y)$。

更一般地:设$X_1,X_2,...,X_n \ \ n\ge 2$为相互独立的随机变量,则: $D(X_1+X_2+...+X_n) = D(X_1) + D(X_2) + ... + D(X_n)$。

例13: 设$X_1,X_2,...,X_n \ \ n\ge 2$ 为相互独立的随机变量,都服从$0-1$ 分布,概率为:$P{X_i = 1} = p,\ \ P{X_i = 0} = 1-p \ \ \ i=1,2,...,n$;设$X = X_1 + X_2 + ... +X_n$,证明:$X \sim B(n,p)$ ,并求$E(X),D(X)$。

解: $X$的可能取值为$0,1,2,...,n$,概率为: $P{X=k} = P{X_1+X_2+...+X_n = k} = P{k个X_i 取1,剩余的取0} \xlongequal{独立} C_n^k p^k(1-p)^{n-k}$ 故$X \sim B(n,p)$

由$E(X_k) = p,\ D(X_k) = p(1-p)$ 且$X_i$ 间相互独立,有:

$E(X) = E(X_1) + E(X_2) + ... + E(X_n) = np$

$D(X) = D(X_1) + D(X_2) + ... + D(X_n) = np(1-p)$

例14:设有随机变量$X, E(X)=\mu, D(X) = \sigma^2$,求$Y = \frac{X-\mu}{\sigma}$ 的数学期望和方差。

解:$E(Y) = E(\frac{X-\mu}{\sigma}) = \frac{1}{\sigma} E(X-\mu) = \frac{1}{\sigma} [E(X) - \mu] = \frac{1}{\sigma} [\mu - \mu] = 0$

$D(Y) = D(\frac{X-\mu}{\sigma}) = \frac{1}{\sigma^2} D(X-\mu) = \frac{1}{\sigma^2} D(X) = 1$

例15:设$X_1,X_2,...,X_n$为相互独立的随机变量,其数学期望和方差分别为$E(X_i) = \mu, D(X_i)= \sigma^2,\ \ i = 1,2,...,n$,令$\overline{X} = \frac{1}{n} \sum_{i=1}^{n} X_i$,求$E(\overline{X}),\ D(\overline{X})$。

解:$E(\overline{X}) = E(\frac{1}{n} \sum_{i=1}^{n} X_i) = \frac{1}{n} \sum_{i=1}^{n} E(X_i) = \frac{1}{n} \cdot n\mu = \mu$

$D(\overline{X}) = D(\frac{1}{n} \sum_{i=1}^{n} X_i) = \frac{1}{n^2} \sum_{i=1}^{n} D(X_i) = \frac{1}{n^2} \cdot n\sigma^2 = \frac{\sigma^2}{n}$

例16:设随机变量$X,Y$表示投掷两骰子的点数,求$X+Y,X-Y$的数学期望和方差。$\bigstar \bigstar \bigstar$

解:$X$的分布律为:$P{X=k} = \frac{1}{6},\ \ k=1,2,...,6$

$E(X) = \sum_{k=1}^{6} x_k \cdot p_k= \sum_{k-1}^{6} k \cdot \frac{1}{6} = \frac{7}{2}$

$E(X^2) = \sum_{k=1}^{6} x_k^2 \cdot p_k= \sum_{k-1}^{6} k^2 \cdot \frac{1}{6} = \frac{91}{6}$

$D(X) = E(X^2) - [E(X)]^2 = \frac{35}{12}$

同理:$E(Y) = \frac{7}{2},\ D(Y) = \frac{35}{12}$,由题目知,$X$与$Y$相互独立,故:

$E(X+Y) = E(X) + E(Y) = 7$

$E(X- Y) = E(X) + E(-Y) = E(X) - E(Y) = 0$

$D(X+Y) = D(X) + D(Y) = \frac{35}{6}$

$D(X-Y) = D(X) + D(-Y) = D(X) + D(Y) = \frac{35}{6}$

小结$\bigstar \bigstar \bigstar \bigstar \bigstar$

分布 分布律或概率密度 数学期望(均值) 方差
离散型 $X$服从参数为$p$的$0-1$分布 $P{X=1}=p,P{X=0}=1-p$ $p$ $p(1-p)$
离散型 二项分布:$X \sim (n,p)$ $P{X=k} = C_n^k p^k (1-p)^{n-k},\ \ k=0,1,...n,\ \ 0 \lt p \lt 1$ $np$ $np(1-p)$
离散型 泊松分布:$X \sim P(\lambda)$ $P{X=k} = \frac{\lambda^k}{k!} e^{-\lambda},\ \ k=0,1,...n,\ \ \lambda \gt 0$ $\lambda$ $\lambda$
连续型 均匀分布:$X \sim U(a,b)$ $$f(x) = \begin{cases} \frac{1}{b-a},\ \ &a \le x \le b \ 0,&其他 \end{cases}$$ $\frac{a+b}{2}$ $\frac{(b-a)^2}{12}$
连续型 指数分布:$X \sim E(\lambda)$ $$f(x) = \begin{cases} \lambda e^{-\lambda x},\ \ &x \gt 0 \ 0,& x \le 0 \end{cases},\ \ \ \ \ \ \ \ \lambda \gt 0$$ $\frac{1}{\lambda}$ $\frac{1}{\lambda^2}$
连续型 正态分布:$X \sim N(\mu, \sigma^2)$ $f(x) = \frac{1}{\sqrt{2\pi} \sigma} e^{-\frac{(x-\mu)^2}{2\sigma}},\ \ \ \ \sigma \gt 0$ $\mu$ $\sigma^2$

3 协方差与相关系数

对于二维随机变量$(X,Y)$而言,$X$和$Y$的数学期望与方差仅仅描述了$X$和$Y$的自身的默写特性,而对于$X$与$Y$之间的关系并未提供任何信息,因此,我们需要引入协方差和相关系数。

3.1 协方差

注意到:$D(X) = E[X- E(X)]^2 = E[(X-E(X)) \times (X-E(X))]$,它反映了一个随机变量与它自身均值的平均偏差,将前面等式右边的第二个$(X-E(X))$换成$Y-E(Y)$就得到了如下协方差的定义。

定义4: 设$(X,Y)$未二维随机变量,且$E(X), E(Y)$存在,若$E[(X-E(X)) \times (Y - E(Y))]$存在,则称其为随机变量$X$与$Y$的<u>协方差</u>,记为:$Cov(X,Y)$,即:$Cov(X,Y) = E[(X-E(X)) \times (Y-E(Y))]$ 。

当$(X,Y)$为二维离散型随机变量是,其分布律为:$p_{ij} = P{X=x_i,Y=y_j},\ \ i,j=1,2,...$ 则:

$Cov(X,Y) = \sum_{i=1}^{\infty} \sum_{j=1}^{\infty} [x_i-E(X)] \cdot [y_j-E(Y)] \cdot p_{ij}$

当(X,Y)为二维连续型随机变量是,其概率密度为:$f(x,y)$ 则:

$Cov(X,Y) = \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} [x_i-E(X)] \cdot [y_j-E(Y)] \cdot f(x,y)dxdy$

计算协方差还有另一个常用公式:$Cov(X,Y) = E(XY) - E(X)E(Y)$

证明: $$ \begin{align} Cov(X,Y) &= E[(X-E(X)) \times (Y-E(Y))] \ &= E[XY - XE(Y) - YE(X) + E(X)E(Y)] \ &= E(XY) -E(X)E(Y) - E(Y)E(X) + E(X)E(Y) \ &= E(XY) -E(X)E(Y) \end{align} $$ 特别是当$X=Y$时:$Cov(X,Y) = D(X) = D(Y)$。

例1:设二维随机变量$(X,Y)$的概率密度为: $$ f(x,y) = \begin{cases} \frac{1}{2}, \ \ \ \ \ & 0 \lt x \lt 1,0 \lt y \lt 2 \ 0,&其他 \end{cases} $$ 求:$Cov(X,Y)$

解:由已知可得:

$E(X) = \int_{0}^{1} \int_{0}^{2} x f(x,y) dxdy = \int_{0}^{1} x dx = \frac{1}{2}$

$E(Y) = \int_{0}^{1} \int_{0}^{2} y f(x,y) dxdy = \int_{0}^{1} 1 dx = 1$

$E(XY) = \int_{0}^{1} \int_{0}^{2} xy f(x,y) dxdy = \int_{0}^{1} x dx = \frac{1}{2}$

则:$Cov(X,Y) = E(XY) - E(X)E(Y) = 0$

例2:设二维随机变量$(X,Y)$在区域$D$上服从均匀分布,其中$D$为$x$轴、$y$轴以及$x+y=1$所围成的平面区域,求$X$与$Y$的协方差$Cov(X,Y)$。

解:先画图

image-20250105145453111

平面区域的面积$S = \frac{1}{2}$

由题目知$(X,Y)$的概率密度为: $$ f(x,y) = \begin{cases} \frac{1}{S} = 2,\ \ \ \ & (x,y) \in D \ 0,&其他 \end{cases} $$ 分别计算$E(X),E(Y),E(XY)$:

$E(X) = \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} x \cdot f(x,y) dxdy = \int_{0}^{1} \int_{0}^{1-x} 2x dxdy = \int_{0}^{1} 2x(1-x) dx = \frac{1}{3}$

$E(Y) = \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} y \cdot f(x,y) dxdy = \int_{0}^{1} \int_{0}^{1-x} 2y dxdy = \int_{0}^{1} (1-x)^2 dx = \frac{1}{3}$

$E(XY) = \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} xy \cdot f(x,y) dxdy = \int_{0}^{1} \int_{0}^{1-x} 2xy dxdy = \int_{0}^{1} (x - 2x^2 + x^3) dx = \frac{1}{12}$

于是:$Cov(X,Y) = E(XY) - E(X)E(Y) = -\frac{1}{36}$

协方差的性质$\bigstar \bigstar \bigstar$

① $Cov(X,X) = D(X)$

② $Cov(X,c) = 0,\ \ c是常数$

③ $Cov(X,Y) = Cov(Y,X)$

④ $Cov(aX,bY) = abCov(X,Y)$

⑤ $Cov(X+Y,Z) = Cov(X,Z) + Cov(Y,Z)$

⑥ $D(X \pm Y) = D(X) + D(Y) \pm 2Cov(X,Y)$

$D(X + Y) = D(X) + D(Y) + 2Cov(X,Y)$

$D(X - Y) = D(X) + D(Y) - 2Cov(X,Y)$

⑦ 若$X$与$Y$相互独立,则$Cov(X,Y) = 0$

需要注意的是: $Cov(X,Y) = 0$ 并不能代表$X$与$Y$相互独立!若 $Cov(X,Y) \ne 0$ 那么$X$与$Y$肯定不是相互独立的!!!

例3:设二维随机变量$(X,Y)$在圆域$D={(x,y)|x^2 + y^2 \le 1}$上服从均匀分布,求协方差$Cov(X,Y)$,并判断$X,Y$是否相互独立。

解:画图

image-20250105152836843

区域$D$的面积为$S$,则$(X,Y)$的概率密度为: $$ f(x,y) = \begin{cases} \frac{1}{S} = \frac{1}{\pi}, \ \ \ \ & (x,y) \in D \ 0,&其他 \end{cases} $$ 先分别计算$f_X(x),f_Y(y)$: $$ \begin{align} f_X(x) = \int_{-\infty}^{+\infty} f(x,y) dy &= \begin{cases} \int_{-\sqrt{1-x^2}}^{\sqrt{1-x^2}} \frac{1}{\pi} dy = \frac{2}{\pi} \sqrt{1-x^2},\ \ \ &-1 \le x \le 1 \ 0,&其他 \end{cases} \end{align} $$

$$ \begin{align} f_Y(y) = \int_{-\infty}^{+\infty} f(x,y) dx &= \begin{cases} \int_{-\sqrt{1-y^2}}^{\sqrt{1-y^2}} \frac{1}{\pi} dy = \frac{2}{\pi} \sqrt{1-y^2},\ \ \ &-1 \le y \le 1 \ 0,&其他 \end{cases} \end{align} $$

$$ E(XY) = \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} xy \cdot f(x,y) dxdy = \int_{-1}^{1}( \int_{-\sqrt{1-x^2}}^{\sqrt{1-x^2}} \frac{1}{\pi} xydy)dx = \int_{-1}^{1} 0 dx = 0 $$

$$ E(X) = \int_{-\infty}^{+\infty} x \cdot f_X(x) dx = \int_{-1}^{1} x\cdot \frac{2}{\pi} \sqrt{1-x^2} dx = 0 $$

$$ E(Y) = \int_{-\infty}^{+\infty} y \cdot f_Y(y) dy = \int_{-1}^{1} y\cdot \frac{2}{\pi} \sqrt{1-y^2} dy = 0 $$ 于是:$Cov(X,Y) = E(XY) -E(X)E(Y) = 0$;但是$f(x,y) \ne f_X(x) \cdot f_Y(y)$,所以:$X$与$Y$并非相互独立的。

3.2 相关系数

定义5: 若$D(X) \gt 0,D(Y) \gt 0$,称$\frac{Cov(X,Y)}{\sqrt{D(X)} \sqrt{D(Y)}}$为$X$与$Y$的<u>相关系数</u>,简记:$\rho_{XY}$,即:$\rho_{XY} = \frac{Cov(X,Y)}{\sqrt{D(X)} \sqrt{D(Y)}}$。

例4:设随机变量$X$与$Y$的方差分别为$D(X) = 16,D(Y) = 25$,协方差$Cov(X,Y) = 6$,求相关系数$\rho_{XY}$。

解:$\rho_{XY} = \frac{Cov(X,Y)}{\sqrt{D(X)} \sqrt{D(Y)}} = \frac{6}{4 \times 5} = 0.3$

相关系数具有以下性质$\bigstar \bigstar \bigstar$

设$\rho$为随机变量$X$与$Y$的相关系数,则:

(1) $|\rho| \le 1$;

(2) $|\rho| = 1$的充分必要条件是存在常数$a,b$,使得$P{Y = aX+b} = 1,\ \ a \ne 0$ 。

相关系数是两个随机变量间<u>线性关系</u>强弱的一种度量;其中性质(2)表示随机变量$X$与$Y$之间存在线性关系的概率为$1$。

当$\rho = 1$时,为正线性相关,即$a \gt 0$;

当$\rho = -1$时,为负线性相关,即$a \lt 0$;

当$|\rho| \lt 1$时,$|\rho|$越小,$X$与$Y$的线性相关程度越弱;

直到$\rho=0$时,$X$与$Y$之间就不存在线性相关了。

定义6: 设离散型型随机变量$X$与$Y$的相关系数$\rho_{XY} = 0$,则称随机变量$X$与$Y$不相关。

显然,<u>若$D(X) \gt 0, D(Y) \gt 0$时</u>,随机变量$X$与$Y$<u>不相关</u>的充要条件是:$Cov(X,Y) = 0$。

若$X$与$Y$相互独立,则$Cov(X,Y)=0$,因此$X$与$Y$也不相关;但是反之,$X$与$Y$不相关并不意味着$X$与$Y$相互独立,而只能说明$X$与$Y$之间不存在线性关系,但是还是有可能存在其他非线性关系的。

需要特别指出的是:二维正态分布$N(\mu_1,\mu_2,\sigma_1^2,\sigma_2^2,\rho)$是一个例外;若$(X,Y) \sim N(\mu_1,\mu_2,\sigma_1^2,\sigma_2^2,\rho)$,则$X$与$Y$的相关系数$\rho_{XY} = \rho$;故,$X$与$Y$不相关的充分必要条件是$\rho = 0$,另一方面,$X$与$Y$相互独立的充分必要条件也是$\rho=0$;从而,对于服从二维正态分布的随机变量$(X,Y)$而言,不相关与独立性是一致的。换句话说:在这种情况下,$X$与$Y$相互独立和$X$与$Y$相互独立互为充分必要条件。

$\bigstar \bigstar \bigstar$例5:设二维随机变量$(X,Y)$的分布律为:

Y X X
Y -1 1
-1 0.25 0.5
1 0.25

求:$E(X),E(Y),D(X),D(Y),Cov(X,Y),\rho_{XY}$

解:先分别计算$X$与$Y$的分布律:

$X$的分布律:

X -1 1
P 0.25 0.75

$Y$的分布律:

Y -1 1
P 0.75 0.25

则有:

$E(X) = (-1) \times 0.25 + 1 \times 0.75 = 0.5$

$E(X^2) = (-1)^2 \times 0.25 + 1^2 \times 0.75 = 1$

$D(X) = E(X^2) - [E(X)]^2 = 0.75$

$E(Y) = (-1) \times 0.75 + 1 \times 0.25 = -0.5$

$E(Y^2) = (-1)^2 \times 0.75 + 1^2 \times 0.25 = 1$

$D(Y) = E(Y^2) - [E(Y)]^2 = 0.75$

$E(XY) = (-1) \times (-1) \times 0.25 + (-1) \times 1 \times 0.5 + 1 \times (-1) \times 0 + 1 \times 1 \times 0.25 = 0$

$Cov(X,Y) = E(XY) - E(X)E(Y) = 0.25$

$\rho_{XY} = \frac{Cov(X,Y)}{\sqrt{D(X)} \sqrt{D(Y)}} = \frac{1}{3}$

$\bigstar \bigstar \bigstar$例6:设二维随机变量$(X,Y)$的概率密度为: $$ f(x,y) = \begin{cases} 8xy,\ \ \ \ &0 \le y \le x, 0 \le x \le 1 \ 0,&其他 \end{cases} $$ 求:$(1)E(X),E(Y);\ \ \ (2)D(X),D(Y);\ \ \ (3)Cov(X,Y),\rho_{X,Y}$

解:这是一个综合性的题目,接替思路可以先求出$(X,Y)$的关于$X$和关于$Y$的边缘密度函数,再求数学期望及方差;也可以直接由$f(x,y)$求数学期望和方差,接下来我们分别用这两种思路求解:

首先画图:(提醒下:题目没说$(X,Y)$在$D$上服从均匀分布,而是直接给出了概率密度函数。)

image-20250105170741148

方法1: $$ \begin{align} f_X(x) = \int_{-\infty}^{+\infty} f(x,y) dy &= \begin{cases} \int_{0}^{x} 8xy dy,\ \ \ \ & 0 \le x \le 1 \ 0,&其他 \end{cases} \ &= \begin{cases} 4x^3,\ \ \ \ & 0 \le x \le 1 \ 0,&其他 \end{cases} \end{align} $$

$$ \begin{align} f_Y(y) = \int_{-\infty}^{+\infty} f(x,y) dx &= \begin{cases} \int_{y}^{1} 8xy dx,\ \ \ \ & 0 \le y \le 1 \ 0,&其他 \end{cases} \ &= \begin{cases} 4y(1-y^2),\ \ \ \ & 0 \le y \le 1 \ 0,&其他 \end{cases} \end{align} $$ 则:(1)$E(X) = \int_{-\infty}^{+\infty} x \cdot f_X(x) dx = \int_{0}^{1} x \cdot 4x^3 dx = (\frac{4}{5} x^5)|_{0}^{1} = \frac{4}{5}$

$E(Y) = \int_{-\infty}^{+\infty} y \cdot f_Y(y) dy = \int_{0}^{1} y \cdot 4y(1-y^2) dy = (\frac{4}{3} y^3 - \frac{4}{5} y^5)|_{0}^{1} = \frac{8}{15}$

(2)$E(X^2) = \int_{-\infty}^{+\infty} x^2 \cdot f_X(x) dx = \int_{0}^{1} x^2 \cdot 4x^3 dx = (\frac{4}{6} x^6)|_{0}^{1} = \frac{2}{3}$

$E(Y^2) = \int_{-\infty}^{+\infty} y^2 \cdot f_Y(y) dy = \int_{0}^{1} y^2 \cdot 4y(1-y^2) dy = (y^4 - \frac{2}{3} y^6)|_{0}^{1} = \frac{1}{3}$

$D(X) = E(X^2) - [E(X)]^2 = \frac{2}{75}$

$D(Y) = E(Y^2) - [E(Y)]^2 = \frac{11}{225}$

(3)$E(XY) = \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} xy f(x,y) dxdy = \int_{0}^{1} \int_{0}^{x} xy \cdot 8xy dxdy = \int_{0}^{1} \frac{8}{3} x^5 dx = \frac{4}{9}$

$Cov(X,Y) = E(XY) - E(X)E(Y) = \frac{4}{225}$

$\rho_{XY} = \frac{Cov(X,Y)}{\sqrt{D(X)} \sqrt{D(Y)}} = \frac{2\sqrt{66}}{32}$

方法2:

(1)$E(X) = \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} x \cdot f(x,y) dxdy = \int_{0}^{1} (\int_{0}^{x} x \cdot 8xy dy) dx = \int_{0}^{1} 4x^4 dx = \frac{4}{5}$

$E(Y) = \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} y \cdot f(x,y) dxdy = \int_{0}^{1} (\int_{0}^{x} y \cdot 8xy dy) dx = \int_{0}^{1} \frac{8}{3}x^4 dx = \frac{8}{15}$

(2)$E(X^2) = \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} x^2 \cdot f(x,y) dxdy = \int_{0}^{1} (\int_{0}^{x} x^2 \cdot 8xy dy) dx = \int_{0}^{1} 4x^5 dx = \frac{2}{3}$

$E(Y^2) = \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} y^2 \cdot f(x,y) dxdy = \int_{0}^{1} (\int_{0}^{x} y^2 \cdot 8xy dy) dx = \int_{0}^{1} 2x^5 dx = \frac{1}{3}$

$D(X) = E(X^2) - [E(X)]^2 = \frac{2}{75}$

$D(Y) = E(Y^2) - [E(Y)]^2 = \frac{11}{225}$

(3)$E(XY) = \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} xy f(x,y) dxdy = \int_{0}^{1} \int_{0}^{x} xy \cdot 8xy dxdy = \int_{0}^{1} \frac{8}{3} x^5 dx = \frac{4}{9}$

$Cov(X,Y) = E(XY) - E(X)E(Y) = \frac{4}{225}$

$\rho_{XY} = \frac{Cov(X,Y)}{\sqrt{D(X)} \sqrt{D(Y)}} = \frac{2\sqrt{66}}{32}$

例7:已知$D(X) = 4, D(Y) = 1, \rho_{XY} = 0.6$,求:$D(X+Y),D(3X-2Y)$。

解:$D(X+Y) = D(X) + D(Y) + 2Cov(X,Y) = D(X) + D(Y) + 2\rho_{XY} \sqrt{D(X)} \sqrt{D(Y)} = 7.4$

$D(3X-2Y) = D(3X) + D(2Y) - 2Cov(3X,2Y) = 9D(X) + 4D(Y) - 2 \times \rho_{XY} \sqrt{D(3X)} \sqrt{D(2Y)} $

$= 9D(X) + 4D(Y) - 2 \times \rho_{XY} \sqrt{9D(X)} \sqrt{4D(Y)} = 25.6$

例8:已知某箱中由100件产品,一、二、三等品各80、10、10件,现从中任取一件产品,记: $$ X_i = \begin{cases} 1, \ \ \ \ &该产品属于i等品 \ 0,&该产品不属于i等品 \end{cases} \ \ \ \ \ ,i = 1,2 $$ 求:$\rho_{XY}$。

解:由题意知:

X_1 1
P 0.2 0.8
X_2 1
P 0.9 0.1

则有:

$E(X_1) = 0.8,\ D(X_1) = 0.16$

$E(X_2) = 0.1,\ D(X_2) = 0.09$

又因为:$P{X_1 X_2 = 1} = P{X_1 =1, X_2 = 1} = 0$

$P{X_1 X_2 = 0} = 1-P{X_1X_2} = 1$

于是:$E(X_1X_2) = 1 \times P{X_1X_2 = 1} + 0 \times P{X_1X-2 = 0} = 0$

$Cov(X_1,X_2) = E(X_1X_2) - E(X_1)E(X_2) = -0.08$

因此:$\rho_{XY} = \frac{Cov(X_1,X_2)}{ \sqrt{D(X_1)} \sqrt{D(X_2)}} = -\frac{2}{3}$

3.3 矩、协方差矩阵

1.矩的定义

随机变量的数学期望和方差乐意纳入一个更一般的概念范畴之中,那就是随机变量的<u></u>。

定义7: 设$X$为随机变量,若$E(X^k)$存在,$k$为正整数,则称它为<u>随机变量$X$的$k$阶原点矩</u>,记为:$\mu_k$,即:$\mu_k = E(X^k)$。

若$E[X- E(X)]^K$存在,则称$E[X - E(X)]^k$为**<u>$X$的$k$阶中心距</u>**,记为:$\nu_k$,即:$\nu_k = E[X- E(X)]^k$。

若$X$为离散型随机变量,其分布律为:$P{X= x_i} = p_i,\ \ i=1,2,...$,则:

$\mu_k = E(X^k) = \sum_{i=1}^{\infty} x_i^k \cdot p_i,\ \ \nu_k = E[X - E(X)]^k = \sum_{i=1}^{\infty} [x-E(X)]^k \cdot p_i$。

若$X$为连续型随机变量,其概率密度为:$f(x)$,则:

$\mu_k = E(X^k) = \int_{-\infty}^{+\infty} x_i^k \cdot f(x)dx,\ \ \nu_k = E[X - E(X)]^k = \int_{-\infty}^{+\infty} [x-E(X)]^k \cdot f(x) dx$。

显然:一阶原点矩是数学期望,即$\mu_1 = E(X)$;二阶中心矩是方差,即$\nu_2 = E[X - E(X)]^2 = D(X)$。

定义8: 设$X、Y$为随机变量,若$E(X^k Y^l),\ \ k,l=1,2,...$存在,则称它为<u>$X$和$Y$的$k+l$阶混合原点矩</u>。

若$E[(X - E(X))^k \times (Y - E(Y))^l]$存在,则称它为**<u>$X$和$Y$的$k+l$阶混合中心距</u>**。

2.协方差矩阵的定义

定义9: 设二维随机变量$(X_1,X_2)$的四个二阶中心矩存在存在,记:

$c_{11} = E[X_1-E(X_1)]^2 = D(X_1) = Cov(X_1,X_1)$

$c_{12} = E[X_1 - E(X_1)] \times E[X_2 - E(X_2)] = Cov(X_1,X_2)$

$c_{21} = E[X_2 - E(X_2)] \times E[X_1 - E(X_1)] = Cov(X_2,X_1)$

$c_{22} = E[X_2-E(X_2)]^2 = D(X_2) = Cov(X_2,X_2)$

则称,矩阵: $$ C=(C_{ij}){2 \times 2} = \begin{pmatrix} c{11} &c_{12} \ c_{21} &c_{22} \ \end{pmatrix} $$ 为二维随机变量$(X_1,X_2)$的<u>协方差矩阵</u>。

定义10: 设$n$为随机变量$(X_1, X_2, ...,X_n)$的二阶中心距:$c_{ij} = E[(X_i - E(X_i)) \times (X_j - E(X_j))] = Cov(X_i, X_j),\ \ i,j=1,2,...$存在,则称矩阵: $$ C=(C_{ij}){n \times n} = \begin{pmatrix} c{11} &c_{12} &... &c_{1n}\ c_{21} &c_{22} &... &c_{2n} \ ... &... &... &... \ c_{n1} &c_{n2} &... &c_{nn} \ \end{pmatrix} $$ 为$n$维随机变量$(X_1, X_2, ...,X_n)$的协方差矩阵

例9:设$(X,Y)$的协方差矩阵为$C= \begin{pmatrix} 4 &-2\ -2 &9 \ \end{pmatrix}$,求$\rho_{XY}$。

解:由题目知:$D(X) = 4, D(Y)=9, Cov(X,Y) = -2$;因此:

$\rho_{XY} = \frac{Cov(X,Y)}{\sqrt{D(X)} \sqrt{D(Y)}} = -\frac{1}{3}$