【概率论与数理统计】第四章随机变量的数字特征

原创

Arthur古德曼 2025-02-17 17:57:52 博主文章分类：概率论与数理统计 ©著作权

文章标签 数学期望概率密度取值方差夏明亮 文章分类 数据分析人工智能

©著作权归作者所有：来自51CTO博客作者Arthur古德曼的原创作品，请联系作者获取转载授权，否则将追究法律责任

随机变量的分布函数可以全面地描述该随机变量的统计规律，但是再许多实际问题中，要确定一个随机变量的分布往往并不容易；另一方面，有些问题也无需知道随机变量的精确分布，只要知道该随机变量的某些特征即可。

例如：测量某零件的长度，一般指关系这批零件的平均长度以及测量结果的精确程度，也就是测量结果对平均值的偏差程度；刻画随机变量某些方面的特征的数值称为：随机变量的数字特征。

1 随机变量的数学期望

1.1 离散型随机变量的数学期望

引用一个例子：某次考试全班30人参加，得5分的由8人，得4分的有12人，得3分和2分的各有5人，则全班30人的平均分为：

$\frac{2\cp 5 + 3\cp 5 + 4\cp 12 + 5\cp 8}{30} = \frac{113}{30} = 3.77$分；

如果将得分记为随机变量$X$，则$X$的取值为$x_k,\ (x_k = 2,3,4,5,\ \ k=1,2,3,4)$ 的频数分别为$m_k, (m_k=5,5,12,8)$；总人数为$n=30$，取值为$x_k$的频率为：$\frac{m_k}{n},\ (\frac{m_k}{n} = \frac{5}{30}, \frac{5}{30},\frac{12}{30},\frac{8}{30})$，平均分是与随机变量的取值和频率密切相关的，但由于频率是随着人数$n$的变化而不同的，所以整个数值具有波动性，其中$\frac{m_k}{n}$是事件${X = x_k}$发生的频率，由频率稳定性(会在第五章中介绍)知，当$n$很大时，频率$\frac{m_k}{n}$将在一定意义下接近于事件${X=x_k}$的概率$p_k$，用概率$p_k$代替频率$\frac{m_k}{n}$，称$\sum_{k=1}^{n} x_k p_k$为随机变量$X$的数学期望，简称期望或者均值。

**定义1：**设离散型随机变量$X$的分布律为：

$P{X=x_k} = p_k,\ \ \ \ k=1,2,...$

若级数$\sum_{k=1}^{n} x_k p_k$绝对收敛（即：级数$\sum_{k=1}^{\infty} |x_k| p_k \lt +\infty$），则称级数$\sum_{k=1}^{n} x_k p_k$的和为随机变量$X$的数学期望，简称期望，记作$E(X)$，即：$E(X) = \sum_{k=1}^{n} x_k p_k$。

例1：设随机变量$X$的分布律为：

X	-1		1	2
P	0.1	0.2	0.3	0.4

求$E(x)$。

解：$E(X) = (-1)\cp 0.1 + 0\cp 0.2 + 1\cp 0.3 + 2\cp 0.4 = 1$

例2：甲乙两名射手在一次射击中的得分为$X,Y$，其分布律分别为：

X	1	2	3
P	0.4	0.1	0.5

Y	1	2	3
P	0.1	0.6	0.3

试比较甲乙两射手的技术。

解：分别计算$X$和$Y$的数学期望：

$E(X) = 1\cp 0.4 + 2\cp 0.1 + 3\cp 0.5 = 2.1$

$E(Y) = 1\cp 0.1 + 2\cp 0.6 + 3\cp 0.3 = 2.2$

据此，可认为乙的技术更好。

几种常见的离散性随机变量的数学期望如下：

（1）$0-1$分布

设随机变量$X$的分布律为：$P{X=1} = p,\ P{X=0}=1-p,\ \ \ \ 0 \le p \le 1$，则：$E(X) = 1\cp p + 0\cp (1-0) = p$

（2）二项分布

设随机变量$X \sim B(n,p)$，即：$p_k = P{X=k} = C_n^k p^k (1-p)^{n-k},\ \ \ \ k=0,1,2,...,\ \ 0 \le p \le 1$则： $$ \begin{align} E(X) = \sum_{k=0}^{n} x_k p_k &= \sum_{k=0}^{n} k \cdot C_n^k p^k (1-p)^{n-k} \ &= \sum_{k=1}^{n} k \cdot \frac{n!}{k! (n-k)!} \cdot p^k (1-p)^{n-k} \ \ \ \ \ \ # k=0是该项等于0，直接可以舍去\ &= np \cdot \sum_{k=1}^{\infty} \frac{(n-1)!}{(k-1)! (n-k)!} \cdot p^{k-1} (1-p)^{n-k} \ &= np \cdot \sum_{k=1}^{\infty} C_{n-1}^{k-1} \cdot p^{k-1} (1-p)^{n-k} \ \ \ \ \ \ # 令i=k-1\ &= np \cdot \sum_{i=0}^{\infty} C_{n-1}^{i} \cdot p^{i} (1-p)^{n-1-i} \ &= np \cdot [p+(1-p)]^{n-1} \ &= np \end{align} $$

二项分布的数学期望$np$有明显的概率意义，比如：掷硬币试验，进行1000次试验则可以期望出现$1000 \cp \frac{1}{2} = 500$次正面向上的结果；再比如：掷骰子，若进行1000次试验则可以期望出现$1000 \cp \frac{1}{6} = 166.67$次出现1点。

（3）泊松分布

设随机变量$X \sim P(\lambda)$，其分布律为：$p_k = P{X=k} = \frac{\lambda^k}{k!} e^{-\lambda},\ \ \ k=0,1,2,...$则： $$ \begin{align} E(X) = \sum_{k=0}^{\infty} k \cdot p_k &= \sum_{k=0}^{\infty} k \cdot \frac{\lambda^k}{k!}e^{-\lambda} \ &= \lambda e^{-\lambda} \cdot \sum_{k=1}^{\infty} \frac{\lambda^{k-1}}{(k-1)!} \ \ \ \ \ \ \ \ \ # k=0时该项为0，直接舍弃\ &\xlongequal {i=k-1} \lambda e^{-\lambda} \cdot \sum_{i=0}^{\infty} \frac{\lambda^i}{i!} \ &= \lambda e^{-\lambda} e^{\lambda} \ &= \lambda \end{align} $$

比如：服从泊松分布的随机变量$X$表示某个时间段你交通事故的次数，则平均次数为参数$\lambda$。

例3：设随机变量$X \sim B(n,0.08)$，已知$E(X)=1.2$，求参数$n$。

解：$E(X) = np = n \cp 0.08 = 1.2$得：$n=15$

例4：已知随机变量$X$的取值为$2$和$a$，且$P{X=2} = 0.8$，$E(X) = 1.2$，求$a$的值。

解：$E(X) = 2\cp 0.8 + a \cp 0.2 = 1.2$得：$a=-2$。

以下介绍一个定理，不用刻意去寻找$Y$的分布也能计算出$Y$的数学期望$E(Y)$：

**定理1：**设$X$为离散型随机变量，其分布律为：$P{X=x_k} = p_k,\ \ k=1,2,...$；令$Y=g(X)$，若级数$\sum_{k=1}^{\infty} g(x_k) p_k$绝对收敛，则$Y = g(X)$的数学期望存在，且有：$E(Y) = E[g(X)] = \sum_{k=1}^{\infty} g(x_k) p_k$。

例5：设随机变量$X$的分布律为：

X	-1		2	3
P	$\frac{1}{8}$	$\frac{1}{4}$	$\frac{3}{8}$	$\frac{1}{4}$

求：$E(X),\ E(X^2),\ E(-2X+1)$。

解：（1）$E(X) = -1 \cp \frac{1}{8} + 0 \cp \frac{1}{4} + 2 \cp \frac{3}{8} + 3 \cp \frac{1}{4} = \frac{11}{8}$

（2）$E(X^2) = (-1)^2 \cp \frac{1}{8} + 0^2 \cp \frac{1}{4} + 2^2 \cp \frac{3}{8} + 3^2 \cp \frac{1}{4} = \frac{31}{8}$

（3）$E(-2X+1) = 3 \cp \frac{1}{8} + 1 \cp \frac{1}{4} + (-3) \cp \frac{3}{8} + (-5) \cp \frac{1}{4} = -\frac{4}{7}$

例6：测量一个正方形的边长(cm)，结果时一个随机变量$X$，其分布律为：

X	9	10	11	12
P	0.2	0.3	0.4	0.1

求：周长$L$和面积$S$的数学期望。

解：$E(L) = E(4X) = 36 \cp 0.2 + 40 \cp 0.3 + 44 \cp 0.4 + 48 \cp 0.1 = 41.6(cm)$

$E(S) = E(X^2) = 81 \cp 0.2 + 100 \cp 0.3 + 121 \cp 0.4 + 144 \cp 0.1 = 109(cm^2)$

1.2 连续型随机变量的数学期望

对于连续型随机变量的数学期望，可以类似与离散型随机变量的数学期望给予定义，只需将$\sum_{k=1}^{\infty} x_k p_k$中的求和号$\sum_{k=1}^{\infty}$改变为积分号$\int$，取值$x_k$改变为$x$，分布律也就是概率$p_k$改变为$f(x)dx$即可；其中$f(x)$为连续型随机变量$X$的概率密度。

定义2：设连续型随机变量$X$的概率密度为$f(x)$，若广义积分$\int_{-\infty}^{+\infty} x f(x) dx$的值为随机变量$X$的数学期望，简称为期望或均值；记作$E(X)$；即：$E(X) = \int_{-\infty}^{+\infty} x f(x) dx$。

例7：设随机变量$X$的概率密度为： $$ f(x) = \begin{cases} 2-2x,\ \ \ \ & 0\le x \le 1 \ 0, &其他 \end{cases} $$ 求：$E(X)$。

解：根据定义得： $$ \begin{align} E(X) = \int_{-\infty}^{+\infty} x f(x) dx &= \int_{-\infty}^{0} xf(x)dx + \int_{0}^{1} xf(x)dx + \int_{1}^{+\infty} xf(x)dx \ &= 0 + \int_{0}^{1} x(2-2x)dx + 0 \ &= (x^2 -\frac{2}{3}x^3)|_{0}^{1} \ &= \frac{1}{3} \end{align} $$

例8：设随机变量$X$的概率密度为： $$ f(x) = \begin{cases} c \sin^2{x},\ \ \ \ &|x| \le \frac{\pi}{2} \ 0, &其他 \end{cases} $$ 求：（1）常数$c$；（2）数学期望$E(X)$。

解：（1）计算步骤： $$ \begin{align} P{-\infty \lt X \lt +\infty} = 1 = \int_{-\infty}^{+\infty} f(x)dx &= \int_{-\frac{\pi}{2}}^{\frac{\pi}{2}} c\sin^2{x} dx \ &= \int_{-\frac{\pi}{2}}^{\frac{\pi}{2}} c(\frac{1-\cos{2x}}{2}) dx \ &= c(\frac{x}{2} - \frac{1}{4} \sin{2x}) |_{-\frac{\pi}{2}}^{\frac{\pi}{2}} \ &= c \cdot \frac{\pi}{2} \end{align} $$

这里用到了三角函数及其导数等式变换。

因此解得：$c = \frac{2}{\pi}$。

（2）$E(X) = \int_{-\infty}^{+\infty} x f(x) dx = \int_{-\infty}^{+\infty} x \cdot \frac{2}{\pi} \sin^2{x} dx \xlongequal{奇函数} 0 $

$\bigstar \bigstar \bigstar \bigstar \bigstar$

下面介绍几种重要的连续型随机变量的数学期望：

①均匀分布

设随机变量$X$服从区间$[a,b]$上的均匀分布，其概率密度为： $$ f(x) = \begin{cases} \frac{1}{b-a},\ \ \ \ & a \le x \le b \ 0,&其他 \end{cases} $$ 则：$E(X) = \int_{-\infty}^{+\infty} x f(x) dx = \int_{a}^{b} x \frac{1}{b-a} dx = \frac{1}{b-a} \cdot \frac{x^2}{2} |_{a}^{b} = \frac{a+b}{2}$

也就是说在区间$[a,b]$上服从均匀分布的连续型随机变量的数学期望时该区间的中点。

②指数分布

设随机变量$X$服从参数为$\lambda \gt 0$的指数分布，其概率密度为： $$ f(x) = \begin{cases} \lambda e^{-\lambda x},\ \ \ \ &x \gt 0 \ 0,&其他 \end{cases} $$ 则：$E(X) = \int_{-\infty}^{+\infty} x f(x) dx = \int_{0}^{+\infty} x \cdot \lambda e^{-\lambda x} dx = -xe^{-\lambda x} |{0}^{+\infty} + \int{0}^{+\infty} e^{-\lambda x} dx = 0-\frac{1}{\lambda}|_{0}^{+\infty} = \frac{1}{\lambda}$

这里利用到：$(uv)' = u'v + uv'$

③正态分布

设随机变量$X \sim N(\mu, \sigma^2)$，其概率密度为：$f(x) = \frac{1}{\sqrt{2\pi} \sigma} e^{-\frac{(x-\mu)^2}{2\sigma^2}},\ \ \ -\infty \lt x \lt +\infty$ ；则： $$ \begin{align} E(X) = \int_{-\infty}^{+\infty} x f(x) dx &= \int_{-\infty}^{+\infty} x \cdot \frac{1}{\sqrt{2\pi} \sigma} e^{-\frac{(x-\mu)^2}{2\sigma^2}} dx \ &\xlongequal{令z=\frac{x-\mu}{\sigma},则\frac{dz}{dx} = \frac{1}{\sigma}} \frac{1}{\sqrt{2\pi} \sigma} \int_{-\infty}^{+\infty} (\sigma z+\mu) \cdot e^{-\frac{z^2}{2}} \cdot \sigma dz \ &= \frac{\sigma}{\sqrt{2\pi}} \int_{-\infty}^{+\infty} ze^{-\frac{z^2}{2}}dz + \mu \int_{-\infty}^{+\infty} \frac{1}{\sqrt{2\pi}} e^{-\frac{z^2}{2}}dz \ &= 0 + \mu \cp 1 \ &= \mu \end{align} $$ 由此可见$X \sim N(\mu, \sigma^2)$中的$\mu$是其数学期望。

因为$\mu$是正态分布的中心，也是正态变量取值的集中位置，又因正态分布是对称的，所以$\mu$应该是其期望。

**定理2：**设连续型随机变量$X$，其概率密度为$f_X(x)$，又随机变量$Y=g(X)$；则当积分$\int_{-\infty}^{+\infty}g(X) f_X(x) dx$绝对收敛时，$Y = g(X)$数学期望存在，且有：$E(Y) = E(g(X)) = \int_{-\infty}^{+\infty}g(X) f_X(x) dx$；证明略。

例9：对圆的直径做近似测量$(cm)$，设其测量值在区间$(19.9,20.1)$上服从均匀分布，求其面积的均值。

解：设圆的面积为$S = g(X) = \pi(\frac{X}{2})^2 = \frac{\pi}{4} X^2$；已知$X$服从均匀分布，因此其概率密度为： $$ f_X(x) = \begin{cases} \frac{1}{0.2},\ \ \ \ \ & 19.9 \lt x \lt 20.1 \ 0, &其他 \end{cases} $$ 因此，$E(S) = E(g(X)) = E(\frac{\pi}{4} X^2) = \int_{-\infty}^{+\infty} \frac{\pi}{4} x^2 f(x) dx = \int_{19.9}^{20.1} \frac{\pi}{4} x^2 \frac{1}{0.2} dx = 314.16{cm^2}$

例10：设随机变量$X$的概率密度为： $$ f(x) = \begin{cases} x, \ \ \ \ &0 \le x \lt 1 \ 2-x, \ \ \ \ &1 \le x \lt 2 \ 0, &其他 \end{cases} $$ 求：$E[|X - E(X)|]$

解：先计算$E(X)$： $$ \begin{align} E(X) = \int_{-\infty}^{+\infty} x \cdot f(x) &= \int_{0}^{1} x \cdot x dx + \int_{1}^{2} x \cdot (2-x) dx + 0 \ &= \frac{1}{3} x^3 |{0}^{1} + (x^2 -\frac{1}{3}x^3)|{1}^{2} \ &= 1 \end{align} $$ 再计算$E[|X - E(X)|]$： $$ \begin{align} $E[|X - E(X)|]$ = E(|X - 1|) &= \int_{0}^{1} |x-1| \cdot x dx + \int_{1}^{2} |x-1| \cdot (2-x)dx \ &= \int_{0}^{1} (1-x) \cdot x dx + \int_{}^{} (x-1) \cdot (2-x) dx \ &= \int_{0}^{1} (x-x^2)dx + \int_{1}^{2} (-x^2 + 3x -2)dx\ &= (\frac{1}{2}x^2 - \frac{1}{3}x^3) |{0}^{1} + (-\frac{1}{3}x^3 + \frac{3}{2} x^2 -2x) |{1}^{2} \ &= \frac{1}{3} \end{align} $$

例11：设$X \sim N(0,1)$，$Y = e^X$，求$E(Y)$。

解：$X$的概率密度为：$f_X(x) = \frac{1}{\sqrt{2\pi}} e^{-\frac{x^2}{2}},\ \ -\infty \lt x \lt +\infty$ ，则： $$ \begin{align} E(Y) = \int_{-\infty}^{+\infty} e^x \cdot f_X(x) &= \int_{-\infty}^{+\infty} e^x \cdot \frac{1}{\sqrt{2\pi}} e^{-\frac{x^2}{2}} \cdot dx \ &= \int_{-\infty}^{+\infty} \frac{1}{\sqrt{2\pi}} e^{-\frac{x^2}{2} + \frac{2x}{2}} \cdot dx \ &= \int_{-\infty}^{+\infty} \frac{1}{\sqrt{2\pi}} e^{-\frac{x^2 -2x +1 - 1}{2}} \cdot dx \ &= \int_{-\infty}^{+\infty} \frac{1}{\sqrt{2\pi}} e^{-\frac{(x-1)^2 - 1}{2}} \cdot dx \ &= \int_{-\infty}^{+\infty} \frac{1}{\sqrt{2\pi}} e^{-\frac{(x-1)^2}{2} + \frac{1}{2}} \cdot dx \ &= e^{\frac{1}{2}}\int_{-\infty}^{+\infty} \frac{1}{\sqrt{2\pi}} e^{-\frac{(x-1)^2}{2}} \cdot dx \ &= e^{\frac{1}{2}} \end{align} $$

$\int_{-\infty}^{+\infty} e^{-\frac{(x-1)^2}{2}} = \sqrt{2\pi}$

1.3 二维随机变量的数学期望

**定理3：（1）**若$(X,Y)$为二维离散型随机变量，其分布律为：$P{X=x_i, Y=y_j} = p_{ij},\ \ i,j=1,2,...$；边缘分布律为：

$p_{i \cdot} = \sum_{j=1}^{\infty} p_{ij},\ \ \ \ p_{\cdot j} = \sum_{i=1}^{\infty} p_{ij}$ 则：

$E(X) = \sum_{i=1}^{\infty} x_i \cdot p_{i \cdot} = \sum_{i=1}^{\infty} (x_i \cdot \sum_{j=1}^{\infty} p_{ij}) = \sum_{i=1}^{\infty} \sum_{j=1}^{\infty} x_i \cdot p_{ij}$，

$E(Y) = \sum_{j=1}^{\infty} y_j \cdot p_{\cdot j} = \sum_{j=1}^{\infty} (y_j \cdot \sum_{i=1}^{\infty} p_{ij}) = \sum_{i=1}^{\infty} \sum_{j=1}^{\infty} y_j \cdot p_{ij}$。

**（2）**若$(X,Y)$为二维连续型随机变量，其概率密度为$f(x,y)$；$f_X(x),f_Y(y)$分别是关于$X,Y$的边缘概率密度，则：

$E(X) = \int_{-\infty}^{+\infty} x \cdot f_X(x) \cdot dx = \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} x \cdot f(x,y) \cdot dxdy$，

$E(Y) = \int_{-\infty}^{+\infty} y \cdot f_Y(y) \cdot dy = \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} y \cdot f(x,y) \cdot dxdy$，

**定理4：**设$g(x,y)$为连续函数，对于二维随机变量$(X,Y)$的函数$g(X,Y)$：

**（1）**若$(X,Y)$为离散型随机变量，且级数$\sum_{i=1}^{\infty} \sum_{j=1}^{\infty} g(x_i,y_j) \cdot p_{ij}$绝对收敛；则$E[g(X,Y)] = \sum_{i=1}^{\infty} \sum_{j=1}^{\infty} g(x_i,y_j) \cdot p_{ij}$ ；

**（2）**若$(X,Y)$为连续型随机变量，且积分$\int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} g(x,y) \cdot f(x,y) \cdot dxdy$绝对收敛；则$E[g(X,Y)] = \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} g(x,y) \cdot f(x,y) \cdot dxdy$ 。

例12：设二维随机变量$(X,Y)$的分布律为：

X	Y	Y
X	2	3
	0.2
1	0.3	0.5

求：（1）$E(X+Y)$ （2）$E(XY)$

解：（1）如下： $$ \begin{align} E(X+Y) &= \sum_{i=1}^{\infty} \sum_{j=1}^{\infty} (x_i + y_j) \cdot p_{ij} \ &= (0+2)\cp 0.2 + (0+3)\cp 0 + (1+2)\cp 0.3 + (1+3)\cp 0.5 \ &= 3.3 \end{align} $$ （2）如下： $$ \begin{align} E(XY) &= \sum_{i=1}^{\infty} \sum_{j=1}^{\infty} (x_i \cdot y_j) \cdot p_{ij} \ &= (0\cp 2)\cp 0.2 + (0\cp 3)\cp 0 + (1\cp 2)\cp 0.3 + (1\cp 3)\cp 0.5 \ &= 2.1 \end{align} $$

例13：设二维随机变量$(X,Y)$的概率密度为： $$ f(x,y) = \begin{cases} c,\ \ \ \ & -1 \le x \le 1,\ 0 \le y \le 2 \ 0, &其他 \end{cases} $$ 求：（1）常数$c$ （2）$E(X+Y)$ （3）$E(XY)$

解：（1）$ \int_{-\infty}^{+\infty} f(x,y) dxdy = 1 = \int_{-1}^{1} \int_{0}^{2} c \cdot dxdy + 0 = 4c$；因此：$c = \frac{1}{4}$

（2）如下： $$ \begin{align} E(X+Y) &= \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} (x+y) \cdot f(x,y)dxdy \ &= \int_{-1}^{1} \int_{0}^{2} (x+y) \cdot \frac{1}{4}dxdy \ &= \frac{1}{4} \int_{-1}^{1} \int_{0}^{2} x \cdot dxdy + \frac{1}{4} \int_{-1}^{1} \int_{0}^{2} y \cdot dxdy \ &= \frac{1}{4} \int_{0}^{2} (\frac{1}{2} x^2 | {-1}^{1}) dy + \frac{1}{4} \int{-1}^{1} (\frac{1}{2} y^2 | {0}^{2}) dx \ &= 0 + \frac{1}{4} (2x|{-1}^{1}) \ &= 1 \end{align} $$ （3）如下： $$ \begin{align} E(XY) &= \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} xy \cdot f(x,y) \cdot dxdy \ &= \int_{-1}^{1} \int_{0}^{2} xy \cdot \frac{1}{4}dxdy \ &= \frac{1}{4} \int_{-1}^{1} xdx \cdot \int_{0}^{2} y dy \ &= 0 \end{align} $$

1.4 数学期望的性质

理解并掌握下列性可以大大地降低计算难度：

**性质1：**设$c$为整数，则$E(c) = c$； # 随机变量的值只能取$c$，即$P{X=c} = 1$；因此均值肯定是$c$。

**性质2：**设$X$为随机变量，$c$是常数，则$E(cX) = cE(X)$；

①若$X$为离散型随机变量：$E(cX) = \sum_{k=1}^{\infty} cx_k \cdot p_k = c\sum_{k=1}^{\infty} x_k \cdot p_k = cE(X)$；

②若$X$为连续型随机变量：$E(cX) = \int_{-\infty}^{+\infty} cx \cdot f(x) dx = c\int_{-\infty}^{+\infty} x \cdot f(x) dx = cE(X)$。

**性质3：**设$X、Y$均为随机变量，则：$E(X+Y) = E(X) + E(Y)$。

以连续型随机变量为例：设$(X,Y)$为二维随机变量，其概率密度为$f(x,y)$，$Z = X+Y$是$（X,Y)$的函数，有：

$E(Z) = E(X+Y) = \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} (x+y) \cdot f(x,y) dxdy = \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} x \cdot f(x,y) dxdy + \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} y \cdot f(x,y) dxdy = E(X) + E(Y)$

**性质4：**设$X$与$Y$为相互独立的随机变量，则$E(XY) = E(X) \cdot E(Y)$。

以连续型随机变量为例：设$(X,Y)$为二维随机变量，其概率密度为$f(x,y)$，由于$X$与$Y$为相互独立的随机变量，因此$f(x,y) = f_X(x) \cdot f_Y(y)$；从而：

$E(XY) = \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} xy \cdot f(x,y) dxdy = \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} xy \cdot f_X(x) \cdot f_Y(y) dxdy = (\int_{-\infty}^{+\infty} x \cdot f_X(x) dx) \cdot (\int_{-\infty}^{+\infty} y \cdot f_Y(y) dy) = E(X) \cdot E(Y)$ 。

例14：设随机变量$X \sim B(n,p)$，利用数学期望的性质求$E(X)$。

解：在$n$重伯努利试验中，令： $$ X_k = \begin{cases} 1,\ \ \ \ & A在第k次试验中出现\ 0,&其他 \end{cases} \ \ \ \ \ \ \ \ ,k=1,2,...,n,... $$ 易知：$X = X_1 + X_2 + ... + X_n + ...$；又因$X_k$是服从$0-1$分布的，因此$P{X_k = 1} = p$；$E(X_k) = p$；再有性质3得：

$E(X) = E(X_1) + E(X_2) + ... + E(X_n) = np$

可见使用性质计算数学期望比使用定义要便利许多。

2 方差

2.1 方差的概念

数学期望反应的是随机变量取值的平均水平。

**定义3：**设$X$为随机变量，若$E[X - E(X)]^2$存在，则称它为随机变量$X$的方差，记为$D(X)$，即$D(X) = E[X - E(X)]^2$，称$\sqrt{D(X)}$为随机变量$X$的标准差。

因此，$D(X)$是$X$的函数$[X-E(X)]^2$数学期望，它描述了$X$与其均值的偏离程度，$D(X)$越小说明$X$取值越集中；反之越分散。即：$D(X)$反应了$X$ 取值的波动性大小。

若$X$为离散型随机变量，其分布律为$P{X=x_k} = p_k,\ \ k=1,2,...$，则有：$D(X) = \sum_{k=1}^{\infty} [x_k - E(X)]^2 \cdot p_k$；

若$X$为连续型随机变量，其概率密度为$f(x)$，则$D(X) = \int_{-\infty}^{+\infty} [x-E(X)]^2 \cdot f(x) dx$。

事实上，无论$X$为离散型随机变量还是连续型随机变量，通常都使用：$D(X) = E(X^2) - [E(X)]^2$来计算方差。

证明：$\bigstar \bigstar \bigstar \bigstar \bigstar $ $$ \begin{align} D(X) = E[X - E(X)]^2 &= E{X^2 - 2X \cdot E(X) + [E(X)]^2} \ &= E{X^2 - 2E(X) \cdot E(X) + [E(X)]^2} \ \ \ \ \ \ \ \ \ #近似地 \ &=E{X^2 -[E(X)]^2} \ &=E(X^2) - [E(X)]^2 \end{align} $$

例1：设随机变量$X$的分布律为：

X	-1		1
P	0.2	0.3	0.5

求：$D(X)$

解：方法1：使用定义

$E(X) = (-1)\cp 0.2 + 0 \cp 0.3 + 1 \cp 0.5 = 0.3$

$D(X) = (-1 - 0.3)^2 + (0 - 0.3)^2 + (1-0.3)^2 = 0.61$

方法2：使用上面的性质

$E(X^2) = (-1)^2 \cp 0.2 + (0)^2 \cp 0.3 + 1^2 \cp 0.5 = 0.7$

$D(X) = E(X^2) - [E(X)]^2 = 0.7 - 0.3^3 = 0.61$

例2：设随机变量$X$的概率密度为： $$ f(x) = \begin{cases} 1,\ \ \ \ \ \ \ \ &0 \le x \le 1 \ 0,&其他 \end{cases} $$ 求：$D(X)$

解：方法1：使用定义

$E(X) = \int_{-\infty}^{+\infty} x \cdot f(x) dx = \int_{0}^{1} xdx = (\frac{1}{2} x^2) | _{0}^{1} = \frac{1}{2}$

$D(X) = \int_{-\infty}^{+\infty} [x - E(X)]^2 \cdot f(x)dx = \int_{0}^{1} (x-\frac{1}{2})^2 \cdot 1dx = \frac{1}{12}$

方法2：使用性质

$E(X^2) = \int_{-\infty}^{+\infty} x^2 \cdot f(x) dx = \int_{0}^{1} x^2 \cdot 1 dx = \frac{1}{3}$

$D(X) = E(X^2) - [E(X)]^2 = \frac{1}{3} - (\frac{1}{2})^2 = \frac{1}{12}$

例3：若随机变量$X$的数学期望$E(X)=-2,D(X)=4$，求$E(X^2)$。

解：$D(X) = 4 = E(X^2) - [E(X)]^2 = E(X^2) - (-2)^2$ ；因此$E(X^2) = 8$。

例4：设随机变量$X$的概率密度为： $$ f(x) = \begin{cases} 1+x,\ \ \ \ \ \ \ \ \ &-1 \le x \lt 0 \ 1-x, & 0 \le x \lt 1 \ 0,&其他 \end{cases} $$ 求$D(X)$

解：$E(X) = \int_{-\infty}^{+\infty} xf(x)dx = \int_{-1}^{0} x(1+x) dx + \int_{0}^{1} x(1-x) dx = (\frac{x^2}{2} + \frac{x^3}{3})|{-1}^{0} + (\frac{x^2}{2} - \frac{x^3}{3})|{0}^{1} = 0$

这里还有个思路：$f(x)$在$[-1,1]$上是偶函数，因此$xf(x)$在$[-1,1]$上是奇函数，因此：$E(X) = \int_{-\infty}^{+\infty} xf(x) dx = \int_{-1}^{1} xf(x) dx = 0$

$E(X^2) = \int_{-\infty}^{+\infty} x^2 f(x) dx = \int_{-1}^{0} x^2 f(x) dx + \int_{0}^{1} x^2 f(x) dx = \int_{-1}^{0} x^2 (1+x) dx + \int_{0}^{1} x^2 (1-x) dx = (\frac{x^3}{3} + \frac{x^4}{4})|{-1}^{0} + (\frac{x^3}{3} - \frac{x^4}{4})|{0}^{1} = \frac{1}{6}$

$D(X) = E(X^2) - [E(X)]^2 = \frac{1}{6} - 0 = \frac{1}{6}$

例5：设随机变量$X$的概率密度为： $$ f(x) = \begin{cases} ax^2 + bx+ c,\ \ \ \ \ \ \ \ &0 \lt x \lt 1 \ 0,&其他

\end{cases} $$ 已知$E(X) = 0.5,\ D(X)=0.15$，求常数$a,b,c$的值。

解：由$\int_{-\infty}^{+\infty} f(x) dx = 1$知：$\int_{0}^{1} (ax^2 + bx + c) dx = 1$，即：$\frac{a}{3} + \frac{b}{2} + c = 1$

由$E(X)= 0.5$知：$\int_{-\infty}^{+\infty} x f(x) dx = \int_{0}^{1} x (ax^2 + bx + c) dx = 0.5$，得：$\frac{a}{4} + \frac{b}{3} + c = 0.5$

由$E(X)=0.5,\ D(X)=0.15$知：$E(X^2) = D(X) + [E(X)]^2 = 0.4$，得：$\int_{-\infty}^{+\infty} x^2 f(x) dx = \int_{0}^{1} x^2 (ax^2 + bx + c) dx =0.4$；得：$\frac{a}{5} + \frac{b}{4} + c = 0$

根据以上解得：$a = 12, b = -12, c = 3$。

2.2 常见随机变量的方差 $\bigstar$

1. $0-1$分布

设随机变量$X$服从$0-1$分布，其分布律为：$P{X=1}=p,\ P{X=0} = 1-p,\ \ 0 \lt p \lt 1$，则$X$的方差：

$D(X) = p(1-p)$

因为：$E(X) = 1\cp p + 0 \cp (1-p) = p$，同样地$E(X^2) = p$；故：$D(X) = E(X^2) - [E(X)]^2 = p-p^2 = p(1-p)$

2.二项分布

设随机变量$X \sim B(n,p)$，其分布律为：$p_k = P{X=k} = C_n^k p^k(1-p)^{n-k},\ k=0,1,...,n\ \ ;0\lt p \lt 1$，则$X$的方差：

$D(X) = np(1-p)$

例6：已知随机变量$X \sim B(n,p)$，且$E(X) = 1.6,\ D(X) = 1.28$，求参数$n,p$的值。

解：$E(X)= 1.6 = np;\ \ \ D(X) = 1.28 = np(1-p)$因此得：$n=8,p=0.2$

3.泊松分布

设随机变量$X \sim P(\lambda)$，其分布律为：$p_k = P{X=k} = \frac{\lambda^k}{k!} e^{-\lambda},\ k=0,1,...$，则$X$的方差：$D(X) = \lambda$。

在$X\sim P(\lambda)$的情况下：$\lambda$既是$X$的数学期望，又是其方差。

例7：设随机变量$X \sim P(\lambda)$，且$P{X=1} = P{X=2}$，求$D(X)$。

解：由已知：$P{X=1} = \frac{\lambda^1}{1!} e^{-\lambda},\ \ P{X=2} = \frac{\lambda^2}{2!} e^{-\lambda}$ 得：$\frac{\lambda e^{-\lambda}}{1} = \frac{\lambda^2 e^{-\lambda}}{2}$

因此：$\lambda = 2$；即$D(X) = 2$

4.均匀分布

设随机变量$X$服从区间$[a,b]$上的均匀分布，其概率密度为： $$ f(x) = \begin{cases} \frac{1}{b-a},\ \ \ \ &a \le x \le b \ 0,&其他 \end{cases} $$ 则$X$的方差为：$D(X) = \frac{(b-a)^2}{12}$

$$ 从而：$P{X \gt 2.5} = \int_{2.5}^{+\infty} f(x) dx = \int_{2.5}^{3} \frac{1}{2} dx = 0.25$

5.指数分布

设随机变量$X$服从参数为$\lambda$的指数分布，其概率密度为： $$ f(x) = \begin{cases} \lambda e^{-\lambda x},\ \ \ \ \ \ \ \ & x \gt 0 \ 0,&其他 \end{cases} $$ 则$X$的方差为：$D(X) = \frac{1}{\lambda^2}$

6.正态分布

设随机变量$X \sim N(\mu, \sigma^2)$，其概率密度为：$f(x) = \frac{1}{\sqrt{2\pi} \sigma} e^{-\frac{(x - \mu)^2}{2 \sigma^2}}, \ \ -\infty \lt x \lt +\infty $ ；则$X$的方差：$D(X) = \sigma^2$。

因为：$X \sim N(\mu, \sigma^2)$，所以$E(X) = \mu$；再根据方差的定义：$D(X) = \int_{-\infty}^{+\infty} [x - E(X)]^2 f(x) dx = \int_{-\infty}^{+\infty} (x-\mu)^2 \cdot \frac{1}{\sqrt{2\pi} \sigma} e^{-\frac{(x - \mu)^2}{2 \sigma^2}} \cdot dx$ ；我们令$t = \frac{x-\mu}{\sigma}$得：

$D(X) = \frac{\sigma^2}{\sqrt{2\pi}} \int_{-\infty}^{+\infty} t^2 e^{-\frac{t^2}{2}} dt = \frac{\sigma^2}{\sqrt{2\pi}} (-te^{-\frac{t}{2}} | {-\infty}^{+\infty} + \int{-\infty}^{+\infty} e^{-\frac{t^2}{2}} dt) = \sigma^2$

例9：设随机变量$X \sim N(0,1)$求$D(|X|)$。

解： $$ \begin{align} E(|X|) &= \int_{-\infty}^{+\infty} |x| \cdot \frac{1}{\sqrt{2\pi}} e^{-\frac{x^2}{2}} \cdot dx \ &= 2 \cp \frac{1}{\sqrt{2\pi}} \int_{0}^{+\infty} x \cdot e^{-\frac{x^2}{2}} \cdot dx \ &= -\frac{2}{\sqrt{2\pi}} \int_{0}^{+\infty} de^{-\frac{x^2}{2}} \ &= -\frac{2}{\sqrt{2\pi}} (e^{-\frac{x^2}{2}})|_{0}^{+\infty} \ &= \sqrt{\frac{2}{\pi}} \end{align} $$ 又有：$E(|X|^2) = E(X^2) = 1 = D(|X|) + [E(|X|)]^2$则：$D(|X|) = E(|X|^2) - [E(|X|)]^2 = 1 - \frac{2}{\pi}$。

例10：设二维随机变量$(X,Y)$得分布律为：

X	Y	Y	Y
X		$\frac{1}{3}$	1
-1		$\frac{1}{4}$	$\frac{1}{3}$
	$\frac{1}{6}$
2	$\frac{1}{4}$

求：$E(X),E(Y),D(X),D(Y)$。

解：$X$的边缘分布律为：

X	-1		2
P	$\frac{7}{12}$	$\frac{1}{6}$	$\frac{1}{4}$

则有：$E(X) = (-1) \cp \frac{7}{12} + 0 \cp \frac{1}{6} + 2 \cp \frac{1}{4} = -\frac{1}{12}$

$E(X^2) = (-1)^2 \cp \frac{7}{12} + 0^2 \cp \frac{1}{6} + 2^2 \cp \frac{1}{4} = -\frac{19}{12}$

$D(X) = E(X^2) - [E(X)]^2 = \frac{227}{144}$

$Y$的边缘分布律为：

Y		$\frac{1}{3}$	1
P	$\frac{5}{12}$	$\frac{1}{4}$	$\frac{1}{3}$

则有：$E(Y) = 0 \cp \frac{5}{12} + \frac{1}{3} cp \frac{1}{4} + 1 \cp \frac{1}{3} = \frac{5}{12}$

$E(Y^2) = 0^2 \cp \frac{5}{12} + (\frac{1}{3})^2 cp \frac{1}{4} + 1^2 \cp \frac{1}{3} = \frac{13}{36}$

$D(Y) = E(Y^2) - [E(Y)]^2 = \frac{27}{144}$

例11：设二维随机变量$(X,Y)$的概率密度为： $$ f(x,y) = \begin{cases} \frac{1}{2},\ \ \ \ & 0 \lt x \lt 1,\ 0 \lt y \lt 2 \ 0,&其他 \end{cases} $$ 求：$E(X),E(Y),D(X),D(Y)$。

解：$X$的概率密度为： $$ f_X(x) = \int_{-\infty}^{+\infty} f(x,y) dy = \begin{cases} 1,\ \ \ \ & 0 \lt x \lt 1 \ 0,&其他 \end{cases} $$ 则有：$E(X) = \int_{-\infty}^{+\infty} x f_X(x) dx = \int_{0}^{1} xdx = \frac{1}{2}$

$E(X^2) = \int_{-\infty}^{+\infty} x^2 f_X(x) dx = \int_{0}^{1} x^2dx = \frac{1}{3}$

$D(X) = E(X^2) - [E(X)]^2 = \frac{1}{12}$

$Y$的概率密度为： $$ f_Y(y) = \int_{-\infty}^{+\infty} f(x,y) dx = \begin{cases} \frac{1}{2},\ \ \ \ & 0 \lt y \lt 2 \ 0,&其他 \end{cases} $$ 则有：$E(Y) = \int_{-\infty}^{+\infty} yf_Y(y) dy = \int_{0}^{2} y \cdot \frac{1}{2} dy = 1$

$E(Y^2) = \int_{-\infty}^{+\infty} y^2 f_Y(y) dy = \int_{0}^{2} y^2 \cdot \frac{1}{2} dy = \frac{4}{3}$

$D(X) = E(X^2) - [E(X)]^2 = \frac{1}{3}$

例12：设二维随机变量$(X,Y)$在$D$上服从均匀分布，其中$D$是由$x$轴，$y$轴以及直线$x+y=1$所围成的平面区域，求$D(X)$。

解：首先画图：

$D$的面积：$S = \frac{1}{2}$；所以$(X,Y)$的概率密度为： $$ f(x,y) = \begin{cases} \frac{1}{S} = 2, \ \ \ \ & x,y \in D \ 0,&其他 \end{cases} $$ 解法一：（先求概率密度）

$X$的概率密度为： $$ \begin{align} f_X(x) = \int_{-\infty}^{+\infty} f(x,y) dy &= \begin{cases} \int_{0}^{1-x} 2 dy , \ \ \ \ &0 \le x \le 1 \ 0,&其他 \ \end{cases} \ &= \begin{cases} 2(1-x) , \ \ \ \ &0 \le x \le 1 \ 0,&其他 \ \end{cases} \ \end{align} $$ 因此：$E(X) = \int_{-\infty}^{+\infty} x \cdot f_X(x) dx = \int_{0}^{1} 2x(1-x) dx = \frac{1}{3}$

$E(X^2) = \int_{-\infty}^{+\infty} x^2 \cdot f_X(x) dx = \int_{0}^{1} 2x^2(1-x) dx = \frac{1}{6}$

$D(X) = E(X^2) - [E(X)]^2 = \frac{1}{18}$

解法二：（不求概率密度）

$E(X) = \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} x \cdot f(x,y) dxdy = \int_{0}^{1}( \int_{0}^{1-x} 2x dy)dx = \int_{0}^{1} 2x(1-x) dx = \frac{1}{3}$

$E(X^2) = \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} x^2 \cdot f(x,y) dxdy = \int_{0}^{1}( \int_{0}^{1-x} 2x^2 dy)dx = \int_{0}^{1} 2x^2(1-x) dx = \frac{1}{6}$

$D(X) = E(X^2) - [E(X)]^2 = \frac{1}{18}$

2.3 方差的性质 $\bigstar \bigstar \bigstar$

**前提：**假设以下所遇到的随机变量的方差都是存在的。

性质1： 设$X$为随机变量，$c$是常数，则： $D(c)=0,\ D(X+c) = D(X)$。

性质2： 设$X$为随机变量，$c$是常数，则： $D(cX) = c^2D(X)$。

性质3： 设$X$ 与$Y$ 是相互独立的随机变量，则：$D(X+Y) = D(X) + D(Y)$。

更一般地：设$X_1,X_2,...,X_n \ \ n\ge 2$为相互独立的随机变量，则： $D(X_1+X_2+...+X_n) = D(X_1) + D(X_2) + ... + D(X_n)$。

例13：设$X_1,X_2,...,X_n \ \ n\ge 2$ 为相互独立的随机变量，都服从$0-1$ 分布，概率为：$P{X_i = 1} = p,\ \ P{X_i = 0} = 1-p \ \ \ i=1,2,...,n$；设$X = X_1 + X_2 + ... +X_n$，证明：$X \sim B(n,p)$ ，并求$E(X),D(X)$。

解： $X$的可能取值为$0,1,2,...,n$，概率为： $P{X=k} = P{X_1+X_2+...+X_n = k} = P{k个X_i 取1，剩余的取0} \xlongequal{独立} C_n^k p^k(1-p)^{n-k}$ 故$X \sim B(n,p)$

由$E(X_k) = p,\ D(X_k) = p(1-p)$ 且$X_i$ 间相互独立，有：

$E(X) = E(X_1) + E(X_2) + ... + E(X_n) = np$

$D(X) = D(X_1) + D(X_2) + ... + D(X_n) = np(1-p)$

例14：设有随机变量$X, E(X)=\mu, D(X) = \sigma^2$，求$Y = \frac{X-\mu}{\sigma}$ 的数学期望和方差。

解：$E(Y) = E(\frac{X-\mu}{\sigma}) = \frac{1}{\sigma} E(X-\mu) = \frac{1}{\sigma} [E(X) - \mu] = \frac{1}{\sigma} [\mu - \mu] = 0$

$D(Y) = D(\frac{X-\mu}{\sigma}) = \frac{1}{\sigma^2} D(X-\mu) = \frac{1}{\sigma^2} D(X) = 1$

例15：设$X_1,X_2,...,X_n$为相互独立的随机变量，其数学期望和方差分别为$E(X_i) = \mu, D(X_i)= \sigma^2,\ \ i = 1,2,...,n$，令$\overline{X} = \frac{1}{n} \sum_{i=1}^{n} X_i$，求$E(\overline{X}),\ D(\overline{X})$。

解：$E(\overline{X}) = E(\frac{1}{n} \sum_{i=1}^{n} X_i) = \frac{1}{n} \sum_{i=1}^{n} E(X_i) = \frac{1}{n} \cdot n\mu = \mu$

$D(\overline{X}) = D(\frac{1}{n} \sum_{i=1}^{n} X_i) = \frac{1}{n^2} \sum_{i=1}^{n} D(X_i) = \frac{1}{n^2} \cdot n\sigma^2 = \frac{\sigma^2}{n}$

例16：设随机变量$X,Y$表示投掷两骰子的点数，求$X+Y，X-Y$的数学期望和方差。$\bigstar \bigstar \bigstar$

解：$X$的分布律为：$P{X=k} = \frac{1}{6},\ \ k=1,2,...,6$

$E(X) = \sum_{k=1}^{6} x_k \cdot p_k= \sum_{k-1}^{6} k \cdot \frac{1}{6} = \frac{7}{2}$

$E(X^2) = \sum_{k=1}^{6} x_k^2 \cdot p_k= \sum_{k-1}^{6} k^2 \cdot \frac{1}{6} = \frac{91}{6}$

$D(X) = E(X^2) - [E(X)]^2 = \frac{35}{12}$

同理：$E(Y) = \frac{7}{2},\ D(Y) = \frac{35}{12}$，由题目知，$X$与$Y$相互独立，故：

$E(X+Y) = E(X) + E(Y) = 7$

$E(X- Y) = E(X) + E(-Y) = E(X) - E(Y) = 0$

$D(X+Y) = D(X) + D(Y) = \frac{35}{6}$

$D(X-Y) = D(X) + D(-Y) = D(X) + D(Y) = \frac{35}{6}$

小结$\bigstar \bigstar \bigstar \bigstar \bigstar$

	分布	分布律或概率密度	数学期望(均值)	方差
离散型	$X$服从参数为$p$的$0-1$分布	$P{X=1}=p,P{X=0}=1-p$	$p$	$p(1-p)$
离散型	二项分布：$X \sim (n,p)$	$P{X=k} = C_n^k p^k (1-p)^{n-k},\ \ k=0,1,...n,\ \ 0 \lt p \lt 1$	$np$	$np(1-p)$
离散型	泊松分布：$X \sim P(\lambda)$	$P{X=k} = \frac{\lambda^k}{k!} e^{-\lambda},\ \ k=0,1,...n,\ \ \lambda \gt 0$	$\lambda$	$\lambda$
连续型	均匀分布：$X \sim U(a,b)$	$$f(x) = \begin{cases} \frac{1}{b-a},\ \ &a \le x \le b \ 0,&其他 \end{cases}$$	$\frac{a+b}{2}$	$\frac{(b-a)^2}{12}$
连续型	指数分布：$X \sim E(\lambda)$	$$f(x) = \begin{cases} \lambda e^{-\lambda x},\ \ &x \gt 0 \ 0,& x \le 0 \end{cases},\ \ \ \ \ \ \ \ \lambda \gt 0$$	$\frac{1}{\lambda}$	$\frac{1}{\lambda^2}$
连续型	正态分布：$X \sim N(\mu, \sigma^2)$	$f(x) = \frac{1}{\sqrt{2\pi} \sigma} e^{-\frac{(x-\mu)^2}{2\sigma}},\ \ \ \ \sigma \gt 0$	$\mu$	$\sigma^2$

3 协方差与相关系数

对于二维随机变量$(X,Y)$而言，$X$和$Y$的数学期望与方差仅仅描述了$X$和$Y$的自身的默写特性，而对于$X$与$Y$之间的关系并未提供任何信息，因此，我们需要引入协方差和相关系数。

3.1 协方差

注意到：$D(X) = E[X- E(X)]^2 = E[(X-E(X)) \times (X-E(X))]$，它反映了一个随机变量与它自身均值的平均偏差，将前面等式右边的第二个$(X-E(X))$换成$Y-E(Y)$就得到了如下协方差的定义。

定义4： 设$(X,Y)$未二维随机变量，且$E(X), E(Y)$存在，若$E[(X-E(X)) \times (Y - E(Y))]$存在，则称其为随机变量$X$与$Y$的协方差，记为：$Cov(X,Y)$，即：$Cov(X,Y) = E[(X-E(X)) \times (Y-E(Y))]$ 。

当$(X,Y)$为二维离散型随机变量是，其分布律为：$p_{ij} = P{X=x_i,Y=y_j},\ \ i,j=1,2,...$ 则：

$Cov(X,Y) = \sum_{i=1}^{\infty} \sum_{j=1}^{\infty} [x_i-E(X)] \cdot [y_j-E(Y)] \cdot p_{ij}$

当(X,Y)为二维连续型随机变量是，其概率密度为：$f(x,y)$ 则：

$Cov(X,Y) = \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} [x_i-E(X)] \cdot [y_j-E(Y)] \cdot f(x,y)dxdy$

计算协方差还有另一个常用公式：$Cov(X,Y) = E(XY) - E(X)E(Y)$

证明： $$ \begin{align} Cov(X,Y) &= E[(X-E(X)) \times (Y-E(Y))] \ &= E[XY - XE(Y) - YE(X) + E(X)E(Y)] \ &= E(XY) -E(X)E(Y) - E(Y)E(X) + E(X)E(Y) \ &= E(XY) -E(X)E(Y) \end{align} $$ 特别是当$X=Y$时：$Cov(X,Y) = D(X) = D(Y)$。

例1：设二维随机变量$(X,Y)$的概率密度为： $$ f(x,y) = \begin{cases} \frac{1}{2}, \ \ \ \ \ & 0 \lt x \lt 1,0 \lt y \lt 2 \ 0,&其他 \end{cases} $$ 求：$Cov(X,Y)$

解：由已知可得：

$E(X) = \int_{0}^{1} \int_{0}^{2} x f(x,y) dxdy = \int_{0}^{1} x dx = \frac{1}{2}$

$E(Y) = \int_{0}^{1} \int_{0}^{2} y f(x,y) dxdy = \int_{0}^{1} 1 dx = 1$

$E(XY) = \int_{0}^{1} \int_{0}^{2} xy f(x,y) dxdy = \int_{0}^{1} x dx = \frac{1}{2}$

则：$Cov(X,Y) = E(XY) - E(X)E(Y) = 0$

例2：设二维随机变量$(X,Y)$在区域$D$上服从均匀分布，其中$D$为$x$轴、$y$轴以及$x+y=1$所围成的平面区域，求$X$与$Y$的协方差$Cov(X,Y)$。

解：先画图

平面区域的面积$S = \frac{1}{2}$

由题目知$(X,Y)$的概率密度为： $$ f(x,y) = \begin{cases} \frac{1}{S} = 2,\ \ \ \ & (x,y) \in D \ 0,&其他 \end{cases} $$ 分别计算$E(X),E(Y),E(XY)$：

$E(X) = \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} x \cdot f(x,y) dxdy = \int_{0}^{1} \int_{0}^{1-x} 2x dxdy = \int_{0}^{1} 2x(1-x) dx = \frac{1}{3}$

$E(Y) = \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} y \cdot f(x,y) dxdy = \int_{0}^{1} \int_{0}^{1-x} 2y dxdy = \int_{0}^{1} (1-x)^2 dx = \frac{1}{3}$

$E(XY) = \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} xy \cdot f(x,y) dxdy = \int_{0}^{1} \int_{0}^{1-x} 2xy dxdy = \int_{0}^{1} (x - 2x^2 + x^3) dx = \frac{1}{12}$

于是：$Cov(X,Y) = E(XY) - E(X)E(Y) = -\frac{1}{36}$

协方差的性质$\bigstar \bigstar \bigstar$

① $Cov(X,X) = D(X)$

② $Cov(X,c) = 0,\ \ c是常数$

③ $Cov(X,Y) = Cov(Y,X)$

④ $Cov(aX,bY) = abCov(X,Y)$

⑤ $Cov(X+Y,Z) = Cov(X,Z) + Cov(Y,Z)$

⑥ $D(X \pm Y) = D(X) + D(Y) \pm 2Cov(X,Y)$

$D(X + Y) = D(X) + D(Y) + 2Cov(X,Y)$

$D(X - Y) = D(X) + D(Y) - 2Cov(X,Y)$

⑦ 若$X$与$Y$相互独立，则$Cov(X,Y) = 0$

需要注意的是： $Cov(X,Y) = 0$ 并不能代表$X$与$Y$相互独立！若 $Cov(X,Y) \ne 0$ 那么$X$与$Y$肯定不是相互独立的！！！

例3：设二维随机变量$(X,Y)$在圆域$D={(x,y)|x^2 + y^2 \le 1}$上服从均匀分布，求协方差$Cov(X,Y)$，并判断$X,Y$是否相互独立。

解：画图

区域$D$的面积为$S$，则$(X,Y)$的概率密度为： $$ f(x,y) = \begin{cases} \frac{1}{S} = \frac{1}{\pi}, \ \ \ \ & (x,y) \in D \ 0,&其他 \end{cases} $$ 先分别计算$f_X(x),f_Y(y)$： $$ \begin{align} f_X(x) = \int_{-\infty}^{+\infty} f(x,y) dy &= \begin{cases} \int_{-\sqrt{1-x^2}}^{\sqrt{1-x^2}} \frac{1}{\pi} dy = \frac{2}{\pi} \sqrt{1-x^2},\ \ \ &-1 \le x \le 1 \ 0,&其他 \end{cases} \end{align} $$

$$ \begin{align} f_Y(y) = \int_{-\infty}^{+\infty} f(x,y) dx &= \begin{cases} \int_{-\sqrt{1-y^2}}^{\sqrt{1-y^2}} \frac{1}{\pi} dy = \frac{2}{\pi} \sqrt{1-y^2},\ \ \ &-1 \le y \le 1 \ 0,&其他 \end{cases} \end{align} $$

$$ E(XY) = \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} xy \cdot f(x,y) dxdy = \int_{-1}^{1}( \int_{-\sqrt{1-x^2}}^{\sqrt{1-x^2}} \frac{1}{\pi} xydy)dx = \int_{-1}^{1} 0 dx = 0 $$

$$ E(X) = \int_{-\infty}^{+\infty} x \cdot f_X(x) dx = \int_{-1}^{1} x\cdot \frac{2}{\pi} \sqrt{1-x^2} dx = 0 $$

$$ E(Y) = \int_{-\infty}^{+\infty} y \cdot f_Y(y) dy = \int_{-1}^{1} y\cdot \frac{2}{\pi} \sqrt{1-y^2} dy = 0 $$ 于是：$Cov(X,Y) = E(XY) -E(X)E(Y) = 0$；但是$f(x,y) \ne f_X(x) \cdot f_Y(y)$，所以：$X$与$Y$并非相互独立的。

3.2 相关系数

定义5： 若$D(X) \gt 0,D(Y) \gt 0$，称$\frac{Cov(X,Y)}{\sqrt{D(X)} \sqrt{D(Y)}}$为$X$与$Y$的相关系数，简记：$\rho_{XY}$，即：$\rho_{XY} = \frac{Cov(X,Y)}{\sqrt{D(X)} \sqrt{D(Y)}}$。

例4：设随机变量$X$与$Y$的方差分别为$D(X) = 16,D(Y) = 25$，协方差$Cov(X,Y) = 6$，求相关系数$\rho_{XY}$。

解：$\rho_{XY} = \frac{Cov(X,Y)}{\sqrt{D(X)} \sqrt{D(Y)}} = \frac{6}{4 \times 5} = 0.3$

Y	X	X
Y	-1	1
-1	0.25	0.5
1		0.25

X	-1	1
P	0.25	0.75

Y	-1	1
P	0.75	0.25

X_1		1
P	0.2	0.8

X_2		1
P	0.9	0.1

3.3 矩、协方差矩阵

1.矩的定义

随机变量的数学期望和方差乐意纳入一个更一般的概念范畴之中，那就是随机变量的矩。

定义7： 设$X$为随机变量，若$E(X^k)$存在，$k$为正整数，则称它为随机变量$X$的$k$阶原点矩，记为：$\mu_k$，即：$\mu_k = E(X^k)$。

若$E[X- E(X)]^K$存在，则称$E[X - E(X)]^k$为**$X$的$k$阶中心距**，记为：$\nu_k$，即：$\nu_k = E[X- E(X)]^k$。

若$X$为离散型随机变量，其分布律为：$P{X= x_i} = p_i,\ \ i=1,2,...$，则：

$\mu_k = E(X^k) = \sum_{i=1}^{\infty} x_i^k \cdot p_i,\ \ \nu_k = E[X - E(X)]^k = \sum_{i=1}^{\infty} [x-E(X)]^k \cdot p_i$。

若$X$为连续型随机变量，其概率密度为：$f(x)$，则：

$\mu_k = E(X^k) = \int_{-\infty}^{+\infty} x_i^k \cdot f(x)dx,\ \ \nu_k = E[X - E(X)]^k = \int_{-\infty}^{+\infty} [x-E(X)]^k \cdot f(x) dx$。

显然：一阶原点矩是数学期望，即$\mu_1 = E(X)$；二阶中心矩是方差，即$\nu_2 = E[X - E(X)]^2 = D(X)$。

定义8： 设$X、Y$为随机变量，若$E(X^k Y^l),\ \ k,l=1,2,...$存在，则称它为$X$和$Y$的$k+l$阶混合原点矩。

若$E[(X - E(X))^k \times (Y - E(Y))^l]$存在，则称它为**$X$和$Y$的$k+l$阶混合中心距**。

2.协方差矩阵的定义

定义9： 设二维随机变量$(X_1,X_2)$的四个二阶中心矩存在存在，记：

$c_{11} = E[X_1-E(X_1)]^2 = D(X_1) = Cov(X_1,X_1)$

$c_{12} = E[X_1 - E(X_1)] \times E[X_2 - E(X_2)] = Cov(X_1,X_2)$

$c_{21} = E[X_2 - E(X_2)] \times E[X_1 - E(X_1)] = Cov(X_2,X_1)$

$c_{22} = E[X_2-E(X_2)]^2 = D(X_2) = Cov(X_2,X_2)$

则称，矩阵： $$ C=(C_{ij}){2 \times 2} = \begin{pmatrix} c{11} &c_{12} \ c_{21} &c_{22} \ \end{pmatrix} $$ 为二维随机变量$(X_1,X_2)$的协方差矩阵。

定义10： 设$n$为随机变量$(X_1, X_2, ...,X_n)$的二阶中心距：$c_{ij} = E[(X_i - E(X_i)) \times (X_j - E(X_j))] = Cov(X_i, X_j),\ \ i,j=1,2,...$存在，则称矩阵： $$ C=(C_{ij}){n \times n} = \begin{pmatrix} c{11} &c_{12} &... &c_{1n}\ c_{21} &c_{22} &... &c_{2n} \ ... &... &... &... \ c_{n1} &c_{n2} &... &c_{nn} \ \end{pmatrix} $$ 为$n$维随机变量$(X_1, X_2, ...,X_n)$的协方差矩阵。

例9：设$(X,Y)$的协方差矩阵为$C= \begin{pmatrix} 4 &-2\ -2 &9 \ \end{pmatrix}$，求$\rho_{XY}$。

解：由题目知：$D(X) = 4, D(Y)=9, Cov(X,Y) = -2$；因此：

$\rho_{XY} = \frac{Cov(X,Y)}{\sqrt{D(X)} \sqrt{D(Y)}} = -\frac{1}{3}$