分类目录:《算法设计与分析》总目录
有时候,我们知道了一组变量的联合概率分布,但想要了解其中一个子集的概率分布。这种定义在子集上的概率分布被称为边缘概率分布。例如,假设有离散型随机变量
x
x
x和
y
y
y,并且我们知道
P
(
x
,
y
)
P(x, y)
P(x,y)。我们可以依据下面的求和法则来计算
P
(
x
)
P(x)
P(x):
∀
x
i
∈
x
:
P
(
x
i
)
=
∑
y
i
P
(
x
i
,
y
i
)
\forall x_i\in x:P(x_i)=\sum_{y_i}P(x_i, y_i)
∀xi∈x:P(xi)=yi∑P(xi,yi)
“边缘概率”的名称来源于手算边缘概率的计算过程。当 P ( x , y ) P(x, y) P(x,y)的每个值被写在由每行表示不同的 x x x值,每列表示不同的 y y y值形成的网格中时,对网格中的每行求和是很自然的事情,然后将求和的结果 P ( x ) P(x) P(x)写在每行右边的纸的边缘处。
对于连续型变量,我们需要用积分替代求和:
p
(
x
)
=
∫
p
(
x
,
y
)
d
y
p(x)=\int p(x, y)dy
p(x)=∫p(x,y)dy