EM聚类 R em聚类参数迭代公式推导

转载

mob6454cc7966b9 2024-02-28 13:25:25

文章标签 EM聚类 R 算法机器学习概率论迭代 文章分类 机器学习人工智能

EM算法公式推导

EM 算法是一种用来进行含有隐变量的概率生成模型参数估计的迭代算法。

EM算法步骤

EM 算法通过迭代求 $EM聚类 R em聚类参数迭代公式推导_算法$

算法流程：

输入：观测变量数据 $EM聚类 R em聚类参数迭代公式推导_迭代_02$ ，隐变量数据 $EM聚类 R em聚类参数迭代公式推导_EM聚类 R_03$ ，联合分布 $EM聚类 R em聚类参数迭代公式推导_概率论_04$ ，条件分布： $EM聚类 R em聚类参数迭代公式推导_EM聚类 R_05$
输出：模型参数 $EM聚类 R em聚类参数迭代公式推导_EM聚类 R_06$
步骤

选择参数的初值 $EM聚类 R em聚类参数迭代公式推导_机器学习_07$
E 步：记 $EM聚类 R em聚类参数迭代公式推导_EM聚类 R_08$ 为第 $EM聚类 R em聚类参数迭代公式推导_概率论_09$ 次迭代参数 $EM聚类 R em聚类参数迭代公式推导_迭代_10$ 的估计值，在第 $EM聚类 R em聚类参数迭代公式推导_概率论_11$ 次迭代的 E 步，计算：
$EM聚类 R em聚类参数迭代公式推导_概率论_12$
这里 $EM聚类 R em聚类参数迭代公式推导_机器学习_13$ 为给定观测数据 $EM聚类 R em聚类参数迭代公式推导_EM聚类 R_14$ 和当前参数估计 $EM聚类 R em聚类参数迭代公式推导_迭代_15$ 下隐变量数据 $EM聚类 R em聚类参数迭代公式推导_概率论_16$
M 步：求使 $EM聚类 R em聚类参数迭代公式推导_算法_17$ 极大化的 $EM聚类 R em聚类参数迭代公式推导_迭代_10$ ，确定第 $EM聚类 R em聚类参数迭代公式推导_概率论_19$ 次迭代的参数估计值 $EM聚类 R em聚类参数迭代公式推导_迭代_20$ :
$EM聚类 R em聚类参数迭代公式推导_概率论_21$
重复 2、3 两步，直到收敛。

函数 $EM聚类 R em聚类参数迭代公式推导_EM聚类 R_22$ 是 EM 算法的核心，称为 $EM聚类 R em聚类参数迭代公式推导_算法_23$

EM算法收敛性证明

EM 迭代算法终归要求的是 $EM聚类 R em聚类参数迭代公式推导_算法_24$ 的极大似然估计，因此，要证明它的收敛性，即要证明：
$EM聚类 R em聚类参数迭代公式推导_机器学习_25$
下面开始证明：
$EM聚类 R em聚类参数迭代公式推导_机器学习_26$
接下来我们同时对等式两边乘 $EM聚类 R em聚类参数迭代公式推导_机器学习_27$ 在对 $EM聚类 R em聚类参数迭代公式推导_机器学习_28$ 求积分：
$EM聚类 R em聚类参数迭代公式推导_迭代_29$
即，左边相当于没变。
$EM聚类 R em聚类参数迭代公式推导_机器学习_30$
分别将上式两项记为 $EM聚类 R em聚类参数迭代公式推导_EM聚类 R_22$ 和 $EM聚类 R em聚类参数迭代公式推导_迭代_32$ 。我们要证的是 $EM聚类 R em聚类参数迭代公式推导_迭代_33$ ，这里可以通过证明
$EM聚类 R em聚类参数迭代公式推导_迭代_34$
来得到。对于 $EM聚类 R em聚类参数迭代公式推导_EM聚类 R_22$ ，明显是通过迭代过程的 $EM聚类 R em聚类参数迭代公式推导_机器学习_36$ 可以保证。因此，我们只需证明 $EM聚类 R em聚类参数迭代公式推导_概率论_37$ ：
$EM聚类 R em聚类参数迭代公式推导_EM聚类 R_38$
发现最后的形式是 $EM聚类 R em聚类参数迭代公式推导_概率论_39$ 和 $EM聚类 R em聚类参数迭代公式推导_EM聚类 R_40$

上面我们是给出最终的公式，然后证明它的收敛性，即 $EM聚类 R em聚类参数迭代公式推导_迭代_33$ ，这样来说明 EM 算法确实可以以迭代的形式来最大化 $EM聚类 R em聚类参数迭代公式推导_概率论_42$

EM算法的导出——KL散度

我们再回顾一下整个算法的设定：

观测数据： $EM聚类 R em聚类参数迭代公式推导_迭代_02$
隐变量： $EM聚类 R em聚类参数迭代公式推导_EM聚类 R_03$
完整数据： $EM聚类 R em聚类参数迭代公式推导_概率论_45$
参数： $EM聚类 R em聚类参数迭代公式推导_EM聚类 R_06$
MLE： $EM聚类 R em聚类参数迭代公式推导_EM聚类 R_47$
EM 公式
$EM聚类 R em聚类参数迭代公式推导_概率论_48$

E 步求对数条件联合概率 $EM聚类 R em聚类参数迭代公式推导_算法_49$ 关于后验 $EM聚类 R em聚类参数迭代公式推导_概率论_50$ 的期望，M 步选择一个新的 $EM聚类 R em聚类参数迭代公式推导_迭代_51$ 使得上述期望达到最大。从而迭代地使得 $EM聚类 R em聚类参数迭代公式推导_算法_24$

下面开始推导公式的导出。我们还是从对数似然 $EM聚类 R em聚类参数迭代公式推导_算法_24$ 出发：
$EM聚类 R em聚类参数迭代公式推导_EM聚类 R_54$

第一步先从似然，引入隐变量 $EM聚类 R em聚类参数迭代公式推导_EM聚类 R_03$
然后通过对数的性质写开；
引入关于 $EM聚类 R em聚类参数迭代公式推导_EM聚类 R_03$ 的概率分布 $EM聚类 R em聚类参数迭代公式推导_算法_57$ ，两个对数里面同时除 $EM聚类 R em聚类参数迭代公式推导_算法_57$
然后两边同时求关于 $EM聚类 R em聚类参数迭代公式推导_算法_57$

$EM聚类 R em聚类参数迭代公式推导_机器学习_60$

左边原来就与 $EM聚类 R em聚类参数迭代公式推导_迭代_61$

$EM聚类 R em聚类参数迭代公式推导_迭代_62$

右边也求期望后，后一项是 $EM聚类 R em聚类参数迭代公式推导_算法_57$ 对 $EM聚类 R em聚类参数迭代公式推导_EM聚类 R_05$ 的相对熵，也就是 KL 散度。而前一项我们通常称为 ELBO （Evidence Lower BOund）证据下界。很明显的， KL 散度是恒正的，因此前一项 ELBO 是 $EM聚类 R em聚类参数迭代公式推导_机器学习_65$ 的一个下界。当且仅当后一项相对熵为零，即两个分布完全相同 $EM聚类 R em聚类参数迭代公式推导_算法_66$
EM 算法的思想就是通过使得 ELBO 取得最大，从而使得对数似然 $EM聚类 R em聚类参数迭代公式推导_机器学习_65$

$EM聚类 R em聚类参数迭代公式推导_算法_68$

当 $EM聚类 R em聚类参数迭代公式推导_概率论_69$
在经过一次变换后，我们发现中括号中后面一项与 $EM聚类 R em聚类参数迭代公式推导_机器学习_70$ 无关，因此丢掉。注意，在迭代算法中 $EM聚类 R em聚类参数迭代公式推导_算法_71$ 都是常数， $EM聚类 R em聚类参数迭代公式推导_机器学习_70$
最终得到了 EM 的公式