混合高斯模型(Mixture Gaussian Model)是一种常用于概率密度估计和聚类的统计模型。在混合高斯模型中,假设数据是由多个高斯分布组合而成的,每个高斯分布称为一个分量(component),而数据点则根据这些分量的权重进行分配。

当你选择将混合高斯模型的分量数设置为 k = 2 时,意味着你希望用两个高斯分布来拟合数据。每个高斯分布都有其均值、方差和权重。

对于每个高斯分布的均值(mean)的计算,通常使用一种称为“期望最大化”(Expectation-Maximization,EM)算法来进行。EM 算法分为两个主要步骤:E 步骤(Expectation)和 M 步骤(Maximization)。

E 步骤(Expectation):
在 E 步骤中,首先通过当前参数(均值、方差、权重)来计算每个数据点属于每个高斯分布的概率(后验概率)。这通常使用高斯分布的概率密度函数来计算。

M 步骤(Maximization):
在 M 步骤中,根据 E 步骤中计算的后验概率,重新估计每个高斯分布的参数。均值的更新可以通过对数据点的权重加权平均来计算。

具体地,给定数据集 D,对于第 i 个高斯分布的均值 μ_i,它的更新可以如下计算:

混合高斯模型_权重


其中,N 是数据点的总数,wij是数据点 x_j 属于第 i 个高斯分布的后验概率。上述计算中,wij通常是在 E 步骤中计算得出的后验概率。

重复进行 E 步骤和 M 步骤,直到模型的参数收敛为止。这样就可以获得适合数据的两个高斯分布,每个分布对应一个均值,从而完成了混合高斯模型的参数估计。