第五讲:聚类 物以类聚,人以群分

 

聚类的本质:将数据集中相似的样本进行分组的过程

    每一个组成为一个簇,每个簇的样本对应一个潜在的类别

    样本没有类别标签,一种典型的无监督学习方法。

    这些簇满足以下两个条件

      相同簇的样本之间距离较近

      不同簇的样本之间距离较远

    聚类方法:层次聚类,K-Means,谱聚类等

 

 K-means