非监督分类python算法非监督分类的优缺点

转载

mob6454cc6b8546 2023-07-31 17:59:56

非监督分类，是机器学习的一种方法，训练数据中不带标签，让机器自动寻找数据规律并完成任务。

特点：

1、数据不需要标签；

2、算法不受监督信息（偏见）约束。

优点：

1、极大难度降低数据采集难度，极大程序扩大样本量；

2、可能发现新的数据规律，被忽略的重要信息；

主要运用：聚类分析、关联规则、维度缩减。

聚类分析：把数据样本按照一定的方法分成不同的组别，让同一个组中的成员对象都有相似的一些属性。可实现例如：目标用户的群体分类，图像切割，基因聚类。

最基本的方法有K-Means分类法

K均值聚类：

在样本数据空间中选取K个点作为中心，计算每个样本到各中心的距离，根据距离确定数据类别，是聚类算法中最为基础但最为重要的算法。中心点会根据类别内样本的数据更新中心点的位置。

其核心流程如下：

1、基于观察与经验确定聚类的个数；

2、确定K个中心点

3、计算样本到各个中心点的距离；

4、根据距离确定各个样本的所属类别；

5、计算同类别的样本的中心点，将其设定为新的中心；

6、重复步骤3-5直到收敛（中心点不再变化）。

K均值聚类实现图像分割，最基础的实现方法：灰度阈值分割。

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

非监督分类python算法 非监督分类的优缺点