系统聚类 python实现

转载

mob6454cc6b413f 2024-07-30 12:15:40

文章标签 系统聚类 python实现聚类机器学习类簇数据集 文章分类 Python 后端开发

迟到的周更，下次一定！
下周补充一个介绍篇的评价指标（分上下，先说用的多的评价指标，然后我再查查不常见的）

算法篇——系统聚类（或层次聚类）

始发于：2020-6-9  最新更改：2020-6-9

一、扯
讲系统聚类，优先看一下它的应用前景，系统聚类用的多吗？用的方面广吗？答案都是否定的。那我们学它干什么？我相信学任何一个东西，学会了应该没有坏处，一方面呢，技多不压身，另一方面我们有时候学一个人东西，过了很长时间，在另一个方面研究东西，或者做东西的时候，一些想法，骚操作，可能就来自你之前学过的被称为“没用的”知识。

问：系统聚类为啥用的不多？
答：系统聚类适合小样本数据集，对于大样本系统聚类的运算复杂度成倍叠加，这导致这个方法用的时候不多。现在大多数都是在分析中等量样本集和大数据样本集。

二、系统聚类

系统聚类的原理，比如在一个平面，上面有5个点，首先把每一个点看做一类，我们就有5个类簇，每个类簇有1个点。如下图：

系统聚类 python实现_聚类