本文是“漫谈 Clustering 系列”中的第 8 篇,参见本系列的其他文章。系列不小心又拖了好久,其实正儿八经的 blog 也好久没有写了,因为比较忙嘛,不过觉得 Hierarchical Clust...            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2016-08-05 11:12:00
                            
                                304阅读
                            
                                                                                    
                                2评论
                            
                                                 
                 
                
                             
         
            
            
            
            1. 层次聚类 层次聚类算法与之前所讲的顺序聚类有很大不同,它不再产生单一聚类,而是产生一个聚类层次。说白了就是一棵层次树。介绍层次聚类之前,要先介绍一个概念——嵌套聚类。讲的简单点,聚类的嵌套与程序的嵌套一样,一个聚类中R1包含了另一个R2,那这就是R2嵌套在R1中,或者说是R1嵌套了R2。具体说怎么算嵌套呢?聚类R1={{x1,x2},{x3},{x4,x5}嵌套在聚类R2={{x1,x2,            
                
         
            
            
            
            聚类分析广泛用于市场研究、管理研究中,用于对个体细分,或对比聚类后不同样本差异。本文给大家简单梳理下聚类分析的分析思路。  聚类分析,通俗地讲即是分类,根据样本的一些特征,最终将样本分为几类。在总体类别划分不清楚的情况下,可以用聚类的方法来分类。 01 常用的聚类方法Spssau提供两种常见聚类方法: 如果是按样本聚类,使用SPSSAU的进阶方法>“聚            
                
         
            
            
            
            1、python语言from scipy.cluster import hierarchy # 导入层次聚类算法
import matplotlib.pylab as plt
import numpy as np
# 生成示例数据
np.random.seed(0)
data = np.random.random((20,1))
# 使用树状图找到最佳聚类数
Z = hierarchy.lin            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-06-19 19:51:22
                            
                                148阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            聚类算法实践(一)——层次聚类、K-means聚类摘要: 所谓聚类,就是将相似的事物聚集在一 起,而将不相似的事物划分到不同的类别的过程,是数据分析之中十分重要的一种手段。比如古典生物学之中,人们通过物种...            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2016-08-05 11:09:00
                            
                                1425阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            假设有N个待聚类的样本,对于层次聚类来说,步骤: 1、(初始化)把每个样本归为一类,计算每两个类之间的距离,也就是样本与样本之间的相似度; 2、寻找各个类之间最近的两个类,把他们归为一类(这样类的总数就少了一个); 3、重新计算新生成的这个类与各个旧类之间的相似度; 4、重复2和3直到所有样本点都归            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2017-03-06 20:10:00
                            
                                137阅读
                            
                                                                                    
                                2评论
                            
                                                 
                 
                
                             
         
            
            
            
            机器学习 聚类算法 层次聚类 Hierarchical Clustering            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2022-05-24 20:57:07
                            
                                2663阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            全栈工程师开发手册 (作者:栾鹏) python数据挖掘系列教程本文使用层次聚类为文档进行分组,层次聚类为不给定聚类数目的情况下对数据对象进行聚类。形成一个对聚类二叉树。每个树节点的左右子树都具有最佳相似性。层次聚类算法层次聚类(Hierarchical Clustering)是聚类算法的一种,通过计算不同类别数据点间的相似度来创建一棵有层次的嵌套聚类树。在聚类树中,不同类别的原始数据点是树的            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2022-03-27 16:50:59
                            
                                290阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            前面的笔记搞了那么多的数学,这篇来一点轻松的,提前适应一下除了监督问题以外的非监督学习。这篇笔记有没有前面那么多的数学了,要讲的聚类算是无监督的学习方式。一.一般问题聚类分析的目标是,创建满足于同一组内的对象相似,不同组的对象相异的对象分组.它作为一种无监督学习,将相似对象归到同一个簇中去.因此,聚类有时候被称为无监督分类.二.K均值聚类(K-means)Ⅰ.概念假设有一些数据...            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2018-10-06 08:48:27
                            
                                624阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            无监督模型。聚类算法需要度量样本间的距离,距离度量的方式可以参考【机器学习】一般会使用欧氏距离。起步层次聚类( Hierarchical Clustering )是聚类算法的一种,通过计算不同类别的相似度类创建一个有层次的嵌套的树。(分为凝聚的和分裂的两种方式,常用的方式是凝聚的方式)层次聚类算法介绍假设有 n 个待聚类的样本,对于层次聚类算法,它的步骤是:步骤一:(初始化)将每个样本都视为一个聚            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-12-27 13:09:06
                            
                                95阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            前言前面文章给大家介绍了 关于层次聚类算法的实现,那么本文给大家继续介绍层次聚类的优化算法 BIRCH 。大家都知道像 K-means 这样的聚类算法比较有局限性,而且在大数据场景下很难处理,特别是在有限的内存和较慢的CPU硬件条件下。我相信这样的情况常规的聚类算法都没有办法确保随着数据量的不断增加而保证很好的聚类的质量和高效的运行时间。于是 BIRCH 应运而生: Balanced Iterat            
                
         
            
            
            
            层次聚类-概念全解需求分析:  之前学习的划分方法把对象集划分成一些互斥的群组,满足了聚类的基本要求。但在某些情况下,我们想把数据划分成不同层上群组,具有层次性。于是,层次聚类方法将数据对象组成层次结构或簇的树也称聚类树。根据层次分解是以自底向上(合并),还是自顶向下(分裂)方式,层次聚类方法可以进一步分为凝聚的和分裂的。纯粹的层次聚类方法的质量受限于:一旦合并或分裂执行,就不能修改。也就是说,如            
                
         
            
            
            
            一、前述聚类就是对大量未知标注的数据集,按数据的内在相似性将数据集划分为多个类别,使类别内的数据相似度较大而类            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2022-12-30 16:46:30
                            
                                160阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            一文搞懂 层次聚类算法            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                            精选
                                                        
                            2024-04-11 15:26:24
                            
                                233阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            今天,总结一下如何使用层次聚类算法里面的自定义距离度量层次聚类上次已经总结过。 这次仅仅说明层次聚类的距离参数,这里的距离参数可以使用自定义函数。 我们进入该函数的文档页面我们看到linkage的说明文档上面的函数scipy.cluster.hierarchy.linkage(y, method='single', metric='euclidean',optimal_ordering=False            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-08-24 02:56:28
                            
                                73阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            聚类分析(层次聚类分析(Q型聚类和R型聚类)、快速聚类分析)聚类分析的实质:是建立一种分类方法,它能够将一批样本数据按照他们在性质上的亲密程度在没有先验知识的情况下自动进行分类。这里所说的类就是一个具有相似性的个体的集合,不同类之间具有明显的区别。 聚类分析的特点:聚类分析是一种探索性的分析,在分类的过程中,人们不必事先给出一个分类的标准,聚类分析能够从样本数据出发,自动进行分类。1.层次聚类分析            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-08-14 06:51:50
                            
                                89阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            MFC浅谈层次聚类算法写文章的起因所用数据集及预处理划分簇的基础思维和结果开发中遇到的一些问题及算法优化预测错误率的算法写在后面的话 写文章的起因本人是一名大二的学生,原本对于人工智能方面的算法就有一定的兴趣,正巧碰上期末课设需要用到层次聚类来完成课设,就顺水推舟,用C++(准确来说是MFC)完成了层次聚类算法的课设,之所以没用python一方面是了解不够另一方面是为了照顾队友吧,然后深刻体会到            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-12-09 13:11:15
                            
                                67阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            引言最近在读西瓜书,查阅了多方资料,恶补了数值代数、统计概率和线代,总算是勉强看懂了西瓜书中的公式推导。但是知道了公式以后还是要学会应用的,几经摸索发现python下的sklearn包把机器学习中经典的算法都封装好了,因此,打算写几篇博客记录一下sklearn包下的常用学习算法的使用,防止自己以后忘了,嘿嘿。1.聚类西瓜书中197页对“聚类”做了详细的解释,以下为摘录:在无监督学习中,训练样本的标            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-08-24 13:39:28
                            
                                219阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            1. K-Means 算法    此算法是很常用的一个算法,也是基于向量距离来做聚类。算法步骤:    (1) 从 n 个向量对象任意选择 k 个向量作为初始聚类中心    (2) 根据在步骤(1)中设置的 k 个向量(中心对象向量),计算每个对象与这 k 个中心对象各自的距离  &nbs            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                            精选
                                                        
                            2022-12-10 16:10:52
                            
                                383阅读
                            
                                                        
                                点赞
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            文章目录四种基本算法以及如何选择基于连通性的聚类或层次聚类基于质心的聚类期望最大化算法基于数据密度的聚类 这里介绍四种基本的聚类算法—层次聚类、基于质心的聚类、最大期望算法和基于密度的聚类算法, 并讨论不同算法的优缺点。聚类算法十分容易上手,但是选择恰当的聚类算法并不是一件容易的事。数据聚类是搭建一个正确数据模型的重要步骤。数据分析应当根据数据的共同点整理信息。然而主要问题是,什么一般性的参数可            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-10-01 22:04:32
                            
                                19阅读
                            
                                                                             
                 
                
                                
                    