本文简要介绍了多种无监督学习算法的 Python 实现,包括 K 均值、层次、t-SNE 、DBSCAN 。无监督学习是一用于在数据中寻找模式的机器学习技术。无监督学习算法使用的输入数据都是没有标注过的,这意味着数据只给出了输入变量(自变量 X)而没有给出相应的输出变量(因变量)。在无监督学习中,算法本身将发掘数据中有趣的结构。人工智能研究的领军人物 Yan Lecun,解释道:
转载 2023-08-23 16:16:50
124阅读
1.k均值简介k均值是一种无监督学习方法,当数据量小,数据维度低时,具有简单、快速、方便的优点,但是当数据量较大时,其速度较慢,也容易陷入局部最优。2. 步骤和以前一样,kMeans的原理在网上有很多讲解,所以这里不在赘述,直接给出步骤,而通过伪代码将是一个描述步骤的不错选择:随机初始化k个中心 while 有样本所属的中心发生改变时: for 每个样本i: 初始化所有簇
文章目录一、前言二、基本原理(一) 无向权重图1、 邻接矩阵 W2、 度 D(二)相似矩阵/邻接矩阵 W1、ϵ-邻近法2、K邻近法3、全连接法(三)拉普拉斯矩阵(2) 拉普拉斯矩阵的性质(四) 无向图切图1、 子图与子图的连接权重2、 切图的目标函数(五) 谱切图1、 RatioCut切图2、 Ncut切图三、谱算法流程四、python实现五、sklearn库中的谱使用六、谱算法
转载 2023-12-06 16:28:20
408阅读
# Python实现 ## 1. 整体流程 首先,让我们来看一下实现Python实现”这个任务的整体流程: ```mermaid erDiagram PARTICIPANT as 开发者 PARTICIPANT as 小白 开发者 -->> 小白: 教授Python实现 ``` ## 2. 每一步的具体操作 接下来,让我们来具体看一下每一步需要做什么
原创 2024-05-01 05:39:16
42阅读
  层次算法分为合并算法和分裂算法。合并算法会在每一步减少中心的数量,产生的结果来自前一步的两个的合并;分裂算法与合并算法原理相反,在每一步增加的数量,每一步产生的结果都将是前一步中心分裂得到的。合并算法现将每个样品自成一,然后根据间距离的不同,合并距离小于阈值的。我用了基于最短距离算法的层次算法,最短距离算法认为,只要两个的最小距离小于阈值,就将
转载 2023-09-05 18:18:46
143阅读
层次算法的主要优点在于我们无需事先知道最终所需集群数量。很遗憾的是,网上并没有很详细的教程讲述如何使用 SciPy 的层次包进行层次。本教程将帮助你学习如何使用 SciPy 的层次模块。命名规则在我们开始之前,我们先设定一下命名规则来帮助理解本篇教程:X - 实验样本(n 乘 m 的数组)n - 样本数量m - 样本特征数量Z - 集群关系数组(包含层次信息)k - 集群数量导
转载 2024-02-29 15:13:06
159阅读
在之前的文章里,介绍了比较传统的K-Means、Affinity Propagation(AP)、比K-Means更快的Mini Batch K-Means以及混合高斯模型Gaussian Mixture Model(GMM)等算法,今天介绍一个比较近代的一算法——Spectral Clustering 中文通常称为“谱”。Spectral Clustering(谱,有时
聚类分析是数据挖掘方法中应用非常广泛的一项,而聚类分析根据其大体方法的不同又分为系统和快速,其中系统的优点是可以很直观的得到数不同时具体中包括了哪些样本,而Python和R中都有直接用来聚类分析的函数,但是要想掌握一种方法就得深刻地理解它的思想,因此自己从最底层开始编写代码来实现这个过程是最好的学习方法,所以本篇前半段是笔者自己写的代码,如有不细致的地方,望指出。一、仅使用num
      本文将对谱的知识进行一些总结。目的在于记录自己的学习经历,当作自己的笔记来写。写得不好的地方欢迎交流指正。谱是一种非常流行的算法,它不需要对簇的类型有很强的假设,可以任何形状的数据。一、简要介绍      由于网上有许多的关于谱的介绍,所以我这里只是简要介绍一下谱是一种对数据分析非常有用的工具,它
层次(hierarchical clustering)基于簇间的相似度在不同层次上分析数据,从而形成树形的结构,层次一般有两种划分策略:自底向上的聚合(agglomerative)策略和自顶向下的分拆(divisive)策略,本文对层次算法原理进行了详细总结。目录1. 层次算法原理2. 簇间相似度的计算方法3. 层次算法的复杂度计算4. 层次算法的优化方法5. 层次
# Python层次实现教程 作为一名经验丰富的开发者,我很高兴能够帮助刚入行的小白们学习如何使用Python实现层次。层次是一种常用的方法,它将数据点逐步合并成更大的簇,直到达到某个终止条件。在本文中,我将详细介绍层次实现步骤,并提供相应的Python代码示例。 ## 层次实现流程 首先,我们来看一下实现层次的整体流程。以下是层次的主要步骤: | 步骤
原创 2024-07-30 03:39:40
38阅读
# 模糊Python实现 ## 引言 在聚类分析中,我们常常使用K-means算法或层次等方法来将数据分成不同的簇。然而,在一些情况下,数据并不适合被硬性地分成具体的簇,而是更适合被模糊地分类到各个簇中。这时候,我们可以使用模糊算法来解决这个问题。本文将介绍如何使用Python实现模糊算法,并给出代码示例。 ## 模糊算法简介 模糊是一种分析的方法,它将数据分为
原创 2024-05-01 07:14:51
90阅读
时序python实现是一个涉及到数据挖掘与时间序列分析的重要课题,尤其在金融、物联网以及气象等领域,时序数据的规律性与变化性常被用来进行深入分析。但时序数据的特点使得传统算法难以适用,因此需要特定的方法来有效。 为了更好地理解时序实现,我们可以从以下几个方面展开: ### 背景描述 时序数据是指按时间顺序排列的数据序列,这类数据呈现时间相关性,因此在处理时序数据时,我们通常要
原创 6月前
30阅读
迟到的周更,下次一定! 下周补充一个介绍篇的评价指标(分上下,先说用的多的评价指标,然后我再查查不常见的)算法篇——系统(或层次)始发于:2020-6-9 最新更改:2020-6-9一、扯 讲系统,优先看一下它的应用前景,系统用的多吗?用的方面广吗?答案都是否定的。那我们学它干什么?我相信学任何一个东西,学会了应该没有坏处,一方面呢,技多不压身,另一方面我们有时候学一个人东西,过
# Python实现SOM 自组织映射(Self-Organizing Maps,SOM)是一种用于高维数据和可视化的无监督学习算法。它通过将输入数据映射到一个二维的网格结构中,保留数据的拓扑结构,使得相似的数据样本被映射到相邻的节点上。在本文中,我们将介绍如何使用Python实现SOM算法,并对其进行可视化展示。 ## SOM算法简介 SOM算法由芬兰科学家Teuvo Koho
原创 2024-06-08 06:00:15
228阅读
# FCM Python实现指南 ## 简介 在本文中,我将向你介绍如何使用Python实现FCM(模糊C均值)算法。FCM是一种模糊算法,它可以将数据点分成不同的类别,并且每个数据点可以属于多个类别。通过本文的指南,你将学会使用Python编写代码来实现FCM算法。 ## FCM算法流程 下面是FCM算法的基本流程: 1. 初始化隶属度矩阵U和中心矩阵C
原创 2023-11-24 04:24:51
164阅读
是一种强大的无监督学习算法,广泛应用于图像分割、社交网络分析以及生物信息学等领域。谱通过构建数据之间的相似度矩阵,利用图论中的概念来有效识别数据的结构。本文将将谱Python实现逐步进行详细阐述,涵盖背景描述、技术原理、架构解析、源码分析、性能优化和扩展讨论等方面。 ### 背景描述 谱的概念可以追溯到1990年代。随着数据量的迅速增长,传统方法在高维空间中的效果逐渐
原创 6月前
28阅读
今天说K-means算法,但是必须要先理解聚和分类的区别,很多业务人员在日常分析时候不是很严谨,混为一谈,其实二者有本质的区别。分类其实是从特定的数据中挖掘模式,作出判断的过程。比如Gmail邮箱里有垃圾邮件分类器,一开始的时候可能什么都不过滤,在日常使用过程中,我人工对于每一封邮件点选“垃圾”或“不是垃圾”,过一段时间,Gmail就体现出一定的智能,能够自动过滤掉一些垃圾邮件了。这是因
写在前面:健忘星人自学笔记,仅供参考简单易懂的阅读资料 层次-概念全解 - 万勇's 前面的文章我们分别介绍了 K-means , 密度,谱,其中谱的难度比较大,要求有一定的矩阵学习基础,今天不妨轻松一下,学习一个较为简单的“层次”。正文:一、层次基本原理层次的方法(Hierarchical Clustering),从字面上理解,其
相关数学概念协方差矩阵 多维高斯分布 其中k=n,即x的维度。GMM的原理GMM,高斯混合模型,是一种算法。 1.GMM概念:          -将k个高斯模型混合在一起,每个点出现的概率是几个高斯混合的结果。          -每个 Gaussian 称为一个“Component”,这
  • 1
  • 2
  • 3
  • 4
  • 5