目录1、DBSCAN算法介绍4、DBSCAN 的参数选择5、Scikit-learn中的DBSCAN的使用核心参数:属性: 1、DBSCAN算法介绍下图中,左边的图形可以使用K-Means算法进行聚类,右边两个有交叉部分【噪音】,故需要使用密度聚类(DBSCAN)算法 K-Means和层次聚类算法,是基于对象之间的距离进行聚类,这样的方法只能发现球状的簇,【密度聚类】只要临近区域的密度,对象或数            
                
         
            
            
            
            1 机器学习            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2022-08-16 01:31:57
                            
                                190阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            生物群体智能群智能。     可以把群(Swarm)定义为某种具有交互作用的组织或智能体的集合。在这种群体中,个体在结构上很简单,而他们的集体行为可能变得相当复杂。个体行为和全局群行为之间存在着某种紧密地联系,这些个体的行为构成和支配了群行为,同时,群行为又影响和改变这些个体的自身行为。个体之间的交互在构建群行为中起到重要的作用,它帮助群体改善了对环境的经验            
                
         
            
            
            
            1.amazon AVS (alex voice service)架构            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2022-12-04 00:00:17
                            
                                194阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            5.3 Boosting【**】    1.boosting集成原理        随着学习的积累从弱到强    2.实现过程        1.初始化训练数据     数据方面:             
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2022-10-14 11:28:08
                            
                                81阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            NLP=NLU+NLGNLU自动写新闻
DreamWriter:腾讯AI撰稿机器人,年均新闻写作实际发稿量已超过50万篇、8000万字。以2018年11月15日为例,机器人共写作天气新闻1298篇、财经773篇、汽车546篇、房产126篇、体育76篇。聊天机器人Bi报告生成NLU太难了。NLGNLG 的6个步骤:
①内容确定 - Content Determination②⽂本结构 - Text             
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-06-08 16:07:44
                            
                                79阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            DBSCAN(Density-Based Spatial Clustering of Applications with Noise,具有噪声的基于密度的聚类方法)是一种很典型的密度聚类算法,和K-Means,BIRCH这些一般只适用于凸样本集的聚类相比,DBSCAN既可以适用于凸样本集,也可以适用于非凸样本集。1.基于密度聚类算法的原理DBSCAN方法是一种基于密度的聚类方法,这类密度聚类方法一            
                
         
            
            
            
            目录1 无监督学习的目标2 聚类(clustering)2.1欧氏距离2.2曼哈顿距离2.3马氏距离2.4夹角余弦3Sklearn & 聚类            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2022-08-16 01:22:20
                            
                                230阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            录1 概述(1)无监督学习(2)聚类(3)K-Mean均值算法2 K-Mean均值算法 2.1 引入2.2 针对大样本集的改进算法:Mini Batch K-Means 2.3 图像3 案例 3.1 代码3.2 结果 4 致谢 1 概述(1)无监督学习(2)聚类(3)K-Mean均值算法2 K-Mean均值算法 2.1 引入步骤:设定 K 个类别的中心的初值;计算每个样本到 K个中心的距离,按最近            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2022-01-05 15:22:01
                            
                                403阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            1 概述(1)无监督学习(2)聚类(3)K-Mean均值算法2 K-Mean均值算法2.1 引入步骤:设定 K 个类别的中心的初值;            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2022-08-16 01:20:02
                            
                                256阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            本实验的目的是学习和掌握k-均值聚类算法。k-均值算法是一种经典的无监督聚类和学习算法,它属于迭代优化算法的范畴。本实验在MATLAB平台上,编程实现了k-均值聚类算法,并使用20组三维数据进行测试,比较分类结果。实验中初始聚类中心由人为设定,以便于实验结果的比较与分析。一、技术论述1.无监督学习和聚类在之前设计分类器的时候,通常需要事先对训练样本集的样本进行标定以确定类别归属。这种利用有标记样本            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-05-03 16:52:01
                            
                                73阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            最近在阅读阿里数据分析专家卢辉的《数据挖掘与数据化运营实战》。书中结合了实际业务案例,介绍了在实战项目中数据分析和数据挖掘的许多知识点,干货满满。因此,打算结合书中内容,对一些重要的主题加以总结,在过程中加深对各个知识点的理解。 文章目录1. 聚类应用场景2. 常用聚类方法2.1 原型聚类Kmeans聚类算法高斯混合模型GMM2.2 密度聚类DBSCAN2.3 层次聚类3. 聚类效果的评估4. 聚            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-04-22 19:49:19
                            
                                103阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            OM 即自组织映射,是一种用于特征检测的无监督学习神经网络。它模拟人脑中处于不同区域的神经细胞 分工不同的特点,即不同区域具有不同的响应特征,而且这一过程是自动完成的。SOM 用于生成训练样本的低维 空间,可以将高维数据间复杂的非线性统计关系转化为简单的几何关系,且以低维的方式展现,因此通常在降维问题中会使用它。SOM 的训练过程:紫色区域表示训练数据的分布状况,白色网格表示从该分布中提取的当前训            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2023-01-25 08:16:07
                            
                                215阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            支持向量机-《统计学习方法》学习笔记1 概述2聚类的基本概念2.1 相似度或距离2.2 类或簇2.3 类与类的距离3 层次聚类3.1 聚合聚类算法3.2 聚合聚类例题4 k均值聚类4.1 K均值算法4.2 k均值例题4.2 k值的选择 1 概述 聚类是针对给定的样本,依据他们特征的相似度或距离,将其归并到若干个类或簇的数据分析问题。  聚类的目的是通过得到的类或簇来发现数据的特点,或对数据进行处            
                
         
            
            
            
            新基建区别于传统基建的核心在于数字化、智能化的属性,人工智能将在新基建的智能化建设中发挥关键作用,拓展应用场景。新基建涉及到的5G、特高压、城际高速铁路和轨道交通、新能源汽车充电桩、工业互...            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2021-07-20 16:40:05
                            
                                99阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            人工智能的应用广泛,涵盖了许多不同的领域。一些常见的人工智能应用包括:自然语言处理(NLP):用于文本分析、语音识别、机器翻译等领域。机器学习和数据分析:用于预测分析、推荐系统、数据挖掘等。计算机视觉:用于图像识别、目标检测、人脸识别等领域。智能助理和虚拟机器人:如智能客服、智能助手、智能家居设备等。医疗健康:用于医学影像分析、疾病诊断、个性化治疗等。自动驾驶:包括自动驾驶汽车、飞行器等。智能制造            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2024-04-30 15:56:01
                            
                                129阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            我们在说机器学习分类的时候,简单介绍了一下不同机器学习方法,主要是解决是什么问题,在本节中具体介绍一些常用的应用场景,主要说明这些应用到底怎么用,不对其中的算法以及原理做深入的介绍。机器学习的应用1. 分类和聚类分类和聚类机器学习最常用的应用场景,分类和聚类都是对数据的分组,我们刚接触的时候,很容易混淆这两个应用的概念,觉得分类就是聚类,其实他们有很多的不同。分类是我们知道有哪些组,然后对数据进行            
                
         
            
            
            
            聚类是机器学习中一种重要的无监督算法,它可以将数据点归结为一系列特定的组合。理论上归为一类的数据点具有相同的特性,而不同类别的数据点则具有各不相同的属性。在数据科学中聚类会从数据中发掘出很多分析和理解的视角,让我们更深入的把握数据资源的价值、并据此指导生产生活。以下是五种常用的聚类算法。 K均值聚类 这一最著名的聚类算法主要基于数据点之间的均值和与聚类中心的聚类迭代而成。它主要的优点是十分的高效            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-03-27 09:48:41
                            
                                137阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            1. AI辅助诊疗系统MedGPT临床试验:全球最大规模AI诊疗一致性研究项目,由华西医院与诺奖得主厄温·内尔团队合作,门诊诊断一致性达96%,样本量超3万例1。中医AI四诊仪:通过广角摄像头、3D结构光和96个传感器实现“望闻问切”,可识别舌苔、脉象等传统体征,但尚未完全替代老中医2。2. 手术机器人技术“卓业云”介入治疗系统:结合AI大模型与3D打印技术,辅助医生完成肿瘤精准微创治疗,已在30            
                
         
            
            
            
            此处并不会列举每一种聚类(Clustering)算法,因为学术界Clustering算法如果真要细分,还真有很多变种。此处只会介绍几种在我近几年互联网工作生涯中实际碰到的具体问题, 以及如何使用Clustering算法解决这些问题。 一般来说,我们可以将Clustering认为是将出现的数据进行Data Segmentation,也就是经常说的哲理: 物以类聚。 从机器学习的观点来看, Clus