《Python机器学习基础教程》笔记预处理步骤,有时可以提高监督算法的精度,或者减少内存占用和时间开销。不过评估无监督算法却没有什么好方法,唯一的方法就是人工检查。一、无监督学习的分类无监督学习主要有两种类型:数据集变换与聚类。数据集变换:数据集的无监督变换是创建数据新的表示,与数据原始表示相比,新的表示可能更容易被人或其他机器学习算法所理解。利用无监督学习进行数据变换最常见的目的就是可视化、压缩
转载
2023-12-31 17:00:07
69阅读
【机器学习】无监督学习
众所周知,机器学习的训练数据之所以非常昂贵,是因为需要大量人工标注数据。
autoencoder可以输入数据和输出数据维度相同,这样测试数据匹配时和训练数据的输出端直接匹配,从而实现无监督训练的效果。并且,autoencoder可以起到降维作用,虽然输入输出端维度相同,但中间层可以维度很小,从而起到降维作用,形成数据的一个浓缩表示。
可以用autoencoder做Pr
转载
2018-11-15 08:36:07
600阅读
**************************************注:本系列博客是博主学习Stanford大学 Andrew Ng 教授的《机器学习》课程笔记。博主深感学过课程后,不进行总结非常easy遗忘。依据课程加上自己对不明确问题的补充遂有此系列博客。本系列博客包含线性回归、逻辑回归、神经网络、机器学习的应用和系统设计、支持向量机、聚类、将维、异常检測、推荐系统及大规模机器学习等内
转载
2017-06-21 11:40:00
295阅读
2评论
1.理解分类与监督学习、聚类与无监督学习。简述分类与聚类的联系与区别。简述什么是监督学习与无监督学习。 2.朴素贝叶斯分类算法 实例利用关于心脏病患者的临床历史数据集,建立朴素贝叶斯心脏病分类模型。有六个分类变量(分类因子):性别,年龄、KILLP评分、饮酒、吸烟、住院天数目标分类变量疾病:–心梗–不稳定性心绞痛新的实例:–(性别=‘男’,年龄<70, KILLP=‘I',饮酒=‘
基于深度学习的三维点云智能分析——北京科技大学自动化系樊彬老师研究背景许多应用需要三维数据的理解机器人、增强现实、自动驾驶、医学图像处理(CT、核磁共振)广泛应用前景和现实的应用基础三维数据有多种表示方式:多视角图片体素网格mesh数据(工业界)深度图像(RGB-D)3D点云,是由原始传感器输出的3D数据,一般是激光雷达Li-Dar 数据格式简单:一组3D坐标+额外的属性上述的体素网格、mesh数
主要介绍 KMeans、GMM 、Agglomerative 、DBSCAN 等模型的使用,KMeans 是最常用最简单的模型,它尝试根据 n_clusters 设置找到代表数据区域的簇中心。而 GMM 可以看成是升级版的 KMeans ,它会改 KMeans 模型簇边界的计算方式,把圆形改成椭圆形,让数据边界更明显。Agglomerative 则更类似于树模型
转载
2021-08-13 15:51:18
497阅读
本章主要介绍了最常见的 PCA 主成分分析、NMF 非负矩阵分解等无监督模型,举例说明使用使用非监督模型对多维度特征数据集进行降维的意义及实用方法。对 MDS 多维标度法、LLE 局部线性嵌入法、Isomap 保距映射法、t-SNE 分布邻域嵌入算法等 ML 流形学习模型的基础使用方法进行讲解
原创
2021-08-02 11:19:12
753阅读
主要介绍 KMeans、GMM 、Agglomerative 、DBSCAN 等模型的使用,KMeans 是最常用最简单的模型,它尝试根据 n_clusters 设置找到代表数据区域的簇中心。而 GMM 可以看成是升级版的 KMeans ,它会改 KMeans 模型簇边界的计算方式,把圆形改成椭圆形,让数据边界更明显。
原创
2021-08-13 15:49:18
225阅读
前言
在上篇《 Python 机器学习实战 —— 无监督学习(上)》介绍了数据集变换中最常见的 PCA 主成分分析、NMF 非负矩阵分解等无监督模型,举例说明使用使用非监督模型对多维度特征数据集进行降维的意义及实用方法。对 MDS 多维标度法、LLE 局部线性嵌入法、Isomap 保距映射法、t-SNE 分布邻域嵌入算法等 ML 流形学习模型的基础使用方法进行讲解。本文将对聚类算法进行讲解,聚类
转载
2021-08-13 15:49:20
216阅读
# 边缘分割与深度学习的无监督学习方法
## 引言
在计算机视觉领域中,边缘分割是一种重要的技术,用于检测图像中的重要结构和对象的边界。传统的分割方法往往依赖于手动设计的特征,这使得其适应性较差。随着深度学习的迅速发展,无监督学习在边缘分割中的应用逐渐受到关注。
本文将探讨无监督深度学习在边缘分割中的应用,并提供一个简单的代码示例,最后以甘特图形式展示相关的时间管理计划。
## 什么是边缘
原创
2024-10-24 04:52:29
219阅读
本文是论文《Unsupervised End-to-end Learning for Deformable Medical Image Registration》的阅读笔记。该模型要比VoxelMorph更早一点,网络结构上两者非常类似,不同的是,本文的模型的配准网络采用的是FlowNet,而VoxelMorph采用的是UNet,两者结构是类似的,都是编码器-解码器结构,都有跳跃连接。此外,该模型
摘要日志异常检测,其对开发稳定、可持续的系统具有重要意义。但当系统刚上线时,收集足够的数据训练一个无监督模型是不现实的。为此本文提出了一个可转移的日志异常检测(LogTAD)框架,该框架利用对抗域适应技术使来自不同系统的日志数据具有相似的分布,从而使检测模型能够检测来自多个系统的异常。实验表明,LogTAD在使用少量新系统日志的情况下,可以实现较高的跨系统异常检测精度。介绍在实践中,系统日志被广泛
转载
2024-02-22 19:57:18
132阅读
1.理解分类与监督学习、聚类与无监督学习。简述分类与聚类的联系与区别。分类指监督学习,就是按照某种标准给对象贴标签,再根据标签来区分归类。聚类是指事先没有“标签”而通过某种成团分析找出事物之间存在聚集性原因的过程。指无监督学习,是指根据“物以类聚”的原理,将本身没有类别的样本聚集成不同的组,这样的一组数据对象的集合叫做簇,并且对每一个这样的簇进行描述的过程。区别是,分类是事先定义好类别 ,聚类则没
文章目录GANSeg: Learning to Segment by Unsupervised Hierarchical Image Generation摘要引言方法Level 1: Point Generation and Part ScaleLevel 2: From Points to MasksLevel 3: Mask-conditioned Image Generation损失函数实
转载
2024-05-31 14:25:10
594阅读
机器学习无监督学习聚类-K均值
原创
2021-08-17 17:13:45
234阅读
一、监督学习(supervised learning) 通过已有的训练样本(即已知数据以及其对应的输出)来训练,从而得到一个最优模型,再利用这个模型将所有新的数据样本映射为相应的输出结果,对输出结果进行简单的判 断从而实现分类的目的,那么这个最优模型也就具有了对未知数据进行分类的能力。监督学习中只要
转载
2017-06-09 10:44:00
237阅读
2评论
机器学习无监督学习聚类-K均值
原创
2022-03-07 11:09:23
70阅读
迄今为止,前四篇文章已经介绍了分词的若干思路,其中有基于最大概率的查词典方法、基于HMM或LSTM的字标注方法等。这些都是已有的研究方法了,笔者所做的就只是总结工作而已。查词典方法和字标注各有各的好处,我一直在想,能不能给出一种只需要大规模语料来训练的无监督分词模型呢?也就是说,怎么切分,应该是由语料来决定的,跟语言本身没关系。说白了,只要足够多语料,就可以告诉我们怎么分词。 看上去很完美,可
转载
2024-05-13 12:09:15
85阅读
作者 | 程明明 编辑 | CVer
大规模无监督语义分割
引言语义分割是计算机视觉领域中被广泛关注的一个研究方向,其旨在针对图像中每一个像素进行分类。由于语义分割的固有挑战,目前大多数工作都关注于多样性受限(例如几十类)且数据规模受限场景的语义分割。尽管许多方法在这些受限的场景中取得了显著的效果,但是面对现实世界中常用的几百上千类物体规模带
转载
2024-04-20 20:37:46
56阅读
本文介绍两种聚类方法: K-means、DBSCAN, 讨论高斯混合模型, 并了解如何将它们用于密度估计、聚类和异常检测 ...
转载
2021-09-29 23:41:00
156阅读
2评论