大数据无监督

无监督数据挖掘

什么是聚类（clustering）个人理解：聚类就是将大量无标签的记录，根据它们的特点把它们分成簇，最后结果应当是相同簇之间相似性要尽可能大，不同簇之间相似性要尽可能小。聚类方法的分类如下图所示：一、如何计算样本之间的距离？样本属性可能有的类型有：数值型，命名型，布尔型……在计算样本之间的距离时，需要将不同类型属性分开计算，最后统一相加，得到两个样本之间的距离

无监督数据挖掘

人工智能

样本集

聚类

距离计算

转载

bingfeng

10月前

25阅读

大数据-194 数据挖掘机器学习理论有监督、无监督、半监督、强化学习

从上图我们看出，对于复杂的数据，低阶多项式往往是欠拟合的状态，而高阶多项式则过分捕捉噪声数据的分布规律，而噪声数据

大数据

数据挖掘

机器学习

人工智能

深度学习

原创

武子康1998

11月前

195阅读

无监督学习质量预警大数据分析

# 无监督学习质量预警大数据分析无监督学习在大数据分析中扮演着越来越重要的角色，尤其是在质量预警方面。通过发现数据中的潜在模式和结构，我们能够及早识别临界质量问题，从而做好应对准备。本文将介绍无监督学习在质量预警分析中的应用，并提供相关代码示例，帮助读者理解这一过程。 ## 什么是无监督学习？无监督学习是一种机器学习方法，它使用未标记的数据进行训练，旨在从中提取信息和规律。不同于监督学习

无监督学习

数据

聚类

原创

mob64ca12e7f20c

2024-09-11 06:16:27

61阅读

无监督语义分割的数据集无监督分词

分词算法中，一般都需要一个词典，但这些词典往往很难覆盖所有的词，特别是在一些专业领域，甚至有超过40%的词都不在词典里面，这样首先就需要“学习”大量的新词，否则分词准确性很难提高，进一步的，有研究就干脆不要词典了，由算法自动从大量的语料中学得一个词典，这就是统计分词，或者成为无字典分词。一般就只预设一个小规模的词典，

无监督语义分割的数据集

数据

xml

无监督学习

转载

编程艺术家

2024-05-06 19:18:52

52阅读

1 什么是无监督学习现实生活中常常会有这样的问题：缺乏足够的先验知识，因此难以人工标注类别或进行人工类别标注的成本太高。很自然地，我们希望计算机能代我们完成这些工作，或至少提供一些帮助。根据类别未知(没有被标记)的训练样本解决模式识别中的各种问题，称之为无监督学习。一家广告平台需要根据相似的人口学特征和购买习惯将美国人口分成不同的小组，以便广告客户可以通过有关联的广告接触到他们的目标客户。某个人需

CNN无监督

聚类

算法

机器学习

python

转载

落花流水人家

2024-04-25 13:55:18

128阅读

cnn无监督学习无监督nlp

文章目录前言一、数据介绍二、实验代码1.将语料转存为文本2.用Kenlm统计ngram3.加载Kenlm的ngram统计结果4.过滤ngram5.构建字典树，做预分词，得到候选词6.候选词回溯7.输出结果文件前言这篇文章是对发现新词 | NLP之无监督方式构建词库(三)的性能优化。主要改动包括如下两个方面：1、使用了语言模型工具kenlm的count_ngrams程序来统计ngram。由于

cnn无监督学习

自然语言处理

发现新词

无监督构建词库

kenlm

转载

墨舞天涯

2024-03-08 08:48:34

77阅读

无监督NLP 无监督模型有哪些

1、类型主要有两种类型：数据集变换和聚类。无监督变换：降维：接受数据的高维表示，找到新的表示方法，以用较少的特征概括重要特性。找到“构成”数据的各个组成部分。例如，文本的主题提取。聚类：将数据划分成不同的组，每组包含相似的物项2、降维1.主成分分析（PCA）一种旋转数据集的方法，旋转后的特征在统计上不相关。旋转后，通常根据新特征对数据集的重要性来选择它的一个子集。主成分方差最大的方向为“成分1”，

无监督NLP

无监督学习

聚类

数据集

数据

转载

墨韵流香

2023-12-09 12:36:49

73阅读

无监督的adam pytorch 无监督nlp

编译 | reason_W编辑 | 明明【AI 科技大本营导读】近日，OpenAI 在其官方博客发文介绍了他们最新的自然语言处理（NLP）系统。这个系统是可扩展的、与任务无关的，并且在一系列不同的 NLP 任务中都取得了亮眼的成绩。但该方法在计算需求等方面仍存在改进的空间。下面我们来看他们的博文：我们即将发布一个可扩展的，与任务无关的自然语言处理系统，该系统在一系列不同的语言任务上都取得了目前最

无监督的adam pytorch

数据集

无监督学习

自然语言处理

转载

码海探险家

2024-05-21 14:24:52

37阅读

nlp无监督无监督算法的是

无监督算法简介就是依靠数据之间的相似度，形成数据的类别。（下图有些是网上扒的，如有侵权望告知，立删）层次聚类比如有7个数据点，A，B，C，D，E，F，G。我们采用数据的欧式距离作为相似度（距离越小越相似）：将数据分别两两计算相似度：得到BC的距离最小，这样我们就得到一个新的集合或者说是类：（B,C)。这样我们下一次计算相似度时，只有6个元素了：A，（B,C），D，E，F，G。然后两两计算相似度

nlp无监督

算法

聚类

机器学习

数据

转载

IT智行者

2024-08-20 20:23:38

13阅读

无监督图像增强图像无监督分类

无监督学习的核心思想是构建出一个与待测样本最相近的“模板”与之比较，根据像素或特征的差异性实现缺陷得到检出与定位，根据维度不同，分为两种方法：（1）基于图像相似度的方法该方法在图像像素层面进行比较，核心思想是重建出与输入样本最相近的正常图像，二者仅在缺陷区域有差别。生成图与输入图之间的差

无监督图像增强

深度学习

人工智能

图像处理

Memory

转载

fjfdh

2024-07-08 18:55:38

181阅读

无监督分类nlp cnn无监督分类

图神经网络的相关知识机器学习的分类按有无标签分类监督学习监督学习指的是每个训练数据的样本都有标签，通过标签可以指导模型进行学习，学到具有判别性的特征，然后对未知样本进行预测。翻译成人话：班里的人分为内卷人和摆烂人，有一个机器会自动观察内卷人的成绩和摆烂人的成绩，等观察的人够多了之后，他就可以根据成绩判断哪个是摆烂人哪个是内卷人，这样机器看到小废物rytter的成绩后就能判断出rytter是个摆烂人

无监督分类nlp

神经网络

cnn

机器学习

损失函数

转载

AI智行者

2023-10-19 10:54:25

122阅读

无监督深度学习需要训练数据集吗无监督训练算法

1、无监督学习（Unsupervised Learning）1.1、定义利用无标签的数据学习数据的分布或数据与数据之间的关系被称作无监督学习。1.2、两大任务聚类(clustering)降维(Dimension Reduction)1.3、聚类(clustering)1.3.1、定义聚类，就是根据数据的“相似性”将数据分为多类的过程。估算两个不同样本之间的相似性，通常使用的方法就是计算两个样本之

无监督深度学习需要训练数据集吗

机器学习

数据

强化学习

聚类

转载

fjfdh

2024-01-29 17:39:47

93阅读

python的无监督学习数据降维 pytorch无监督分类

第3章深度神经网络基础3.1 监督学习和无监督学习监督学习(supervised learning)：提供一组输入数据和其对应的标签数据，然后搭建一个模型，让模型在通过训练后准确地找到输入数据和标签数据之间的最优映射关系，在输入新的数据后，模型能够通过之前学到的最优映射关系，快速地预测出这组新数据的标签。这就是一个监督学习的过程3.1.1监督学习监督学习的主要应用场景：回归问题和分类问题回归问

python的无监督学习数据降维

神经网络

深度学习

机器学习

数据

转载

网猴儿

2024-02-11 21:16:54

43阅读

无监督 pytorch

兄弟萌，我咕里个咚今天又杀回来了，有几天时间可以不用驻场了，喜大普奔，终于可以在有网的地方码代码了，最近驻场也是又热又心累啊，抓紧这几天，再更新一点的新东西。今天主要讲一下非监督学习，你可能要问了，什么是非监督学习，我的理解就是不会给样本标签的，它本质上是一个统计手段，在没有标签的数据里可以发现潜在的一些结构的一种训练方式。这个可以用来干什么，举个例子，在工业场景瑕疵检测的运用中，由于良品的数量远

无监督 pytorch

pytorch

深度学习

无监督学习

人工智能

转载

小鱼儿

10月前

30阅读

无监督目标检测数据集

这篇论文有以下三点贡献：1、展示了如何从预训练语言模型中构建知识图谱。2、提出了一种无监督的两阶段方法：MAMA。3、构建了一类全新的知识图谱——开放知识图谱1. 背景介绍简单介绍一下知识图谱：现有大型知识图谱，诸如Wikidata、Yago、DBpedia，富含海量世界知识，并以结构化形式存储。如下图所示，每个节点代表现实世界中的某个实体，它们的连边上标记实体间的关系。这样，美国作家马克·吐温的

无监督目标检测数据集

自然语言处理

Dylan

搜索

语言模型

转载

mob64ca14085c24

2月前

407阅读

无监督学习数据集

任务* 了解以下概念： > 监督式学习 > 非监督式学习* 了解一种数据挖掘（机器学习）算法，并了解案例有监督学习和无监督学习构建机器学习模型包括：选择建模技术，并在数据集中应用该技术。从高层次上区分，有两种类型的建模技术：监督学习和无监督学习。▲ 基本流程：准备原料--> 模型学习 --> 模型评价构建模型之后，使用标准

无监督学习数据集

数据挖掘

无监督学习

数据

监督学习

转载

架构设计师

2024-07-16 22:46:18

72阅读

深度学习无监督训练无监督训练算法

机器学习-无监督学习-聚类算法1.什么是无监督学习2.聚类算法(K-均值)3.优化目标4.随机初始化以及K值的选择 1.什么是无监督学习首先，在一个典型的监督学习中，我们有一个有标签的训练集，我们的目标是找到能够区分正样本和负样本的决策边界，在这里的监督学习中，我们有一系列标签，我们需要据此拟合一个假设函数。与此不同的是，在非监督学习中，我们的数据没有附带任何标签，我们拿到的数据就是这样的：在

深度学习无监督训练

机器学习

聚类

数据

聚类算法

转载

mob64ca1411a6fc

2024-01-09 11:15:21

401阅读

CNN做无监督学习无监督nlp

文章目录一、数据介绍及处理二、寻找未登录词1.统计语料库中的词信息2.利用互信息熵得到初始化词库3.对语料库进行切分4.利用搜索引擎判断新词5.迭代寻找新词6.方法总结一、数据介绍及处理本文以电商领域的商品名称为语料进行实验，来寻找未登录词。首先，将json格式的数据，提取其goods_name列，写入到txt文件中。import pandas as pd """ 将数据中

CNN做无监督学习

自然语言处理

无监督方法

未登录词

python

转载

技术博主

2024-04-25 13:03:06

44阅读

cnn无监督分类无监督分层聚类

机器学习之无监督学习——聚类无监督学习一、基于划分的聚类方法1、基于划分的方法简介A、概念B、分组C、分组与样本对应关系D、硬聚类与软聚类二、基于层次的聚类方法1、基于层次的聚类方法概念 :2、基于层次的聚类方法 :A、聚合层次聚类 ( 叶子节点到根节点 )聚合层次聚类图示切割点说明B、划分层次聚类 ( 根节点到叶子节点 )划分层次聚类图示切割点说明基于层次的聚类方法切割点选取3

cnn无监督分类

机器学习

聚类

算法

层次聚类

转载

代码匠人之心

2024-04-01 06:29:57

139阅读

nlp无监督预训练无监督语义匹配

今天分享的论文解决了我很久以来的一个疑惑，名字叫做：On the Sentence Embeddings from Pre-trained Language Models[1]：这个论文主要探讨两个问题：为什么Bert做无监督文本匹配效果不好？是因为bert的输出携带的语义信息太少还是我们没有正确的利用挖掘这些语义信息如果说是因为没有正确挖掘利用这些语义信息，那么我们怎么使用无监督的方式，让这种语

nlp无监督预训练

人工智能

机器学习

自然语言处理

python

转载

编程思想者

2024-01-16 10:03:13

67阅读

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

51CTO博客

大数据无监督

无监督数据挖掘

大数据-194 数据挖掘机器学习理论有监督、无监督、半监督、强化学习

无监督学习质量预警大数据分析

无监督语义分割的数据集无监督分词

CNN无监督无监督的算法

cnn无监督学习无监督nlp

无监督NLP 无监督模型有哪些

无监督的adam pytorch 无监督nlp

nlp无监督无监督算法的是

无监督图像增强图像无监督分类

无监督分类nlp cnn无监督分类

无监督深度学习需要训练数据集吗无监督训练算法

python的无监督学习数据降维 pytorch无监督分类

无监督 pytorch

无监督目标检测数据集

无监督学习数据集

深度学习无监督训练无监督训练算法

CNN做无监督学习无监督nlp

cnn无监督分类无监督分层聚类

nlp无监督预训练无监督语义匹配

无监督语义分割综述无监督分词方法

无监督目标检测无监督目标检测pycharm

python 无监督学习 pytorch无监督分类

python 无监督实体识别 pytorch无监督分类

NLP无监督情感分析无监督语义分割

计数无监督深度学习无监督的算法

nlp无监督

无监督分类器python cnn无监督分类

cnn 无监督还是有监督

无监督深度学习获取训练数据集label 无监督预训练网络

51CTO博客

大数据无监督

无监督数据挖掘

大数据-194 数据挖掘 机器学习理论 有监督、无监督、半监督、强化学习

无监督学习质量预警大数据分析

无监督语义分割的数据集 无监督 分词

CNN无监督 无监督的算法

cnn无监督学习 无监督nlp

无监督NLP 无监督模型有哪些

无监督的adam pytorch 无监督nlp

nlp无监督 无监督算法的是

无监督图像增强 图像无监督分类

无监督分类nlp cnn无监督分类

无监督深度学习需要训练数据集吗 无监督训练算法

python的无监督学习数据降维 pytorch无监督分类

无监督 pytorch

无监督目标检测数据集

无监督学习数据集

深度学习 无监督训练 无监督训练算法

CNN做无监督学习 无监督nlp

cnn无监督分类 无监督分层聚类

nlp无监督预训练 无监督语义匹配

无监督语义分割综述 无监督分词方法

无监督 目标检测 无监督目标检测pycharm

python 无监督学习 pytorch无监督分类

python 无监督实体识别 pytorch无监督分类

NLP无监督情感分析 无监督语义分割

计数 无监督 深度学习 无监督的算法

nlp无监督

无监督分类器python cnn无监督分类

cnn 无监督还是有监督

无监督深度学习获取训练数据集label 无监督预训练网络

大数据-194 数据挖掘机器学习理论有监督、无监督、半监督、强化学习

无监督语义分割的数据集无监督分词

CNN无监督无监督的算法

cnn无监督学习无监督nlp

nlp无监督无监督算法的是

无监督图像增强图像无监督分类

无监督深度学习需要训练数据集吗无监督训练算法

深度学习无监督训练无监督训练算法

CNN做无监督学习无监督nlp

cnn无监督分类无监督分层聚类

nlp无监督预训练无监督语义匹配

无监督语义分割综述无监督分词方法

无监督目标检测无监督目标检测pycharm

NLP无监督情感分析无监督语义分割

计数无监督深度学习无监督的算法