半监督文本分类的优势:可以减少数据的标注,节省人力成本。项目流程:1.数据预处理:1).生成字的字典:加载所有训练数据,统计词频,统计每个字在各个文本中出现的文本数量n,取n大于1的字,再根据词频大小排序,取前6000个字,并保存。2).生成训练数据:训练数据分为语言模型的训练数据和分类模型的训练数据。 语言模型训练数据的封装:遍历有标签和无标
转载
2024-10-24 13:57:17
10阅读
Paper:PREDICT THEN PROPAGATE: GRAPH NEURAL NETWORKS MEET PERSONALIZED PAGERANK关键词:PageRank ,PPNP ,APPNP,图卷积神经网络1. Motivation最近在图上进行半监督分类的神经信息传递算法取得了巨大的成功。但是,为了对节点进行分类,这些方法仅考虑距离传播步骤不远的节点,并且所利用的邻
转载
2023-11-23 14:30:28
144阅读
Deep Graph Library(DGL) DGL是一个专门用于深度学习图形的Python包, 一款面向图神经网络以及图机器学习的全新框架, 简化了基于图形的神经网络的实现。 在设计上,DGL 秉承三项原则:DGL 必须和目前的主流的深度学习框架(PyTorch、MXNet、TensorFlow 等)无缝衔接。从而实现从传统的 tensor 运算到
转载
2023-08-14 10:23:35
275阅读
一、机器学习算法分类:监督学习:提供数据和数据分类标签。——分类、回归非监督学习:只提供数据,不提供标签。半监督学习强化学习:尝试各种手段,自己去适应环境和规则。总结经验利用反馈,不断提高算法质量遗传算法:淘汰弱者,留下强者,进行繁衍和变异穿产生更好的算法。二、选择机器学习算法和数据集sklearn中有很多真实的数据集可以引入,也可以根据自己的需求自动生成多种数据集。对于数据集可以对其进行归一化处
转载
2024-08-29 15:54:29
25阅读
1.《Semi-Supervised Classification with Graph Convolutional Networks》 作者提出了一种可扩展的方法,用于图形结构数据的半监督学习,该网络是传统卷积算法在图结构数据上的一个变体,可以直接用于处理图结构数据,通过谱图卷积的局部一阶近似来激励卷积结构。模型在图形边缘的数量上进行线性缩放,并学习隐藏层表示,编码图形结构和节点的特征。2 图作
转载
2024-01-10 14:38:19
79阅读
半监督学习:综合利用有类标的数据和没有类标的数据,来生成合适的分类函数。它是一类可以自动地利用未标记的数据来提升学习性能的算法。一、LabelPropagation和LabelSpreading(1)标记传播算法:优点:概念清晰缺点:存储开销大,难以直接处理大规模数据;而且对于新的样本加入,需要对原图重构并进行标记传播(2)迭代式标记传播算法:输入:有标记样本集Dl,未标记样本集Du,构图参数δ,
转载
2023-09-05 13:37:20
118阅读
一、机器学习算法分类:监督学习:提供数据和数据分类标签。——分类、回归非监督学习:只提供数据,不提供标签。半监督学习强化学习:尝试各种手段,自己去适应环境和规则。总结经验利用反馈,不断提高算法质量遗传算法:淘汰弱者,留下强者,进行繁衍和变异穿产生更好的算法。二、选择机器学习算法和数据集 sklearn中有很多真实的数据集可以引入,也可以根据自己的需求自动生成多种数据集。对于数据集可以对其进行归一
转载
2023-10-17 23:26:51
130阅读
【翻译自: Semi-Supervised Learning With Label Propagation】 【说明:Jason Brownlee PhD大神的文章个人很喜欢,所以闲暇时间里会做一点翻译和学习实践的工作,这里是相应工作的实践记录,希望能帮到有需要的人!】  
转载
2024-04-10 13:45:57
75阅读
半监督学习:综合利用有类标的数据和没有类标的数据,来生成合适的分类函数。它是一类可以自动地利用未标记的数据来提升学习性能的算法1、生成式半监督学习 优点:方法简单,容易实现。通常在有标记数据极少时,生成式半监督学习方法比其他方法性能更好 缺点:假设的生成式模型必须与真实数据分布吻合。如果不吻合则可能效果很差。而如何给出与真实数据分布吻合的生成式模型,这就需要对问题领域的充分了解2、图半监督
转载
2023-08-17 16:24:39
110阅读
半监督: 半监督学习是指监督学习与无监督学习的结合,是在含有少量被标记数据的情况下,利用大量未标记图像进行无监督学习从而改善监督学习的性能。半监督GAN用于分类的步骤: 将GAN中判别器的输出层替换成softmax分类器,假设训练数据有C类,则softmax输出C+1类,多一个生成器生成的伪图像的概率。由于判断真伪图像的任务是无监督的,因此我们可以利用到大量的未标注样本来进行训练。 训练时将未标注
转载
2024-04-26 09:12:15
34阅读
本文主要介绍如何在tensorflow上仅使用200个带标签的mnist图像,实现在一万张测试图片上99%的测试精度,原理在于使用GAN做半监督学习。前文主要介绍一些原理部分,后文详细介绍代码及其实现原理。前文介绍比较简单,有基础的同学请掠过直接看第二部分,文章末尾给出了代码GitHub链接。 监督,无监督,半监督学习介绍 在正式介绍实现半监督学习之前,我在这里首先介绍一
转载
2024-08-12 10:32:27
72阅读
基于图的半监督学习 以一个无标签数据的例子作为垫脚石正在翻阅一本《Sky and Earth》的杂志,里面是关于天文学和旅行的文章。Alice不会英文,她只能通过文章中的图片来猜测文章的类别。比如第一个故事是“Bridge Asteroid”有一张多坑的小行星图片,那么它很明显是天文学类别的。第二个故事是“Yellowstone Camping”有张灰熊的图片,那么将它分类到旅行类别。但
转载
2024-01-19 17:32:17
57阅读
4章 机器学习基础4.1 三类机器学习4.2 机器学习术语4.3 评估模型4.4 数据预处理和特征工程4.4 过拟合和欠拟合4.5 机器学习模型基本设计流程 4.1 三类机器学习1. 有监督学习:有标签数据的学习(需要得到的学习结果为具体的、可表示的、可描述的)分类问题回归问题分割问题识别问题2. 无监督学习:没有标签数据的学习(对数据进行整理,归类寻找特征)聚类问题降维问题3. 强化学习4.2
转载
2023-08-13 19:18:44
98阅读
1、监督学习(supervised learning)训练数据既有特征(feature)又有标签(label),通过训练,让机器可以自己找到特征和标签之间的联系,在面对只有特征没有标签的数据时,可以判断出标签,即生成合适的函数将输入映射到输出。2、无监督学习(unsupervised learning)训练样本的标记信息未知,目标是通过对无标记训练样本的学习来揭示数据的内在性质及规律,为进一步的数
转载
2024-06-15 19:06:38
121阅读
半监督学习考虑一个分类问题。 如果训练集中大部分样本没有标记类别,只有少部分样本有标记。则需要用半监督学习(semi-supervised)方法来训练一个分类器。wiki上的这张图很好地说明了无标记样本在半监督学习中发挥作用: 如果只考虑有标记样本(黑白点),纯粹使用监督学习。则得到垂直的分类面。 考虑了无标记样本(灰色点)之后,我们对样本的整体分布有了进
前言:《SESS: Self-Ensembling Semi-Supervised 3D Object Detection》CVPR2020 Oral 新加坡国立大学出品论文地址:https://openaccess.thecvf.com/content_CVPR_2020/papers/Zhao_SESS_Self-Ensembling_Semi-Supervised_3D_Objec
转载
2023-12-20 05:20:09
101阅读
翻译 | 王柯凝出品 | Python大本营(ID:pythonnews)【导读】对于人工智能和机器学习来说,目前有很多种可以实
转载
2023-12-20 16:47:56
39阅读
半监督节点分类:标签传播和消息传递半监督节点分类问题的常见解决方法:特征工程图嵌入表示学习标签传播图神经网络基于“物以类聚,人以群分”的Homophily假设,讲解了Label Propagation、Relational Classification(标签传播)、Iterative Classification、Correct & Smooth(C & S)、Loopy Beli
转载
2024-04-25 21:41:15
37阅读
最近一直在看半监督在高光谱图像分类上的应用,打算写一个系列,把一些经典的效果好的论文总结梳理一下,当作一个督促。一. 半监督大体分成五种方法① Generative model 缺点:生成模型是基于严格的假设构建的,例如,训练样本应遵循高斯分布或其他分布②Self-trainingSelf-Training的做法如下:用已标注数据集A训练一个分类模型M用该模型对未标记数据集B进行预测将预
转载
2023-11-20 05:57:32
92阅读
1.监督,无监督,半监督学习介绍在正式介绍实现半监督学习之前,我在这里首先介绍一下监督学习(supervised learning),半监督学习(semi-supervised learning)和无监督学习(unsupervised learning)的区别。监督学习是指在训练集中包含训练数据的标签(label),比如类别标签,位置标签等等。最普遍使用标签学习的是分类任务,对于分类任务,输入给网