深度学习无监督分类算法

转载

GhostLover 2024-08-01 00:56:27

监督学习中的数据中是提前做好了分类的信息的，如垃圾邮件检测中，他的训练样本是提前存在分类的信息，也就是对垃圾邮件和非垃圾邮件的标记信息

深度学习无监督分类算法_有监督学习和无监督学习

垃圾邮件筛选

监督学习中，他的训练样本中是同时包含有特征和标签信息的，

监督学习中，比较典型的问题就是像上面说的分类问题(Classfication)和回归问题(Regression)

它们两者最主要的特点就是分类算法中的标签是离散的值，就像上面说的邮件分类问题中的标签为{1, -1},分别表示了垃圾邮件和非垃圾邮件

而回归算法中的标签值一般是连续的值，如预测一个人的年龄，一般要根据身高、性别、体重等标签，这是因为年龄是连续的正整数

在这个上面比较典型的算法有哦LR(Logistic Regression)、BP神经网络算法以及常见的线性回归算法

无监督学习是另一种常用的机器学习算法，与监督学习不同的是，无监督学习的样本是不包含标签信息的，只有一定的特征，所以由于没有标签信息，学习过程中并不知道分类结果是否正确

比较典型的是一些聚合新闻网站，利用爬虫爬取新闻后对新闻进行分类的问题

例如百度新闻

它们都是没有新闻工作者的，只是聚合全网的新闻

例如我们搜索5G试点城市

深度学习无监督分类算法_有监督学习和无监督学习_02

所有有关这个关键字的新闻都会出现，它们被作为一个集合，在这里我们称它为聚合(Clustering)问题

无监督学习的典型问题就是上面说的聚类问题，比较有代表性的算法有K-Means算法(K均值算法)、DBSCAN算法等

聚类算法是无监督学习算法中最典型的一种学习算法，它是利用样本的特征，将具有相似特征的样本划分到同一个类别中，而不会去关心这个类别是什么

除了聚类算法外，无监督学习中还有一类重要的算法就是降维的算法，原理是将样本点从输入空间通过线性或非线性变换映射到一个低维空间，从而获得一个关于原数据集的低维表示

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

深度学习 无监督分类算法