Python3入门机器学习
1.3 监督学习,非监督学习,半监督学习和增强学习
如果从机器学习算法本身进行分类,可分为监督学习,非监督学习,半监督学习和增强学习这四个大类。
(1).监督学习:
所谓监督学习,就是给机器的训练数据集拥有“标记”或者“答案”。监督的意思就是我们人类已经针对给机器的数据进行了正确答案的划分,这种正确答案的划分就称为一种监督的信息。
在实际的生活中,很多学习的过程都是监督学习的过程,如:
- 图像已经拥有了标定信息(是猫或狗)
- 银行已经积累了一定的客户信息和他们信用卡的信用情况
- 医院已经积累了一定的病人信息和他们最终确诊是否患病的情况
- 市场积累了房屋的基本信息和最终成交的金额
- …
监督学习主要处理两大类问题:分类问题和回归问题。
(2).非监督学习:
所谓非监督学习,就是给机器的训练数据集没有任何“标记”或者“答案”。所以非监督学习可以针对这种没有“标记”或者“答案”的数据进行分类,通常称为聚类分析。
非监督学习可以完成的一个重要工作就是对数据进行降维处理(降维处理的意义:方便可视化):
- 特征提取:信用卡的信用评级和人的胖瘦无关?
- 特征压缩:尽量少的损失信息的情况下将高维的特征向量压缩成低维的特征向量,从而提高机器学习算法的运行效率,常用的方法是PCA算法。
非监督学习还可以完成的一个重要工作就是异常检测,如下:
通常要将异常的点去除。
(3).半监督学习:
所谓半监督学习,就是我们所面临的任务一部分数据有“标记”或者“答案”,另一部分数据没有。其实在生活中这种情况是更常见的,如各种原因产生的标记缺失。
通常都先使用无监督学习手段对数据做处理,之后使用监督学习手段做模型的训练和预测。
(4).增强学习:
根据周围环境的情况,采取行动,根据采取行动的结果,学习行动方式。
AlphaGo本质上就是一个增强学习的应用。