文章目录

监督学习(Supervised Learning)

有正确的label

如图:
机器学习的四种学习方法_学习
有两个维度x1和x2,这里的1和2代表的是标签,即是分类结果,也就是正确结果,那么机器学习会按照这个结果自动帮你分界限,即
机器学习的四种学习方法_学习_02

无监督学习(Unsupervised Learning)

无正确的label
例如在个二维坐标内,可能只知道每个点的坐标其余的什么也不知道,即是没有包含正确结果的
机器学习的四种学习方法_无监督学习_03
那么机器就会有很多种的分法,例如
机器学习的四种学习方法_学习_04

半监督学习(Semi-supervised Learning)

趋于监督学习和无监督学习之间

有部分有正确结果,其他的没有的,即含少量正确结果,那么根据无监督学习分法,中间那条线就不再适用,因为有了部分的正确结果,要使其分在同一类里,那么就可能有这两种分类方法。
机器学习的四种学习方法_机器学习_05

强化学习(Reinforcement Learning)

具有奖惩机制

机器会根据建立的模型进行操作,得到的结果如果跟答案匹配就会去奖励,然后进一步去优化,逐步去寻找最高奖励的方法,代表的有AlphaGo,其就是每天都在自我下棋,不断地去优化下棋方式,也就是寻找最高奖励的过程。

判断是监督还是无监督:
训练是否有正确结果的标签

应用

监督学习:价格预测、图像识别、语言翻译等。
无监督学习:客户分类、新闻聚类、数据降维等。
半监督学习:混合型学习应用等。
强化学习:OpenAi Five、AlphaGo等。