自监督学习有潜力吗 自我监督有何意义?_强化学习

如何突破当代人工智能(AI)的瓶颈?图灵奖得主杨立昆(可打开海森公众号查看对杨立昆的介绍),自监督学习可能使AI产生类人的推理能力。自监督学习,可以让AI像人一样自觉观察世界

他在博客上深度阐述了他的自监督学习思路,他认为AI想要突破现在的瓶颈,必须让机器学习世界模型,从而能够填补缺失的信息,预测将要发生的事情,并预测行动的影响。

自监督学习有潜力吗 自我监督有何意义?_人工智能_02

那么什么是自监督学习呢?

自监督学习旨在对于无标签数据 ,通过设计辅助任务(Proxy tasks) 来挖掘数据自身的表征特性作为监督信息,来提升模型的特征提取能力。

杨立昆为自监督学习做了类比,「不管是我们人类,还是动物,在学习大多数事物时,都是在自我监督的模式下进行的,而不是强化学习模式。这个模式本质上就是观察这个世界,然后不断与之增进互动,这种观察是自发的,而不是在测试条件下完成的。」杨立昆表示, 「这种学习方式,比较难以用机器来复制。」

普通的监督式学习需要在有标注的数据集上训练AI模型,监督学习的局限性有时会被误以为是深度学习的局限性,这些限制可以通过自监督学习来克服。

当然,单单自监督学习是不够的,我们还需要搭配“世界模型”来进行研究,世界模型需要融合不同的学科的观点,包括但不限于认知科学、系统神经科学、最优控制、强化学习以及 "传统 "人工智能。使机器能够以自监督的方式学习世界模型,然后使用这些模型进行预测、推理和规划。

自我监督学习的主要好处之一是AI能够主动输出巨大的信息量。在强化学习中,训练AI系统是在标量级别执行的,模型会收到一个数值作为对其行为的奖励或惩罚。在监督学习中,AI系统为每个输入结果预测类别或数值。

在自监督学习中,输出结果将涉及到整个图像或是一组图像,「自监督学习输出的信息量很大。要让AI学习相同量的有关世界的知识,自监督学习需要的样本量也更少。」 杨立昆说。

自监督学习是AI的未来,自监督学习背后的核心想法,是开发一种深度学习系统,可以通过学习填补AI未知的领域。

杨立昆说,「如果说人工智能是一块蛋糕,那么自监督学习就是其中最大的一块。」