机”不如人,AI 辩论尚差火候

IBM AI辩手对战世界级人类辩手,炒作还是秀肌肉?_java

主持人 John Donvan

人机辩论赛的规则是这样的:参赛双方在赛前均不知道辩论的题目,所以选手无法进行提前准备,这也就增加了比赛的难度,最终的结论将由观众以投票的方式进行判决。

IBM AI辩手对战世界级人类辩手,炒作还是秀肌肉?_java_02

Project Debater 与 Harish Natarajan

辩论的话题为:是否应该对学前教育进行补贴。人类辩手 Harish Natarajan 迎战,Harish 是剑桥大学的硕士生,曾在牛津大学获得政治、哲学和经济学学士学位,目前是剑桥联盟协会的现任辩论官,曾获得 2012 年欧洲辩论冠军。

IBM AI辩手对战世界级人类辩手,炒作还是秀肌肉?_java_03

辩论话题:是否应该对学前教育进行补贴

这场辩论赛除了吸引不少现场观众外,还在线上引发了超过 5000 人同时观看及讨论。在比赛刚刚开始的时候,就有好事者问观看的网友:支持 AI 还是人类选手?不知是出于恶搞的目的还是真实的想法,有不少人都为 AI 打 call。

IBM AI辩手对战世界级人类辩手,炒作还是秀肌肉?_java_04

最终的结果可能让他们失望了,人类辩手守住了辩论领域的疆土,人工智能暂时无法在这一领域击败人类。不过,Project Debater 凭借强大丰富的知识库,让观众学到了更多的知识,在这一方面仍旧获得了较高的票数。

IBM AI辩手对战世界级人类辩手,炒作还是秀肌肉?_java_05

但是在一些观众来看,这场比赛仍旧是炒作大于实用的一场秀。

有网友评论道:辩论比赛本就带有较强的主观性,最终的比赛结果由观众投票决定,就这一点上来说,人为操作的可能性就增加了不少。如果一开始不告诉观众哪一方是 AI,通过匿名展示的方式进行辩论以及投票,或许更能体现出 AI 的水平。

AI 辩手:噱头 or 实用产品?

说起 IBM 的 Project Debater,作为一个 AI 辩手,这并不是它首次与人类辩手比赛。

Project Debater 于 2018 年首次亮相,当时它与两名人类辩论家 Noa Ovadia 和 Dan Zafrir 进行了辩论。主题分别是:“是否应该补贴太空探索费用”和“是否应该增加远程医疗的使用”。在那场比赛的过程中,Project Debater 不仅能够与其对手进行辩论,甚至可以与辩手开玩笑,并最终赢得了比赛。

IBM AI辩手对战世界级人类辩手,炒作还是秀肌肉?_java_06

在 CES 2019 大会上,IBM 也将 Project Debater 进行了展示,研发人员表示:众包演讲(Speech By Crowd)的应用前景很是广泛,小至训练校园辩论队、大至准备诉讼案件的论证,都可以在 AI 的帮助下完成。

研发人员认为,Project Debater 代表了一种新的 AI 挑战,因为 AlphaGo 相比,辩论是更具开放性的活动,这种根本差异具有重要意义。在复杂的棋盘游戏中,AI 系统可能会提出任何确保获胜的策略,即使一些棋路不能被人类所理解,而在辩论中,情况则完全不同, 人工智能系统必须适应人类理性,并提出人类可以遵循和理解的推理路线。

其次,与之前的棋类挑战形成鲜明对比的是,在辩论中,AI 系统无法依赖自然评分功能。个人行动的价值,即论据,往往具有内在的主观性;此外,甚至没有商定的客观指标来确定谁是赢家。Project Debater 证明人工智能可以在这个未知领域发挥重要作用,研发人员相信它将实现一种新颖的决策形式,将人与机器协同结合,让人们做出更明智的决策。

为了开发 Project Debater,IBM 研究团队必须赋予系统三个功能,每个功能都在 AI 中开辟了新天地:

1)数据驱动的语音写作和交付:  Project Debater 能够消化大量语料库,并且给出一个有争议的主题的简短描述,写出结构良好的语音,并以清晰的方式进行表述,甚至在适当的时候加入幽默元素。

2)听力理解:识别对手长期连续口语中隐藏的关键概念和主张的观点。

3)对人类困境进行建模:以独特的知识表示模拟人类争议和困境,使系统能够根据需要提供原则性的论据。

专家观点:有意义的开始,仅限于开始

为了给各位读者更加深度的解读这场比赛,我们采访到了海知智能 CEO 谢殿侠先生,作为同行,谢殿侠老师也观看了这场比赛,在他看来,Project Debater 项目是个有意义的开始,但是也仅限于开始

他认为,从积极的方面来看,Project Debater 对于长句子内容的语音识别、语义理解都是有一定进步的,它可以通过对海量语料进行搜索,从而抽取事实,形成一定的逻辑,对于具体观点可以推理判断与决策,这样的尝试是有意义的。

但是,这一切的前提是:仅限于命题辩论

8 分钟的发言,Project Debater 或许可以通过搜索进行文字匹配,促成有一定观点的回复,但是本质上来说,它并没有真正理解对手的论点和论据,普适性不够强,如果遇到开放性主题,最终呈现的效果可能差别会非常之大。

谢殿侠告诉我们,如果用棋类比赛的 AI 进行类比,目前的 Project Debater 就像早期的国际象棋选手“深蓝”,通过算力可以计算出一些结果,但是也仅限于国际象棋领域。如果遇到围棋这样充满变化的棋类游戏,深蓝或许也会“歇菜”,只有 AlphaGo 这样拥有学习能力,可以自我升级的 AI 才会称霸围棋游戏。

谢殿侠说,对于 Project Debater 这类 AI 来说,最终的发展目标是能够“自由辩论”的境界,然而受限于目前的技术,几乎没有一款 AI 产品达到这个位置,所以 Project Debater 是一个有意义的开始,但是能够真正达到人类辩手的水平,仍需要努力。