IBM AI辩手对战世界级人类辩手，炒作还是秀肌肉？

原创

mb5fdb0a1b25659 2021-04-01 13:46:22 ©著作权

文章标签 java 文章分类 Java 后端开发

©著作权归作者所有：来自51CTO博客作者mb5fdb0a1b25659的原创作品，请联系作者获取转载授权，否则将追究法律责任

机”不如人，AI 辩论尚差火候

IBM AI辩手对战世界级人类辩手，炒作还是秀肌肉？_java

主持人 John Donvan

人机辩论赛的规则是这样的：参赛双方在赛前均不知道辩论的题目，所以选手无法进行提前准备，这也就增加了比赛的难度，最终的结论将由观众以投票的方式进行判决。

IBM AI辩手对战世界级人类辩手，炒作还是秀肌肉？_java_02

Project Debater 与 Harish Natarajan

辩论的话题为：是否应该对学前教育进行补贴。人类辩手 Harish Natarajan 迎战，Harish 是剑桥大学的硕士生，曾在牛津大学获得政治、哲学和经济学学士学位，目前是剑桥联盟协会的现任辩论官，曾获得 2012 年欧洲辩论冠军。

IBM AI辩手对战世界级人类辩手，炒作还是秀肌肉？_java_03

辩论话题：是否应该对学前教育进行补贴

这场辩论赛除了吸引不少现场观众外，还在线上引发了超过 5000 人同时观看及讨论。在比赛刚刚开始的时候，就有好事者问观看的网友：支持 AI 还是人类选手？不知是出于恶搞的目的还是真实的想法，有不少人都为 AI 打 call。

IBM AI辩手对战世界级人类辩手，炒作还是秀肌肉？_java_04

最终的结果可能让他们失望了，人类辩手守住了辩论领域的疆土，人工智能暂时无法在这一领域击败人类。不过，Project Debater 凭借强大丰富的知识库，让观众学到了更多的知识，在这一方面仍旧获得了较高的票数。

IBM AI辩手对战世界级人类辩手，炒作还是秀肌肉？_java_05

但是在一些观众来看，这场比赛仍旧是炒作大于实用的一场秀。

有网友评论道：辩论比赛本就带有较强的主观性，最终的比赛结果由观众投票决定，就这一点上来说，人为操作的可能性就增加了不少。如果一开始不告诉观众哪一方是 AI，通过匿名展示的方式进行辩论以及投票，或许更能体现出 AI 的水平。

AI 辩手：噱头 or 实用产品？

说起 IBM 的 Project Debater，作为一个 AI 辩手，这并不是它首次与人类辩手比赛。

Project Debater 于 2018 年首次亮相，当时它与两名人类辩论家 Noa Ovadia 和 Dan Zafrir 进行了辩论。主题分别是：“是否应该补贴太空探索费用”和“是否应该增加远程医疗的使用”。在那场比赛的过程中，Project Debater 不仅能够与其对手进行辩论，甚至可以与辩手开玩笑，并最终赢得了比赛。

IBM AI辩手对战世界级人类辩手，炒作还是秀肌肉？_java_06

在 CES 2019 大会上，IBM 也将 Project Debater 进行了展示，研发人员表示：众包演讲（Speech By Crowd）的应用前景很是广泛，小至训练校园辩论队、大至准备诉讼案件的论证，都可以在 AI 的帮助下完成。

研发人员认为，Project Debater 代表了一种新的 AI 挑战，因为 AlphaGo 相比，辩论是更具开放性的活动，这种根本差异具有重要意义。在复杂的棋盘游戏中，AI 系统可能会提出任何确保获胜的策略，即使一些棋路不能被人类所理解，而在辩论中，情况则完全不同，人工智能系统必须适应人类理性，并提出人类可以遵循和理解的推理路线。

其次，与之前的棋类挑战形成鲜明对比的是，在辩论中，AI 系统无法依赖自然评分功能。个人行动的价值，即论据，往往具有内在的主观性；此外，甚至没有商定的客观指标来确定谁是赢家。Project Debater 证明人工智能可以在这个未知领域发挥重要作用，研发人员相信它将实现一种新颖的决策形式，将人与机器协同结合，让人们做出更明智的决策。

为了开发 Project Debater，IBM 研究团队必须赋予系统三个功能，每个功能都在 AI 中开辟了新天地：

1）数据驱动的语音写作和交付： Project Debater 能够消化大量语料库，并且给出一个有争议的主题的简短描述，写出结构良好的语音，并以清晰的方式进行表述，甚至在适当的时候加入幽默元素。

2）听力理解：识别对手长期连续口语中隐藏的关键概念和主张的观点。

3）对人类困境进行建模：以独特的知识表示模拟人类争议和困境，使系统能够根据需要提供原则性的论据。

专家观点：有意义的开始，仅限于开始

为了给各位读者更加深度的解读这场比赛，我们采访到了海知智能 CEO 谢殿侠先生，作为同行，谢殿侠老师也观看了这场比赛，在他看来，Project Debater 项目是个有意义的开始，但是也仅限于开始。

他认为，从积极的方面来看，Project Debater 对于长句子内容的语音识别、语义理解都是有一定进步的，它可以通过对海量语料进行搜索，从而抽取事实，形成一定的逻辑，对于具体观点可以推理判断与决策，这样的尝试是有意义的。

但是，这一切的前提是：仅限于命题辩论。

8 分钟的发言，Project Debater 或许可以通过搜索进行文字匹配，促成有一定观点的回复，但是本质上来说，它并没有真正理解对手的论点和论据，普适性不够强，如果遇到开放性主题，最终呈现的效果可能差别会非常之大。

谢殿侠告诉我们，如果用棋类比赛的 AI 进行类比，目前的 Project Debater 就像早期的国际象棋选手“深蓝”，通过算力可以计算出一些结果，但是也仅限于国际象棋领域。如果遇到围棋这样充满变化的棋类游戏，深蓝或许也会“歇菜”，只有 AlphaGo 这样拥有学习能力，可以自我升级的 AI 才会称霸围棋游戏。

谢殿侠说，对于 Project Debater 这类 AI 来说，最终的发展目标是能够“自由辩论”的境界，然而受限于目前的技术，几乎没有一款 AI 产品达到这个位置，所以 Project Debater 是一个有意义的开始，但是能够真正达到人类辩手的水平，仍需要努力。