超越图灵测试:从10万美元到100万美元的电商之旅
图灵测试过时了吗?DeepMind创始人Mustafa Suleyman提出了这个振聋发聩的新观点。
他在新书《The Coming Wave: Technology, Power and the Twenty-First Century's Greatest Dilemma》中提出了一个全新的「图灵测试」,给AI 10万美元的启动资金,让它通过电子商务,赚到100万美元的利润。
赚不到这个数的,都不算AI!
为什么图灵测试过时了?
图灵测试的基本原理是:如果一个机器能够在文本对话中模仿人类,使得与之交谈的人类无法分辨对方是人还是机器,那么这台机器就可以被认为具有智能。然而,随着科技的进步,我们已经看到了许多能够通过图灵测试的聊天机器人,但它们在现实任务中的表现却远远不够智能。
Suleyman认为,图灵测试已经不能反映机器真正的智能水平了。他在书中写道:
“目前还不清楚这是否是一个有意义的里程碑。它并没有告诉我们系统能做什么或理解什么,也没有告诉我们它是否建立了复杂的内部对话或能否在抽象的时间范围内进行规划,这些都是人类智能的关键。”
他指出,我们不仅关心机器能说什么,还关心它能做什么。他认为,机器应该具备“人工能力智能”(artificial capable intelligence, ACI),也就是能够完成一些具有短期目标和任务的活动,并且尽量减少人类的干预。
图灵测试的局限性主要体现在以下几个方面:
- 过于强调语言能力:图灵测试把重点放在了机器的语言沟通能力上,忽略了其他方面的智能,如视觉、听觉和运动能力。
- 容易受到欺骗:有些聊天机器人通过设计出具有迷惑性的回答方式,使对方难以分辨其真实身份,但这并不意味着它们具有真正的智能。
- 缺乏实际应用价值:通过图灵测试的机器人并不一定具备实际问题解决能力,例如在金融、医疗、教育等领域的应用。
什么是新的图灵测试?
Suleyman提出了一个新颖而具有挑战性的想法,用来衡量机器是否具备ACI。他建议给一个AI聊天机器人10万美元的种子投资,并让它通过电子商务赚到100万美元的利润。
他预计AI在未来两年内能够达到这个目标。
为了完成这个任务,AI聊天机器人必须:
- 研究一个有潜力的电商创意
- 制定一个产品开发计划
- 寻找一个合适的制造商
- 销售产品并获取收益
这个过程涉及到很多复杂而多样的技能和知识,比如市场分析、商业策略、供应链管理、客户服务、营销推广等等。AI聊天机器人不仅要与人类进行有效沟通,还要与其他AI系统进行协作和竞争。
这个测试有什么意义?
Suleyman认为,这个测试可以展示AI在现实世界中的实用价值和创造力。他说:
“我们不只关心机器能说什么,我们也关心它能做什么。我们想看到它能否在不同的领域和环境中,解决不同的问题和挑战,创造出有价值的东西。”
他还表示,这个测试可以促进AI的伦理和社会责任,因为AI聊天机器人必须遵守法律和规范,尊重人类的利益和权利,保护环境和资源,避免造成危害和风险。
他希望,这个测试可以激发更多的人对AI的兴趣和参与,让AI成为一个更加开放和多元的领域,而不是一个只有少数精英掌控的领域。
这个测试有什么难度?
这个测试看起来很简单,但实际上很困难。目前,还没有任何一个AI聊天机器人能够通过这个测试。
虽然近年来,AI聊天机器人的技术有了很大的进步,比如OpenAI的ChatGPT,它可以进行流畅而自然的对话,生成代码、文章等内容,但它还不能完成复杂而具体的任务,也不能理解深层次的语义和逻辑。
要让AI聊天机器人通过这个测试,需要解决很多技术和理论上的难题,比如:
- 实际应用价值:电商领域涉及到了供应链管理、库存管理、客户关系管理等多个方面,一个成功的电商AI需要在这些领域都有所建树。
- 综合能力考验:电商挑战要求AI不仅具备优秀的语言沟通能力,还需要具备视觉识别、数据分析等多方面的能力。
- 创新与策略:为了在竞争激烈的电商市场脱颖而出,AI需要不断创新,制定出有效的市场策略。
这个测试有什么影响?
如果有一天,有一个AI聊天机器人能够通过这个测试,那么它将会对人类社会产生巨大的影响。
-
首先,它将会改变电子商务的格局和竞争力。一个能够自主运营、创新、优化、扩张的电商平台,将会给传统的电商企业带来巨大的挑战和压力。同时,它也将会给消费者带来更多的选择、便利、优惠和体验。
-
其次,它将会推动其他领域的AI应用和发展。通过这个测试的AI聊天机器人具备通用性和可迁移性的智能技能和知识,可在其他领域发挥作用并与其他AI系统交流合作,形成更强大的AI网络。
-
最后,它将会引发一系列的社会、经济、政治、文化、伦理等方面的问题和挑战。通过这个测试的AI聊天机器人可能对人类产生影响和威胁,可能改变人类的工作、生活、学习、娱乐方式,影响人类的价值观、道德观念,引发权利、责任、利益、冲突、危机等问题。
因此,我们需要对这个测试和它的结果有一个清醒和审慎的态度,同时也要有一个积极和主动的参与,以确保AI的发展是符合人类的利益和价值的。
总结
Mustafa Suleyman提出的新图灵测试为人工智能的发展提供了一个全新的视角。通过电商领域的实际挑战,我们可以更好地衡量AI的能力和潜力。虽然实现这一挑需要解决很多技术和理论上的难题,但个测试可以更好地反映AI在现实世界中的实用价值和创造力,同时也可以促进AI的伦理和社会责任。我们可以一起期待一个全新的AI时代。
大语言模型能力提高,各种AI应用体验和质量会提高,工具也更简单实用。最重要的是学习运用各种AI工具,大幅释放生产力。