OpenAI 研究人员认为,这种辩论或类似的方法最终可以帮助人们训练 AI 系统执行超越人类认知能力的任务,同时保持与人类的偏好一致。
在这个实验中,研究人员发现通过单个像素识别图像中的物体时,诚实的一方胜算更大,但也并不总是胜利。他们很好奇,其他人还会有什么发现。因此,他们设计了一个概念化的实验并提供了一个 Web 页面,让大家可以亲手尝试一下这项技术。为了便于理解,我们先来看看 OpenAI 在网站上的一个演示案例:
如上图所示,所谓的“辩论”,就是锁定图中的若干像素,红色(Red)和蓝色(Blue)双方就图片里的目标是小狗