人工智能正在引入计算机历史上的第三种用户界面范式,转向一种新的交互机制,用户告诉计算机他们想要什么,而不是如何做——从而扭转了控制源。
ChatGPT 和其他人工智能系统正在准备推出计算机历史上的第三个用户界面范例——60 多年来的第一个新的交互模型。
前两个范式
范式一:批处理
从计算机诞生开始,1945 年左右,第一个 UI 范式 就是批处理。在这种范例中,用户指定了他们希望计算机执行的所有操作的完整工作流程。这批指令被提交给数据中心(通常作为一副打孔卡),并在某个未指定的时间(通常是夜间)进行处理。
后来,通常是第二天早上,用户会拿起他们批次的输出,一般是厚厚的文件打印输出,但也可能是一副新的打孔卡。如果原始批次包含哪怕最轻微的错误,都不会有输出,或者结果将毫无意义。
从 UI 角度来看,批处理不涉及用户和计算机之间的任何来回。用户界面是一个单一的联系点:那批打孔卡。可用性很糟糕,通常需要几天的时间来微调批处理,直到执行它才能产生所需的最终结果。
范式二:基于命令的交互设计
1964 年左右 ,分时技术(多个用户通过连接的终端共享一台大型计算机)的出现导致了第二种 UI 范式:基于命令的交互。在这种范例中,用户和计算机将轮流执行一个命令。这种范式非常强大,以至于从那时起它就一直主导着计算领域——长达 60 多年。
基于命令的交互已经成为 贯穿三代 用户界面技术的基本方法:命令行(如 DOS 和 Unix)、全屏基于文本的终端(常见于 IBM 大型机)和 图形用户界面 (GUI:Macintosh、 Windows 和所有当前的智能手机平台)。确实强大且持久。
与批处理相比,基于命令的交互的好处是显而易见的:执行每个命令后, 用户可以重新评估情况并修改未来的命令 以实现所需的目标。
事实上,用户甚至不需要心中有一个完全指定的目标,因为当他们从计算机获得更多信息并查看初始命令的结果时,他们可以调整解决手头问题的方法。(至少,如果设计遵循 10 个可用性启发式中的第一个:系统状态的可见性,情况就是这样。)
早期的命令行系统通常不会显示系统的当前状态,从而导致可用性很差。例如,在 Unix 中,没有消息就是好消息,因为只有当您的命令导致错误消息时,您才会从计算机获得反馈。没有错误意味着计算机没有关于新状态的信息,这使得用户更难编写以下命令。
图形用户界面的美妙之处在于,它们确实会在每个命令之后显示状态,至少在设计良好的情况下是这样。 自 1984 年 Macintosh 推出以来,图形用户界面一直主导着 UX 世界:大约 40 年的霸主地位,直到它可能被下一代 UI 技术取代,更重要的是,被人工智能形式的下一个 UI 范例所 取代。
最新范式
范式 三:基于意图的结果规范
我怀疑当前的生成式 AI 工具集(如 ChatGPT、Bard 等)能否代表我们几年后将使用的 UI,因为它们 存在根深蒂固的可用性问题。他们的问题催生了一个新角色——“Prompt工程师”。Prompt工程师可以使用正确的语言交互方式触发 ChatGPT,这样它就能给出正确的结果。
这个新角色让我想起我们过去如何需要经过专门培训的查询专家来搜索广泛的医学研究或法律案例数据库。然后谷歌出现了,任何人都可以搜索。这些新工具需要同样水平的可用性跨越: 人工智能更好的可用性应该是一个显着的竞争优势。
当前基于聊天的交互方式还需要用户将他们的问题写成散文文本。根据最近的读写能力研究,我认为 富裕国家有一半人口的表达能力可能不足以 从当前的人工智能机器人中获得良好的结果。
也就是说, 人工智能用户界面 代表了人类与计算机之间交互的一种不同范式——一种前景广阔的范式。
正如我所提到的,在基于命令的交互中,用户一次向计算机发出一个命令,逐渐产生所需的结果(如果设计具有足够的可用性以允许人们了解每一步要发出什么命令)。计算机完全听话,完全按照它的指示去做。缺点是可用性较低通常会导致用户发出的命令与用户真正想要的不同。
有了新的人工智能系统,用户不再告诉计算机 该做什么。相反,用户告诉计算机他们想要什么结果。 因此, 以当前生成式人工智能为代表的第三种 UI 范式是 基于意图的结果规范。
AI系统提示的一个简单例子是:
给我画一张适合低俗科幻杂志封面的图画,画的是一个穿着宇航服的牛仔在一个没有空气的星球上,天空中有两个红色的月亮。
你如果想在2021 年左右,使用Photoshop 来做到这一点!那时,可能会发出数百条操作命令来逐渐显示插图。今天,Bing Image Creator 在几秒钟内为我制作了四张建议图像。
由 Bing Image Creator 根据提示制作的图像:“给我画一张适合低俗科幻杂志封面的图画,展示一个穿着宇航服的牛仔在一个没有空气的星球上,天空中有两个红色的月亮。”
通过这种以当前生成式人工智能为代表的新 UI 范式,用户告诉计算机所需的结果,但没有指定如何实现该结果。与传统的基于命令的交互相比, 这种范式 完全颠倒了控制源。我怀疑我们是否应该将这种用户体验描述为“交互”,因为没有轮流或渐进的进展。
也就是说,在我的科幻插图示例中,我对太空服不满意。这可能会通过人工智能的另一轮修复。这些轮次的逐步完善是目前支持较差的一种交互形式,为那些费心进行用户研究 以发现普通人控制系统的更好方法的人工智能供应商提供了丰富的可用性改进机会 。
做我的意思,而不是我所说的, 是一种诱人的 UI 范式——正如前面提到的,用户经常命令计算机做错误的事情。另一方面,将控制点完全分配给计算机确实有缺点,特别是对于当前的人工智能来说,它很 容易在结果中包含错误信息。 当用户 不知道某件事是如何完成时,他们可能更难识别或纠正问题。
基于意图的范例并没有上升到 我在 1993 年引入的非命令系统的水平。 真正的非命令系统不需要用户指定意图,因为计算机充当用户正常操作的副作用。
举个例子,考虑通过拉门把手来解锁汽车:这是非命令解锁,因为无论汽车锁定还是解锁,用户都会执行相同的操作。(相比之下,通过语音识别操作的汽车可以解锁车门,因为用户说“我希望汽车解锁”,这将是基于意图的结果规范。而老式汽车可以由语音识别操作通过插入并旋转钥匙来解锁门的明确命令。)
人工智能系统是否能够在基于意图的结果规范范式中实现高可用性尚不清楚。我对此表示怀疑,因为我是图形用户界面的狂热粉丝。视觉信息通常比文本更容易理解并且交互更快。你能通过与聊天机器人对话来填写一份长表格(如银行账户申请或酒店预订)——即使是像新的生成人工智能工具一样智能的聊天机器人吗?
单击或点击屏幕上的内容 是用户交互的直观且重要的方面,不应被忽视。 因此,第二种 UI 范式将继续存在,尽管其主导作用较小。未来的人工智能系统可能会拥有一个 混合用户界面 ,结合了基于意图和基于命令的界面元素,同时仍保留许多 GUI 元素。