image-20230809154702230

一系列应用程序已经启动,利用 ChatGPT 的人工智能作为平台来回答用户问题或生成有关特定域的文本。这是该技术的一个有趣的用法,但影响仍然有限。当AI开始充当代理,以自然语言从用户界面记录交易时,游戏将发生变化。和我一起做一点关于未来的梦想。

这是三篇系列文章中的第一篇,我打算探讨不同轨道上可能的人工智能进步:

  1. 自然语言用户界面

2.AI可以访问业务知识库

  1. 动态系统改变流程和规则

本系列的目标不是介绍可用技术的现状,而是设计下一阶段的发展,以指导研发投资。这不是关于预测未来,而是关于根据我们今天所看到的来预测它。

用户界面的演变

随着技术的进步和日益精细的产品的可用性,我们与机器的互动方式每天都在变化。然而,一些变化可以归类为彻底改变这种互动的重大历史变革浪潮。以下是计算机使用中最具代表性的三个:

  1. 1980年代在个人计算机上创建图形用户界面(GUI)。
  2. 随着 1990 年代互联网的普及,万维网上的超文本导航。
  3. 2000 年代前十年移动设备上的触摸屏交互。

我们现在正在经历的自然语言与人工智能模型的交流代表了人机界面的新革命,可能比前三次更具影响力。这场革命才刚刚开始。

image-20230809154741834

*人机界面

今天:使用自然语言的聊天机器人

基于语言模型的新人工智能,如ChatGPT,Chat Bing或Google Bard,以通用聊天机器人的形式访问。这意味着用户必须访问命令框(提示符)并键入将由 AI 处理以生成和返回响应的输入指令。

image-20230809154805381

这些AI还具有一定的维护对话上下文的能力,因此响应不仅可以考虑上次输入的指令,还可以考虑过去各种交互中交换的信息的历史。这使得它们的使用比谷歌或必应等传统互联网搜索引擎中的简单“问答”更具对话性。可以在消息交换过程中“迭代”,并与聊天机器人作为内容创建的合作伙伴合作,逐步完善结果。

通过训练通用语言模型,一些应用程序已经可用,这些模型具有有关特定领域、专业或业务的额外专有知识层。领域的一些例子是房地产市场[1][2],管理方法[3]和软件开发方法[4]。通过该领域的这一附加和专用层,用户可以向杰出的“虚拟顾问”提问。

进化的下一步是将当前的聊天机器人应用程序转换为代理,以供其他应用程序和设备用作事务接口。继续阅读本文以了解。

自然语言:界面的巅峰之作

当今数字包容性的主要障碍之一是人机界面。用户需要学习如何使用技术。仅仅拥有该主题的专业知识是不够的;用户必须了解该工具并了解其菜单、按钮、窗口、快捷方式和结构的逻辑。

例如,在使用纸张和墨水创建计划方面训练有素且经验丰富的土木工程师不能立即有资格使用 CAD 软件工具开发项目。实际上,菜单和命令的复杂界面一直是一些年长的专业人士继续进入市场的障碍。

经过多年的医学培训和实践,对人体有深入的了解,医生仍然必须学习诊断设备和软件手册中描述的命令和步骤,以利用技术进步。

银行的客户经理需要记住一系列代码,并接受数十种应用程序的培训,以开立账户、谈判投资、发放贷款和满足客户要求。如果他们换工作到另一家银行工作,他们将不得不再次学习一切,因为系统不同。

自然语言 UI 的强大功能

自然语言界面的可用性将允许将技术使用扩展到不太精通数字的用户。工程师仍然需要了解工程学,医生需要了解医学,银行经理需要了解银行产品,但他们不需要浪费时间学习系统的特定命令、菜单和界面。

人类创造的最好的交流方式是通过自然语言。当然,人类的沟通带有模糊性,并可能导致误解。需要共享词汇,避免环境,物理,心理和语义噪音,以及共享沟通渠道,以便像任何其他沟通方式一样成功[5]。但这仍然是人们相互交流甚至与自己交流的最简单方式。静静地想一会儿。我们的思想基于自然语言。

即将出现的是能够根据自然语言给出的命令进行交易的系统,并考虑到用户请求的上下文来理解需求。

除了提高生产力和效率外,这种类型的界面还将使数字经济中的“数字文盲”能够访问。它只需要掌握主题以及使用文字和语言进行交流的能力,以定义目标并指示由能够理解其上下文中请求内容的AI代理执行的命令。

未来:具有自然语言界面的 AI 代理

代理是一种旨在独立思考和行动的人工智能[6]。根据用户提供的目标,代理遵循内部对话以建立需要执行的任务,并开始在与外部环境交互时执行命令,不断反馈其对上下文的理解,以重新评估和调整后续步骤,直到实现目标。

除了通过机器学习获得的大语言模型(LLM)之外,代理还能够在互联网上在线研究信息,通过消息(API)的命令交换与其他系统进行交互,甚至通过电子邮件或专有接口与其他用户交换消息。

image-20230809154826933

这不是传统的任务自动化,因为不需要在传统的编程模型中预定义任务。AI智能体可以重新定义并进行必要的调整,以自主实现用户自定义的目标,并在此过程中进行调整。

这改变了我们与系统交互的方式。通过像个人助理一样与您的座席交谈,用户不再需要知道需要按特定顺序访问以实现其目标的系统命令和接口。所有这些复杂性对用户都是透明的,并由代理管理。

在您的业务中使用自然语言的 AI 代理

将基于语言模型的 AI 代理视为要集成到业务中的组件,并配置为提供对公司向客户、员工和合作伙伴提供的所有数字服务的访问。正如我们过去创建互联网渠道(内联网或外联网)来增强我们的界面并优化我们的业务一样,现在新的界面是自然语言。开始问自己以下问题:

  • 哪些利益相关者目前不在您的业务范围内,但可以通过这个新的自然语言渠道进行整合?
  • 可以提供哪些新服务?
  • 哪些服务(内部和外部)可以通过简化访问复杂性来改进?
  • 哪些流程可以完全(或部分)由人工智能执行?
  • 这如何代表您企业的竞争优势?

这些问题可以为您的企业指明探索此新方案并转变组织中使用技术的方式的途径。

差距:需要克服的挑战

我们看到的大多数人工智能在传统企业中使用的例子仍然是问答聊天机器人,并附有关于答案质量的免责声明,这些答案的质量通常不是很好。但未来并不遥远。已经有平台和解决方案提供商允许创建AI代理,这些代理充当接口以自然语言执行业务交易[7] [8]。

但值得注意的是,在向人工智能提供对公司交易的访问之前,还有很多工作要做。需要克服几个挑战,包括测试、实验和设置障碍,以确保:

  • 所使用的AI能够深入了解用户的上下文和意图,并且不会以错误的方式执行交易。
  • 道德问题得到充分解决,以防止人工智能代理造成损害或伤害人以实现其目标。
  • 确保信息隐私,并且访问仅限于定义的权限和配置文件。
  • 用于训练人工智能的数据没有可能导致偏见决定或行动的偏见。
  • 人工智能提高了处理歧义和复杂问题的能力,没有“妄想”或假设可能导致错误的信息。
  • 开发 API 的目的是使具有必要安全性的代理能够访问您的业务交易。

我并不低估克服这些挑战的难度,但我相信它们将很快被克服。准备好尽快利用人工智能利用企业的战略愿景,并利用成为先驱的机会。

结语

在本系列的第一篇文章中,我们探讨了通过自然语言(以新语言模型为代表)在用户界面方面的重大进步。我们已经意识到我们正在经历一场人机交互的革命,技术的发展使与机器的交流变得越来越自然和直观。基于语言模型的聊天机器人实现了更多的对话式交互,超越了传统的互联网搜索引擎。

这种自然语言界面的潜力是非凡的,特别是在使技术水平较低的用户更容易访问技术方面。通过消除学习复杂界面的需要,人工智能代理将使各个领域的专业人员能够专注于他们的专业知识,而不会浪费时间进行特定的系统培训。这种变化有能力促进数字包容性,并为数字经济中的“数字文盲”提供机会。

未来,配备集成到业务应用程序中的语言模型的代理将作为进行交易的接口,成为与公司提供的服务进行交互的主要方式。

本系列文章旨在精确预测这些下一阶段的演变,指导研发投资,并推动社会走向与技术互动和合作的时代。

让我们成为这一旅程的先驱,建立一个人工智能和自然语言携手并进的未来,为所有人带来创新和繁荣。