人工智能(AI)现在备受关注,无论是从学术界、媒体报道还是大众兴趣的角度来看,都达到了历史上的巅峰。医疗领导者们正面临一个重要问题,即在何时、何地以及如何应用人工智能,以及如何理解它的风险、问题和可能性。

在这个科技变革的时刻,我们需要一个简单易懂的框架来帮助决策者理解不同种类人工智能的优点、缺点和挑战。

就像我们不能把细菌和病毒感染都归为一类来制定治疗计划一样,将不同种类的人工智能合并在一起可能会导致错误的决策。这个三个时代的人工智能框架能够帮助我们更好地应对这一变革时刻的挑战。

医疗AI发展的三个时代是什么?_深度学习

医疗AI发展的三个时代是什么?_深度学习_02

AI 1.0 时代:符号AI和概率模型

过去50多年,人工智能研究主要关注将人类知识编码为机器中的规则,如if-then规则和决策树,这种符号式人工智能在某些领域如国际象棋和医疗保健有所成就。

如IBM的Deep Blue在1997年击败了国际象棋世界冠军。在医疗保健领域,如INTERNALIST-I等工具旨在表示关于疾病的专家知识以帮助解决复杂病例

然而,它存在逻辑错误、偏见和根本能力限制等问题。因此,研究开始转向概率建模,如传统回归和贝叶斯网络,这些模型能更优雅地处理现实世界情况,但在扩展和处理复杂数据方面有限。

AI 2.0 时代:深度学习

随着数据集的增长和计算机运算速度的提升,多层神经网络的深度学习开始崭露头角,AI 2.0 时代开始了。

医疗AI发展的三个时代是什么?_深度学习_03

深度学习已经深刻改变了我们的日常生活和医疗保健领域。通过卷积神经网络架构和词向量等技术的发现,计算机现在能够“看”和“理解”语言,从而实现了图像分类、语音识别、语言翻译等功能的广泛应用。

在医疗保健领域,深度学习也取得了突破,包括糖尿病视网膜病变的识别、癌症筛查和预测等。然而,这些模型虽然具有强大的能力,但也存在风险。

基于深度学习的模型具有出色的能力,但也存在重要的风险。当实时数据与训练模型所用的数据不同时,模型可能会失败。例如,如果模型仅经过“猫与狗”的训练,但给出了飞机的图片,它将无法得出好的结果。这种分布外问题的更微妙版本是医疗保健中的关键安全问题。

还可能出现复杂的偏见,这与基础数据的包容性有关,也与基于种族的诊断和治疗选择的不平等和不公平、算法设计选择以及其他问题有关

AI 3.0 时代:基础模型和生成式人工智能

AI 2.0 存在一个关键问题,即所谓的灾难性遗忘5:在处理长文本序列时,它很难记住序列中较早出现的内容。2017 年出现的transformer 架构有助于解决这一问题,使模型能够关注长文本段落。

在接下来的几年中,使用transformer创建了基础模型和大型语言模型。2022 年和 2023 年的进步速度大大加快,标志着第三个时代的到来。

AI 2.0 是针对特定任务的。它一次只做一件事。它生成新单词、图像或其他内容的能力有限。

AI 3.0 可以执行许多不同的任务,而无需重新训练。例如,一个简单的文本指令就可以改变模型的行为。像“为专业顾问写这封便条”和“为患者母亲写这封便条”这样的提示将产生明显不同的内容。这些模型的能力也有了显著的提高:解释真正复杂的问题;接受和生成文本、图像和声音;创建与人类编写的文本几乎无法区分的响应;进行长时间的对话。

医疗AI发展的三个时代是什么?_人工智能_04

它们已经对我们的日常生活产生了影响,包括写作助手、图像生成器、软件编码助手和聊天机器人。现在也存在专门针对医疗保健领域的大型语言模型。例如,谷歌开发的 Med-PaLM 是经过医学调整的基础模型,在医学执业资格考试风格的问题上达到了专家级的表现。

医疗AI发展的三个时代是什么?_数据_05

AI 3.0 中的一类新风险是可能出现幻觉,生成一些假东西(胡说八道)。

总结

基础模型和生成式人工智能代表了人工智能能力的一场重大革命,为改善医疗保健提供了巨大的潜力。如今,医疗保健领导者正在就人工智能做出决策。虽然任何启发式方法都会忽略细节并失去细微差别,但 AI 1.0、2.0 和 3.0 的框架可能对决策者有所帮助,因为每个时代都有着根本不同的能力和风险。

以上内容参考自JAMA论文,部分图源网络,非文章提供: Howell MD, Corrado GS, DeSalvo KB. Three Epochs of Artificial Intelligence in Health Care. JAMA. 2024;331(3):242–244. doi:10.1001/jama.2023.25057