任何依赖经验传承的行业,都需要足够的记忆力。就记忆力而言,长远来看,人脑一定比不过电脑。所以,从人类研究电脑伊始,尤其是开始研究人工智能以来,世界顶级研究机构,就致力于电脑医生的研制。

早期比较出名的研究项目,是斯坦福大学的 MYCIN (1),这套系统把医学临床指南,整理成 if-then 那样的规则,企图以此诊断疾病并下处方。if-then 式的规则库,又称为专家系统。MYCIN 共整理了 600 多条 if-then 式的规则。可惜,MYCIN 从未走出实验室投入临床应用。

在 MYCIN 的基础上,其它研究机构,添加了反绎推理等等,进一步完善推理机制,后来又添加了模糊数学,概率,贝叶斯模型等等,均不成功(2)。

就这样,从 1970 年到 2010 年,基于 if-then 式的演绎法及其变种,电脑医生的研究持续了 40 年,屡战屡败。人们开始反思,是不是应该换一个思路?2011年8月 IBM Dr Watson 登场了。

IBM Dr Watson 起初是一个研究项目,研究自动问答系统。例如,问:“谁是第一个登上印度次大陆的欧洲航海家?”。问答系统自动阅读大量文献,摘录出 “葡萄牙人,瓦斯科·达·伽马,于1498年5月20日到达卡利卡特”。又从其它文献中,摘录出 “卡利卡特位于印度西南部”。串联这两条信息,得出 “葡萄牙人,瓦斯科·达·伽马,于1498年5月20日,登陆印度” 。同理,找到其他欧洲航海家登陆印度的时间。最后排序,从而找到问题的答案。

IBM 研究院从 2006 年开始研究自动问答系统,并参与美国智力竞答电视节目,Jeopardy!这个节目与江苏卫视的 “一站到底” 类似,主持人出题,竞答者比赛准确性和抢答速度。5 年以后,2011 年 2 月,IBM 的自动问答系统,战胜了往届人类冠军,一举夺魁。

半年后,2011 年 8 月,IBM 决定把自动问答系统,应用到医疗领域。

IBM Dr Watson 的那些事儿_人工智能

以上是 IBM 自动问答系统的工作流程(3)。整个系统围绕三个核心构成,1. 自然语言处理,2. 基于循证的自动回答,3. 基于用户反馈的自学习和系统优化。其中,自然语言处理,和基于用户反馈的自学习和系统优化,大体上是常见技术。

这三个核心中,最有启发的是第二个,基于循证的自动回答。以往的电脑医生,基本原理都是专家系统,都是基于 if-then 式的规则,都是演绎法。而循证问答,基本原理是类比归纳法。通过类比大量相似病历,归纳出对应于某些症状,医生们通常习惯于做哪些检查。然后,类比相似检查结果,归纳出这些检查结果与哪些疾病关联密切。再然后,仍然基于相似病历的类比,归纳出对应于某一疾病或者某些疾病的组合,医生们通常习惯于开哪些药,等等。

从古希腊的帕拉图亚里士多德开始,人类的主要思想方法,是演绎法。到 17 世纪初,呐喊 “知识就是力量” 的培根,首倡归纳法。思想方法转变了,现代科学就萌芽了,随后就有了伽利略、牛顿、莱布尼兹等等科学巨匠。

循证学习依赖于海量病历。但是截止 2013 年 2 月,IBM Dr Watson 只收集到了 60 万份病历,此外还有 2 百万篇文章,2.5 万案例,1.5 万小时的门诊对话录音(4)。远远达不到海量的数据规模。

怎么办?病历数量太少,做全科医生肯定不行。那就专门收集肿瘤专科的病历吧,全科医生做不了,那就先做专科医生吧。

为什么不惜工本的 IBM,花了那么多钱,只收集了那么一点病历呢?两个原因,1. 美国人口基数小,2. 美国隐私保护法执行太严。反观中国,一家中等规模的三甲医院,5 年积累的病历数量,就超过 1000 万份。所以,在中国做循证学习,比在美国更有机会。

今年 7 月份,IBM 与美国最大的连锁药店 CVS,签署合作协议,通过 CVS 的 7600 店铺和 1000 家诊所,监测 7 千万患者的健康状态,尤其关注糖尿病、高血压等慢性病(5)。今年 8 月份,IBM 花费 10 亿美金,收购医疗图像分析公司 Merge Healthcare(6)。

这两个举措,似乎表明 IBM Dr Watson 在发展规划上,内部有争议。与 CVS 合作,似乎意味着 IBM 计划尽快开拓市场,为患者服务。而收购图像分析公司 Merge Healthcare,似乎意味着 IBM 打算深入肿瘤、眼科、骨科、皮肤病等专科,最终完全取代人类医生诊疗在诊疗过程中的各个环节。

作为旁观者,更赞同与 CVS 合作,尽快开拓市场。而全面取代人类医生,即便仅限于某几个专科,将面临诸多艰难。但是与 CVS 合作,最好是全科,而不仅仅局限于专科。

沙特是全球石油储藏量最大的国家,中国是全球电子病历储藏量最大的国家。

如果中国也做 Dr Watson,很有希望超越 IBM 的版本。

作者微信:deng_kan

参考文献

(1)Introduction to MYCIN.

​https://en.wikipedia.org/wiki/Mycin​

(2)Introduction to Clinical Decision Support System.

​https://en.wikipedia.org/wiki/Clinical_decision_support_system​

(3)Introduction to IBM Dr Watson。

​https://en.wikipedia.org/wiki/Watson_(computer)​

(4)IBM Watson Progress and Roadmap,2013.

​http://www.slideshare.net/manojsaxena2/ibm-watson-progress-and-roadmap-saxena​

(5)IBM Watson and CVS deal.

​https://www.washingtonpost.com/news/to-your-health/wp/2015/07/30/ibm-watson-cvs-deal-how-the-smartest-computer-on-earth-could-shake-up-health-care-for-70m-pharmacy-customers/​

(6) IBM vs Merge HealthCare.

​http://www.informationweek.com/healthcare/ibm-merge-healthcare-plans-giving-watson-the-gift-of-sight/d/d-id/1321668​