是过往,皆为序章。
我的意思是说,当人们对莎士比亚的《暴风雨》中,安东尼奥说的这句话有两种解读。
其中一种解读认为,过去注定了未来,命运的剧目将一幕幕上演。所以我相信,我们过去在人工智能领域所达到的水平将决定接下来的方向,因此值得研究一下过去。
而另一种解读是,过去并不重要,大部分必要的工作都在前方,等待我们去完成。我觉得也没错,甚至人工智能在刚起步的阶段就已经给我们抛出了很多难题。
早期
人们普遍认为,约翰·麦卡锡(John McCarthy )在 1956 年 8 月 31 日的达特茅斯研讨会上提交的书面提案中创造了“人工智能”一词。这份提案的署名者按顺序分别为达特茅斯的约翰·麦卡锡,哈佛的马文明斯基,纳撒尼尔 IBM 的 Rochester 和贝尔实验室的 Claude Shannon。后来,除了罗切斯特外,所有人都在麻省理工学院任教,尽管在 60 年代早期麦卡锡已经离开加入斯坦福大学。这份 19 页的提案有一张标题页和 6 张介绍页(1 至 5a),随后由四位作者分别撰写了关于拟议研究的部分。据推测,麦卡锡写了前六页,其中包括由洛克菲勒基金会为 10 位研究人员提供预算的提案。
标题页简要说明了达特茅斯夏季研讨会的 AI 提案项目。其中在第一段提到了“intelligence”:
这项研究是在猜想的基础上进行的,即学习的每一个方面或者智力的任何其他特征在原则上都是可以被精确描述的,以便可以创造出模拟的机器。
随后是第二段的第一句话:
以下是关于人工智能的一些问题:
不管你相不相信!我们还没有关于人类智能的确切描述,没有关于机器是否可以做到这一点的观点(即“dointelligence”),也没有人引入“人工智能”这个术语。
当时分别在兰德公司和卡内基理工学院(后来都是卡内基梅隆大学的重要人物)就职的 Allen Newell 和 Herb Simon 在 1956 年 3 月 6 日撰写了另外四页,提出他们的研究贡献。他们表示正在进行一系列涉及复杂信息处理领域的工作,并且“这项活动的很大一部分属于人工智能的范畴”。看起来,“人工智能”这个词很快地被接受并采用,但却没有任何正式的定义。
在麦卡锡的介绍中,以及六位参与者提出的研究大纲中,他们的雄心大志一览无余。
目前电脑的速度和内存容量可能不足以模拟人类大脑的许多高级功能,但主要的障碍并非缺乏机器容量,而是我们无法充分利用现有的程序编写程序。
麦卡锡在介绍中概述了一些主题,包括如何让计算机使用人类语言,如何安排“神经网络”(1943 年发明时,少数技术精英第一次听到这个概念非常兴奋),以便其能够形成概念,机器如何自我改进(即学习或进化),机器如何通过传感器观察世界并形成抽象,以及如何使计算机创造性地思考等。 Shannon,Minsky,Rochester 和 McCarthy 在个别工作提案中对这些主题进行了扩展。Newell 和 Simon 的附录增加了机器玩象棋(包括通过学习),证明数学定理,机器如何学习的理论,以及它们如何解决人类可以解决的相似的问题。
这些主题不乏野心!请记住,当时世界上仅有很少的几台数字计算机,而且它们的运行程序和数据内存最多只有数十字节,而且只有打卡或纸带用来长期存储。
麦卡锡当然不是第一个谈论机器和“智能”的人,事实上,在此之前,艾伦·图灵曾经写过并发表过关于人工智能的文章,但没有用“人工智能”的这个术语。他最广为人知的是 1950 年 10 月出版的论文《计算机器与智能》(Computing Computing and Intelligence http://people.csail.mit.edu/brooks/idocs/compmach.pdf)。文中他介绍的“模仿游戏”被称为“图灵测试”,指一个人如何判定一条 1950 年的即时消息是通过一个人,还是一台电脑传递的。图灵估计,在 2000 年,拥有 128MB 内存的计算机(他称它为 10^9 二进制数字)将有 70%的可能达到欺骗人类的水平。
尽管论文标题中包含“智能”一词,但在论文正文中只在一处使用了该词(而“机器”至少出现了 207 次),指代人类创建一个可以模仿成年人的机器的智力。但他的目标很明确,他认为,到 2000 年,制造一台可以像人一样思考的机器是可能的。他甚至还估计了需要多少程序员(60 位工程师工作 50 年,相当于 3000 名工程师用 1 年时间,以现在软件系统标准来说是个小数字)。
在一篇早在 1948 年即完成,但直到 1970 年才发表的论文《智能机械》(Intelligent Machinery http://people.csail.mit.edu/brooks/idocs/IntelligentMachinery.pdf)一中,图灵概述了“分立式控制机器”(iscrete controlling machines)的性质,今天我们称之为“电脑”。在 1937 年的一篇论文中,他基本上已经发明了数字计算机,随后他转向制作一台完全模仿人类的机器,他指出,当时的传感器和电机系统可能并不适用,因此得出结论,最适合作为研究智能的起始领域,就是游戏和密码学,随后是语言翻译和数学。
再次强调,他们不乏雄心壮志,然而当时的技术发展却限制了他们的脚步。
人工智能起源的灵感来源于人类的表现和智力。我认为,在头 60 年中,这个目标是吸引大部分研究人员进入该领域的最大理由。事实上,我们没能达成这些愿望并不是因为研究人员偷懒,也不是因为他们不优秀。只是这个目标太过艰巨。
1991 年,也就是 27 年前,我开始写一篇关于人工智能的起源和早期发展的(长篇)论文 Intelligence without Reason(http://people.csail.mit.edu/brooks/papers/AIM-1293.pdf),并为之付出了 35 年的努力。直到现在我还在博客文章中填补细节并更新。
现状
在 AI 发展的早期,几乎没有办法将传感器连接到数字计算机,或让这些计算机控制执行器。
在二十世纪六十年代早期,想要使用计算机视觉算法,人们必须在胶片上拍摄照片,将它们转化为印刷品,再将印刷品附着到鼓上,然后在一个感光传感器附近旋转并上下移动,把照片变成强度数组。到 70 年代后期,使用二三十磅重的设备,花费数万美元,研究人员可以直接将相机获取的图像传到计算机中。直到 80 年代,随着时间的推移,这个事情才逐渐变得简单、便宜。
其他传感器模式的境况也差不多,可以将计算机程序的输出结果转化为物理行为。
因此,正如图灵所说,人工智能的早期工作转向了几乎不需要感知或动作的领域。有一些游戏可以通过键盘和打印机轻松将人类动作向计算机输入或输出,解决数学练习(如应用于符号代数的微积分或逻辑定理证明)以及理解英语句子类型等算术问题。
编写游戏程序很快引出了“树搜索”这个概念,它几乎是上述其他领域中所有早期 AI 实验的关键,而且事实上,它现在已成为很多计算机科学的基本工具。早期的游戏程序还创造了探索机器学习的机会,并产生了一个特殊变体——强化学习,这也是 AlphaGo 取得成功的核心。我在 2017 年 8 月发布的 Machine Learning Explained(https://rodneybrooks.com/forai-machine-learning-explained/)一文中详细描述了这一段早期历史。
不久之后,一个被称为积木世界的领域被开发出来,可以探索各种智力问题。1963 年麻省理工学院的拉里罗伯茨(Larry Roberts)在计算机视觉方面的第一篇博士论文也许表明,在精心的光线布景下,可以恢复木块表面的所有边缘。
这证明,将位置描述或边缘作为程序的输入,我们可以对木块进行复杂的处理,因为原则上可以解决这个问题的感知部分。这个感知和动作的模型,几十年来一直是人工智能的主要测试平台。
一些人在一个二维方块世界中用一个想象中的机器人来解决问题,这个机器人可以从堆栈顶部或模拟的一维表中拾取并放下块。
也有人致力于根据输入线来恢复被遮挡的三维块的几何形状,包括阴影,为未来更完整的视觉系统铺平了道路,这已经超出了罗伯茨所展示的内容。
另外,还有一些人则从事复杂的自然语言理解研究,以及在复杂的三维空间中解决各种问题。
这些人努力的目标不在于这些方块。相反地,他们认为通过这些有用的工具,他们可以在人工智能问题上取得进展。但是,他们并不认为这一刻即将到来,奇迹般地一下子可以被理解、有所突破,并得以应用。
随着人们发现人工智能特定子学科问题的方法越来越深入,人工智能的子学科得到发展。在很长一点时间内,新成果都没能跟上人工智能研究的广度。这些子学科包括规划、问题解决、知识表示、自然语言处理、搜索、游戏、专家系统、神经网络、机器推理、统计机器学习、机器人技术、移动机器人技术、同时定位和映射、计算机视觉、图片理解等等。
脱离主流的群体
通常,当一组研究人员发现一些问题需要解决时,他们会脱离主流,建立自己的期刊和会议,在那里,审阅论文的任务都由了解特定历史和背景的人完成。
20 世纪 80 年代末和 90 年代初,我参与了两个这样的脱离主流的小组,它们今天仍然存在:人工生命小组和自适应行为模拟小组。其中第一个关注秩序混乱的基本机制,包括进化过程。第二个小组研究如何通过感知、动作和计算的交互来产生动物性行为。这些小组和他们的期刊今天仍然活跃。
下面是我从 1993 年到 2014 年发表的一整套“人造生命”的文章。它今天仍然由麻省理工学院出版社在线发布(https://www.mitpressjournals.org/loi/artl)。
关于人工生命还有其他的期刊,自 1989 年以来,也有关于它的国际会议举行。1994 年,我参加了有数百人出席的会议,并在与 Pattie Maes 合编的复印件论文集中发表了 56 篇经过仔细审查的论文。所有这些文件现在都可以在线获取(http://cognet.mit.edu/book/artificial-life-iv)。
下图是我从 1992 年至 2013 年发表的“自适应行为”期刊论文集,今天仍由 Sage 在线发表(http://cognet.mit.edu/book/artificial-life-iv)。
另外,一系列被称为 SAB 的会议一直在举行并具有较大的影响力,它发表模拟适应行为的论文,现在也都有了电子版。
人工生命会议将于今年 7 月在东京举行,SAB 会议将于 8 月在法兰克福举行,每个会议都将吸引数千名研究人员前往。上述每本期刊包含 20 多卷,4 个主题,总共 100 多个主题,每个主题有 4-10 篇论文,所以这些期刊总共包含数千篇论文。人工生命社区充满活力,在开发遗传算法方面有一定的技术性影响,并得到一些应用。
但是人工生命社区和适应行为模拟社区都没有成功实现他们的早期目标。
我们仍然不知道生命系统是如何从非生命系统中产生的,甚至对于生命的真正含义还没有很好的定义。早期的承诺也没有实现,我们至今没有普遍可用的计算进化演化模拟。我们还没有想出如何演化包含完整的一般智能的基本组成部分系统,即使是非常简单的生物。
在 SAB 方面,我们仍然不能在计算上模拟经过仔细研究的最简单的生物的行为,即拥有 959 个细胞,其中 302 个是神经细胞的线虫。我们知道它的完整连接组(甚至它的 56 个神经胶质细胞),但我们仍然无法模拟它们如何产生大部分行为。
我讲这些故事并不是因为它们多独特,而是因为它们展示了复杂问题的研究方式,特别是在学术界。有许多(至少二十或三十个)其他人工智能研究小组具有相同的专业领域。它们一时繁荣,一时消亡。所有这些小组都给自己独特的命名,它们规模很大,有很多研究人员积极分享和发表想法。
但人工智能领域的所有研究人员都对通用人类智能感兴趣。虽然他们各自得出的结果通常应用领域狭窄,但是通用智能是所有人的目标。
这一部分,我将以一个更大规模的专业研究小组,即计算机视觉的故事来结束。这种专业化的研究已经产生了实际的技术性影响。35 年来,计算机视觉领域每年会举行至少 4 次大型会议,有六种主要期刊。 1987 年,我参与创办了国际计算机视觉杂志“Takeo Kanade”,共 126 卷(我只是作为前七卷的编辑),350 期,共 2,080 篇文章。请记住,这只是该领域六种主要期刊之一。计算机视觉社区起到了非常大推动作用,数十年来,全世界数千名研究人员一直活跃在这一社区。
AGI 是骗人的
如果你是位媒体人,或 AI 评论员,认为 AGI(通用人工智能)是场规模空前、万人瞩目的大变革,甚至有应用系统呼之欲出,恐怕你是被忽悠了,彻底被忽悠了。在我看来,那些自称在研究 AGI 的人完全是圈地自萌,因为迄今为止这方面并没有实质的方法和进步。成千上万的研究者已经研究了这个问题 62 年了,但没有突然出现转折点。
这是关于 AGI 的一本期刊(https://www.degruyter.com/view/j/jagi),我们可以看到,自 2009 年以来,总共才有 14 期,其中许多只有一篇论文,在这十年期间总共只有 4 篇论文发表。一些论文是关于 AGI 的预测,但大多数都是关于具体逻辑问题的,普普通通的,或用于行动选择的架构,并没有关于已经构建成了显示出智能的有意义的讨论。
自 2008 年以来,每年还会举行一次针对这个群体的年度会议(http://agi-conf.org/),每年有约 20 篇论文审核,其中只有少数可以在作者的博客上看到。再次强调,这些论文涵盖从 AGI 的风险到理论专业化的研究主题,但没有一篇是有技术价值的。
因此,虽然 AGI 社区存在着,但它非常小,根本无法处理任何实际的人工智能技术问题,它最大的意义只存在于新闻中。
我挖得更深一点吧,看看这两个经常被新闻界引用来谈论 AGI 话题的小组。
其中一个也许是媒体最常引用的组织,他们自称东圣弗朗西斯科湾研究所,致力于用数学使 AGI 让人类更安全。几乎所有的人工智能研究人员的目标都是制定安全的人类智能水平。但是他们中的大多数人都乐观地认识到,实现这个目标还有很长的路要走。
这个研究小组在网站上列出了 2001 年到 2018 年所有的出版物和会议报告。这很令人钦佩,也是大多数学术界研究小组采用的做法。
自 2001 年以来,他们已经制作了 10 份档案期刊论文(见下文),在会议上发表了 29 次演讲,编写了 9 本书,还有 45 份额外的内部报告,一家研究学校的教授和学生一共有 93 项产出。但这 93 个产出中有 36 个是预测 AGI 什么时候能够“实现”,因此技术性成果削减至 57。剩下的这 57 个“成果”全都是关于表示和推理的数学和逻辑论证理论,并没有实用的算法,也没有在现实世界的应用。也就是说,18 年来,他们的所有产出都没有任何的应用!
还有只有一小部分人才有机会看到 10 份档案期刊,全部都是关于何时实现 AGI 的预测。
这些特殊的群体被新闻界和 AGI 狂热者一再引用,但是当你用批评眼光看待它时,你会发现它们并不是引领 AGI 前进的主要力量。
另一个经常被引用称为 AGI 进步力量的群体是东欧的一家公司,它声称将在 10 年内创造出 AGI。从某种意义上说,这只是一家公司,一个成功的企业家正在投入足够的资金以维持运营。我们可以从其网站上看出蛛丝马迹。
他们一直在呼吁外部人士提出建议和想法,他们将提炼这些意见并应用进自己的研究:
我们计划将所有这些需求应用到一个通用算法中,这个算法只需通过与环境和老师进行交互,就能成功学习所有设计和派生的能力。
是的,这正是图灵在 1948 年提出的建议,所以这个组织与图灵有着共同的愿望。他们承认这只是他们的愿望,但到目前为止,他们还不知道怎么做到。而图灵至少在 1948 年至少还提出了几点建议。
记者们、预测者,求你们了,多做做功课。别只看表面,你们应该深入研究一下那些所谓的 AGI 研究团体是否会带来人类水平的人工智能,或者为他们是否实实在在取得了一些进展做出有意义的评价。那些极端的人,没有学术研究的人高谈阔论他们做的事情多么独特,就像那些精明的骗子一样,这很容易让人感到迷惑。但是,他们在数十年之内是不会成功的,因为就像我曾参与的人工生命和适应行为模拟小组一样,他们研究了三十多年但仍然没有实现他们的目标。
那些声称正在研究 AGI 的人并不一定了解如何开发,需要多长时间,或者是否一定会取得任何进展。当然,1950 年代和 1960 年代的人工智能研究人员一定也认为他们正在研究人工智能的关键部分,但这并不意味着他们已经接近目标。
那么,媒体们,敢不敢在十年后再来说说曾经大肆报道让人满怀期待的 AGI 哪去了?
虽然我们的命名五光十色,但我们不要忘记“深度学习”。我怀疑这个名字中的“深”这个词会使外人误入歧途。不知何故,这个词似乎表明,当“学习深度”算法学到某些东西时,可能会产生深刻的理解。事实上,从这个意义上讲,深度学习的理解是浅薄的,也不是“深”所指的真正意义。“深度学习”中的“深度”是指网络中单元或“神经元”的层数。
反向传播是深度学习中使用的学习机制,在 20 世纪 80 年代开发时,大多数网络只有两层或三层。现在一些革命性的新网络与 30 年前的结构基本相同,但层数增至 12 层甚至更多。这就是“深”的意思,12 vs.3。为了让这些“深层”网络学习,它必须具有更强大的计算能力,每个神经元中的激活功能有巧妙的转变,以及被称为钳位(clamping)的阶段训练网络的方法。但不是深刻的理解。
为什么发表这篇文章?
我发布这篇文章的目的在于澄清人们关于人工智能的一些困惑,以及人工智能研究人员的目标。
自 1956 年以来,每年已经有超过 100 万人从事 AI 研究,远远超过 Alan Turing 认为需要的三千人!
现在,我们距离早期人工智能的目标仍然遥远。在我的下一篇博文中(或许在 5 月),我将概述所有我们还不了解的关于如何建立一个全面的人工智能应用的话题。
而这篇文章旨在:
打消人们担心超级人工智能即将出现的忧虑(但是,我知道,他们会享受这种令人毛骨悚然的感觉,并会继续不合理地炒作)。
提出可能对人工智能的未来产生真正影响的研究方向,以及加速研究的建议。
提醒人们还有很多有趣的研究可以做,鼓励他们解决难题,而不仅仅是炫耀性的演示。最后,我想和大家分享 Alan Turing 在论文《计算机器与智能》中的最后一句话,在今天它还是像 68 年前一样适用:
虽然我们只能看到前面的一小段距离,但是未来需要解决的事情背后,隐藏着广阔的天地。