那为什么不制造一台可以模仿人类大脑运作方式的计算机呢?“最终我们将能够测定人类基因组的序列,并复制出自然赋予碳基系统的智慧,”比尔·盖茨预测道,“这就像是为了解决一个难题而对其他人的产品进行逆向工程一样。”14 这不是一个可以轻易实现的目标。科学家们花了40年的时间才测定出一种身长1毫米的线虫的神经活动,它只有302个神经元和8 000个突触。[2] 而人类大脑则拥有860亿个神经元和多达150万亿个突触。15
所有这些任务都有一个共同点:这些都是连一个四岁的小孩都能做到的事情。根据哈佛大学的认知科学家史蒂芬·平克(Steven Pinker)的说法:“过去35年的人工智能研究带给我们的主要启示是,困难的问题是简单的,简单的问题是困难的。”12 未来学家汉斯·莫拉维克(Hans Moravec)等人表示这个悖论之所以存在,是因为识别视觉或语言模式需要消耗的计算资源过于巨大。
埃达还有一个更具争议性的观点:无论如何强大的计算机都不可能真正成为一台“会思考的”机器。至少到目前为止,她仍然可以理直气壮地夸耀自己的想法是正确的。在她身故的一个世纪之后,艾伦·图灵将这个观点称为“洛夫莱斯夫人的异议”,并尝试对它进行反驳。他为会思考的机器给出了一个可操作的定义——能够让提问者以为是人类的机器。他还预计在几十年之内将会出现可以通过这个测试的计算机。但是现在60多年过去了,那些试图通过图灵测试的机器最多只能进行一些蹩脚的对话,而不是真正的思考。显然现在还没有一台机器能够达到埃达提出的严格标准:能够“拥有”自己的思想。
长期以来,人工智能的狂热支持者们都在鼓吹(或者说是威胁)像HAL那样的机器很快就会出现,并且证明埃达的想法是错误的。这也是举行于1956年的达特茅斯会议的前提,这场由约翰·麦卡锡和马文·明斯基发起的会议确立了人工智能这一研究领域。与会者们最终总结得出,人工智能领域将在大约20年之后出现重大突破。但事实并非如此。每隔10年都会有一批新的专家断言人工智能将会在可见的未来实现,然而他们见到的只是镜花水月,总是与我们相隔20年的距离。
这轮新闻报道也许确实意味着能够像人类一样思考的机器会在几十年之后出现。“我们一直都在关注机器还不能做的事情——下象棋、驾驶汽车、翻译语言,而当机器有能力做出这些事情的时候,我们就把这个清单上的项目一一划去,”蒂姆·伯纳斯–李说道,“终有一天,我们可以把清单上的最后一行划去。”18
这些最新的研究进展甚至会导致“奇点”(singularity)的出现,这是由冯·诺依曼创造的一个术语,并在未来学家雷·库茨韦尔(Ray Kurzweil)和科幻作家弗诺·文奇(Vernor Vinge)的推广之下深入人心。“奇点”一词可以用来描述计算机的智慧开始超越人类的时刻,届时它们将能够通过自我完善而变得越来越智能,因此就不再需要依赖人类。文奇表示这种情况到2030年将会出现。19
一位来自康奈尔大学的教授弗兰克·罗森布拉特(Frank Rosenblatt)在1958年尝试实现这个目标。他利用数学方式设计了一种模拟大脑的人工神经网络,并将其命名为“感知机”(Perceptron)。通过使用加权统计输入,它在理论上可以处理视觉数据。当为这个项目提供资金支持的美国海军将其对外公布的时候,这个事件吸引了众多媒体的大肆炒作,随后还出现了许多关于人工智能的论断。“海军在今天公布了一个电子计算机的胚胎,它将可以行走、说话、视物、写作、自我繁殖,而且可以意识到自己的存在。”这是来自《纽约时报》的报道。《纽约客》也表现出了同样的兴奋:“顾名思义……感知机能够达到独立思考的程度……它让我们感到第一个真正可以媲美人类大脑的东西已经被发明出来了。”2
同样,沃森也是利用了大量的计算能力才能在《危险边缘》中获胜:它拥有4TB的储存容量,里面存放了2亿页的信息,而整个维基百科的内容仅占其中的0.2%。它可以在一秒钟之内搜索相当于100万本书的内容。它还能说流利的英语口语。尽管如此,看过它上电视的人都不会认为它可以通过图灵测试。事实上,IBM团队的负责人非常担心该节目的脚本写作者会设计一些蒙骗机器的问题,将这个节目变成一场图灵测试,所以他们坚决要求节目组只能使用来自未播放节目的现有问题。然而,这台机器还是在节目上多次展示了自己非人性的一面。例如其中一个问题是关于奥运会体操冠军乔治·埃塞尔(George Eyser)的“生理结构特点”。沃森的回答是“什么是一条腿?”而正确的答案应该是“埃塞尔缺了一条腿”。这个问题的难点在于理解“不寻常”的意思,IBM沃森项目的负责人戴维·费鲁奇(David Ferrucci)解释道,“这台计算机理解不了缺了一条腿是一件极不寻常的事情。”6
2013年底,《纽约时报》报道了“一项即将颠覆数字世界的研究进展”,这项进展“可能会实现新一代的人工智能系统,它们将会拥有一些对于人类来说轻而易举的功能:视觉、语言、听觉、寻路、操纵和控制”。这些用词会让人想起《纽约时报》在1958年对感知机的报道(“它将可以行走、说话、视物、写作、自我繁殖,而且可以意识到自己的存在”)。这是复制人类大脑神经网络运作模式的另外一次尝试。正如《纽约时报》所描述的,“这种新的计算方式的基础是生物神经系统,具体来说是神经元对刺激的反应以及神经元之间通过连接转译信息的方式。”16 IBM和高通均公布了开发“神经形态”(neuromorphic)计算机处理器的计划,还有一个叫作“人类大脑计划”(Human Brain Project)的欧洲研究委员会也宣称自己已经研制出一种神经形态微型芯片,这种芯片含有“5 000万个塑料突触和20万个仿真神经元模型,所有这些元件都被安放在一个8英寸的硅片上。”17
然而,我们的未来还存在另外一种可能性,这是埃达·洛夫莱斯所认同的未来,也是建立在过去半个世纪的计算机发展道路之上的未来,而这条道路的开辟者是万尼瓦尔·布什、J·C·R·利克莱德和道格·恩格尔巴特。
莫拉维克的悖论印证了冯·诺依曼在半个世纪之前提出的观点——人类大脑的碳基化学物质的运作模式不同于计算机的硅基二进制逻辑电路。湿件[1] 和硬件之间存在差别。人脑不仅结合了模拟和数字的处理方式,它还是一个分布式的系统,就像互联网一样。计算机的中央处理器执行指令的速度可以远远超过大脑的神经元。“但是大脑能够很好地弥补这个劣势,因为所有的神经元和突触都能同时被激活,而目前大多数计算机都只有一个或几个CPU(中央处理器)。”这句话出自斯图尔特·拉塞尔(Stuart Russell)和彼得·诺维格(Peter Norvig)合著的一本书,它是人工智能领域最为重要的一本教科书。13
另外,这些新闻报道也有可能只是重现了20世纪50年代的海市蜃楼。真正的人工智能或许需要再过几代人甚至几个世纪的时间才能达到。我们可以把这个话题留给未来学家们讨论。实际上,根据我们对意识的定义,它也许永远都不可能出现。这个话题则可以留给哲学家和神学家们讨论。“人类的创造力将永远不可能设计出比自然造物更完美、更简单、更恰当的发明。”达·芬奇写道,他创作的《维特鲁威人》(Vitruvian Man )成为艺术与科学相结合的终极象征。
即使是IBM的工作人员也认同这个观点。他们从来没有标榜沃森是一台“智能”的机器。“现在的计算机都是聪明的笨蛋,”IBM的研发总监约翰·E·凯利三世(John E. Kelly III)在深蓝和沃森击败人类之后说道,“它们在储存信息和数字计算方面有着惊人的能力——远远超出任何人。然而在另外一方面的技能,比如理解、学习、适应和互动的能力,计算机只能向人类俯首称臣。”8
这种方法产生了一种令人费解的现象:虽然计算机可以完成世界上最困难的一些任务(分析数十亿种可能的棋子走法,在数百个相当于维基百科大小的数据库中找出关联的内容),但是一些我们人类认为最简单不过的事情它们却做不到。如果向谷歌询问一个高难度的问题,比如“红海的深度是多少”,它马上就可以给出答案“7 254英尺”,这可能连你最聪明的朋友都不一定知道。不过如果问它一个简单如“鳄鱼会打篮球吗”的问题,它却会不知所措,但是就连蹒跚学步的孩童都能在一阵笑声之后给出正确的答案。11
在洛杉矶附近的Applied Minds公司里面,你可以看到控制机器人行动的程序是如何被编写出来的,但是在兴奋之余,你很快就会发现这些机器人在陌生的房间里会晕头转向,也拿不起蜡笔并写下自己的名字。在参观波士顿附近的Nuance Communications公司的过程中,你会了解到语音识别技术的惊人进展,这种技术是支撑Siri和其他类似系统的基础。但是任何使用Siri的人都清楚,我们现在还不能与计算机进行真正有意义的对话,除非是在科幻电影当中。在麻省理工学院的计算机科学与人工智能实验室里面,一项关于计算机图像识别技术的研究正在如火如荼地进行当中。然而,尽管计算机能够从图像中识别出一个拿着杯子的女孩、一个站在喷泉旁的男孩、一只正在舔奶油的猫,但是它缺乏最基本的抽象思维能力,所以识别出他们都在做同样的动作——喝东西。位于曼哈顿的纽约市警察指挥中心有一个区域警戒系统(Domain Awareness System),这个系统中的计算机能够扫描来自成千上万个监控摄像头的图像信号,但是它们仍然不能从人群中准确地辨认出你妈妈的样子。
约翰·冯·诺依曼在逝世(1957年)之前曾经短暂研究过人工智能。在参与了现代数字计算机结构的设计工作之后,他认识到人类大脑和计算机的结构之间存在根本性的区别。数字计算机会采用精确的单位进行计算,但是根据我们目前的了解,大脑也是一个部分模拟的系统,它会处理一系列连续统一的可能性。换句话说,人类在进行思考的时候,大量来自不同神经的信号脉冲和模拟波会聚集在一起,产生出“也许”和“可能吧”等各种有着细微差别的答案,有时还会出现困惑的情况,而不是像计算机那样只有二进制的“是”与“否”两种结果。冯·诺依曼提出未来的智能计算或许需要放弃完全数字的方式,建立一种同时含有数学和模拟形式的“混合程序”。他表示,“逻辑学将必须从内在转变为神经学”这句话翻译过来的大致意思就是,电脑将需要变得更像人脑。1
深蓝和沃森并没有证明机器已经进一步实现了人工智能,它们反映的是一个完全相反的事实。“令人感到讽刺的是,这些最近出现的成果揭示了计算机科学和人工智能的局限所在,”麻省理工学院的大脑、思维与机器研究中心的主管托马索·波焦(Tomaso Poggio)表示,“我们目前还不了解大脑是如何产生智慧的,也不知道如何做出和我们一样拥有全面智慧的机器。”9
埃达·洛夫莱斯应该会感到欣慰。对于一位已经逝去超过150年的先人来说,我们只能狭隘地揣测她的思想。我们可以想象她如何自豪地在书信中炫耀自己的敏锐洞察力,她知道计算设备总有一天会成为通用型计算机,这种美妙的机器不仅可以处理数字,而且能够谱写音乐和处理文字,甚至“将通用符号以连续的无限变化的形式结合起来”。
印第安纳大学的道格拉斯·霍夫施塔特(Douglas Hofstadter)教授在1979年出版了一本结合艺术与科学的著作《哥德尔、埃舍尔、巴赫》(Gödel, Escher, Bac ),令他意想不到的是,读书竟然成为一本风靡全球的畅销书。他认为如果要实现有意义的人工智能,唯一的方法是理解人类想象力的运作方式。他所提出的研究方向在20世纪90年代已经基本被放弃了,因为当时的研究人员发现在处理复杂任务的时候,更为高效的做法是借助强大的处理能力来处理海量数据,正如深蓝下象棋的方式。10
这已经是差不多60年之前的事情了,但是感知机的设想到现在仍未实现。3 尽管如此,几乎从那以后的每一年都会出现这种激动人心的新闻报道,它们的主题都是说一些能够复制和超越人类大脑的神奇发明即将到来,其中有很多都用到了跟1958年的感知机新闻几乎一模一样的措辞。
这样的机器在20世纪50年代开始出现。在接下来的30年当中,计算机在两项重大创新的驱动之下彻底改变了我们的生活方式:微型芯片让计算机尺寸可以缩小为作为个人设备使用;分组交换网络让计算机可以作为网络上的节点互相连接。个人电脑和互联网的结合促进了数字创意、内容分享、社区营造和社交网络的迅速发展。它实现了埃达所说的“诗意科学”,这是创意和技术的相互交织,就如出自雅卡尔织布机的华丽织锦一般。
玛丽·雪莱在与埃达的父亲拜伦勋爵度假期间想出了《科学怪人》的故事,自此以后,人造机器可能形成独立思想的想法使得一代又一代的人们深感不安。《科学怪人》的主题也成为后世科幻作品的基石,其中一个生动的例子是斯坦利·库布里克(Stanley Kubrick)1968年的电影《2001太空漫游》(2001: A Space Odyssey ),这部电影的主角是一台令人恐惧的智能计算机“HAL”。HAL通过自己平静的嗓音展现出了一些人类特有的能力:说话、推理、识别人脸、审美、表达情绪,(当然)还有下象棋。当HAL似乎出现故障的时候,人类宇航员们决定将其关闭。在得知这个计划之后,HAL将他们逐一杀害,最后只剩下一位幸存者。经过一番英勇斗争之后,仅存的那位宇航员打开了HAL的认知电路,把它们一个接一个地断开。HAL开始逐渐退化,直到最后哼唱出了“Daisy Bell”的曲调,这是向历史上第一首计算机合成乐曲致敬——1961年,位于贝尔实验室的一台IBM 704计算机唱出了这首曲子。
后来发生的两件事让关于人工智能的讨论变得更为热烈了(至少在大众媒体的范围之内)。首先是IBM的国际象棋计算机深蓝在1997年击败了世界国际象棋冠军加里·卡斯帕罗夫(Garry Kasparov),然后同样也是来自IBM的自然语言答题计算机沃森在2011年的《危险边缘》(Jeopardy! )智力竞猜节目中胜出,它同时击败了两位冠军选手——布拉德·拉特(Brad Rutter)和肯·詹宁斯(Ken Jennings)。“我认为它唤醒了整个人工智能社区。”IBM的首席行政官金尼·罗曼提(Ginni Rometty)说道。4 但是正如她首先承认的,这些都不是人工智能的真正突破。深蓝是依靠蛮力算法在国际象棋比赛中胜出的,它可以每秒分析2亿步棋,然后将每一步棋与以往的70万局大师级比赛进行比对。大多数人都会认同深蓝的计算方式与普遍定义的真正思考之间存在根本性的差别。“深蓝的智能程度跟你的可编程闹钟一样,”卡斯帕罗夫说道,“但并不是说输给一台价值1 000万美元的闹钟会让我感到好过一些。”5
加州大学伯克利分校的哲学教授,“中文房间”思维实验的设计者约翰·希尔勒认为,沃森根本连一丁点的人工智能都算不上。“沃森并不理解那些问题,也不能理解问题的答案,它不知道自己有没有答对,不知道自己在参加比赛,更不知道自己赢了——因为它不能理解任何东西,”希尔勒表示,“IBM不是,也不能以理解为目的来设计这台计算机。一个更恰当的说法是,它的设计目的是模拟理解,是让它假装自己能理解。”7