但需要考虑到机器智能的各个方面。在我的一家公司里,我们花了数年的时间使用模式识别软件教一个研究性计算机识别人类的连续讲话。6我们向它展示了数千小时的录音讲话,纠正了它的错误,并耐心地训练它的“混沌”自组织算法来改善性能(这是一种修改自己规则的方法,它基于半随机初始信息的过程,其结果不能完全预测)。最后,电脑变得非常善于识别讲话。现在,如果希望个人计算机识别讲话,你不必通过同样艰苦的学习过程(就像我们对待每个人的孩子一样),仅通过几秒钟的下载就可以建立这一模式。
研究人员已经证明,他们能迅速地理解和应用这些通过建模仿真出来的信息。大脑区域模拟的基础是数学复杂性理论和混沌计算原理,并且已经获得了与实际人类和动物大脑紧密匹配的实验结果。
新的脑成像和建模工具。通过逆向工程仔细研究大脑的第一步是确定它的工作原理。到目前为止,我们的工具,虽然很简陋,但也正在发生变化,作为新的扫描技术,它大大改善了时间和空间分辨率,提高了性价比和带宽。同时,我们正在迅速地积累关于大脑系统及其组成部分的精确特点和动态性的数据,这些数据包括从个别突触到大的区域,如小脑,其中包括超过一半的大脑神经元。大量的数据库正在有条不紊地为我们呈指数增长的大脑知识组织目录。3
现代电子和生物神经元连接间的电化学信号的实际速度比至少有1000 000:1。我们在生物学的各个方面都能发现相同的低效率,因为生物进化建立的所有机制和系统都是使用严格约束的材料:细胞,它本身是由有限的蛋白质集合组成。虽然生物蛋白质是三维的,但是它们也仅限于从线性(一维)的氨基酸序列折叠成复杂分子。
一旦计算机达到人类的智能水平,它一定会飙升上去。非生物智能的一个关键优势在于机器能够轻松共享它们的知识。如果你学法语或阅读《战争与和平》,你不能轻易地通过下载来完成,就像学习对于我来说,我要获得学问也要付出和你一样艰苦的努力。我不能(也还没有)快速访问或传输你的知识,因为知识是根植于神经递质浓聚物(允许一个神经元影响另一个的突触的化学物质的水平)的一种巨大模式以及神经元间的连接(这称为是连接神经元的轴突和树突,是神经元的一部分)中。
将人类智能与计算机在速度、精度、存储分享能力上所固有的优越性结合起来是十分艰巨的。然而,到目前为止,大多数人工智能的研究和发展已经利用了一些工程方法,但是这些方法不一定基于人脑功能,原因很简单,我们还没有精密的工具去开发详细的人类认知模型。
采用这种自组织的方法,我们不必试图复制每一个神经元连接。在任何特定大脑区域都有大量的重复和冗余。我们发现,较高级的大脑区域模型比较详细的神经元组成部分的模型还比较简单。
大多数大脑建模算法都是不连续的逻辑算法,这也是当前常见的数字计算方法。大脑的工作过程往往是自组织、混乱且全息的(即不在一个地方但分布在整个区域的信息)。这也是大规模并行的,而且使用混合数字控制的模拟技术。然而,大范围的项目表明,我们能够理解这些技术,并能够从我们大脑及其组织里迅速升级的知识中抽象出来。
正如在第2章所说,大脑逆向工程所需的扫描和计算工具的能力正在加速提高,这可以加速提升基因组计划可行技术。当我们到达纳米机器人时代,我们将能够利用高时空分辨率,从大脑内部进行扫描。4我们有能力逆向设计人类智慧的运作原则,并可以在更强大的基板上复制这些能力,要做到这些并不存在内在的障碍,我们将会在几十年后实现它们。人类的大脑是一个具有复杂等级制度的系统,但并不代表它的复杂程度已经超出我们可以处理的范围。
我们大脑逆向工程的能力——观察内部、建模并模拟各区域——正以指数方式增长。我们最终会理解隐藏在思维、知识全部范围内的运作原则,这些将为开发智能机器的软件提供强大的程序支持。伴随着这些计算技术的应用,它们将得到不断修改、完善和扩展,而这些技术远比生物神经元内部的电化学加工过程更为强大。这一宏伟工程的关键优势是,它为我们提供了精确的见解。我们也将获得有效的新方法,以便治疗诸如阿尔茨海默氏症、帕金森氏症、感官残疾、中风等疾病,并最终大大扩展我们的智能。
正如汉斯·莫拉维茨等人的推测,这些高效率的功能模拟所需要的计算量大约比我们模拟每个树突、突触以及该区域的其他副神经结构的非线性要少1000倍。(正如我在第3章讨论的,大脑仿真估计需要每秒1016次计算,与此相对应的副神经非线性的仿真则需要1019cps。)12
掌握智能软件最吸引人的场景就是直接进入到一个蓝图,也就是智能进程中我们亲手实现的最好样例:人的大脑。虽然原来的“设计师”(进化)用了几十亿年时间来发展大脑,但我们还是很容易就能获得它。虽然大脑被头盖骨保护着,但我们还是可以使用合适的工具将它暴露在我们的视野范围内。大脑的内容还没有版权或专利。(不过,我们可以期待着改变,基于大脑逆向工程的专利已经有人申请。)7我们将利用数千万亿来源于大脑扫描和各级别神经模型的信息,来为我们的机器设计更多智能的并行算法,特别是那些基于自组织模式的算法。
大脑软件。计算和通信的性价比每年翻一番。正如我们前面看到的,模拟人类智能的计算能力可在不到20年内实现。5一个隐藏在奇点期望下的重要设想是非生物媒介能够模拟大脑思维的丰富度、精度和深度。但是实现一个单一人类大脑的硬件计算能力(甚至是一个村庄和国家的集体智力)将不会自动产生人类水平的能力。(我说的“人类水平”包括所有使人类智能化的多样而微妙的方式,如音乐和艺术才能、创造力、穿越世界的物理运动、理解和适度的回应情绪。)硬件的计算能力是必要的,但还不够。理解这些资源(智能软件)的组织和内容更为关键,这是大脑逆向工程所承诺的目标。
剥洋葱。大脑不是一个单一的信息处理机构,而是一个复杂的集合,由数百个专门区域交织在一起。理解这些交叉区域功能的“剥洋葱”过程正在顺利地进行当中。当必要的神经元描述和大脑神经元间的连接的数据可利用时,详细的、可实施的副本,例如接下来要描述的听觉区域模拟将在大脑各区域发展。
只有在大脑扫描和神经元结构信息可用后,可行模型和模拟仿真的创建才可以进行。超过50000名神经科学家为超过300个期刊撰写过这方面的文章。11该领域广泛而且多样化,科学家和工程师创造新的扫描和遥感技术,多层次地发展模型和理论。所以,即使是这个领域的人们,往往也都没有完全意识到当代研究的整体规模。
大脑有多么复杂?虽然在人类大脑中的信息需要10亿比特按顺序存放(见第3章),大脑的最初设计还是基于相当紧凑的人类基因组的。整个基因组由8亿字节组成,但大部分是多余的,只留下约3000万~1亿字节(小于109比特)的独特信息(压缩后),这比微软的Word程序还要小。8公平地说,我们也应考虑到“后生”的数据,也就是那些存储在控制基因表现(也就是确定允许哪些基因在每个细胞中创建蛋白质)的蛋白质中的信息,以及整个蛋白质的复制机制,如核糖体和众多酶。然而,这些额外的信息并没有较大地改变这种计算的数量级。9遗传基因中略多于一半的信息和后生的信息塑造了人类大脑的初始状态。
当然,当我们与世界交互时,我们的大脑复杂性大大增加了(大约是基因组的10亿倍)。10但是,在每个特定的大脑区域中可以发现很多高度重复的模式,所以没有必要捕捉每个细节,以便逆向设计数字和模拟相结合的有关算法(例如,神经放电可以认为是一个数字事件,然而在突触的神经递质水平上则可以视为是模拟值)。例如,小脑的基本的布线图在染色体中只描绘过一次,但却要重复数十亿次。通过分析来自大脑扫描和建模的信息,我们可以设计模拟“神经形态”的等价软件(算法的功能相当于一个大脑区域的整体性能)。
分析大脑VS神经形态模型。为了了解人类智能和当代人工智能之间的分歧,我们可以通过一个很好的例子来说明,这就是它们各自是如何解决国际象棋问题的。人类是通过认知模式,而机器则是建立庞大的逻辑“树”,里面包含所有可能的位置移动和对策。迄今为止的大多数技术都是利用后一种的“自上而下”的分析设计方法。例如我们的飞行器不能试图重建鸟类的生理机能和生物结构。作为逆向设计自然方式的工具正在复杂性上迅速发展,技术正在走向模拟自然的道路,而这些技术也将在更强大的基板上实施。
为大脑建模。在当代神经系统科学中,建模和模拟仿真正在由多种来源开发出来,包括大脑扫描、神经元间的连接模型、神经元模型和心理生理测试。如前面所述,听觉系统研究者劳埃德·瓦特制作了一个听觉处理系统重要部分的综合模型,它来源于特定神经类型和神经元间连接信息的神经生物学研究。瓦特的模型包括5个平行的路径和神经传导每个处理阶段的听觉信息的实际表现形式。瓦特用计算机实验了他的模型,他将这个模型作为一个实时软件,可以用来定位和识别声音,这类似于人类听力的方式。虽然该项工作还正在进行,但已经可以看到,该模型阐明了对神经生物学的工作模式和脑连接数据进行模拟仿真的可行性。
在理解了某一特定区域的算法后,它们就可以在合成神经当量之前加以完善和延伸。它们可以运行在一个远远快过神经线路的计算基板上(当前计算机的计算在十亿分之一秒级别,而神经元间的传导是千分之几秒)。此外,我们还可以利用已经了解的建造智能机器的方法。