顾凡及
复旦大学 生命科学学院,上海 200433
人工智能狂潮使人们对“人工脑”产生了极大的兴趣。通过“逆向工程”,用硬件或是软件复制出结构和功能都类似于脑(特别是人脑)的系统,就是人工脑。用机器忠实地拷贝人脑,是否现实和必要?这依然是一个有着极大争议的问题。
美国计算机科学家米德(Carver Andress Mead)(图1) 是大规模集成电路的先驱,他对脑是如何进行计算的深感兴趣。他说道:“我对于动物视觉系统的机制越来越佩服。我老是对自己说:‘我永远也想不到这一点,但是这确实是一个好主意。’”[1]他在20世纪80年代末提出了仿神经结构工程(neuromorphic engineering)1也译为“神经形态工程”,不过这里实际上最重要的并非神经组织的表观形态,而是其构筑或结构,因此笔者建议译为“仿神经结构工程”。的概念[1]。最初这一概念指的是采用由模拟电路构成的超大规模集成电路(VLSI)模仿神经结构来实现相应的神经功能。现在这一概念已不限于模拟电路,而可以是用模拟电路、数字电路或混合电路构成的VLSI甚至软件系统来建立神经系统的模型。
图1 卡弗·安德烈斯·米德教授(引自http://quecomoquien.republica.com/ fi les/2012/01/carver-mead.jpg)
20世纪末,正是通过学习视网膜的神经机制,米德指导自己的一位博士生马霍瓦尔德(Misha Mahowald)研制出“硅视网膜”。马霍瓦尔德的硅视网膜是一个模拟视网膜头三层解剖结构(感光细胞、水平细胞和双极细胞)和功能原理的芯片(图2)。这一人工视网膜能够产生与生物视网膜类似的输出信号。之后,该实验室开发出来的人工视网膜和人工耳蜗成为仿神经结构工程在医学上得到实际应用的第一批成果之一。他们的另一项成果是用互补型金属氧化物半导体(CMOS)电路直接模拟离子通道,并在此基础上构建出硬件的“硅神经元”。这些工作成为仿神经结构工程的发韧之作[2]。
图2 硅视网膜线路的示意图。左图中的每一个节点都代表一个双极细胞(其详细线路显示于右图,该图右上侧的光敏元件代表感光细胞),把节点连接起来的电阻则代表水平细胞,其作用是使相邻的双极细胞相互抑制,从而模仿了双极细胞的功能。这一线路能再现马赫带(也就是在光刺激图像明暗交界处两侧分别有一条特别亮的亮线和特别暗的暗线的知觉的现象)等视觉现象(引自http://tapec.uv.es/pardo/doctorado/visionchips/vision_chips/mahowald_mead.html)
近年来,许多大学和公司的实验室都纷纷出资研制仿神经结构芯片,企图由此开发能耗小、速度快的新型信息处理装置,甚至开发出超越冯·诺伊曼架构的新一代计算机。究其原因,这是因为人们发现传统计算机虽然在计算和逻辑操作上远超人脑,但是在模式识别和运动控制方面却不如人脑。虽然现在通过机器学习,计算机也能执行这些任务,但是其耗费的能量远超人脑,速度则远不如人脑。人脑工作消耗的能量几乎和冰箱里的小灯泡差不多,大概只有20 W。如果采用最简单的神经元模型,在传统计算机上用软件计算一个其中节点数和人脑中神经元数目相仿的神经网络,那么即使耗尽一个超大城市的全部电力也还不够。原因在于,作为传统计算机基本元件的门电路需要在两个相差数伏的不同电平之间来回切换,需要不断消耗能量,而生物神经元则只有在发送脉冲的很短时间里才消耗能量。另外,在传统计算机中处理单元和存储单元是分隔开来的,需要在两者之间不断通信,这也需要消耗大量能量;而脑并没有彼此分离的中央处理器和存储器,许多处理都在当地就解决了。因此当计算规模非常大时,能耗和速度就成了用传统计算机仿真某些脑功能时的瓶颈,更不要说具体应用了。
工程师们由此受到启发,试图构建由脉冲发放神经元(这种神经元模型的输出和真实神经元类似,都是一个个离散的脉冲,因此只有在输出脉冲时才消耗能量)构造的网络来实时解决模式识别和运动控制问题,甚至发展新一代计算机,这就是近年来倍受重视的仿神经结构芯片。目前,欧美的一些大学和大公司正在竞相开发,如米德以前的学生、美国斯坦福大学教授包汉(Kwabena Boahen)用硅神经元开发的神经网格超级计算机(neurogrid supercomputer)[3],IBM公司印度裔美国科学家莫德哈(Dharmendra S. Modha)开发的“真北”(TrueNorth)系统[4-5],在欧盟人脑计划(EU Human Brain Project,EU HBP)仿神经结构计算平台(Neuromorphic Computing Platform)下的两个项目:英国曼彻斯特大学的弗伯(Steve Furber)领衔的“脉冲发放神经网络构筑”(Spiking Neural Network Architecture,SpiNNaker)项目和由德国海德堡大学的迈尔(Karlheinz Meier)领衔的“仿神经结构混合系统脑启发多尺度计算”(Brain-Inspired Multiscale Computation in Neuromorphic Hybrid Systems,BrainScaleS)项目,以及英特尔公司的洛以希(Loihi)芯片,等。
这些系统中的神经元数都达到了百万级或以上,而消耗的能量要比在传统计算机上仿真有同样节点数的神经网络降低4个数量级以上。这些系统的共同特点是采用脉冲发放神经元作为基本元件,并用脉冲进行通信。不过在实现脉冲发放神经元方面则各显神通,有用传统数字电路、模拟电路的,也有用硅神经元的。下面就介绍其中一个有一定代表性的项目。
从2008年开始,美国国防部高级研究计划局(DARPA)资助了一项称为“仿神经结构适应性可塑可扩缩2Scalable的意思是大小可变,这里译为可扩缩。这是因为这种系统把处理单元和存储单元放在一起,因此可以在留有通信口的情况下随意拼接,这样系统的大小就可以在两个维度上随意扩大或缩小。电子学系统”(Systems of Neuromorphic Adaptive Plastic Scalable Electronics,SyNAPSE)的计划,这一计划的目的是开发一种在形态、功能和结构上都类似于哺乳动物脑的认知计算机。莫德哈(图3)领导的团队承担了其中的一部分。
图3 IBM公司印度裔美国科学家莫德哈
2009年11月,莫德哈宣称编写了一个仿真猫脑的程序。2012年11月,他宣称在由96台IBM的蓝基因超级计算机组成的红杉(Sequoia)超级计算机上仿真了5 300亿个神经元和137万亿个突触,其规模大体上和人脑相当。当然,就“神经元”本身和相互连接的复杂性而言,都无法与人脑相比。即使如此,为了实现类似于人脑的某些功能,其速度仅为人脑的1/1500。如果想把速度提高到和人脑相仿,那么就要耗尽纽约市加上洛杉矶市的全部电力。
2014年,他又宣称在硬件上开发出这样的芯片,每块芯片都有4 096个核。这些核进行并行分布式处理,并且不用时钟控制,而由事件驱动。核把记忆、计算和通信整合在一起。因此,即使个别的核坏了,芯片还能继续工作,同时也能按需要无缝扩展。图4就是这样的一块电路板,其上有4×4块芯片。这种称为“真北”的芯片上有100万个电子“神经元”和2.56亿个电子“突触”,运行功率仅为70 mW,要比在传统计算机上运行同样功能少4个数量级。其速度是每秒每瓦执行460亿次突触运算。这种芯片在实现模式识别等复杂功能方面比传统芯片要强得多,能实时识别环境中的不同对象,如行人、骑车人、卡车、汽车、大巴等(图5)。虽然传统技术也能实现类似功能,但是真北系统的速度要快得多,而能耗则少得多。其远期目标是建立起有100亿个神经元和100万亿个突触的系统,而体积只有2 L,能耗仅为1 kW。
图4 由16个真北芯片构成的电路板(图片来源:维基百科)
为了方便而有效地运行这种芯片,需要开发合适的软硬件环境,也就是所谓的“生态系统”(ecosystem)。应用这种系统,现在已经可以运行深度学习和卷积网络。为了推广这种系统,IBM甚至成立了一所虚拟的网上“突触大学”(Synapse3“突触”这一术语的英语单词synapse正好和“仿神经结构适应性可塑伸缩电子学系统”的缩写SyNAPSE一样。University)进行这种新语言的编程教学。
真北系统最后能否成功,在一定程度上将取决于应用者是否愿意重新投资学习这种新语言进行编程,以换取提高速度和减低能耗。据2016年11月的报道,当时已有30个以上的大学和政府或公司的实验室正在使用这种系统,但是这和现在几乎所有实验室和产业界都在使用的传统计算机比较起来仍然只是沧海一粟。当然,造价也是一个关键因素。
尽管人们常常把真北系统称为人工脑,但是莫德哈强调:“我们没有建造脑,也没有建造任何脑一样的东西。我们所建造的只是一种受脑启发而来的计算机。这个计算机的输入和输出都是脉冲。从功能上说起来,它只是把输入脉冲的时空流变换成输出脉冲的时空流。”他的这段话也适用于其他仿神经结构芯片。不过他在另一个场合又说道:“在无机硅技术允许的范围之内,我们力图使系统尽可能接近于脑。”
下面我们介绍在这方面以研究脑功能为主要目的的一些努力,这可以称为人工脑(artificial brain)或是脑仿真(brain simulation)。
低等动物神经系统中神经元的数目远比人脑要少,结构也相对简单,其行为当然也远没有人那么复杂,因此以此起步也就不足为怪了。说起对低等动物神经系统线路图的研究,大概没有比对秀丽隐杆线虫(C. elegans)(图6)的研究更透彻的了。这种线虫的神经系统中一共只有302个神经元,所以还称不上是一个脑。到1985年科学家就把它的线路图画清楚了,1993年就有人对此做了局部仿真,2004年后更有了不少用软件仿真的模型。但是即使这样“简单”的一个神经系统(其中有100多种不同的神经元),迄今为止我们依然解释不清楚其种种行为的神经机制[6]。也有人对果蝇的脑进行仿真。不过低等动物的神经系统与人相去甚远,所以更多人把这方面的研究放到像鼠这样的哺乳动物上,其中最著名的当数在瑞士洛桑联邦理工学院工作的南非神经科学家马克拉姆(Henry Markram)的蓝脑计划(Blue Brain Project,BBP)。
2005年,马克拉姆启动了一项称为“蓝脑计划”的研究。其目的是创立人工人脑,把有关人脑的一切知识,从基因组到神经细胞膜上的离子通道结构,直到有意识的决策,都通过超级计算机仿真整合在一起。他认为这样建立起来的模型将阐明神经回路是如何组织起来的,行为和认知是怎样产生的,从而彻底完善对脑的认识。
图6 秀丽隐杆线虫的放大图,它的整个长度在1 mm左右(引自https://en.wikipedia.org/wiki/Caenorhabditis_elegans#/media/File:CelegansGoldsteinLabUNC.jpg)
2005年底,他们建立了一个包括各种离子通道和形态细节的神经元模型,在这些神经元模型中考虑了200种不同的离子通道模型、它们在细胞膜上的分布,以及神经元的形态。2006年,他们把10 000个简化的神经元模型相互连接构成一个功能柱模型(一些科学家发现从皮层表面垂直向下所遇到的神经元有类似的功能特性,因此他们假定这些神经元可能组织成某种功能单元,而称之为功能柱)。模型考虑了不同类型神经元在新皮层柱中的分布和密度,每个神经元又可能与好几千个神经元有联系。然而由于缺乏实验数据,具体如何连接只能是假设的。此模型能自发地涌现出与生物脑类似的高频脑电,成为他们的标志性成就。这一工作的完整版本于2015年在《细胞》(Cell)杂志上正式发表:历时20年,由国际上82位科学家合作,仿真了幼鼠体感皮层中相当于一个功能柱组织的一块1/3 mm3大小的组织(图7)[10]。他们也曾把100个这样的功能柱相互连接起来。
图7 数字重建鼠体感皮层微型回路[10]。(上)采集实验数据。(中)从解剖结构和生理电性质上重建硅神经细胞。(下)左图:当令钙离子浓度从低到高增大时,仿真结果得出网络在两种定性上不同的动力学状态之间翻转;右图:由仿真结果预测的生物实验结果
不过,他们构建人工脑的实质性的进展好像到此为止就一直踏步不前。虽然2009年他声称可以在3年内建立人工鼠脑,而如果能得到巨额资助的话,则可以在2023年建立起人工人脑。2012年,当他在争取以他为首的“人脑计划”(Human Brain Project,HBP)在欧盟的“未来和新兴技术旗舰计划(2013—2023)”立项时,他又一次重申3年内实现人工鼠脑,2023年实现人工人脑的承诺。2013年,他如愿以偿获得立项和10亿欧元的资助。不过以后的进展似乎始终踏步于神经元和功能柱的层次。两个3年都过去了,始终未见有人工鼠脑的报道。
人脑计划由于科学目标不现实、技术路线不可行、领导专横等原因而受到许多科学家的联名杯葛,经过调解委员会的调解,对领导机构和计划内容都作了根本性的改变。计划不再提建立人工人脑,马克拉姆本人也黯然下台,回到蓝脑计划。虽然蓝脑计划仍坚持原来的设想,不过从报道来看似乎在人工脑方面也无多大突破。
马克拉姆建立人工全脑的努力看来至少在现在并不现实,但是在简化形式下模仿生物脑的机制,构建在某些功能方面类似于局部脑的机器还是有现实可能性的。诺贝尔奖得主、美国科学家埃德尔曼(Gerald Edelman)(图8)的“仿脑机”(brain based devices,BBD)是这方面的一个例子。
图8 埃德尔曼(图片来源:维基百科)
埃德尔曼因为在免疫学方面的成就而获得1972年的诺贝尔生理学或医学奖,之后他转向脑研究,并且建立起自己的脑科学研究所,研究方向之一就是研发仿脑机。他开发了一系列仿脑机,并给这些机器起名“达尔文”,以纪念进化论和竞争选择学说的奠基人达尔文。这些机器根据脊椎动物脑的组织结构而建立,通过经验进行学习。与传统的机器人不同,“达尔文”系列机器是一种“选择系统”,而不是“指令系统”,也就是说它是通过从许多不同的仿真神经回路中进行选择来学习的,而不是按照事先编制好的程序指令来工作的。这样,这些机器可通过与环境的互动自行改变内部结构而学会一些复杂行为。例如,基于小脑模型结构的仿脑机采用预测控制可学会在两侧由交通锥隔离而成的路径中穿行(图9)。
他们开发了一系列仿脑机,这些机器与其说是为了解决实用目的,不如说是为了探索脑机制。这种机器的特点是必须在实际环境中执行某种任务。在开始时,仿脑机中的神经元是按照已知的解剖结构连接成回路的,但是在和环境相互作用的过程中,这些回路中的神经元之间的连接权重会按照某种奖惩原则发生变化。对每个仿脑机来说,这种变化的模式都是独特的,因为它们的经历不一样。用仿脑机来研究这种变化的优点是可以详细地研究所有的神经元、突触和回路的活动,而这在动物实验中是很难做到的。这也是他们开发系列仿脑机的初衷。
图9 达尔文机在路径中穿行。经过几次摸索,基于小脑模型结构的达尔文机就可自行学会在复杂的过道中行走而不碰到路边的东西[13]
达尔文机10号(它仿真了50个不同的脑区,有9万个神经单元和140万个突触连接) 模仿了海马及其周围脑区50个不同区域的解剖结构,能学会在迷宫中寻找目标。
把达尔文机10号放在一个迷宫中,迷宫的墙上涂有不同宽度的色条作为视觉线索(图10)。经过一番探索以后,它从任何起始点都可以凭记忆和墙上的线索直接走向某个隐藏着的目标(只有当机器正好位于这个地点时它才可以接收到一个红外线的奖励信号,这是它在其他地点用它的“视觉系统”所看不到的)。这实际上是模仿著名的所谓莫里斯(Morris)水迷宫实验:把老鼠放到一只盛满牛奶状液体的池子中,在液面下隐藏着一个老鼠看不到的可以安身的平台,老鼠在乱游一气之后,最后发现了这个平台而得以站在上面休息。池子周围的墙壁上画有不同的标记。经过几次尝试后,不论在什么地方把老鼠放入池中,它都会径直游向平台。但是如果破坏了老鼠的海马,它就再也做不到这一点了。如果在完成这样的训练以后暗中把平台移走,无论是达尔文机10号还是老鼠,都会在原来有平台的地点打转。对达尔文机10号训练完成后,埃德尔曼可以找到驱动机器运动的神经单位,然后追溯所有神经单位之间相互连接的类型和强度的变化过程,结果发现可能有大量各不相同的路径和回路都能最终导致这个驱动单位的活动。这就是他曾经对神经系统工作原理猜测过的“简并”(degeneracy),也就是说,不同的结构可以产生相同的输出。这一研究表明他的猜测很可能是对的,但要做类似的动物实验却很难。
图10 达尔文机10号在迷宫中找“看不见”的目标[12]。(左)示意图。中间的方框表示迷宫,其右上角的圆圈表示“看不见”的目标,四周的彩色条表示在迷宫四边墙上显示的图形标记;数字表示在4次实验中,达尔文机(中心的图标)的4个不同的出发点。(右)实际情形
仿脑机的独特优点就是这种脑模型能主动从和环境打交道的过程中进行学习,这克服了以往的脑模型只是被动地接受程序员外加给它的信息的根本缺点。埃德尔曼希望他的达尔文机不仅有助于阐明神经系统的活动机制,而且也可以付诸实际应用。不过从现在的实际情况来看,尽管他的仿脑机对工程技术会有启发,但是试图完全拷贝脑机制解决工程问题未必实际可行。现在的自动驾驶汽车并没有采用仿脑机的路线,用的还是人工智能技术就是一个例子。不幸的是,埃德尔曼在2014年与世长辞,仿脑机研究失去了一位主要的推动者。
人工脑和仿神经结构工程引起了人们极大的兴趣,近年来一些著名大学和公司的实验室正在竞相开发各种各样的仿神经结构芯片,如何评价这些研究还存在着很大的争论。这里笔者只是说一下自己的思考,供读者参考。
从目的上来说,这些研究有两个虽联系密切但是依然很不相同的方向:一个方向是为了解决工程上的实际问题,向脑学习,开发新一代的智能机器和计算机,特别是在模式识别、运动控制方面做到速度快、能耗少;另一个方向则是为了认识脑的工作机制。在笔者看来,由于目的不同,其技术路线也应该大不相同。大自然并不是一位“工程师”,而是一位“修补匠”。大自然从来也不从头设计一个系统,而是在进化的基础上针对新的环境变化修修补补,只求机体能够适应环境而得以生存延续,不求最优。大自然并非顶层设计,也不追求元器件标准化,而是求助于多样化,通过竞争优胜劣汰。既然有这样本质的不同,因此工程应用不可能也不应该照搬或者在一切细节上都拷贝脑,而应该从脑功能及其机理中寻求启发,用工程上可行的方法来实现。可惜人们往往忘了或不注意这一点,盲目要求拷贝脑。
2009年,当莫德哈宣称在计算机上仿真了一个和猫脑规模相当的神经网络时,马克拉姆怒气冲冲地给IBM的首席技术官(CTO)迈耶森(Bernard Meyerson)发了封信,并抄送给许多媒体。信中声称:“您告诉我上次当莫德哈愚蠢地声称仿真了鼠脑时恨不得把这家伙倒吊起来。我以为在我们小心地进行蓝脑研究以后,记者们应该能认清IBM的报道纯属欺骗,哪里有什么猫脑规模的仿真啊,他们完全被这些谎言骗倒了。……只不过是一些点神经元。……如果计算机足够大,要想仿真10亿个相互作用的点神经元并不算什么事。……全世界没有一个合格的神经科学家会认为这和猫脑相近。……我真希望有一个道德委员会把这个家伙倒吊起来。”其言辞之激烈令人咋舌。除了竞争IBM资助这一利益驱使之外,混淆不同类型的研究也是原因之一。固然莫德哈的仿真并不能说是人工猫脑,但是说这是一个规模和猫脑相当,并用简化神经元构造网络来解决工程问题的尝试却并无大错,至少并没有犯下应该倒吊起来的大罪。
笔者最后想对人工脑和仿神经结构工程的前景提几点想法。
从欧盟人脑计划的浮沉看来,现在要想完全自下而上地从基因组和离子通道起始,一路往上保留生物脑的所有细节重建人工人脑,时机还不成熟。另外,即使详尽如马克拉姆的模型,许多重要因素因为还不清楚而无法考虑在内,如比神经元数目还要多10倍的胶质细胞。脑还有大量的秘密尚未揭开,而不是只有某些缝隙有待填补,现在还没有一个哪怕粗线条的脑理论。现有计算机的高能耗也使这样大规模的仿真不切实际。另外,这样的思路会不会使模型陷入过多的细节,“只见树木,不见森林”,反而看不清背后的总体规律?其实,马克拉姆对其中的一些问题恐怕也不是完全不知道,他在2009年的蓝脑计划网站上就说过:“以目前和可预见的未来的计算机技术而论,看来还不大可能仿真一个精确到细胞和突触复杂性(分子层次以上)的哺乳动物的脑。”对于“你相信可以用一台计算机来真实地仿真人脑吗?”他的回答是:“这个可能性很小,也没有这个必要。要这样做是非常困难的,因为脑中的每个分子就是一台功能强大的计算机,而我们得仿真以百万兆计的分子的结构和功能,还得仿真这些分子相互作用所遵循的全部规律。你至少需要比现在大一百万兆倍和快一百万兆倍的超级计算机。哺乳动物自己就能繁殖,我们无需用计算机来复制哺乳动物。这不是我的目的。我们只是想认识生物系统是如何工作的,又为什么会失常,这将造福于人类。”到2012年他申请“人脑计划”时完全改变了口气,恐怕只是申请大基金的策略吧!
当然,笔者并不否认蓝脑计划或人脑计划对建模和仿真方法的强调,也不否认通过这些方法把大量实验数据跨层次地组织起来的重要性,只是这里有个“度”的问题。一般说来,层次以两三个为宜,对更多层次的模型研究,所考虑的关键变量要少。过多的参数将使研究者可以得出任意他所想要的结果而失去了仿真的意义。
“仿脑机”只集中在仿真脑的某些局部,这可能更为现实。不过由于埃德尔曼的去世,这一工作似乎已经陷入停顿。类似研究是否会有光明的前途值得关注。
仿神经结构芯片已引起大公司的关注。用脉冲神经元取代门电路作为基本单元,在降低能耗上已取得了明显的进步。最近用真北芯片执行深度学习的成功,也反驳了以前对仿神经结构芯片不能实现认知功能的批评。不过这些芯片目前使用的只是深度学习的早期版本,精度较低。弗伯在总结仿神经结构芯片的现状时说道:“现在已经做出了仿神经结构芯片,你可以得到和使用这种芯片。但是其用户的规模还相当小,主要是大学和产业的研究小组,而且使用它还需要相当的专业知识。目前还没有令人信服的大众应用实例能表明仿神经结构技术优于其他同类技术。”也许这种技术首先将在对能耗要求很高的场合找到应用,至于它能否发展成新一代计算机,则在很大程度上取决于其造价能否与传统计算机竞争,特别是有多少人愿意放弃已经驾轻就熟的传统技术,而彻底改换门庭重新投资这一新技术。