人类追求类脑智能已经长达一个世纪,至今的AI应用所拥有的智能离真正的目标还很遥远。人类大脑低功耗的信息存储、处理和传输功能燃起全球科学研究在开发类脑计算芯片上的巨大热情。类脑计算是借鉴人脑科学的基本原理,面向通用人工智能,基于神经形态工程的新型计算技术。目前,美国、欧盟、日本、中国等国家和地区都在开展类脑计算的研究,主要在推进的类脑计算芯片有IBM的TrueNorth,Intel的Loihi、BrainScale、SpiNNaker、Neurogrde,清华大学的“天机芯”等。正如清华大学类脑计算研究中心主任施路平教授所言,现在全球类脑计算研究可谓处于“春秋战国”时期,所选择的技术路径有较大不同。
2012年,清华大学就瞄准未来人工智能发展的前沿,通过人才引进布局类脑计算。2014 年,清华大学依托精密仪器系,联合计算机、微电子、电子、自动化、材料、生物医学共计7个院系,成立了多学科深度交叉融合的类脑计算研究中心,由清华大学原光盘国家工程研究中心主任施路平,组建了由不同学科领域专家组成的研究团队,从基础理论、神经形态器件、类脑芯片、类脑软件、系统和应用等方面对类脑计算进行全面研究。
2015年,类脑计算研究中心研发团队研发出第一代类脑计算芯片,命名为“Tianjic”(天机芯),芯片的制程约为110纳米,有6个功能核,1000多个神經元,运行频率不是太高。主要是进行原理和架构的验证,算是一个DEMO(小样)。
2017年,团队研发出第二代“天机芯”芯片。第二代“天机芯”芯片具有高速度、高性能、低能耗的特点,制程缩小至28纳米,由156个功能核FCore组成,包含约4万个神经元和1000万个突触,面积为3.8毫米×3.8毫米,采用了传统的集成电路工艺。相比当时世界先进的IBM的TrueNorth芯片,其功能更全、灵活性和扩展性更好,密度提升20%,速度提高至少10倍,带宽提高至少100倍。2019年8月,第二代“天机芯”芯片在世界顶级学术杂志《自然》封面亮相,标题为《双重控制》(Dual Control),被作为人工通用智能领域的一个重磅应用案例进行展示。
2021年5月底,第三代“天机芯”芯片问世,制程进一步缩小至14纳米,包含百万个神经元。与第二代芯片相比,其性能有了大幅度提升,可以更好地应用在自动驾驶和智能机器人等领域。这表明清华大学类脑计算研究走在了世界发展的前列。
据清华大学“天机芯”芯片研发团队马骋副教授介绍,“天机芯”芯片为异构融合类脑架构,主要目标是人工通用智能,同时支持机器学习算法和类脑电路,并可支持神经科学发现的众多神经回路网络和异构网络的混合建模。而实现上述两类模型深度高效融合是天机芯片设计中最大的挑战,因为两类模型所使用的语言、计算原理、编码方式和应用场景都不相同。
天机芯芯片可以分别运行两类比较常见的模型,一类是人工神经网络(ANN),一类是脉冲神经网络(SNN),来进行建模。这两类模型的算法技术路线相似,都是由轴突、突触、树突、包体等基本模块组成的。区别主要在脉冲或者是结果发放上,脉冲神经网络是以脉冲发放进行运算,神经网络是基于黏性进行运算。研发团队考虑把两者有可能共用的模块作为共享的单元,实际上就是通过一个融合的方式,在一个结构上实现两类算法的计算。
天机芯芯片的基本运算单位是功能核。功能核的第一部分是轴突,用来实现输入信息的缓存,同时对延迟的时间进行调整。第二部分是树突,是功能模块的核心运算单元,可以进行所有的基本运算,其组成是层加器的增列。加上该部分还要进行大量缓存,因此,树突部分占用芯片30%的资源,功耗也是最大的。第三部分是包体,主要是实现神经元输送的信息的相应功能,如ANN的激活函数、SNN产生的脉冲信息;还有一些与输出相关的功能,如磁化、片子和泄露等。不同功能核可以实现特定的运算功能,多个功能核集成则可进行大规模的运算。不同功能核由路由部分进行连接,可以实现点对点的数据传输,实现循环反馈,还可以实现临近域的突破。由于芯片是异构融合的,因此可以实现ANN和SNN的混合应用。整体构成一个片状网络,形成一个完整的芯片。像第二代“天机芯”芯片就由156个功能核组成,构成一个12×13的布局。一个天机芯芯片加一个控制器构成一个单芯片类脑计算系统。单芯片资源比较少,正常应用会由单芯片组成阵列,构成一个类脑计算单元。
具体的天机系统也是一个异构的系统,是由类脑处理器和传统的冯·伊曼架构共同构成的。所以,其既可以处理传统的计算机领域的问题,也可以处理传统计算机处理不了的一些更为复杂的问题。可以说,其应用前景非常广阔。