李璐璐
2022年5月7日,陳云霁展示由他带领团队研制的“寒武纪1号”芯片。
在联系近一周之后,陈云霁才挤出时间接受了采访。见面时,这位中科院计算技术研究所研究员正忙着编程序,办公桌旁是一张折叠床,侧面墙壁的白板上写满了各种结构图。目前,陈云霁正带领团队全力攻克处理器设计的共性技术壁垒。“一直在忙,每天都搞不清楚是星期几!”他笑着说,“但只要把研究当成兴趣,也不觉得累。”这位“80后”科学家,已在国产处理器芯片研制领域耕耘了20余年。
“让计算机更聪明”“让机器更好地服务人类”……这是陈云霁科研路上的梦想和追求。这份梦想在儿时便埋下了种子。“我小时候喜欢看书,家里书架上有很多工程、历史类的书籍。”陈云霁说,“我也喜欢玩游戏,街机、‘星际争霸’等玩了不少。”渐渐地,他对计算机产生了浓厚的兴趣。
兴趣和求知欲驱动的探索习惯为陈云霁的科研之路打下了良好的基础。陈云霁从小在数学上展现出了过人的天赋,三年级时就学完了全部小学数学课程,9岁小学毕业时已经把初中数学课程学完,同时考上了南昌十中的少年班。
14岁时,陈云霁考入中国科学技术大学少年班。大三时,他把计算机系所有实验室的门敲了一遍,问是否接收本科生。最终,教计算机体系结构的周学海教授所在的实验室收下了他。在研发过程中,尽管做的都是些打下手的“杂活”,却让陈云霁感受到计算机的巨大魅力。2002年,陈云霁如愿以偿来到了中科院计算所,跟随胡伟武研究员硕博连读。当时,计算所正在研制国产通用处理器(龙芯1号),陈云霁成为当时龙芯研发团队中最年轻的成员。博士毕业后,陈云霁顺理成章留在了计算所,成为8核龙芯3号的主要架构师。 “龙芯3号与龙芯1号、2号有所不同,已从单核发展到多核了。”陈云霁解释说,“好比以前一桌菜给一桌客人吃,现在一桌菜要给8桌客人吃。”
在资源十分匮乏的条件下,陈云霁和同事们边干边摸索,提出访存协处理器结构,有效缓解了龙芯3B运算带宽比问题;提出片上多核处理器的有界误差全局时钟理论,解决了多核处理器验证和调试的一系列难题,保障了龙芯3号的研制。研究成果论文被体系结构领域旗舰会议HPCA(高性能计算架构国际研讨会)录用,这也是HPCA上第一篇第一作者来自中国大陆的论文。2013年,时任中科院计算所所长孙凝晖让年仅30岁、只做了1年研究员的陈云霁作为学术带头人主导智能处理器基础研究。
2010年,以深度学习为代表的人工智能技术在全球范围内飞速发展,然而,智能算法规模快速增长,硬件系统的发展仍异常缓慢。为了解决这个矛盾,研究计算机架构的陈云霁与计算所研究人工智能的同事展开了交流合作。“未来的智能计算系统应该是什么样的?”成为了陈云霁每天思考的问题。
科研路上,弟弟陈天石也来到了他的身边。陈天石同样毕业于中科大少年班。2007年,陈天石作为客座博士生从中科大来到了计算所,研究方向是人工智能算法。一个做硬件、一个做软件,兄弟俩决定联手做人工智能和芯片设计的交叉研究。这是他们年少时的一个想法:“做一个东西让计算机更聪明,终极目标像人一样聪明”。
当时,人工智能研究正处于低谷期,人工智能和芯片设计的交叉研究更不被业内人士认可。学生们担忧:做完研究,发不出论文是不是没法毕业?项目申请也不顺利,兄弟俩只能在日常工作之余开展研究。他们经常吃过早饭就坐在电脑前不间断地工作,等感觉饿了已是晚上。熬夜是家常便饭,累了就在折叠床上囫囵一觉……他们先后提出一系列基于人工智能方法的处理器研发技术,多次向体系结构顶级会议投稿,但都一一被拒。“困难一个接着一个,但问题解决之后的喜悦是常人无法体会的。”陈云霁说。
陈云霁( 右一)与龙芯研发团队成员合影(2007年1月1日摄)。
2022年5月7日,陈云霁(前右)与科研团队。
功夫不负有心人。2014年,他们研制的国际上首个深度学习处理器芯片与电脑主板成功连接,能效达到传统芯片的近百倍,圆满实现预期目标。在美国盐湖城召开的国际计算机体系结构支持、编程语言和操作系统国际会议(ASPLOS)上,陈云霁与法国国立计算机及自动化研究院的奥利弗·特曼教授合作的“一种小尺度的高吞吐率机器学习加速器”,获得了最佳论文奖。这是中国内地科研机构首次在计算机系统和高性能计算领域顶级国际会议上获得最佳论文奖,也是亚洲首次、美国之外国家第二次获得ASPLOS会议的最佳论文。以“DianNao”和“DaDianNao”中文拼音命名的深度学习处理器架构正式出现在了计算机体系结构的国际舞台上。参加国际会议时,陈云霁一遍遍地给外国同行纠正发音,他自豪地说:“之前没有中文发音的芯片,我们借此也传播了中国文化。”
2021年7月27日-28日,第二十三届中国科学技术协会年会在北京召开。图为陈云霁在闭幕式上作《深度学习处理器》主旨报告。
这之后,陈云霁全身心投入实际芯片研发,挑战深度学习处理器芯片。他带领團队突破深度学习处理器设计中的规模、适配、能效三个核心挑战,最终,研发出国际首个深度学习处理器芯片“寒武纪”。“‘寒武纪’是显生宙的开始,希望能开启人工智能的新纪元。”陈云霁说。“寒武纪”诞生的那一刻,陈云霁高兴地随手抓起身旁的拖把,和身边的同学们即兴表演了一段“棍棒舞”。
2018年2月,世界权威学术期刊《科学》杂志刊文称,寒武纪的一系列成果为深度学习处理器领域作出了“开创性贡献”,陈云霁和他的团队被评价为该领域的先驱和引领者。陈云霁也被评为2015年度全球35位杰出青年创新者。
回顾科研生涯,陈云霁说:“从导师胡伟武身上,不仅学会如何设计芯片,更明白了一个深刻的道理,科学研究从来没有捷径可走,需要苦干实干。 ”
历时十余年,深度学习处理器芯片已经应用在数千万智能终端上,涉及智能手机、可穿戴设备、无人机和智能驾驶等多种场景。
除了研发强大的人工智能处理器,陈云霁尤为看重人工智能时代的生态布局。“开发芯片的同时,我们提出了一种与通用计算完全不同的指令集。”陈云霁解释,指令集就是电脑硬件与软件之间互相“对话”的语言,是构筑信息产业生态的基础之一。以往信息产业主要应用X86和ARM两种指令集,大部分软件和应用程序都以此为基础开发——这让所有后来者难以在传统信息产业中做大做强。
“我们原来在这方面几乎没有发言权,但智能时代给了一个机会。”陈云霁说,“我们已经迈出第一步,未来或许能够建立起开放共赢的信息产业新生态。”他经常用自己的经历启发学生:“不要为了发论文而一味去追逐热点,要努力去做那些未来有前景、现在没被关注的方向。”
即使硕果累累、荣誉加身,对于陈云霁而言都已经是过去时,如今的他,仍然奋斗在智能计算系统研究的前线。“科学技术的发展路径往往会出人意料。未来50年,计算机的计算能力将达到人类大脑的几十亿倍。智能硬件在提升计算能力的同时,也在推进着智能算法的快速发展。近乎无穷的计算能力也许会革新当前符号主义主导或联结主义主导的已有智能计算范式,带来人工智能能力的跨越式提升。”陈云霁说,“作为一名科研人员,做未知领域的科研探索会很孤独,特别是做别人没有做过的无人区,会更加孤独。但是,在我看来,有科学理想的人应该偏离一般意义的最优路径,有勇气探索冷门、未知的领域,人工智能的星辰大海是他值得投入全部精力去探索奋斗的毕生事业。”
陈云霁喜欢引用茨威格在《人类群星闪耀时》的一段话:“一个人生命中最大的幸运,莫过于在他的人生中途,年富力强的时候,发现了自己的使命。”他说:“能把兴趣和工作结合在一起,我感觉特别幸运。”
1983年出生于江西南昌,中国科学院计算技术研究所副所长,研究员,博士生导师。主持的项目“深度学习处理器体系结构新范式”获2020年度国家自然科学奖二等奖。2022年,获得“全国五一劳动奖章”。