孟祥飞:怀揣一颗振兴中华的心
——国家超级计算天津中心应用研发部部长
他带领团队不断探索创新,研发出中国第一台世界第一的超级计算机——天河一号。从被质疑中看不中用的“大游戏机”,到真正能“算天算地算人”的“国之重器”。
1946年,世界上第一台计算机叫ENIAC,它诞生的时候占地170平方米,相当于两个教室那么大。它的功耗有150千瓦,而它的计算速度是每秒5000次。当然,相比我们人类已经挺快了。但是,现在我们小小的智能手机,它的功耗不到1瓦,而它每秒钟的计算速度可以达到几十亿次,这是计算机的发展速度。实际上,超级计算机更是突飞猛进,它的计算能力在指数级增长,甚至超出了科幻作家的“脑洞”。刘慈欣的《三体》中提到一个世界上当时最快的计算机每秒钟能计算500万亿次。而在2010年,我们“天河一号”问世的时候,它的计算速度已经是《三体》里计算机速度的10倍。现在,我们最快的超级计算机叫“神威·太湖之光”,它的计算速度每秒达到9.3亿亿次,是《三体》里这台计算机性能的186倍。
我们周围充斥了各种计算机,为什么还需要超级计算机?可以简单地拿步枪和大炮做一个比喻,普通的计算机就像步枪,灵活实用。但是要去攻城拔寨,就需要大炮,超级计算机的作用就是来攻城拔寨。2016年,有一个人工智能横空出世,就是AlphaGo。2016年,它以四比一的成绩击败了李世石,今年又击败了柯洁。AlphaGo为什么有这样超强的能力?首先是因为新的人工智能算法的更新推动了AlphaGo的能力,同时它后台的超级计算给它带来超强的算力,成为它重要的一个支撑。AlphaGo的后台,具备千万亿次的一个计算能力,也就是说,它工作1小时,相当于中国13亿人上百年的工作量。所以说,人要是跟它拼速度,那可能跑断腿、跑掉鞋也难望其项背。超级计算,在AlphaGo里的应用只是一个小小的例子。
超级计算在很多领域都有它的重要价值,简单概括成“算天”、“算地”、“算人”。“算天”是什么?就是天气预报,同时研究宇宙起源和演化的能力;“算地”是什么?也就是算地质的演化,还有油藏等地下能源的勘探,我们把它比喻成“给地球做CT”;“算人”又是什么?基因数据是一个庞大的数据群,我们需要用超级计算机来进行基因大数据的分析,来揭示人类基因的密码。所以说,超级计算是解决人类和社会发展重大问题的一个“超级利器”。
我国的超级计算机来得没那么容易。世界上第一台超级计算机是1976年美国研制成功的,而我们开启超级计算机研制的步伐是在1978年,我们跟世界基本同步。但由于我们研发设计的基础非常薄弱,制造能力也有限,所以长期以来,我们的超级计算机研制都处在一个“跟跑”的状态。在这个领域,非常有代表性的一个故事叫“玻璃房子”。当时我们的中石油、国家气象局需要超级计算机,花高价从国外的一些机构购买了超级计算机。但买回来以后,要建独立的机房,把数据交给他们,由他们的工程师进入机房进行数据处理,我们自己的人员只能隔着窗户看一下这台超级计算机。讲到这里,我不知道大家是什么感触。
2007年后,在国家重大专项的支持下,在天津滨海新区开始启动我国第一家国家级超算中心的建设。我毅然加入到这个筹建当中的团队,当时我们六、七个人连办公室都没有,大家吃、住、办公都挤在一个两居室的公寓里。2010年,我们开始正式安装调试“天河一号”系统,全面安装时已经进入到七、八月,外面30多摄氏度,因为没有空调,机房里40多摄氏度。大家累了就躺在我们设备的大纸箱子上休息一下,醒了再接着干。用了7个月左右的时间完成了别人要一年多才能完成的工作。
2010年11月17日,喜讯传来,“天河一号”取得了世界第一的突破。我们觉得心潮澎湃,有一些老专家,因为他们经历过整个发展过程,他们觉得“天河一号”就是一个“争气机”。
说实话,幸福的时光总是短暂的。在“天河一号”取得世界第一不久后,质疑的声音又接踵而来。当时很多国内外专家和媒体质疑中国的“天河一号”是一台为排世界第一而造的超级计算机,中看不中用,甚至有专家调侃中国的“天河一号”实际上就是一台大游戏机。我怒了!我给我们主任立了个小军令状:干不好“天河一号”的应用,我卷铺盖卷儿走人!拉弓没有回头箭,只能拼了。我们面临的第一个挑战就是如何将自主的技术与原来传统的应用相兼容。“天河一号”刚开始运行的时候,我们部署一套国际上药物研发领域的一个通用软件,遇到了非常严重的不兼容问题。用了20多个日夜、上千次的调试、编译,在里面寻找问题,最终把不兼容的问题解决了,保障了我们“天河一号”在药物研发领域的应用基础。现在再看我们的“天河一号”,每天完成近万项的任务,这种应用规模实际上是很多欧美超算中心都很难达到的。我们现在的“天河二号”、“神威·太湖之光”等这些超级计算机都在国家的科技创新和产业领域发挥着越来越强大的作用,所以说我现在更兴奋。
实际上,创新并不都是艰苦卓绝或者“高大上”的,有的时候创新也来自于我们日常的生活。2012年,我们做了一个海洋动力学计算的软件优化,我们遇到了一个非常严重的问题:随着并行计算规模的扩大,用的CPU越来越多,数据开始出现严重拥堵的问题。这是个什么概念呢?比如一个超级大工厂,它的每一个车间生产能力都很强,能生产出各种产品,而这些产品在运到仓库存放的时候都堵在了仓库门口,所以说车间就只能“歇菜”了。如何解决这个问题?当时我经常出差,发现在车站人流密集的地方,会把一个大的进出口用安全栅栏隔离开,分成很多小的通道,提升了通行的效率。这个设计启发了我,我回去把我们整个数据的输出分成很多通道,把我们数据的存储效率提升了大概一倍。通过我们不断地积累和创新,不仅在高端芯片方面形成了完整的产品体系,同时为我们国家的信息安全也提供了坚强有力的保障。
我们说,青年兴则国家兴,青年强则国家强。超级计算机领域的老一辈奠基人慈云桂教授,当时在承接我们第一代自主超级计算机“银河一号”的时候,他说:“拼上这条老命也要把我们中国自主的巨型机研制出来。”而现在青年一代的科学家可能不用再像老一辈科学家那样去筚路蓝缕,但是我们同样有一颗振兴中华的心,我想我们新的青年一代将不辱新时代的历史使命。
李雪源据央视综合频道《开讲啦》节目整理