肖利民 阮利 沈润楠
“超级计算”一词,首次出现在1929 年美国《纽约世界报》的“IBM 为哥伦比亚大学建造大型报表机”新闻报道中。“超级计算机”是指具有极快运算速度、极大存储容量、极高通信带宽的有“超级计算”能力的计算机,它可以解决石油勘探、工业设计、气象预报、地震预测、新药研发、武器模拟、基础科研等领域的挑战性问题,对经济发展、科技创新、社会进步、国防建设具有重要意义。超级计算机是国家科技发展水平和综合国力的重要体现,因此被列为“国之重器”。全球超算TOP500 和中国HPC TOP100 分别维护着世界和中国速度最快的超级计算机性能排名榜单,是超级计算机发展的晴雨表。
无所不在的“国之重器”
作为“国之重器”,超级计算机长期以来用于高科技领域和尖端技术研究,我们日常似乎不常听到、不常见到它。但实际上,超级计算机一直与我们的工作、生活息息相关。
在科学研究中,超级计算机常被用于模拟和预测复杂的物理化学过程,帮助科学家更好地探索自然规律和人类奥秘。比如,中国科学技术大学在新一代“神威”超级计算机上的应用成果获得首届“ACM 戈登·贝尔气候建模奖”提名,通过超级计算机强大算力支撑的火山喷发和大气环流跨圈层模拟系统,成功捕捉到了火山爆发从冲击波、地震、海啸、蘑菇云到随后6-7 天火山灰和水汽的运动扩散特征, 初步获得了火山、地质和大气全耦合的相互影响效应。
在工程建设中,超级计算机被用于开展工程结构分析、模型仿真等,帮助人类更好地理解和改造世界。比如,“神威·太湖之光”助力“天宫一号”空间站研制过程,开展飞行器在复杂空间环境条件下的结构强度仿真分析,模拟空间站的空间飞行状态和大气返回状态,特别是回收时重入大气的陨落飞行绕流情况,并配合大风洞实验,为“天宫一号”的设计制造提供了重要的数据支撑。
在日常生活中, 气象预报同样离不开超级计算机的支撑。我国自主研发的数值天气预报系统GRAPES 在超级计算机上昼夜不停地运行,通过对地表大气进行网格化分割,在中国大地上划分了近四百万个网格点,分析地基和空基观测的气温、气压、湿度等大气数据,构建大气运动方程组,利用超级计算机的强大算力,准确预报全国各地的天气情况。
当下,世界各国在超级计算机领域的竞争日益激烈。尽管我国已跻身超算强国之列,但发展之路并非坦途,从无到有、从受制于人到实现自主可控,可谓传奇。
从零基础到世界领先
超级计算机起源于20 世纪50年代,当时计算机的体积非常庞大,但性能却十分有限。为解决更复杂的问题,美国国防部启动了世界上第一个超级计算机项目,超级计算机的概念也随20 世纪70 年代初的第一代向量计算机而逐渐成熟。1976 年,美国Cray 公司推出首台运算速度达每秒2.5 亿次的超级计算机,在世界掀起了研制超级计算机的热潮。
中国超级计算机自主研制始于1978 年。时年3 月,在全国科学大会上,邓小平提出了“中国要搞四个现代化,不能没有巨型机”,开启了我国超级计算机的自主研制进程。40 多年来,在国家高技术研究发展计划的支持和引导下,国防科技大学的“银河”“天河”系列、中国科学院计算技术研究所和曙光公司的“曙光”系列、联想集团的“深腾”系列及无锡江南计算技术研究所的“神威”系列陆续研制成功。中国超级计算机事业逐步走向可与美日比肩的发展水平。
在挑战中寻求发展
超级计算机是计算机界的“超人”,其“超能力”主要依赖于有超强计算能力的计算“心脏”(由大量高速计算结点构成)、有超大存储能力的存储“大脑”(由大量高性能存储结点构成)、有超快数据传输能力的网络“血管”(由负责连通大量计算结点、存储结点等的高速互连网络构成)以及强大的输入输出设备“眼口”(由大量输入输出结点构成)。同时,也依赖于各种超算软件和中间件。超级计算机的计算能力极其强大,举例来说,我们常用的个人电脑,运算速度通常为每秒数万亿至数十万亿次,而“神威·太湖之光”的峰值性能可达每秒12.5 亿亿次,持续性能为每秒9.3 亿亿次。一台“神威·太湖之光”的计算能力相当于上万台个人电脑之和。
当然,仅靠堆砌足够数量的个人电脑无法达到超级计算机的实际运算速度,因为缺少系统总体均衡设计及高速互连网和系统软件等关键技术的加持。可见,打造最强的超级“心脏”“大脑”“血管”“眼口”,是超级计算机研制的关键。它的研制过程涉及计算芯片研制、各类结点机研发、多种互连网研发、系统软件研发及系统集成联调测试等诸多环节,是复杂的系统工程。在超级计算机的运行与应用过程中,系统功耗巨大,应用编程复杂等问题也很突出。
除了要克服各种科学和工程问题外,我国还要应对他国在超级计算机方面对我们的限制和打压。尽管这给我国超级计算机的发展带来了阻碍,但也凝聚了共识——必须要突破核心技术,实现超算产业链的自主可控。
( 作者单位: 北京航空航天大学计算机学院)