张云泉,袁良,袁国兴,李希代
1.中国科学院计算技术研究所,计算机体系结构国家重点实验室,北京 100190
2.北京应用物理与计算数学研究所,北京 100088
在国际上,自1993年起每年都会按Linpack的测试性能公布在世界范围内已安装的前500台高性能计算机排行[1],成为高性能计算机研制生产、市场发展、应用交流和趋势分析预测的重要参考。在2002年之前,我国的高性能计算机未曾向国际申报Linpack 性能测试结果,故而未列入国际TOP500排行榜。在中国软件行业协会数学软件分会发布首次中国高性能计算机排行榜的2002年当年,就实现了零的突破。在中国TOP50 排行榜中名列第一的联想深腾1800万亿次机群名列2002年世界TOP500第43名,结束了在世界TOP500排行榜没有国产高性能计算机的历史。2003年,在中国TOP100排行榜中名列第一的联想深腾6800万亿次机群名列2003年世界TOP500第14名,达到了国产高性能计算机的历史新高。2004年,在中国TOP100排行榜中名列第一的曙光4000A更是取得了6月份TOP500排行榜世界第十的历史性突破,引起世界关注。2010年9月发布的国产天河一号A 千万亿次超级计算机通过采用先进的CPU+GPGPU的异构混合加速体系架构,以2.56PFlops的Linpack性能夺取2010年11月国际TOP500排行榜的第一名,是中国国产超级计算机首次夺得世界冠军;我国安装的超级计算机的上榜数量也首次超越日本和欧盟,排名世界第二,仅次于美国,标志着我国超级计算机硬件的研制水平达到国际领先水平。2013年,我国的高性能计算机科研工作者戒骄戒躁,刻苦攻关,勇攀高峰,于2013年6月凭借由国防科大研制的天河二号超级计算机,再次夺取世界TOP500第一名。迄今为止,中国研制的天河系列超级计算机已经七次夺取世界第一,天河二号更是取得了六连冠的辉煌成绩,牢牢站稳了中国在世界TOP500超级计算机冠军俱乐部中的位置。安装在中国大陆的超算系统在2016年6月和11月的TOP500上的数量再创历史记录,6月份在历史上首次超过美国,排名世界第一且11月份继续保持与美国持平;而联想生产的超算系统上榜数更是历史性的首次闯入世界前二强,仅仅排在第一名美国HPE 之后。中国的超算系统研制水平和能力经过十多年的快速发展,已经跻身世界先进水平的行列。2016年,中国超级计算系统不仅连续八次夺取TOP500世界第一,连续两次夺取TOP500数量冠军,更是在SC2016年首次获得戈登贝尔奖。更为可喜的是,中国科技大学由安虹教授带领的大学生团队更是代表中国一举夺得世界大学生集群大赛的Linpack 单项冠军和总冠军,2016年对于中国超算界来说,可以骄傲的称之为“中国超算大满贯年”。2017年,中国超级计算系统继续保持上升势头,太湖之光继续领跑,与“天河二号”一起连续五年共十次夺取TOP500世界第一,创下新的历史记录。中国团队在SC2017年再次获得戈登贝尔奖。2018年11月公布的TOP500榜单中,我国以227台数量远超第二名美国的109台。我国联想制造的超算系统达到140台,位列厂商第一,浪潮和曙光分别以84台和57台位列二三名,三家厂商占据281台超过一半,出口54台。2019年11月公布的TOP500排行榜中,我国继续以228台数量远超第二名美国的117台,其中联想达到174台,较之去年又有大幅提升,曙光和浪潮以71和66台位居二三位,三家单位合计311台,这充分说明了我国超算发展已经牢牢占据领先地位。TOP500超级计算系统作为计算科学的必备基础设施,已经成为国家之间的战略必争点和创新转型的利器,各国都投入巨资争夺世界制高点,以超级计算机系统为核心的算力经济时代已经到来。经过三十年的快速发展,中国研制超算系统的能力已经跻身世界先进水平的行列。美国虽然仍是世界超算的强国,但是其在TOP500上的数量已经降低到不足25%的份额,难以恢复二十年前独霸世界TOP50070%系统的盛况。
此次测评按国际惯例选用Linpack 测试(HPL)[2],2008年9月底发布最新的2.0 版本。本文给出对中国计算机学会高性能计算专委会于2019年11月发布的中国高性能计算机性能TOP100排行榜[3]数据的深入分析与展望。文中的图表数据主要来源于中国HPC TOP100。以下将中国HPC TOP100简称中国TOP100[3-7]。
图1 中国高性能计算机年度性能发展趋势(2002-2019) Fig.1 The performance trend of HPC TOP 100 (2002-2019)
本节图1和表1分别给出的是中国TOP100的总体性能发展趋势图以及TOP10 计算机情况的列表。
表1 中国TOP100排行榜TOP10(2019.11)Table1 The top 10 systems (2019.11)
和2019年11月发布的世界TOP500高性能计算机的情况相比较,可以看到:
(1)2019年11月世界TOP500总Linpack 性能达到了1646PFlops,是2018年1414 PFlops的1.16倍,增速较之去年的1.67倍有较大幅度降低;根据2019年中国TOP100排行榜的数据,中国TOP100的总Linpack 性能是347.1PFlops,是2018年307.8PFlops的1.13倍,增速从去年的1.37倍速降低到1.13倍速。这说明世界超级计算的发展速度有所降低。
中国研制的“神威· 太湖之光”超级计算机,以93PFlops的Linpack 性能,蝉联了四次世界TOP500冠军,使得中国研制的国产超级计算机在世界TOP500的冠军位置上保持的次数达到了历史性的十次!2018年美国制造的两台超算系统Summit和Sierra 超过神威太湖之光,其中Summit 峰值达到200PFlops,Linpack 性能首次突破百P 达到143PFlops,Sierra 仅以微弱优势超越神威太湖之光获得亚军。2019年神威太湖之光依然继续保持世界季军的位置。
(2)进 入2019年11月份,世界TOP500机器的Linpack 性能都超过了1142Tflops;进入2019年,中国TOP100机器的Linpack 性能都超过了1556TFlops,中国排行榜的上榜门槛再次超过世界TOP500。中国TOP100中有98个系统是机群,机群体系架构的数量继续保持绝对数量优势。其中采用异构加速体系架构的机器数量达到了27套,且由过去的集中在前几名和比较大的机器,变为分散在TOP100中,这样的变化表明随着深度学习等大数据应用的普及,GPU加速的异构体系结构获得了更广泛的应用。
(3)世界TOP500中TOP 10的最低性能都超过18PFlops;其中2台由Cray 公司制造,IBM为3台,国家并行计算机工程中心、国防科大、日本富士通公司、联想和DELL 各1台。高端能力超算(TOP10)的研制呈现出几家独大的局面,中美日欧都在积极占领制高点,且都发布了2021年左右的E级超级计算机研制计划,抢占下一个制高点。中国TOP100中,TOP 10的最低性能大于2.56Pflops,其中国防科大4台、神威2台、联想6台。
(4)世界TOP500上的474套系统使用Intel 处理器,依然保持94.8%的高比例。采用异构加速体系架构的系统数量再次上升,从2018年的138套上升到145套。中国TOP100的趋势与TOP500一致,2019年有27套系统采用了GPU/MIC 加速,与2018年的30套基本持平,其中主要归因于深度学习算法在互联网公司的成功应用,使得CPU+GPU的异构加速集群成为当前互联网公司进行AI 训练的首选体系架构。
(5)亚洲国家在世界TOP500上的机器数量继续保持较高占比,从去年的276台降为274台。排行榜中有来自中国大陆的228套系统,总数排世界第一。虽然中国上榜的数量排名世界第一,但我们应该清醒的认识到,其中大部分的机器并非应用在传统的科学计算应用,而是新兴的互联网云计算和大数据应用。
(6)目前中国TOP100排行榜中机器的平均Linpack性能3.47Pflops,是2018年3.07Pflops的1.13倍,增速有所降低。2019年国际TOP500排行榜中机器的平均Linpack 性能为3.29Pflops,国内和国际排行榜的平均性能双双首次超过3.2Pflops。我国发布的“神威· 太湖之光”和天河二号两台超级计算机的Linpack 性能就占到了中国TOP100的总性能的接近一半!如何用好“神威·太湖之光”和“天河2号”,发挥其巨大的计算能力,做好中国的超级计算应用软件和应用,成为未来2~3年中国超级计算行业面临的挑战性问题。
我们在图2中给出了中国TOP100制造商的上榜机器数量份额图。
图2 中国TOP100制造商机器数量份额图(2019.11)Fig.2 Vendors system share (2019.11)
2019年中国TOP100排行榜上厂商的上榜机器数量份额与去年类似,国外厂商制造的机器数量不再出现在榜单中,这说明国产超算在国内市场已经占据绝对主导地位。国产机器的市场份额主要被曙光、联想和浪潮三家瓜分,曙光和联想今年并行第一,浪潮以14台位列第三。值得一提的是,本年度DELL 公司提交一台安装在武汉大学超算中心的异构系统,但是Linpack 性能为1403TFlops,未能上榜。
图3给出的是从2002年到2019年中国TOP100国内外厂商系统份额的趋势变化情况。
图3 中国TOP100国内外厂商系统份额趋势(2002-2019)Fig.3 Trend of the Vendors system share (2002 - 2019)
从装机数量上,前三名分别是曙光(39%)和联想(39%)并列第一,失去连续保持三年的第一名宝座的浪潮(14%)位列第三。华为公司作为HPC厂商继续出现在2019年的TOP100上,并继续占据2%的份额。浪潮、曙光和联想公司虽然夺得机器总数量的前三名,且总数量达到惊人的92台,但其机器总性能远低于神威和国防科大的机器性能总和,说明其机器规模仍然属于中小规模。浪潮公司在曙光和联想的激烈竞争之下,失去了其去年数量份额第一名的传奇,作为第一家以HPC为主营业务上市的高科技厂商,如何在上市后,能够继续保持主业的竞争优势而不迷失,成为一个值得思考的问题。在三强大战中,如何重新夺取领先的位置,值得引起浪潮高层的反思。联想公司通过对IBM 公司X86 HPC 产品线的并购,第六次在机器数量份额上取得与曙光并列的成绩,但是如何保持良好的发展势头并持续大力投入,是联想公司需要解决的问题。目前的中国超算市场初步形成了浪潮、曙光和联想三足鼎立的格局,且占据90%以上的份额,国外厂商在HPC 领域已经淡出中国市场。国产厂商在逐渐获得国内市场的垄断优势之后,开始纷纷布局国际市场,开启国际化的征程,其中的华为和联想公司,因为本身公司已经是跨国公司,具备先发优势。而浪潮公司和曙光公司2018年在国际市场也开始有所斩获,传出好消息。从TOP500数据看,我国以228台数量远超第二名美国的117台。联想制造的超算系统达到175台,位列厂商第一,曙光和浪潮分别以71台和66台位列二三名,三家厂商占据312台超过一半,出口84台。这充分说明了我国超算发展已经牢牢占据领先地位,超级计算系统会成为中国继高铁之后,另外一个可以出口的中国制造高科技产品。
为便于分析,我们在图4给出了2019年中国TOP100中的行业应用领域系统数量份额图。
图4 中国TOP100行业应用领域机器系统份额图(2019.11)Fig.4 Area system share (2019.11)
从2019年11月发布的中国TOP100的行业应用领域来看,2019年国内高性能计算主要分布在互联网大数据/深度学习、互联网/云计算、网络安全、科学计算、超算中心、政府电信、能源石油、工业制造和短视频九个领域,领域数量比去年多一个短信视频。互联网大数据/深度学习占比较之去年的27%下降为14%,而互联网/云计算占比34%成为份额排名第一的领域。这与中国互联网公司的云计算应用快速崛起和大数据中的深度学习算法的广泛应用有很大关系,互联网公司通过深度学习算法重新发现了超级计算机特别是GPU加速的异构超级计算机的价值,纷纷投入巨资建设新系统。国内的几大主要应用领域是互联网大数据/深度学习、互联网服务/云计算、科学计算和超算中心等。国内最为突出的特点是互联网服务云计算和大数据应用特别是深度学习应用异军突起,两者的份额之和超过48%,较之去年的47%基本持平。
综合来看,目前的互联网大数据/深度学习、互联网服务/云计算、科学计算、超算中心等领域是高性能计算的主要用户。互联网大数据特别是AI 领域增长强劲。
根据历年积累的数据,我们在图5中给出了中国TOP100从2002年到2019年的应用领域趋势图。
图5 中国TOP100应用领域趋势(2002-2019)Fig.5 Trend of Area system share (2002 - 2019)
综合从2002年开始的中国大陆高性能计算机TOP100排行榜的第一名Linpack 性能、第一名峰值性能和总性能,我们得到了图1中的中国高性能计算机性能发展趋势图(2002-2019)。从图中的数据可以看出,中国高性能计算机的研制和生产也是有一定规律的。我们可以看到,从2002年到2005年,中国超算的发展经历了一次快速发展期,这个发展期维持到2005年(4年),然后在2005年开始进入一个平稳发展期。而2007年排行榜第一名性能的小幅增长,是一个信号,说明大陆地区开始走出平稳发展期,进入新一轮快速发展期。2008年百万亿次机器的出现,证实了我们的观察。2009年千万亿次天河一号的提前横空出世,颠覆了我们之前的2010年底或2011年初发布峰值千万亿次国产机器的预言。2010年11月,天河一号A 登顶世界TOP500第一名,将作为这个从2008年开始的超算发展活跃期的一个休止符。直到2012年天河一号A 再夺国内TOP100第一,标志着我国超算的研制仍然维持在平稳发展期,这个周期在2013年被天河2号的出现结束。2013年6月,天河2号帮助中国再夺世界第一且连续六次蝉联世界第一和连续三次蝉联中国TOP100第一,说明中国超算发展在短暂进入活跃期后,再次进入平稳发展期。这个平稳发展期本来应该在2015年结束,但是由于限售时间的影响,而推迟到2016年结束。果然,中国超算在2016年以超算排行榜连续第八次夺取冠军、首次获得总数量第一名且总性能几乎与美国持平、国产超算应用在国产神威太湖之光超级计算机获得戈登贝尔奖和中国科技大学大学生团队在美国SC 大会比赛获得单项和总冠军等最强音,将2016年定格为中国超算的大满贯年。2017年开始,中国超算再次不可避免的进入一个新的平稳发展期,没有新的大机器发布,三家超算研制单位将在获得科技部的资助后专心研制新的E级超级计算机。2018年,三台E级原型机均已部署到位,将正式决定哪几家获得最后的E级系统的研制资格。新的快速发展期将最早在2020年重新启动。与此同时,美国的超级计算机将迎来一轮活跃期,美国的几台100PFlops 超级计算机将陆续发布,为美国重新夺回世界第一的位置。
从第一名的峰值性能趋势预测可以看出,根据新收集的数据,可以得到的新预测结果是:峰值Exaflops的机 器将在2020年~2021年间出现[8-10]。峰值10Exaflops的机器将在2022年~2023年间出现。峰值100Exaflops的机器将在2024年~2025年间出现。这些预测整体上偏向乐观趋势,预计比实际的发布时间都要早1到2年。
综上,2019年中国TOP100排行榜主要体现了以下几个主要趋势:
(1)神威太湖之光继续蝉联中国TOP100第一名;
(2)曙光和联想公司并列中国TOP100数量份额第一名;
(3)TOP100总体性能接近350PFlops,中国高性能计算市场的增速有所降低;
(4)TOP100平均性能突破3.4PFlops,继续领先国际平均水平;
(5)入门系统性能门槛继续大幅提升,达到1556TFlops,再次大幅度超过国际TOP500的入门系统性能1142TFlops;
(6)98套系统采用机群结构,计算机体系结构创新形势依然严峻;
(7)上榜高性能计算机制造商为6家,继续保持全国产,市场份额进一步集中在曙光、联想和浪潮三家厂商,占据92%的数量份额;
(8)应用领域新增短视频,高性能计算应用特别是在大数据和云计算领域呈现快速发展的局面。大数据、超算中心、互联网服务/云计算和网络安全等是高性能计算主要用户。
展望2020年,各国E级计算机计划的发展是2020年值得关注的大事。我国三套E级原型系统的研制均已顺利完成,最后的E级系统研制任务花落谁家,更值得关注。随着美国E级超级计算机系统研制计划的提前和中国E级超级计算系统研制计划的可能延后,中美两个超级计算大国之间,谁能在2020年夺取世界第一的位置,充满了变数。
利益冲突声明
所有作者声明不存在利益冲突关系。