国内大型超算中心系统及应用发展态势比较分析

2017-04-28 00:58:26
数据与计算发展前沿 2017年5期
关键词:计算中心超级计算机计算机系统

中国科学院计算机网络信息中心,北京 100190

引言

超级计算水平已经成为各国科技竞争力和综合国力的重要标志之一,是世界高技术领域的战略制高点,同时也是我国“十三五”科技发展规划的重要建设内容之一。

超级计算机系统是利用先进的计算能力理解和解决现实问题的工具。从 1964 年被公认为第一台超级计算机的 CDC 6600[1]的诞生,一直到在最新一期TOP 500[2]排行榜占据首位、理论峰值达 125, 435.9 Teraflops/s 的“神威 · 太湖之光”计算机系统,50多年来超级计算机的计算能力已经有了 10 多个数量级的提升。2009 年起,科技部先后批准建立了六家国家超级计算中心,目前已有多家单位多次进入世界五百强超级计算机系统榜单,硬件系统资源发展态势也呈现繁荣发展的景象。

图1 TOP 500 按国家分布划分系统占有率态势图 (2006 年-2016 年)(数据来源:https://www.top500.org/statistics/overtime/)Fig. 1 The systems share occupancy countries distribution trend graph of TOP500 from 2006 to 2016 (Source:https://www.top500.org/statistics/overtime/)

除此之外,令超级计算机系统设备真正发挥效用、为各领域提供高效计算服务的则主要由高性能计算的应用发展水平决定,它同时也象征着各个国家高性能计算的软实力。近年来,我国不断加大对高性能计算应用的重视力度,“造好机器的同时也要用好机器”已不再是一句简单的口号语,国内超算中心除了在硬件基础设施上打破了欧美国家的垄断局面,在应用领域也已开始向戈登贝尔奖发起冲击,2016 年已有多个典型应用获得该奖项的提名。学科应用领域科学研究成果的取得与高性能计算的联系已经越来越紧密,高性能计算的应用发展程度也直接影响着科学领域的进步。

本文第 2 节对国内一些具有代表性的超级计算机系统的建设情况进行了态势分析。第 3 节选择具有代表性的国内大型超级计算中心,并对其高性能计算应用的发展情况做出概况分析。

最后在以上两节的基础上,对我国高性能计算应用的可持续发展问题提出了一些对策分析与发展建议。

1 超级计算机系统建设态势分析

国内超级计算机系统的发展近些年来正逐步缩小与先进发展水平国家的差距,从下图 1[3]可以看出,美国、日本、欧洲一些发达国家长期占据世界超级计算机五百强 (以下简称“TOP 500”) 榜单之内,近年来随着日益增长的计算需求,国家对此高度重视,不断加强基础设施的硬件能力建设力度,自 2010 年起,TOP 500 系统占有率逐年增加,当前国内一些大型超算中心的高性能计算能力业已达到国际领先水平,仅 2016 年一年,我国就有 168 台超级计算机系统进入 TOP 500 榜单,占全部系统的33.6% (如下图 2[4]所示) ,已完全打破美国、日本及欧洲发达国家在先进硬件资源方面垄断的局面。

中国在全球超算 500 强榜单上首次整体性领先,是“中国制造”成功转型的一个象征。167 台超级计算机入榜背后是中国强大的计算机技术集团军,其中国家超级计算无锡中心更是以超过每秒十亿亿次浮点运算能力跃居世界 500 强榜首。本文选取了几个具有代表性的超算中心,并对其超级计算机系统建设的情况进行了详细介绍。

图2 TOP 500 按国家分布划分系统占有率统计图 (2006 年)(数据来源:https://www.top500.org/statistics/list/)Fig. 2 The systems share occupancy countries distribution trend graph of TOP500 in 2016 (Source: https://www.top500.org/statistics/list/)

国家超级计算无锡中心[5](以下简称“无锡超算中心”) 成立于 2016 年 6 月,是无锡市政府直属事业单位,由清华大学与无锡市政府共同建设,并委托清华大学管理运营。拥有世界上首台峰值运算性能超过每秒十亿亿次浮点运算能力的超级计算机——“神威 · 太湖之光”。该系统是我国“十二五”期间“863 计划”的重大科研成果,由国家并行计算机工程技术研究中心研制,运算系统全面采用了由国家高性能集成电路设计中心通过自主核心技术研制的国产“申威 26010”众核处理器。“神威 · 太湖之光”也是我国第一台全部采用国产处理器构建的世界排名第一的超级计算机。

国家超级计算广州中心[6](以下简称“广州超算中心”) 成立于 2013 年 11 月,由广东省人民政府、广州市人民政府、国防科技大学、中山大学共同建设,是广州市重点建设的科技一号工程。天河二号拥有约 17920 个计算节点,每节点配备两颗 Xeon E5 系列 12 核心的中央处理器、三个 Xeon Phi 57核心的协处理器 (运算加速卡),总内存容量约 1.4 PB,全局存储总容量约 12.4 PB。连续六次在世界超级计算机 500 强排名中位列榜首。

国家超级计算天津中心[7](以下简称“天津超算中心”) 是国家科技部 2009 年 5 月正式批准建设,由天津市滨海新区和国防科学技术大学共同建设,以国家高技术研究发展计划 (863 计划) 信息技术领域“高效能计算机及网格服务环境”重大项目“千万亿次高效能计算机系统”研制成果为基础构建的国家级超级计算中心。除了“天河一号”超级计算机外,天津中心还装备有三台高性能计算机系统,具体包括:计算性能达到百万亿次的天河 · 天腾 (TH-1) 系统;包含 128 个 Intel-EX5675 CPU 的天河 · 天翔系统;包含 96 个 CPU 的天河 · 天驰系统;四套计算机系统面向不同的应用领域,将提供高质量的高性能计算和云服务。

中国科学院超级计算中心[8](以下简称“中科院超算中心”) 成立于 1996 年,成为以面向科学院乃至社会提供高性能计算能力和技术支持为宗旨的支撑服务单位。陆续引进了“SGI Power Challenge XL” (64 亿次,1996 年) 、“日立 SR2201” (96 亿次,1998 年) 和“曙光 2000-II” (1117 亿次,2000年) 三台超级计算机。中心先后于 2003 年和 2008年,在中科院信息化专项和国家 863 计划共同支持下,引进当时位居世界超级计算机 TOP500 排名榜第 14 位的 5 万亿次“深腾 6800”超级计算机和排名第 19 位的“深腾 7000”超级计算机。2014 年中科院新一代超级计算机“元”正式上线,也将跨入千万亿次计算时代。

国内大型超算中心的计算机系统建设及发展水平普遍受资金投入力度、运维服务队伍等多方面因素的影响,因此在造机器的同时也要考虑系统的能耗及更新换代等随之而来的问题,从 1996 年至今的十年来,国内超算中心正逐步研制与国际先进超算中心接轨的大型超级计算机系统 (如下图 3 所示),为国内各用户单位提供了持续的计算服务保障。

由上图 3 分析可以看出,作为国内成立最早的超级计算中心,中科院超算中心的计算机系统硬件资源已从 1996 年第一台 64 亿次的“SGI Power Challenge XL”计算机系统发展到 2014 年的计算性能为 2.3PFlops 的新一代“元”系统,先后经历了六次硬件系统的更新换代,为中国科学院内外单位用户持续提供二十年不间断的计算应用服务。无锡超算中心在成立之初即以峰值运算性能为 125,435.9TFlops的超级计算机系统“神威 · 太湖之光”跃居世界超级计算机五百强 (TOP 500 排行榜) 榜首,成为世界上首台峰值运算性能超过每秒十亿亿次浮点运算能力的超级计算机。除此之外,天津超算中心和广州超算中心也先后多次蝉联过 TOP 500 排行榜榜首。我国超级计算机系统的计算能力已从原先的追赶欧美发达国家的脚步,跃升为持续领先国际先进水平的状态。

表1 2016 年国内主要大型超算中心计算机系统统计表Table 1 The statistics of thesupercomputer systems capacity of the majorsupercomputing centers in China (2016)

图3 国内主要大型超算中心峰值计算性能发展历程趋势图(1996-2016 年)(数据来源:https://www.top500.org/lists/)Fig. 3 The systems share occupancy countries distribution trend graph of TOP500 in 2016. The development trend of the peak value calculation performance of the main large-scale super computing centers in China (Source: https://www.top500.org/lists/)

3 高性能计算应用态势分析

应用领域方面[9],新兴应用较传统应用占有很大比重。高性能计算应用领域呈现出扩大化的趋势,除了传统的科研、教育、超算中心外,像电信、互联网、云计算、金融、游戏、信息安全等领域也得到了越来越多的采用。部署在互联网领域的高性能系统的份额进一步扩大。据了解,我国在应用方面主要支持了两方面的应用[10]。一类应用是强调资源共享、协同工作的网格应用。包括新药发现、气象结合预报、科学数据网格、水利信息化、铁路信息化等等,这类属于网格应用。另外一类应用是强调计算能力,解决重大计算问题。比如计算化学、计算天文学、面向千万亿次的并行算法库、大型流体机械的优化设计、激光核聚变领域的并行计算软件、天气预报在国产千万亿次机上运行、大飞机的流场设计等等。

根据国内 TOP100 发布的数据报告显示,对比2014 年和 2015 年的国内高性能计算应用领域的分布情况 (如下图 4[11]、5[9]所示),可以看出,互联网服务的比例由 55% 缩减至 24%,高性能计算应用分支比例逐渐扩张,如大数据、电子商务、云计算、科学计算、视频以及移动互联网的应用范围也在呈现急剧增长的趋势,此外电信、政府部门、超算中心、电力等行业的高性能计算应用情况受计算需求、相对固定的用户群体等稳定因素的影响,应用比例在近两年基本维持不变。

超算发展是速度之争,更是应用之争。被称作超算应用领域诺贝尔奖的“戈登贝尔”奖,从 1987年设立以来,中国团队从未入围过。今年,基于“神威 · 太湖之光”系统的3项全机应用已经入围,占全部入围数量一半。这三项应用分别为中科院软件所与清华大学、北师大合作的“全球大气非静力云分辨模拟”;国家海洋局海洋一所与清华大学合作的“高分辨率海浪数值模拟”以及中科院超算中心的“钛合金微结构演化相场模拟”。此外,国内大型超算中心也开始逐步深入开展一批大规模、多领域的高性能计算应用,如表 2 所示。

近年来,国内超算中心除了在硬件基础设施上完全打破欧美国家的垄断局面外,在高性能计算应用领域方面也有了全面的突破性发展,相比较于早年的重基础设施建设而轻应用的发展观念,如今的国内大型超算中心已经开始有规划、有目的的进行统筹建设与发展[15],也使得“造好机器难,用好机器更难”这样的尴尬局面逐渐成为了历史。

图4 2016 年国内高性能计算应用领域分布情况 (数据来源:http://wenku.baidu.com/link?url=uB5SSN7NjkG2ppgLwLVOOHdlksw pBSbTJ6phVPr_bqTPzRH0sp8Mm2bKWTo4HmnKKuO9xiZZpiXyK O9i73SWtybUyghAz5hGM6KQ6T_75du)Fig. 4 The domestic high performance computing application field distribution in 2014 (Source: http://wenku.baidu.com/link?ur l=uB5SSN7NjkG2ppgLwLVOOHdlkswpBSbTJ6phVPr_bqTPzRH 0sp8Mm2bKWTo4HmnKKuO9xiZZpiXyKO9i73SWtybUyghAz5h GM6KQ6T_75du)

图5 2015 年国内高性能计算应用领域分布情况 (数据来源:http://www.guancha.cn/Science/2015_11_12_341049.shtml)Fig. 5 The domestic high performance computing application field distribution in 2015 (Source: http://www.guancha.cn/Science/2015_11_12_341049.shtml)

3 展望与建议

根据以上对国内一些主要的大型超级计算中心的计算机系统建设和高性能计算应用两方面的态势比较与分析,我们可以清晰地看到,目前我国超级计算机系统的研制水平已经跻身国际领先行列,近两年来高性能计算的应用水平也在逐渐缩小与国际先进国家之间的差距。国内的超算中心在探索可持续发展的道路上,正逐步从“重硬轻软”转变到“软硬兼顾”的层面上来,高性能计算的应用水平与超级计算机系统的计算水平相辅相成,必将极大地提高我国以超级计算机为工具进行科学探索的能力。

为了更加切实有效地推进国内超级计算中心的可持续发展,提出如下几点展望与建议:

(1) 对于面向国家及科研服务为主的超级计算中心,特别是国家级的超级计算中心,应从国家层面进行统筹规划和合理布局,充分发挥国家队的资源优势,坚持以用户需求为导向,助力地区建设为根本[16]。充分利用当前超级计算机系统的计算资源,避免基础设施重复建设,或某些应用领域与高性能计算资源之间出现断档的情况发生。

表2 国内主要大型超算中心高性能计算应用情况统计表Table 2 The statistics of the domestic high performance computing application

(2) 超级计算中心的可持续发展,需要在摸索中找准定位,明确发展方向。一方面需要深入探讨与地方政府、企业以及高校联合研究等多种合作模式。另一方面还需要切实结合实际情况,并借鉴国外一些先进超级计算中心的发展经验,如德国于利希超级计算中心,隶属于德国核物理研究所,该中心由政府出资,为核物理研究所的科学研究提供计算服务,不对外服务,支持的研究领域为网格技术、能源科学、材料科学等。

(3) 目前,我国高性能计算机的用户 (或潜在用户) 达到了前所未有的数量和类型。高性能计算产业蓬勃发展的同时,如何在高性能计算机与用户应用间架设“桥梁”,更好的发挥高性能计算机的“效能”已成为迫在眉睫亟待解决的问题[17]。

(4) 应充分发挥超级计算创新联盟的作用[18],推进国内高性能计算的健康发展。该联盟将造机器、关机器、用机器三个群体有机联合起来,共同探索构建超级计算创新平台,促进行业技术进步和应用发展,更好地服务社会与广大用户,将有力促进我国高性能计算相关技术的创新、应用的普及和产业的发展,加速我国超级计算产、学、研、用的融合,更好地壮大我国超级计算事业的发展。

(5) 加强人才培养、引进与合作[19]。鉴于近年来Gordon Bell 奖项的取得大多数是跨学科、跨单位合作研究的成果,为了更加深入有效地挖掘应用,应打破当前多数固有的应用发展模式,改将科学家、软件研发人员以及系统运行服务人员等多方团队深度契合,充分发挥协同创新的合作模式,共同解决技术和应用等方面的难题,使得彻底扭转“重硬轻软”的局面,达到国际先进高性能计算科学应用的水平,并在 Gordon Bell 奖项上尽早有所突破。

4 结束语

通过本文对于国内一些大型超级计算中心关于计算机系统建设及高性能计算应用的发展态势比较分析,可以发现,这些大型超级计算中心的发展水平已经基本与欧美等国际上先进的超级计算中心相持平,且有领先的趋势。同时,高性能计算的应用水平也在不断提升,今年有三个应用入围 Gordon Bell 奖,也足以说明我国的高性能计算应用水平有了长足突破。但是,国内超算中心的整体发展水平较美国、日本、欧洲仍有较大差距[20],建议在合理规划与布局的基础上,全面充分的探索适合各自超算中心的可持续发展道路,大力推进以领域应用为牵引的新型计算机体系结构研究和系统研制以解决重大问题为目标,继续加大对高性能计算应用软件研发的支持力度[21]。将计算机系统建好、管好、用好,更好地服务于各应用领域,实现更大更多的效益和成果产出。

[1] CDC6600.[EB/OL].http://en.wikipedia.org/wiki/CDC_6600.

[2] TOP500.[EB/OL].[2016-6-20]. https://www.top500.org/lists/2016/06/

[3] 2006 年至 2016 年 10 年间国际 TOP500 发布的按国家分布划分系统占有率态势图表. [EB/OL]. [2016-6-20].https://www.top500.org/statistics/overtime/

[4] 2016 年 TOP 500 按国家分布划分系统占有率统计图.[EB/OL]. [2016-6-20]. https://www.top500.org/statistics/list/

[5] 国家超级计算无锡中心.[EB/OL]. [2016].http://www.nsccwx.cn/introduction.php?word=introduction&i=34

[6] 国家超级计算广州中心.[EB/OL].[2013].http://www.nscc-gz.cn/Introduction/Generalpro file/Basicsituation.html

[7] 国家超级计算天津中心.[EB/OL].[2009].http://nscc-tj.gov.cn/introduction/introduction_1.asp

[8] 中国科学院超级计算中心.[EB/OL].[2012].http://www.sccas.cas.cn/gywm/zxjs/zxjj/

[9] 2015 中国高性能计算机排行公布 10 亿亿次超级计算机未上榜.[EB/OL].[2015-11-12].http://www.guancha.cn/Science/2015_11_12_341049.shtml

[10] 钱德沛.国家高性能计算发展状况[J]. 科研信息化研究与发展. 2014, 1: 33.

[11] 2014 中国高性能计算机性能 TOP100 排行榜及简析.[EB/OL]. [2014]. http://wenku.baidu.com/link?url=uB5SS N7NjkG2ppgLwLVOOHdlkswpBSbTJ6phVPr_bqTPzRH 0sp8Mm2bKWTo4HmnKKuO9xiZZpiXyKO9i73SWtyb UyghAz5hGM6KQ6T_75du

[12] 国家超级计算无锡中心典型案例. [EBOL].[2016]. http://www.nsccwx.cn/case.php?i=58&word=case

[13] 国家超级计算广州中心应用案例. [EBOL].[2016]. http://www.nscc-gz.cn/Apps/Biomedical.html#Page_2_0_0

[14] 国家超级计算天津中心应用案例.[EB/OL].[2016]. http://www.nscc-tj.gov.cn/example/example_9.asp

[15] 郑宁, 王冰, 党岗.广州超级计算中心应用发展分析[J].计算机工程与科学.2013, 35(11): 187-190.

[16] 赵毅, 朱鹏, 迟学斌, 牛铁, 曹宗雁. 浅析高性能计算应用的需求与发展[J]. 计算机研究与发展.2007, 44(10):1640-1646.

[17] 我国超算应用离戈登贝尔奖还有多远?.[EB/OL].[2015-10-23].http://www.chinastor.com/a/hpc/12261UJ2015.html

[18] 超级计算联盟简介.[EB/OL].[2013-9-25].http://www.sc-innovation-alliance.cn/gylm/lmjj/201404/t20140402_167730.html

[19] 迟学斌, 朱鹏, 武虹等. 世界各地超级计算中心的发展概况[J]. 中国计算机学会通讯.2008(6): 33-43.

[20] 迟学斌, 顾蓓蓓, 武虹, 王龙, 朱鹏.高性能计算机系统及平台发展状况分析[J].计算机工程与科学.2013,35(11):6-13.

[21] 葛蔚, 郭力, 李静海, 陈左宁, 胡苏太, 刘鑫. 关于超级计算发展战略方向的思考[J]. 中国科学院院刊.2016,31(6):614-623.

猜你喜欢
计算中心超级计算机计算机系统
中国—东盟人工智能计算中心正式发布
超级计算机
面向反应堆设计的高性能计算中心建设及应用
腾讯云首个5G边缘计算中心正式对外开放
超级计算机及其在航空航天领域中的应用
科技传播(2019年22期)2020-01-14 03:06:36
IBM推出可与人类“辩论”的计算机系统
英语文摘(2019年3期)2019-04-25 06:05:32
美国制造出全球最快超级计算机
每秒100亿亿次 中国超级计算机
分布处理计算机系统研究
MIMD 并行计算机系统结构与定量分析