关于超级计算发展战略方向的思考*

2016-10-18 02:03李静海陈左宁胡苏太中国科学院过程工程研究所北京0090国家并行计算机工程技术研究中心北京0090

中国科学院院刊 2016年6期

葛　蔚　郭　力　李静海　陈左宁　胡苏太　刘　鑫　中国科学院过程工程研究所　北京　0090　国家并行计算机工程技术研究中心　北京　0090

关于超级计算发展战略方向的思考*

葛蔚1郭力1李静海1陈左宁2胡苏太2刘鑫2
1中国科学院过程工程研究所北京100190
2国家并行计算机工程技术研究中心北京100190

超级计算能力是国家科技竞争力乃至综合国力的重要标志，也是经济社会发展、国防和国家安全的重要支撑。特别是在网络化、大数据、云计算和虚拟现实迅猛发展的背景下，超级计算不但是科技发展的利器，正引发科研模式的根本变革，也将成为重要的社会基础设施，并最终深刻地改变我们的生产和生活方式。但目前超级计算正面临应用效率低、能耗高、稳定性差和难以应用等严峻挑战。基于在复杂系统多尺度模拟方面多年的探索和积累，文章提出，按照计算对象、模型、软件与硬件的逻辑和结构一致的原理优化计算机体系结构，缓解和克服商品化通用硬件系统开发中的难点，可能是突破这些瓶颈的一条具有普遍意义的途径。

超级计算，多尺度计算模式，能量最小多尺度（EMMS）范式，虚拟过程工程

1　重要意义

超级计算是革命性的研发手段，代表了一个国家科学技术发展的水平。同时，它已成为现代社会重要的信息基础设施，正在深刻地改变人类的生产和生活方式。

2005 年，美国总统信息技术咨询委员会（PITAC）在给时任美国总统的乔治·W·布什的报告《计算科学：确保美国竞争力》［1］中多次强调：计算科学是继理论和实验之后的第三科学支柱，21 世纪最伟大的科学突破将从计算科学中获得。报告认为：如果在此关键时刻不能高瞻远瞩，美国的科学领导地位和经济竞争力将不堪设想。而超级计算无疑是计算科学的前沿与核心。2014 年美国能源部报告《E 级计算的十大挑战》［2］更明确指出 E 级（Exaflops）计算将改变全球经济。

具体而言，本文认为，超级计算的重要性集中体现在 3 个方面：

（1）超级计算已经是革命性的研发手段。根据已有理论在超级计算机上进行虚拟实验，即计算机模拟，甚至虚拟现实，已经在越来越大的程度上辅助甚至替代现实的实验。比如禁止核试验后计算机模拟的核爆炸就完全代替了核实验。各国大飞机的研制也都依赖计算力学与超级计算完成气动与结构设计。同样，从新药研制到精准医学，从催化机理的分析到反应器放大与优化，从建筑与桥梁设计到地质灾害防治，超级计算几乎在现代科技的所有领域中突破了理论和实验研究的极限，极大地加快了研发进程，并显著降低了费用。由此形成的产业技术带来的效益更是不可估量，并已成为国防和国家安全的一个重要支点。同时超级计算的综合性还有效促进了不同学科的交叉融合，从而促进复杂性科学和脑科学等 21 世纪最激动人心的科学前沿的形成。

（2）超级计算已成为现代社会重要的信息基础设施。可以毫不夸张地说，超级计算对于正在迅速发展的信息社会就像能源和交通对于工业社会那样重要。超级计算的应用正从传统的科研领域向社会经济的各个方面渗透。目前电子商务、金融和社会管理中已经开始用数据挖掘等手段分析人们的消费和行为习惯，从而更精准地指导生产和流通，提高经济和社会的运行效率。同样，在交通和物流的管控与优化、疾病预防与控制、天气预报与气候预测、经济定量预测与调控甚至休闲娱乐等领域的应用即将迎来爆发式增长，带动新兴产业的崛起，使超级计算像电力和自来水一样在日常生活中成为不可或缺的资源。

（3）超级计算正在深刻地改变人类的生产和生活方式。超级计算技术本身正面临深刻的变革，其前景无可限量。目前庞大的超级计算机将演进为紧凑的信息处理设备而融入生产生活的方方面面，通过云计算、物联网和智能设备等形成庞大的网络。这种泛在的超级计算和它驱动与支撑的智能制造、柔性制造、虚拟现实等技术与产业将带来一个“万物有灵”、“虚实难辨”的时代。人类在应对能源与资源短缺、环境污染和气候变化等可持续发展的重大挑战时将具备全新的能力。生产效率将极大提高、能源和资源消耗将显著降低，人类的生存空间将极大地拓展，更加自由而绿色的生活方式将不断涌现。

超级计算对我国的自主创新、跨越发展尤为重要，并将随着发展的进程变得越来越重要。过去 15 年中，我国部署了多个国家级科技项目和资助计划，有力推动了中国超级计算能力的提升。“天河”、“曙光”、“神威”等系列超级计算机的研制成功，使国家级超级计算基础设施进入世界领先行列，形成了相当规模的国家级高性能计算服务环境，支撑了一大批重大的领域应用。因此，持续保持国家对超级计算的投入，不断攻研和创新超级计算机技术，使我国超级计算的发展迈上更高的台阶，对国家经济社会转型升级和中华民族伟大复兴具有重要战略意义。

2　挑战与瓶颈

以商品化通用硬件主导的发展模式由于效率、能耗、稳定性等问题已举步维艰。以应用牵引的模式正逐步成为主流。抓住这一转变的机遇，我国超级计算有望跨越发展，全面领先。

尽管超级计算意义重大、发展迅猛，但近年来也遇到了重大的挑战与发展的瓶颈，急需新的思路来破解。20 世纪 90 年代以来，由于商品化通用处理器的快速发展，极大地促进了超级计算机的发展。据 HPC Top500［3］统计显示，2000 年以来，采用商品化通用硬件构建超级计算机的数量最高时达到总量的 90% 以上。但随着计算机系统规模的增大和峰值计算性能的提高，这种按照“商品化硬件-软件-应用”模式研制的机器遇到了新的挑战。

（1）应用效率低下。商品化通用软硬件对领域高难计算问题或大数据处理问题缺乏针对性，因而系统计算资源的利用率较低，使机器的实际性能大打折扣，大多数机器的实际应用效率不会超过其峰值性能的 10% 左右。

（2）运行功耗大。系统规模的扩大导致机器耗电量急剧增加，高端超级计算系统的能耗已经达到 10 兆瓦量级，但性能能耗比提高缓慢，机器运营成本难以承受。

（3）系统可靠性低。随着系统中处理器的核数达到百万量级以上，主要器件数量达到千万量级以上，当前一个高端系统的平均无故障时间达到数小时已十分困难，对高可靠性的影响极大。

加之开发投入上也是前重后轻，特别是我国在大型应用软件的开发上投入不足，使得应用开发严重滞后，机器的潜力远远没有发挥。显然，在这种模式下，仅仅依靠商品化通用硬件的渐进式技术改善，超级计算机系统的易用性和对需求的适应性会不断降低，整机的实用性也因算法并行性和系统稳定性的限制而大打折扣，从而失去了追求整机性能的意义。

在这种模式下，即使是面向商品化硬件的软件和应用开发，也只能永远滞后于硬件系统的开发。且商品化底层技术的迅速发展使得超级计算系统的有效使用年限非常有限（一般只有 5—7 年），并且研发、制造成本（动辄数亿元人民币）与运维费用日益高昂（可达每年数千万元），因此这种滞后带来的资源浪费也非常巨大。正是由于对成本、能耗、效率、容错与稳定性等问题尚无可靠的解决方案，国际上几个拟议中的 E 级计算项目已被数度推迟。

这些困境背后的共性问题是：在商品化软硬件研发中缺乏对应用对象的结构分析与利用，即计算机与计算对象的逻辑结构和物理结构不一致。近年来微电子和集成电路领域的发展趋势是：运算部件的速度提升快、能耗低，存储和通信部件的速度（带宽与延迟）提升慢、能耗高。为了弥补两者间的差距，需要引入多级数据高速缓存和交换。但这种补偿只有在计算软件具有相应的并行性与数据局部性时才适用，否则只能带来处理器设计复杂性的提高、元器件利用率的降低和编程难度的加大。而如果不从应用出发，考虑计算对象的物理结构和计算特征，计算软件就难以充分挖掘利用问题内在的并行性。另一方面，如果深入考虑了计算对象的结构和特征，现行的复杂的硬件设计非但没有必要，反而还会阻碍内在并行性的充分发挥。

实际上，大多数计算对象的逻辑结构都是多尺度的，但目前很多超级计算系统中的基本处理单元还是同质和单一尺度的，由此造成了存储与通信方面的巨大浪费。最新的异构超级计算系统可支持两尺度并行，但基本处理单元仍为同质。为解决这些问题，根本的出路是改变发展模式，从商品化硬件牵引变为应用牵引，从创新应用模型入手，带动计算模型、体系结构及软硬件的创新。这对我国来讲是一个重大机遇！

3　发展思路与战略

绕开商品化通用硬件发展的瓶颈问题和我国在硬件制造方面的劣势，聚焦计算对象、模型、软件与硬件的逻辑和结构一致性是超级计算的必然发展方向，更是我国超级计算自主可控与跨越发展的宝贵机遇。

从应用角度看，目前国际上超级计算面临的诸多问题本质上都与没有充分考虑计算对象的物理结构和逻辑特征有关。如果能从这一角度出发，超级计算将迎来全新的重大发展机遇。其核心是：高效的超级计算应体现计算对象、模型、软件与硬件的逻辑和结构一致性，而这种结构正是物理过程普遍而内在的多尺度结构，具有从全局相关到近程相关、从稳定性约束到动力学控制的共同特征［4］。

利用计算对象的结构特征可以有效简化硬件系统的设计，即：通过物理过程的多尺度分解，将大尺度的长程关联与小尺度的近程作用分离。后者的计算量非常大，但可以充分并行；前者虽然难以并行，但分解后余留的计算量较小。两者结合可简单高效地计算整个系统的演化。这里的多尺度分解并不纯粹是数学上的分解，也是基于物理机制的简化与分解。而引入稳定性条件，除了能从数学上封闭要求待定参数的模型，还能在物理上引入合理的约束条件，大大减少计算量并保证计算精度。若将此思路贯穿到计算硬件的设计中，带来的处理器微结构简化设计也可为我国核心基础器件的自主可控发展和整机技术的跨越发展提供捷径。

由于计算对象、模型、软件与硬件的逻辑和结构一致性反映了自然界内在的层次性和并行性（层次性也是一种垂直的并行性），它具有很强的普遍性。由此设计的超级计算系统在提高效能的同时并不会显著影响其通用性，反而将促进各领域研究方法由单尺度平均向多尺度耦合的方向发展。同时，这种物理与计算系统的内在一致性也有利于量子计算和仿生计算等从更基础层面利用自然禀赋的颠覆性技术的发展和应用。

4　研究实例

4.1 多尺度模拟和高效能计算机系统

中科院过程工程所针对多相复杂系统的多尺度模拟，以及国家并行计算机工程技术研究中心针对国家“863”计划项目研制的基于自主处理器的高效能计算机系统，在计算对象、模型、软件与硬件的结构和逻辑一致的超级计算方面作了有益的探索，展现了这条途径的广阔前景，其普遍意义值得深入研究。

4.1.1针对多相复杂系统的多尺度模拟

近年来，我国超级计算机无论在峰值速度还是在实测性能上一直保持与世界同步，并逐步达到了世界领先水平。但我们在超级计算软件和应用方面的发展却远远滞后于硬件。同时，我国支撑超级计算的核心基础元器件和部件（芯片）的研发水平也与美日等竞争对手有差距，尤其是高性能 CPU 基础器件的后端生产、封装、测试等环节以及设计工具长期受制于国外，国内工艺普遍落后一代以上，难以完全摆脱受制于人的局面。

多年来，中科院过程工程所以应用为牵引，按照“计算对象、模型、软件与硬件的逻辑和结构一致”的原理，在超级计算发展的新途径上做了不懈的努力，其中的很多思路与经验值得深入探讨与推广。

在国家自然科学基金委等的持续支持下，中科院过程所从 20 世纪 80 年代初就开始了对多相系统多尺度方法的研究，提出了独特的能量最小多尺度（EMMS）模型，以全局和介尺度稳定性条件约束提高了多相反应过程模拟的精度和速度。在检验、扩展和深化该模型的过程中又发展了拟颗粒等离散化方法，并认识到它们是描述复杂系统微尺度行为的有效方法并普遍具有高度的并行性，认为这将成为超级计算的重要应用领域。而 EMM S 模型向气液和湍流等其他领域的扩展形成的极值型多尺度方法又使稳定性约束成为加速复杂系统宏尺度和介尺度模拟的共性方法。两者结合则定义了一种新的具有普遍意义的超级计算模式：EMMS 范式，即用离散化方法模拟系统中的近程强相关作用，利用极值型多尺度方法描述系统中的长程关联。前者的计算具有局部性、可加性等适应大规模、细粒度并行计算的良好特性，后者包含的复杂计算被大幅减少。两者结合为实现高效超级计算提供了全新的途径。

2007 年以来，通用计算图形处理器（GUGPU）的出现，为验证这一思路提供了技术基础。在财政部“国家重大科研装备研制项目”等的支持下，中科院过程工程所按照上述思路研制了 Mole 系列高效能超级计算系统，引领了我国通过异构并行赶超世界超级计算前沿的征程。在国内率先于 2008 年 2 月建成了 100 万亿次 CPU+GPGPU 并行系统。2010 年 4 月建成的 1 000 万亿次系统［5，6］位列当年 Top500 第 19 位和 Green500 第 8 位（在当时全球千万亿次级超级计算系统中列首位）。目前仍在高效运行中。该系统还与分布在全国 6 个城市的 10 套 100 万亿次以上系统一起在中科院形成了聚合计算能力超过 5 000 万亿次的分布式 GPGPU 超级计算环境。

考虑到实际应用需求，进一步扩展峰值性能已无必要，因此研究随后转向在不同的应用实例中进一步探索 EMMS 范式的可行性和通用性，完成了多相流动直接数值模拟、材料和纳微系统微观模拟和生物大分子动态行为模拟等处于世界前沿水平的应用，初步证明了该计算范式的优势和前景。该系统还获得了广泛的工业应用，合作伙伴包括了中石化、中石油、宝钢、壳牌石油、英国石油、道达尔、通用电气、阿尔斯通、必和必拓、联合利华、巴斯夫、法国电力、兖矿等 10 余家世界 500 强企业。

与此同时，通过与实验、测量、可视化和控制系统的结合，中科院过程工程所研究人员还建立了全球首套虚拟过程工程的示范系统，即通过人机界面输入的操作指令可同时作用于实验装置和模拟系统，改变各自的操作状态，从而在可视化系统中直观在线地对比两者的行为。由此在国际上首次实现了对中试规模化工装置的准实时模拟，展示了过程工程研发模式变革的广阔前景，引领了这一领域的发展趋势。

在这些应用的基础上，进一步明确了在计算机体系结构和芯片设计层面实现 EMMS 范式的技术方案。该方案明确了多尺度模拟中不同算法与操作的计算、存储和通信特征，归纳了该范式下典型的稳定性条件求解、连续介质模型和离散单元演化模拟的算法特征，并提出了相应的多尺度体系结构。为验证该方案，借用 Intel M IC 多核处理器实现了 CPU-M IC-GPGPU 节点内耦合的紧密三层结构（图 1）［7，8］，并以此升级了既有系统，初步展示了未来彻底基于 EMMS 范式的多尺度超级计算模式的优势与可行性（图 2）［7］。近期中科院过程工程所与国家并行计算机工程技术研究中心正合作探索这种计算模式的硬件实现方案，并取得了进展（图 3），有望进一步开发针对介尺度计算的新型处理器。

4.1.2基于自主处理器的高效能计算机系统

近年来，国家并行计算机工程技术研究中心在承研国家“863”计划项目“基于自主处理器的高效能计算机系统研制”过程中，面向聚变与裂变能源、真实飞机外形全流场计算和优化设计、新药研发和蛋白质折叠、大型工程设备结构力学分析、数学工程等国民经济与国防重大挑战性应用需求，以领域应用算法和计算模型为导向，采用面向多目标优化的平衡结构设计方法和多因素相结合的设计优化方法，创新提出了多态多尺度自适应体系结构，在系统内部的不同尺度融合了多种计算形态，可以根据不同领域高难应用的需求，灵活构造计算规模，整合计算形态，优化计算效率。

图1　Mole-8.5E 系统的三层结构节点图［7，8］

图2　模型-软件-硬件结构一致性原理图［7］

图3　神威·太湖之光计算机系统

多态多尺度自适应体系结构支持在多个尺度上实现异构，包括处理器内部、处理器之间、节点之间以及系统级的异构等。其中，在处理器内部支持主从异构；在处理器/节点间的异构，支持国产多核/众核处理器、商用多核/众核处理器、GPGPU 等不同处理器的透明共存；系统级异构，支撑各种高性能计算机系统的无缝耦合。该体系结构能够充分发挥不同类型处理器、节点、高性能计算系统的优势，根据应用需求和多目标优化实现快速灵活地部署。同时，系统通过虚拟化操作系统、面向领域典型应用和机器结构的编译优化技术、自适应精细平衡调度等实现应用的高效自适应部署，在充分发挥系统性能的同时，最大程度实现底层异构结构对用户的开放。

该项目使用自主众核处理器的技术路线，通过片上集成大量精简计算核心，实现相对商用处理器更高的计算能力；通过针对应用特征进行处理器结构优化，使众核处理器更为节能高效；通过在国产处理器设计中提供对国家重大应用的共性支撑，大幅度提高应用效率。目前，该项目实现的超级计算机系统无论在峰值性能、实测性能和性能能耗比等关键技术指标上都已经达到国际领先水平。

4.2 多尺度计算模式

基于以上探索，已经可以提出具有足够普遍意义的多尺度计算模式以支撑未来高效超级计算系统的开发。而此类系统不仅能够显著提高实际运行效率与可用性，也将具有普遍性，为我国超级计算的全面跨越发展提供重要机遇。

中科院过程工程所和国家并行机算计工程技术研究中心两方面的探索分别从物理模型和硬件结构方面表明：计算对象、模型、软件和硬件的结构和逻辑一致性应当是未来超级计算发展的重要方向，具有广阔的发展空间，两者的结合有望带动甚至引领未来超级计算的发展。特别值得注意的是，在自然界及工业系统中，多尺度结构与行为具有相当的普遍性，这是物质世界的层次结构决定的。因此，根据上述原理，具有多尺度结构的超级计算系统具备天然的普适性。这些共性应当引起更大关注。

总体而言，具有多尺度结构的复杂系统中各部分或单元间的作用方式，从宏观到微观逐渐趋于简单，能够被更加清晰与可靠的数学模型描述（尽管很多微观运动的模型还不成熟，然而一旦建立，其准确性是毋庸置疑的）。但随着尺度的缩小，对应的部分或单元的数量急剧增加，相应的直接模拟的计算量也急剧增加，甚至达到理论上也不可计算的程度。

幸运的是，基于EMM S范式对越来越多的系统的研究表明，至少就经典的力学和传递、反应行为而言，通过引入稳定性条件可以在介于基本单元与系统整体的某个“介尺度”上建立一种“粗粒化”的离散模型，从而以足够的精度表述该尺度以上的系统行为，并且这些粗粒化离散单元间的作用是局部的和可加的，也是可计算的。同时这些单元的运动还满足整体稳定性条件的约束，通过求解该条件可直接预测系统的整体行为，从而简化和加快粗粒化离散单元的演化计算。

如果充分利用这些复杂系统的共性，可以建立针对其演化模拟的高效超级计算系统，即通过大量简单的具有局部数据交换通道的计算密集处理单元建立高度可扩展的底层离散单元模拟子系统，而通过若干层次具有更高全局数据交换速率和复杂指令处理能力的处理单元阵列提供稳定性条件求解子系统。各层处理单元间通过共享存储或通信网络实现树状的连接。越高层次的处理单元越少但复杂性越高。这种体系结构能充分贴合所解算问题的特征，降低系统整体的复杂性并提高其实际使用效率。尽管各层次更具体的结构形式和不同层次间的配比还需要根据具体的应用需求来优化与确定，这些结构特征是普遍适用的。同时通过软件与硬件的紧密耦合并利用可重构硬件等技术，还可以进一步优化对具体计算任务的执行效率，充分体现EMMS范式结构一致性和多层次处理的优势。

5　实施建议

我国超级计算的发展要以应用为牵引，充分重视学科交叉合作，继续推进自主超级计算机体系结构创新和系统研制；应以解决重大问题为目标，继续加大对高性能计算应用软件研发的支持力度，为提升高性能计算应用水平打下基础。

（1）大力推进以领域应用为牵引的新型计算机体系结构研究和系统研制。基于上述分析，超级计算应该作为国家科技和经济社会发展的一个优先领域继续给予长期大力的支持。特别应该对我国面向应用需求自主提出的体系结构给予更大关注——成立论证小组，通过预研项目系统总结既有成果，确定系统的逻辑结构，并经仿真系统的初步测试，论证项目整体设计的可行性。在此基础上，组织国内不同领域超级计算应用的研究单位和人员，对各自的应用特征进行深入的调研分析，细化对计算对象、模型、软件结构的分析，形成完整、系统而定量的结论，为通用硬件系统的设计提供可靠数据。同时组织硬件开发领域的相关单位（计算机与微电子等方面）开展相关硬件技术的调研与预研。在各方准备充分后，适时启动国家重大专项，联合国内相关单位研制高效能 E 级超级计算机系统，同时开展大规模应用准备，实现同步验收。

（2）以解决重大问题为目标，继续加大对高性能计算应用软件研发的支持力度。国家要切实加大对高性能计算应用软件研发的支持力度，选择重要的应用领域，建立长期的高性能计算应用软件发展计划。不仅在超级计算机研发过程中要同步开展应用软件的开发，更要在机器使用的全生命周期内持续开发应用软件，逐步改变我国大型并行应用软件依赖外国的被动局面。高性能计算应用软件的研发也要突出多学科的协作，以提高大规模并行软件的技术水平。

总之，如果能够在计算机体系结构和应用模式上进行源头创新，突破计算效率、功耗、可靠性等技术瓶颈，实现我国核心元器件（处理器芯片）的完全自主可控，我们就一定能在超级计算机技术领域赶超世界领先水平。多尺度计算方法与计算机体系结构是其中重要而有效的切入点，并且我国在这方面已经形成了优势与特色，应当予以充分重视。以此为基础，国家可以在战略发展领域形成一大批有重大影响的应用范例，使我国高性能计算应用水平迈上新的台阶，最终为解决国家经济建设、科技进步、国家安全等一系列重大挑战性问题作出贡献。

1 Report to the President on Com putational Science： Ensuring America’s Com petitiveness， 2005. ［2016-2-20］. https：// www.nitrd. gov/Pitac/Reports/20050609_ computational/ computational.pdf.

2 Ashby S， Beckman P， Chen J， et al. The Opportunities and Challenges of Exascale Computing. The ASCAC Subcomm ittee on Exascale Computing， USA， 2010.

3 Top500 supercomputer sites. ［2016-2-20］. http：//www.top500. org/

4 Li J H， Ge W， Wang W， et al. From M ultiscale Modeling to Mesoscience. Berlin： Springer， 2013.

5 Ge W， Wang W， Yang N， et al. Meso-scale oriented simulation tow ards virtual process engineering （VPE） — The EMMS Paradigm. Chemical Engineering Science. 2011. 66， 4426-4458.

6 Wang X， Ge W. Chapter 5： The M ole-8.5 Supercomputing System. In： Vetter， J. S. eds. Contem porary High Performance Computing from Petascale tow ard Exascale. Boca Raton：Chapman & Hall / CRC， 2013.

7 Ge W， Lu L， Liu Sh W， et al. Multiscale discrete supercomputing - A game changer for process simulation？ Chemical Engineering Technology. 2015. 38， 575-584.

8 Li B， Zhou G F， Ge W， et al. A mu lti-scale architecture for multi-scale simulation and its application to gas-solid flows. Particuology. 2014. 15， 160-169.

葛蔚中科院过程工程所研究员，博士生导师。1970 年 3 月出生，浙江杭州人。现任多相复杂系统国家重点实验室主任，“多尺度方法与介尺度科学”创新研究团队首席科学家，研究所学术委员会、学位委员会委员，中国颗粒学会理事，Chemical Engineering Science、《过程工程学报》《化学反应工程与工艺》《计算机与应用化学》《数值计算与计算机应用》编委；Particuology 顾问。1992 和 1998 年先后在哈尔滨工业大学热能工程专业获工学学士和博士学位。曾获国家自然科学基金委杰出青年基金，周光召基金会首届“杰出青年基础科学奖”、中国颗粒学会“宝洁青年颗粒学奖”、中科院首届超级计算应用奖及中科院“先进工作者”称号。主要研究对象为气固、颗粒与散料、多孔介质及纳微多相系统，内容包括流动、传递、反应及其耦合过程的介尺度机理与多尺度建模、分子模拟及离散-连续耦合模拟、高性能计算及其工业应用。提出并发展了拟颗粒模拟，以此揭示了气固流态化、气液鼓泡流动和微流动等系统中多种控制机制协调形成稳定性条件的机理，检验并扩展了多相复杂系统极值型多尺度方法。主持研制了效能比位居世界前列的 Mole 系列千万亿次多尺度超级计算软硬件系统，并由此建立了以实时模拟、显示和人机交互为特征的虚拟过程工程能力。先后主持国家自然科学重点基金、国家科技支撑计划和国家重大科研装备研制项目。相关研究成果已有效服务于所主持的中石油、中石化、宝钢、壳牌石油、必和必拓、通用电器、阿尔斯通、联合利华等世界500强企业的工业项目。已发表期刊论文 140 余篇，主持译著 2 本、编著 4 本及 20 余章节。多次在 CHISA，ISCRE，WCPT 等国际会议作 Plenary 或 Keynote 报告。E-mail： wge@ipe.ac.cn

Ge WeiBorn in 1970， got his B. Sc. in 1992 and then Ph. D. in 1998， both from Harbin Institute of Technology， China. He has been professor of chem ical engineering at Institute of Process Engineering， CAS since 2006. He is mainly engaged in multi-scale simulation of particle-fluid two-phase systems. As project leader， he developed the Mole series multi-scale supercomputing systems to bridge simulation of molecular details to reactor performance. He authored over 140 journal papers and 4 monographs. He won the Outstanding Youth in Basic Science Award of Zhou Guangzhao Foundation in 2008， the P&G Outstanding Youth in Particuology Award of Chinese Society of Particuology in 2011 and the National Science Fund for Distinguished Young Scholars in 2012. He is associate editor of Chemical Engineering Science， council member of The Chinese Society of Particuology， and advisory board member of the international journal Particuology. E-mail： wge@ipe.ac.cn

郭力男，中科院过程工程所研究员、中国科学院大学兼职教授。山东省济南市人，1966年出生。1981年考入中国科技大学第五期少年班，1986年毕业于中国科学技术大学计算机科学与技术系，1989年在中科院过程工程所获工学硕士学位。曾主持中科院院长特别支持项目、国家自然科学基金委重点基金项目、面上基金项目、中石化信息化项目，参与多项中科院创新研究项目、国家自然科学基金委重大研究计划子项目、国家自然科学基金委重点基金项目、基金项目等。获中科院科技进步奖二等奖和三等奖各一项，北京市科学技术进步奖三等奖一项。发表科技论文及报告80余篇，作为第一作者出版专著2部，作为第二作者出版专著1部，与他人合作出版译著1部。曾获国务院政府特殊津贴和中科院盈科优秀青年学者奖。E-mail： lguo@ipe.ac.cn

Guo LiMale， born in 1966， has been the professor of Institute of Process Engineering， CAS since 1997， is also the professor of University of Chinese Academ y of Sciences. He was admitted to Special Class for young gifted student of University of Science and Technology of China（USTC） in 1981， graduated from the Department of Computer Science and Technology of USTC and got his B. Sc. in 1986， and his M. Sc. Degree at IPE， CAS in 1989. He was a visiting scientist at National Center for Toxicological Research， FDA， US in 2004 and 2008-2009. Research interests include high performance computing， Internet chem istry & chem ical engineering information systems and text/know ledge m ining. He has published more than 80 scientific papers and three books， two as the first author and one as the second author. He also coauthored one translated book. He is an editorial board member of Journal of Computer and Applied Chemistry. He has received the State Council Special Award for Distinguished Scientists and the PCCW Award for Excellent Young Scholars of Chinese Academy of Sciences. He is also the w inner of The Second Prize and The Third Prize of Scientific & Technology Advancement， Chinese Academy of Sciences， and The Third Prize of Scientific & Technology Advancement， Beijing. E-mail： lguo@ipe.ac.cn

胡苏太男，国家并行计算机工程技术研究中心高级工程师，1956 年出生。长期从事计算机装备发展战略、计算机体系结构和情报研究工作。多年来，参加过多项国家重点型号工程预先研究工作。在国内各种报刊、会议上发表论文、报告 50 余篇，公开出版的著作有《实用网络存储技术》《英汉信息安全技术辞典》《超级计算机发展研究》等；曾获省部级科技进步奖一等奖 2 项、二等奖 5 项、三等奖 5 项；获全国优秀科技信息成果奖一等奖 1 项。

Hu SutaiM ale， born on February 1st， 1956， Bachelor's Degree， is a senior engineer at National Research Center of Parallel Com puter Engineering and Technology. His research fields include the development strategy research on computing technology and equipment， computer architecture and information research. He has participated in many national key pre-research projects and published over 50 papers and researchreports in many domestic journals and conferences for years. His major publications include Practical Network Storage Technologies， An English-Chinese Dictionary of Information Security Technology， and The Research on Development of Super Computer. He has won several provincial-level Scientific and Technological Progress Awards and also got First Prize for National Outstanding Scientific and Technological Information Achievement.

刘鑫女，国家并行计算机工程技术研究中心副研究员，2013 起担任神威高性能计算机系统科学与工程计算应用平台主管设计师。1979 年 6 月出生。2006 年获中国人民解放军信息工程大学获工学博士学位，主要从事并行算法和并行应用软件的研发工作。在大型并行应用软件的多核、众核并行算法设计和优化等方面取得重要进展。曾获省部级科技进步奖一等奖1 项、二等奖2项、三等奖 2 项。发表学术论文 10 余篇。

Liu XinFemale， born on July 30th， 1979， is an associate research fellow at National Research Center of Parallel Computer Engineering and Technology. She is the supervising designer of scientific and engineering application platform of Sunway supercomputer and responsible for large-scale parallel algorithm research and application software development on Sunway supercomputer. In this role， she has got a lot of progress in multi-core and many-core parallel algorithm designing and optim izations. In addition， she is the author or co-author of over 15 published papers on parallel algorithm， applications and related fields. She holds PhD degree from PLA Information Engineering University.

Thinkings on Development Strategy of Supercom puting

Ge Wei1Guo Li1Li Jinghai1Chen Zuoning2Hu Sutai2Liu Xin2
（1Institute of Process Engineering， Chinese Academy of Sciences， Beijing 100190， China；
2National Research Centre of Parallel Computer Engineering & Technology， Beijing 100190， China）

Supercomputing power has now become an important index of science and technology competitiveness of a country， and also a great support to the econom ic and social development and national security. Moreover， w ith the drastic development of Internet， big data，cloud computing， and virtual reality technologies， supercomputing w ill bring about profound changes to production and life styles of modern societies. Nevertheless， contem porary supercom puting is facing grand challenges in terms of low efficiency， high power consumption， poor robustness， and difficulties in applications. General-purpose supercomputing based on commercial processors is not likely to solve the problems completely. Based on our explorations in multiscale simulation of complex systems， we suggest that keeping the structural and logical consistency between the computed system， model， software， and hardware is an effective way towards high efficiency and scalability of supercomputing in the future. In fact， multiscale structure is ubiquitous in natural and industrial systems， which is， after all， a reflection of the hierarchical nature of the physical world and is， therefore， of general significance to a w ider range of applications. For classical mechanical and thermal processes， the computational complexity usually decreases w ith decreasing scales， while the computational cost increases exponentially. Fortunately， w ith reasonable coarse-graining based on meso-scale models， this cost can be reduced by several orders by developing additive discrete methods which can achieve good accuracy， efficiency， and scalability for supercomputing. On the other hand， computation at large scales can be accelerated by introducing stability constraints to the dynam ics models. Multiscale computer hardware conform ing to this software framework is expected to have high efficiency and speeds up the com putation even further. We have already explored the feasibility of this multi-scale strategy for model， software， and hardware developments in different applications， and have achieved very encouraging results. We suggest that this strategy should be given enough considerations in the development of future supercom puters.

supercomputing， multi-scale model， EMMS Paradigm， virtual process engineering

10.16418/j.issn.1000-3045.2016.06.004

*资助项目：中科院战略性先导科技专项（XDA 07080 000），国家自然科学杰出青年基金（21225628）

修改稿收到日期：2016 年6月8日

关于超级计算发展战略方向的思考*

1 重要意义

2 挑战与瓶颈

3 发展思路与战略

4 研究实例

5 实施建议

1　重要意义

2　挑战与瓶颈

3　发展思路与战略

4　研究实例

5　实施建议