□ 杨广文
作为大国重器,超级计算是解决国家经济建设、社会发展、科技创新和国家安全等重大战略问题的重要手段,是国家创新能力的重要体现。经过数十年的不懈努力,我国的超级计算机研制已经在世界上有了一席之地,自主研制的超级计算机天河一号、天河二号、神威·太湖之光先后十一次在全球超级计算机排行榜排名第一,充分体现了我国超算研制方面的实力,对科学研究、工程模拟、重大装备、社会发展等起到了明显的支持和推动作用。在超级计算的研究中,如何更好地发挥超级计算机的性能,高效求解各类应用中的重大科学问题一直是研究的核心问题之一。新世纪以来,超级计算机和高速互联网的不断发展,对面向应用领域的高性能计算环境提出了新的机遇和挑战。
为了提升我国超级计算机的应用水平,推动超算中心从提供机时服务向提供多领域应用服务的转变,基于超级计算机和高性能通信网络构建超算互联网势在必行。
超算互联网的研究与构建,将能够有效应对超算发展新形势下我国超算中心运行面临的挑战,支持超算中心之间通过高速网络实现资源共享和协同工作,实现超算中心从机时提供者向应用服务提供者的转变,提升我国超级计算机的应用水平,为国家经济建设、社会发展、科技创新和国家安全等提供更加强大和易用的超算服务。通过构建超算互联网,我们可以建立连接各国家级超算中心的核心资源网,实现计算资源的高效共享和管理;面向国家重大需求,针对重点应用领域研制支撑领域应用的专业平台并开展应用;构建自主可控的高性能计算应用平台服务体系,提供跨超算中心的统一服务能力。
超算互联网是一种以超级计算机和高速互联网为基础的国家级超算算力基础设施,以高速网络互联地理上分布的超算中心,聚合多个超算中心的软硬件资源,并通过建设超算资源共享与交易平台,支持算力、数据、软件、应用等资源的共享与交易,同时向用户提供多样化算力服务。在此基础上,面向各领域与产业用户构建专业的领域应用平台,为科技创新、产业升级、社会发展、国家安全等提供基于超级算力的专业服务。作为一种超算算力基础设施,超算互联网将超级计算机所提供的强大计算能力抽象为更加本质的计算服务,并以一种标准化的形式提供给计算服务的使用者。
简单地讲,我们可以将超算互联网与电力网相类比。电力网制定标准的发电、传输、用电规范,构建基本的电力传输和交易平台,将来自于火电、水电、风电、核电、光伏等不同来源的电力整合到一起,为工业、农业、居民、科研等各种电力用户提供即用即得的电力服务。与电力网类似,超算互联网通过制定资源接入、共享、交易等规范,构建具备资源共享与交易能力的公益性资源平台,将来自各级超算中心、云计算企业、科研机构等不同来源的算力、数据、软件、应用等抽象为统一的超算资源并整合到一起,为科研、生产、生活和国家安全等提供高效专业的超级计算服务。
为了推动超算互联网的实现,打造算力和服务水平世界领先的战略性关键信息基础设施,充分发挥现有和在建超级计算机的资源潜力,国家超级计算无锡中心联合国家超级计算广州中心、中科院计算机网络信息中心等多家国家级超级计算中心,以及清华大学、青岛海洋国家实验室、之江实验室等多家核心应用单位,依托国家重点研发计划项目“国家高性能计算环境领域应用平台及服务体系研究与构建”,开展超算互联网技术体系和应用模式研究,着力构建超算互联网原型,推动超算中心从提供算力到提供服务的重大转变,提升超算对科技创新、经济建设、社会发展的推动能力,为创新型国家的建设提供基础性的计算支撑。
首先,基于来自紫金山实验室、赛尔网络等多家不同网络运营单位提供的高速网络互联解决方案,超算互联网项目组实现了国家超算无锡中心、国家超算青岛中心、国家超算广州中心、中科院计算机网络信息中心等多个国家级超级计算中心资源的互联互通与资源共享,集成了每秒钟完成超百亿亿次浮点运算的异构超算算力。这些遍布全国的超算算力被有机地整合为一个整体,形成国家高性能计算核心资源网,为超算互联网提供强大的算力基础。
其次,集成和研发资源管理与任务调度软件,形成基于五层九个功能面组成的应用平台体系结构的领域应用平台搭建技术体系。该体系结构由资源层、互联层、平台层、应用支持层(聚合层)和应用层五层组成,包括用户认证授权与管理、资源信息服务、计算任务管理、数据管理、应用商店、计费与审计、日志服务、应用开发与运行时环境、系统管理九个功能面。该技术体系能够在超算的最终用户和超算的并行程序开发者之间搭建一座桥梁,将超算所提供的强大计算能力抽象为更加本质的计算服务,并以标准化的形式提供给计算服务的使用者,实现各级超算中心、云计算企业、科研机构等不同来源的算力、数据、软件、应用等资源的有机整合。
再次,项目在分子模拟与药物设计、环境治理与灾害防治等多个重点领域进行应用资源集成与服务集成,建设领域应用平台并开展应用示范。在分子模拟与药物设计领域,设计和初步构建分子模拟与药物设计领域应用平台,实现和部署高通量药物筛选、分子动力学模拟以及化合物库和数据管理系统。在环境治理与灾害防治领域,设计和初步构建全国精细化短期气候预测业务系统、全球涡分辨率海洋—海冰预报、浪潮流耦合的精细化海洋预报、典型流域精细化水文预报、长三角/环太湖气象预报等领域应用平台。这些领域应用平台能够更加有效地为国家实验室等大型研究机构提供以数值模拟为主、兼顾数据分析和智能计算的科研基础设施服务,让超算算力更好地服务于科学研究和社会进步。
最后,超算互联网将在前期探索的基础上建立资源接入与交易规范和应用服务平台建设规范,支持资源的快捷接入、安全共享和高效交易,以及面向领域的应用服务平台的快速构建。构建超级计算资源管理及应用服务体系,提供跨超算中心的统一服务策略和评价指标,探索超级计算中心、超级计算软件开发者和超级计算用户三方共赢的新型超算商业模式,实现超算中心从提供算力到提供服务的重大转变。通过产业扶持与技术支持,集中优势力量,针对重点行业和产业,形成面向行业或产业的具有技术和市场优势的企业联盟或集群,最终为用户提供基于超算的专业化业务服务,扩大超级计算的应用群体。
超算互联网变提供超算算力为提供超算应用服务的最大特点,带来了在应用模式上的巨大变化,对超算及其应用的发展具有相当大的推动作用。建设和发展超算互联网,打造算力和服务水平世界领先的战略性关键信息基础设施,充分发挥现有和在建超级计算机的资源潜力,对于国产并行软件的研发和商业化、典型应用服务平台的研发及商业化和相关产业生态发展都有着非常明显的支持和带动作用,将为开启算力经济时代提供坚实的基础。策