一提到超算,很多人最直接的联想就是超级计算机,甚至就在超算与超级计算机之间划上了等号。其实,超级计算机只是丰富的、多层次的超算应用的金字塔尖,而不代表超算应用的全部。业内之所以有关于国家超算与商业超算能否并存的探讨,也是从客户的实际应用需求出发,看到了划分超算场景和客户群体的必要性和商业价值。
北京并行科技董事长陈健从商业角度将超算行业划分为“尖端超算、通用超算和行业超算”三大细分市场,并为三大市场的客户进行画像和产品定位。这种对超算行业生态立体化的描述,有利于超算厂商和服务运营机构进一步明确目标客户,提供更有针对性的解决方案和服务,更加充分地发挥超算的威力。所谓尖端超算,一个“尖端”已经直接说明了这类客户和这类需求的特殊性。
通常来说,尖端超算的客户部署的是“万核”以上的应用。他们追求“三极”,即极大的规模、极高的超算硬件系统要求和极致的性能。能够驾驭尖端超算的必定是高端超算的从业人员,来自于攻坚型科研、国家级客户或各行业顶级研究机构。
称得上是尖端超算的产品,毫无疑问,一定是“塔尖上的明珠”“国之重器”。具体分析,尖端超算产品无论是在计算、访存、通信,还是I/O场景下,都具有十分出众的能力,是性能设计平衡的高端超级计算机。“太湖之光”“天河二号”等就是尖端超算的代表,凡是去实地参观过设备的人无不啧啧称赞。众所周知,这些尖端超算产品需要国家大力投入,集中科研力量进行攻关,目的就是集中力量办大事,解決一些重大、棘手的科研难题。因此,不能简单地核算其性价比,必须以速度为王。
提供尖端超算服务的代表就是国家超级计算中心。国家超级计算中心是由科技部批准成立的,截至2019年,科技部批准建立的国家超级计算中心共有七家,包括国家超级计算天津中心、国家超级计算广州中心、国家超级计算深圳中心、国家超级计算长沙中心、国家超级计算济南中心、国家超级计算无锡中心和国家超级计算郑州中心。可以说,它们是中国超算的脊梁。现在仍有一些地方政府在大力兴建超算中心,希望进入到国家超算体系之中。
中科院计算所研究员张云泉介绍说,从实践来看,我国超算在建设思路上采取了优先发展超算系统的性能,然后再拉动超算应用发展的策略,这种方式虽然在短时间内拉近了我们在设备端与世界先进水平的差距,但是也会导致超算系统初期应用效率偏低等情况的出现,需要一定的过渡期,才能让超级计算机的资源和能力得以充分释放。
反观欧美日等国家,它们的超算发展模式是,根据行业和应用领域的实际应用需求,有针对性地研制能满足实际应用需求的超算系统,这样可以有效避免对机器的浪费,形成了供需的动态平衡。
采用通用超算的客户,其应用主要在万核以下,其中绝大多数是千核以下的应用。这类客户的代表是那些海量的自身无超算资源但又想使用超算服务,或是当前在自主建设中小型超算系统的客户。这类客户的核心需求表现在,需要优质的服务,而且特别关注性价比。
通用超算可以针对不同类型的应用,按照动态随需增长模式,提供最高性价比的超算服务计算资源,从而将那些不得不自建超算系统的客户解脱出来,以租用的方式更方便快捷、以更低的成本使用超算服务。
通用超算的代表是超级云计算中心。我国的一些国家超算中心已经在尝试这种模式,并且取得了不错的效果。另外,像北京超级云计算中心,便提供商业运营的通用超算服务平台,用户数已经突破2万,并且仍在持续快速增长。北京超级云计算中心不仅拥有强悍的处理器、专业的平台优化能力,而且可以根据用户需求进行动态扩容,避免了用户排队,同时保证了计算的顺畅。一句话,北京超级云计算中心可以为各类企业提供优质的超级计算和云计算服务。
行业超算的客户可能是范围最广、应用需求差异最大的一类客户,其应用可从单核跨越到几千核。这类客户最关注服务,然后是性能和性价比。与其说这类客户关注超算,还不如说他们更关注的是业务本身,因为超算只是他们用来满足业务需求的一个环节而已,其终极目标是实现完整业务云化,同时保证业务运行的稳定性和可靠性。
行业超算,顾名思义就是面向不同的行业需求,按照各行业的实际业务需求设计完整的云上业务流程,并且保证业务各环节能够快速、高效、动态实现,具有弹性和高性能、高稳定性、高可靠性、高可维护性。行业超算的实现方式通常是“公有云/超算云+专业超算服务商”。
以阿里云、腾讯云等为代表的公有云服务商最近几年加快了在超算领域的布局。以公有云的方式交付超算资源和服务,可以发挥云本身灵活、低成本、服务化等优势,加速超算普惠的进程。举例来说,早在2018年初,腾讯云重庆黑石数据中心便对外提供超算云服务,将超级计算机集群部署在云端,满足了重庆当地工业企业对高性能计算的需求,让他们享受到云服务带来的种种便捷。
另外,阿里云的弹性高性能计算平台E-HPC面向的是传统对高性能计算有强烈需求的高校科研机构和企业用户,能够大幅度降低人工智能计算门槛,很好地诠释了公有云上的HPC as a Service。阿里云表示,E-HPC不仅可以一键部署,而且是可媲美大型超算集群的云上超算中心。
我们虽然按照客户需求和产品特性将超算划分成三大市场,但这三大市场之间的界线并不是泾渭分明,比如通用超算与行业超算之间就有交叉,最终还是要根据客户的实际需求判定采用哪种解决方案或服务。
“有些人可能会迷信超级计算机。但是超级计算机不可能为一些小应用更改配置,更不要说定制化了。这就好比手里攥着一把巨大无比的锤子,到处找小钉子砸。既然有通用超算、行业超算这样顺手的小锤子,为什么不用?用小锤子砸小钉子可能会事半功倍。”陈健表示,“我们从给客户画像入手,先明确用户的需求,再找对路的产品和服务,这样可以更好地满足超算商业化的需求。”
将超算划分成三大市场,最直接的效果是将客户需求梳理清楚,引导客户对号入座,选择最适合自己的超算服务,而不是非要千军万马争过国家超算这一座独木桥。商业超算也有自己的擅长,在某些场景下可能更经济、更高效。俗话说,杀鸡焉用宰牛刀,就是这个道理。不同的设备对应不同的最适合的应用场景,既不要大材小用,也不必一味追求“高大上”。
调查显示,大部分企业客户的计算需求都在千核以下,通用超算或行业超算完全可以满足需求。统计数据显示,我国传统超算市场的整体规模达280亿元,其中尖端超算目前大约占四分之一,而通用超算占四分之三。行业超算包含了行业应用软件市场,是后起之秀,增长势头迅猛,预估市场份额约为1000亿元,假以时日很有可能颠覆目前的超算市场格局。
国外的超算市场更加成熟,也相对简单,尖端超算数量并不多(比如NASA),通用超算和行业超算的用户主要都是由云计算公司来提供服务。在国内,尖端超算的规模还在不断扩大,但是仍有很多企业用户在自建超算系统,这说明在超算市场上还存在供需不平衡的情况。在电商领域,有了天猫和京东,为什么还会有拼多多异军突起?这是不同的市场定位、不同的客户群体和需求决定的。在超算领域,尖端超算、通用超算和行业超算三大市场会进一步明确和细分。