莫依蓉
中国超级计算机快速发展的背后,隐藏着其应用软件平台同步发展的瓶颈:运算速度连年高居榜首,市场应用依然有较大空间
2016年6月20日,中国最新的超级计算机“神威·太湖之光”在新一期的世界计算机500强榜单中,运算速度超越了“天河二号”,一举登上榜首。
“中国超算事业取得了进步,引起了更多人关注,这是一件值得高兴的事。”中国国家超级计算广州中心主任卢宇彤告诉《瞭望东方周刊》,“近年来国产超算系统发展所带动和催生的国产超算应用正在向好的方向发展。”
“天河二号”曾连续6年蝉联世界超级计算机500强排行榜冠军;接棒者“神威·太湖之光”更是将运算速度提高了两倍。
然而,中国超级计算机快速发展的背后,尚存在超算应用软件平台国产化程度偏低的问题:一方面硬件赶超速度惊人,占有量和运算速度连年高居榜首;另一方面,超算商用软件大多为国外垄断,导致其市场应用缺位。
国家名片的“新话柄”
1946年,美国诞生了世界上第一台电子计算机,运算速度为每秒5000次。
而超级计算机是一个由数百甚至数千的处理器(机)组成,能够执行一般个人电脑和服务器无法处理的大信息、高速运算的大型计算机。
超级计算机的出现将运算速度不断刷新,美国一度在运算速度上拥有绝对优势,多年占据世界超级计算机500强排行榜单的榜首。
而2013年,“天河二号”用峰值计算速度每秒5.49亿亿次夺冠证明,中国人用30年实现了大超越,“天河二号”成为国家名片。
中国超级计算机的运算速度究竟有多快?
“如果把普通计算机的速度比喻成人步行,那超级计算机就是火箭速度。”卢宇彤告诉本刊记者,以“天河二号”为例,13亿人用计算器算1000年才能达到其1小时的计算量。
在现有技术条件下,超级计算机的高运算自然不可避免地带来高耗能。
让卢宇彤没想到的是,这个全球面临的共同难题,竟成了外行人士诟病中国超算发展的“新话柄”。
据测算,“天河二号”峰值年耗电量达到2亿度。目前,广州超算中心的设备利用率达到60%,用户中83%是政府机关、高校、科研院所,企业用户只有17%。
在一些人看来,其市场效应并不明显。但卢宇彤认为这显然对中国超算很不公平,“我们要看超算中心的目标与定位,是支持大科学发现、大工程技术突破,还是进入市场化运行赚钱?”
“世界各大超算中心均只为科学研究服务,但中国超算被赋予了更多的使命,既要支持科学研究、工程技术,又要兼顾产业创新需求。”她说,广州超算的用户中83%是科研机构、高校、政府机关,正在积极拓展企业用户。
蓝海彤翔集团副总裁高鹏东非常理解广州超算中心的“烦恼”。
早在2011年,还在中国传媒大学高性能计算中心工作的他,就已经为“天河一号”进行中间件的技术开发和服务工作,非常熟悉超级计算机。
“‘天河二号系统的冷却充分利用了广州市的城市供冷循环系统,采用水风冷相结合的先进制冷技术,避免了其他超算中心专门建设冷水塔的开销,更加绿色环保。”他说。
据了解,天河二号的能效比为1.9GFlops/W,与同时期世界排名前列的美国泰坦、红杉系统相当,是日本“京”计算机(0.8GFlops/W)的2倍多,属于同时期节能型的超级计算机。
有待开发的巨型市场
在高鹏东眼中,任何诟病都不算问题,因为摆在超级计算机面前的是一个无法估量的巨型市场。
“以《阿凡达》为例,其162分钟的片子中运用了大量的特效,耗资3.5亿美元。”他说,“按24帧每秒的电影画面计算,高峰时段每天要处理10000多个任务,每秒钟288M的成品源文件。卡梅隆甚至在新西兰装配了一个10000平方米的机房以完成这些渲染工作。”
随着3D、4K技术的成熟,国内观众对影视、动画的精度要求也大幅提高,普通计算机渲染无法满足要求。
2008年,基于高性能计算的技术以及中国传媒大学在文创行业的经验,高鹏东与合伙人创办了蓝海彤翔集团,为文化创意行业提供云渲染和在线创作服务。
“三维动画电影都需要渲染,即使是真人实拍的院线电影,90分钟里也会有将近60分钟的特效需要渲染。”在高鹏东看来,对于普通从业者来说,购买机器甚至建设机房开支巨大。
“影视行业对大量的计算资源和数字资产存储资源的需求越来越大,而选择超级计算机显然更加划算,这无疑是一个巨大的市场。”他说。
广州优荣资产管理有限公司总经理邱瑞昌同样看好超级计算机未来的市场。
“我们通过收集和挖掘金融大数据,开发了一款智能投资顾问产品,帮助6000多个客户筛选出优质基金。”邱瑞昌告诉本刊记者,“产品每天需要30万个相关新闻页面、28万次相关交易数据、两千页调研报告和4万条市场情绪信息。”
“4000多只基金,每天刷下来的数据就超过1个多G。”邱瑞昌说,这是一项巨大的工程,而“天河二号”恰恰为公司提供了高速且稳定的运算资源。
在卢宇彤看来,高鹏东和邱瑞昌所代表的行业,只是超级计算机市场的“冰山一角”。
据了解,“天河二号”帮助国产C919大型客机开展了高精度外流场气动计算,6天完成了其自身计算平台约需2年的工作量。此外,广汽、广船、海格等企业也在“天河二号”的帮助下进行技术升级,大大缩短了研发时间,节约了研发成本。
“在大气环境、海洋水文、天体物理、高精度数值模拟风洞、新能源、新材料、工业制造、电子设备、生物医药、精准医疗、机器学习、金融等领域,超级计算机都有着广阔的应用空间。”卢宇彤说。
帮企业省钱提效
对“天河二号”来说,市场够大;但对企业来说,是否与之建立合作,取决于成本和效率。
广东三维家信息科技有限公司总经理徐明华告诉《瞭望东方周刊》,作为一家服务于整体家居软件信息化业务的创业公司,在其开发的平台上活跃着7万多名设计师,有超过5万多家家居门店入驻。
“平均每个门店每天就有8张家居效果图需要渲染。每张效果图的数据量都按G计算,我们需要巨大的运算资源和存储资源。”他说。
徐明华首先想到的就是建设自己的服务器平台。为此,他购买了300多台服务器。
“仅购买服务器这一项,我们公司就累计花费了2000多万元。除此之外,服务器的使用一般是2年,其维护和更新成本数倍于购买成本。”他说。
2016年,徐明华用“天河二号”的服务替换掉了将近四分之三的服务器,从而省去了大笔维护和更新费用。
除了效率,他还通过超算帮用户多赚到了钱。“我们的用户每天需要渲染大批的家居效果图,以往需要一个小时渲染的效果图,超算只需要3分钟就可以搞定。因此设计师接单量也提高了3~6倍。”
而对于广州市妇女儿童医疗中心而言,其正在进行的基因组测序项目,正在经历大规模比对运算阶段。
“人体遗传物质这个生命天书里面有30亿个字母,一个或者少数几个关键字母发生变化就可能会导致疾病的发生。我们想找出这些变化,就需要通过测序的方法。”医疗中心的博士后刘广建告诉《瞭望东方周刊》,“一个人的全基因组的数据就超过几个G,我们需要先把其打断成很多小碎片,然后测出每个小碎片的序列,最后在拼接比对过程中找到可能与疾病相关的地方。”
“这个拼接过程就需要运用大量的计算,个人电脑要算上甚至一年。而且在后续的机制研究中,还可以利用超级计算机进行分子模拟,通过精准的结构预测进行合理化药物设计。”在刘广建看来,超算是精准医疗的基础前提,提高了数据分析效率,为基因组学走向临床应用提供保障。
九成商业应用软件依赖国外
但大多数业内人士指出,“市场想要,但超算难给”,这才是目前最“尴尬”的状况,也是企业用户难以充分利用超算资源的问题所在。
高鹏东把这种“尴尬”称为商业应用软件的缺失。
“‘天河二号采用的是Linux运行系统,并非所有的应用都可以直接在其系统上运行,所有基于Windows系统或者串行开发的应用软件就必须重写或修改。”他说。
浪潮集团高性能产品部总经理刘军曾表示,中国九成以上的商用超算软件都依赖国外进口,“我国虽然拥有性能很强的大型超算系统,却缺乏相匹配的大规模并行软件,很多大型超级计算机不得不拆分成小规模的集群来跑应用,大系统并没有发挥出应有的价值。”
在高鹏东看来,这与中国科研开发模式有关。“国外对于超级计算机的开发,硬件、软件和基础设施建设各占三分之一左右的经费,而中国的超算中心建设,硬件往往占据整个超算中心建设成本的85%以上,用于软件采购和开发的费用少得可怜。”
“其实,超算中心有很多客户找上门来,他们有各种各样的需求。但用户来自不同的学科领域,还缺乏超算应用的基础,需要交叉领域的技术支持能力。”卢宇彤说。
为了解决这个难题,“天河二号”设计之初就考虑到了未来应用的生态环境,采用了通用处理器。卢宇彤说,“我们在系统上面部署了很多领域的应用软件,打造了专业的团队去搭建面向各领域的支撑平台应用。”
但在一位不愿透露姓名的专家看来,应用软件国产化程度不高造成超算资源闲置本身就是个伪命题。“虽然很多商业软件被国外垄断,但却并非无软件可用。造成超算计算资源闲置的主要原因是全机计算比较少,鲜有一个大应用能够使用全部资源。”
国策与市场兼得
国家为何耗巨资在超级计算机上?
中科院计算所研究员、中国计算机学会常务理事、高性能计算专委会秘书长张云泉曾表示,超级计算机是国家科技水平与综合国力的标志之一,其研发与应用能力的投入不宜纯粹商业化。
“国家级超算中心作为国家的战略资源,作为国家的基础设施,应该由国家每年拨付运维费用,而不是以市场为主来获取经费。就像我国在大飞机、航天、高铁等领域的长期坚持不懈的投入,才取得今天的成就,带动了相关产业的大发展。”张云泉说。
而在卢宇彤看来,中国的国情给超算中心赋予了更多的意义和任务。
“除了国家科技部投资外,广东省地方政府也有投资,所以除了支持超算传统的科学工程应用以外,还应该支持广东省和区域的科技创新和新型产业应用。”她说。
实际上,自“天河二号”落户以来,超过百万核的大规模领域应用有12个,万核以上的应用100多个,先后为国内外1500多家用户提供了高性能计算和云计算服务。
“不能因为任何原因否定像‘天河二号这样的国产超算系统所带来的巨大社会效益和经济效益。”卢宇彤强调说,“破解超算应用瓶颈,需建立开放、合作、创新的中国超算可持续发展的生态环境。”
在她看来,超算中心应该做超级计算系统与多领域科研、行业应用之间的桥梁,“加快超算应用所需的交叉学科人才培养,加大高性能计算应用软件和支撑平台的开发投入,促进国产超算应用软件的商业化发展。”