张一迪
云计算、AI对绿色计算提出巨大需求
随着云計算、大数据、AI的快速发展,数据中心的工作量越来越多元和复杂,呈现出数据密集、横向扩展、多流并发、多重迭代等特征,因此,云数据中心具有异构、多样化、大规模的计算需求。这些需求,给数据中心提出了三大挑战:高性能、低功耗和多业务。
中国科学院院士梅宏表示,面对这些挑战,低碳、创新、开放和共赢的绿色计算应运而生。他强调,数据中心的硬件和软件来自不同厂商,必须能够相互兼容、统一管理,并支持持续优化,也需要更加开放合理的社会分工模式,协同解决计算产业面临的挑战,只有开放才能共赢。
算力强劲增长摩尔定律逐渐失效
从算力角度来看,近年来在AI和HPC方面的算力急剧增长。据统计,人工智能的训练市场算力需求(Tarin-ing)8年内增长了40倍,推理市场(In-ference)5年内增长了9倍;同时HPC在这8年里也增长了13倍。从计算供应来看,摩尔定律逐渐失效,以前每18个月算力增长1倍,最近每年算力只增加10%左右.
梅宏认为,面向未来AI和HPC算力每年增加10倍的快速增长的需求,这中间将存在100倍的巨大算力缺口。这就需要从计算架构的角度来思考如何更快满足产业界对高算力的需求。
数据中心成为能耗大户降低能耗成为产业共识
我国数据中心耗电不断增长,2018年中国数据中心的耗电量为1609亿千瓦时,占全国能耗的2.3%。预计2030年达4115亿千瓦时,CAGR超过8%,将占全国能耗的4.2%。
梅宏分析认为,从微观角度来看,CPU芯片功耗具有放大效应,CPU每降低1w,数据中心总能耗可降低1.65W。按PUE为1.34的数据中心估算,CPU每节省1w,在CPU风扇节省0.04W,系统电源节省0.14W,UPS节省0.06W,加上配套空调的能耗0.33W,以及配电传输+变压器节省0.08W,总计减少1.65W。
业务多样导致数据多样驱动计算多样
云和人工智能的发展,带来了业务的多样性:智能手机、智慧家庭、IoT物联网、智能驾驶、AR/VR等场景越来越丰富;业务的多样性导致数据多样性的需求,包括数字、文本、图片、视频、图像以及结构化数据、非结构化数据等;同时大数据分析、分布式存储、ARM原生、高性能计算、Web等应用,对高并发计算提出了大量需求。
梅宏表示,在这种情况下,没有一个单一的计算架构能够满足所有场景、所有数据类型的处理,包括文本处理、大数据分析、科学计算和视频处理等等,依赖单一CPU计算架构的时代即将结束。
多种计算架构组合满足多样计算需求
计算产业历经近半个世纪的发展,持续改变着社会和其他产业,但计算产业本身也在不断地进化:从专用计算,到通用计算,再到现在全栈全场景的智能计算时代,应用多样化,业务场景多样化,需要处理的数据类型也多样化。
梅宏指出,计算多样性带来了新挑战,需要各种CPU、DSP、GPU、AI芯片、FPGA等同时存在,发挥计算架构独特优势,多种计算架构的组合才是最忧解决路径。
梅宏认为,目前来看,绿色计算的生态还不成熟,仍需产业界共同努力。希望产业界能够进一步加强合作,共同推动绿色计算生态发展与繁荣。