算力网络发展展望研究

2023-01-24 14:09许耀顺李梓萌陈迎春
大科技 2022年48期
关键词:算力一体架构

潘 叶,许耀顺,李梓萌,陈迎春

(中国移动通信集团广东有限公司,广东 广州 510623)

0 引言

立足新发展阶段,贯彻新发展理念,构建新发展格局。算力网络建设是支撑国家网络强国、数字中国、智慧社会战略的基础,是对接国家规划、落实“东数西算”工程部署的重要支撑,是推动国家新型基础设施建设走向纵深的全新路径,将有力地推动数字经济的持续健康发展[1]。构建以5G、算力网络、智慧中台融合互促的新发展计划,打造“连接+算力+能力”的新型信息服务体系将会是未来十年内网络发展的主要方向。

推动算力网络的发展驱动力主要包括以下6 点:①国家“东数西算”战略实施,预测云服务商和运营商将会是承建和运营的主力[2]。②国家意志在推动,未来算力的使用成本会大幅下降,需求会指数上升,可以预测未来发展前景广阔。③互联网云服务商通过租用光纤建设SDN 化的云骨干网、或者打造SD-WAN 等多种途径进入该领域。④外部竞争对手CT 和IT 厂家如亚信、浪潮、中盈、华为等也在运营商层面积极布局,在各省运营商层面推动算网大脑建设和试点。⑤编排、多云的产品升级,算力网络将是一个契机,编排从业务编排到网络编排、云编排的产品升级,多云从云资源管理到云应用管理的升级。⑥现有产品架构的提升,采用轻量化微服务分布式架构、云原生容器化部署、组件间松耦合、解耦和框架-适配组件思路进行产品设计,提升产品的稳定性、灵活性和适用性。

1 算力网络概述

算力网络是一种根据业务需求,在云、网、边之间按需分配和灵活调度计算资源、存储资源以及网络资源的新型信息基础设施,具体以算为中心、网为根基,网、云、数、智、安、边、端、链等深度融合、提供一体化服务的新型信息基础设施。算力网络的目标是实现“算力泛在、算网共生、智能编排、一体服务”,逐步推动算力成为与水电一样,可“一点接入、即取即用”的社会级服务,达成“网络无所不达、算力无所不在、智能无所不及”的愿景[3]。

算力泛在具体指实现三融通,从而构建云边端多层次、立体泛在的分布式算力,具体包括:空间融通东西,逻辑融通云(C)、边(E)、端(T),内核融通异构,实现x86/ARM/GPU/FPGA 等多样性算力。算网共生指网在算中、算在网中,网络从算力连接感知和承载算力。智能编排指融数注智,构建算网大脑,实现算网统一编排、统一调度、统一管理和统一运维,打造算网资源一体设计、全局编排、灵活调度、高效优化的核心能力。一体服务主要是实现三个融合供给:①多重要素融合供给:融合算网数智链安等多要素。②多元算力融合供给:算力并网、可信交易。③数智服务融合供给:随需满足、体验“无感”、使用更智能便捷。

2 算力网络发展现状

算力网络自提出来后,在业界各方的共同努力下,算力网络的标准化工作取得了很大进展,通信网络运营商和各企业都有积极参与。中国通信学会、CCSA、网络5.0 联盟、IMT-2030(6G)推进组等行业组织和产业联盟纷纷启动算力网络相关标准的制定。2021 年4 月至今,CCSATC3 通过了算力网络总体技术要求、算力路由协议技术要求和算力交易等立项。TC1 通过了泛在计算总体技术要求、泛在算力调度管理技术要求和算力度量等立项,初步建立了算力网络行标体系。IMT-2030(6G)网终技术工作组已正式启动6G 网络中的算网一体需求和关键技术研究。

算力网络是一个庞大的系统性工程,一般认为其发展大致可以分为以下三大阶段。

第一阶段(2022—2023 年)是泛在协同的起步阶段。在算力方面持续发力,从中心云向边缘发展,构建云边协同的算力体系,同时对网络架构进行优化和调整,实现协同编排、网随算动的一站服务和协同运营,向用户能够提供算力和网络的一站式服务。

第二阶段(2024—2025 年)是融合统一的发展阶段,在这一阶段,算力和网络还是两个相对独立的个体。引入统一的算网大脑,向下可以实现算力和网络的统一的编排和调度,向上赋能网络的统一运营,向用户提供算力和网络的统一的融合服务,实现职能编排、算网融合的融合服务和统一运营。

第三阶段(面向“十五五”阶段及更长期)是一体共生的跨越阶段。在这一阶段,不仅在算网大脑方面进行融合,还会引入算力路由等相关技术,实现网络和算力在生态和协议方面进一步融合,实现智慧内生、算网一体的一体服务和模式创新[4]。

3 算力网络的发展及展望

3.1 算力成为数字经济时代的生产力, 云计算推动算力服务化

新一轮科技革命和产业变革正在重塑全球经济结构,算力是信息时代的新生产力,是支撑数字经济发展的坚实基础,算力的发展推进了技术的升级换代、应用的创新发展、产业规模的不断壮大,而云计算作为算力的生产工具,给予算力随时随地、按需等优点,大大降低算力使用门槛,推动了算力向服务化迈进[5]。

全行业数字化转型的加速对算网一体化基础设施和融合人工智能、大数据等多要素融合服务能力的要求日益提升。当前算网各自编排、分域管理,难以提供算网融合的产品。算网大脑通过算网数据感知获取全域实时动态数据,结合算网智能化、多要素融合编排实现要素能力的一体供给和智能匹配,横向全面融合网、云、数、智、安、边、端、链多种能力要素,纵向深度贯穿应用、平台到底层资源,进而为新型信息基础设施对外提供一体化服务提供能力支撑。

3.2 异构算力迎来繁荣期,推动算力向普惠化发展

随着5G、工业互联网、人工智能、云计算等新技术快速发展,GPA、FPGA、AI 芯片等异构算力迎来繁荣期,满足各场景计算需求的同时,从成本的角度大幅度降低计算门槛。算力的服务对象也将从企业和大客户扩展至小微企业及个人,真正推动算力成为“人人可用”的普惠资源。有研究表明,我国基础算力占算力的比重由2016 年的95%下降到2020 年的57%,智能算力占算力的比重由2016 年的3%提升至2020 年的41%。智能算力的比重提升代表算力应用场景的不断丰富,是算力“普惠”发展的重要体现。

3.3 边缘应用场景激增,推动算力向泛在化发展

随着算力泛在性程度的不断加深,边缘侧应用场景层出不穷,算力需求不断增加,算力逐步从中心侧向边缘侧、端侧扩展,形成了云-边-端三级算力架构,以支撑智能安防、游戏、视频等多样化智能应用场景的不断落地。

智慧城市、智慧工厂、智慧家庭等智能场景的逐步落地,人工智能正深刻地改变我们的生产、生活方式,一个以数字化、网络化、智能化为特征的智慧社会正加速到来。一方面,以智算集群、无损网络、高性能存储为核心的智能算力解决方案有效提升计算效能、降低计算成本、缩短人工智能训练周期;另一方面,基于多样性算力的能力评估体系、云边端算力高效协同调度能力和智能应用的敏捷构建方式等新型技术,构建泛在协同的智能算力底座,推动人工智能从“单点突破”迈向“泛在智能”,实现智慧社会转型升级。

3.4 云原生解决多样性算力的兼容性问题, 推动算力向标准化发展

随着多样性技术路线的引入和发展,以GPA、FPGA 为代表的异构计算与以ARM 为代表的CPU 架构的兼容性问题更加突出,多样性算力的标准化度量与输出成为挑战。无论是底层资源的异构,还是不同地域如中心或边缘节点应用的异构,容器化部署使算力资源输出达到统一标准。

以GPU、FPGA、AI 芯片为代表的异构算力增长迅猛,以DPU/IPU 为代表的软硬件深度融合的一体化计算架构逐渐兴起,突破传统冯·诺伊曼架构的近存计算、存算一体等存算融合新计算架构不断出现。这些架构变革以数据处理的高效性为目标,通过数据流驱动计算,对底层数据按需就近处理,极大提升数据处理效率。此外,面向多样性的新型计算架构,跨架构的开放编译平台已成趋势,通过屏蔽底层硬件架构差异,构筑开发环境友好、性能高效的算力服务。

3.5 算力和网络呈现深度融合的趋势, 算网一体技术已现雏形

算力和网路的发展日益呈现一体共生之势,从网随算动到算网融合再到算网一体,网路从支持连接算力,演进为感知算力、承载算力,实现网在算中、算在网中。与此同时,算力度量、算力原生、算力路由等算网一体技术日益受到产学研各界重视,相关技术的成熟将持续推动算网融合纵深发展。

传统的算力和网络相对独立,二者仅为简单的连接关系。以NFV/SDN 为核心技术的下一代网络规模部署,算力和网络开始在基础设施层面逐步融合,随着5G+MEC 的飞速发展,进一步驱动网络开始感知算力的位置,实现就近分流,算网融合的一体化平台服务已成趋势。未来,算网将在协议和形态层面进一步融合,网络将深度感知算力,通过在网络协议中引入算力信息,将应用请求沿最优路径调度至算力节点,网络设备通过共享自身算力,对数据进行在网计算,降低通信延迟,将推动无人驾驶、元宇宙等超低时延类新型业务创新突,进而推动算力服务化,推进算网向一体共生发展。

3.6 多样性算力布局极速扩展, 新的跨架构的开发生态体系逐步形成

面向通用计算,互联网企业和芯片巨头已经完成了x86+ARM 多样性计算布局,面对AI 这一增长预期更加强劲的未来市场,芯片布局更为激烈。多样性算力的开发生态体系相对独立,应用的跨架构开发和迁移困难,需通过开源、开放的方式建立可屏蔽底层硬件差异的统一异构开发平台。例如,寒武纪的AI 加速芯片,华为的CPU+NPU,英特尔的CPU+IPU/FPGA,AMD 的CPU+APU/FPGA,英伟达的GPU/DPU+CPU 等。

“东数西算、东数西存、东数西训、东数西渲”带来跨地域、跨层次、跨架构的海量数据调度需求,对传送网络的容量、时延、成本、能耗等提出了更高要求。以OXC、400G/800G、OSU、SPN、50GPON、FTTR、硅光、新型光纤等为代表的新技术蓬勃发展,推动光传送网向基于光电联动的大带宽、扁平化、低时延的智慧全光网演进[6]。

3.7 算力需要发挥极致性能,呼唤计算架构的技术创新

算力节点、存储和网络共同构成了经典冯诺依曼式的计算架构,网络传输速率和存储墙成为影响算力的最终性能的瓶颈,催生取代经典冯氏架构的技术创新,存与算的工作模式以及网与算的组织形式都将发生巨变。

传统存与算的工作模式是存算分离,具体表现为CPU 从存储单元获取数据后进行计算,然后将计算结果写回存储器。目前存与算的工作模式是近存计算,具体表现为通过3D 封装与HBM 技术,通过缩短CPU 与存储单元之间的距离,从而增强带宽。而中远期存与算的工作模式则采用存算一体的新架构,使用新的存算一体芯片以及新编译器和指令集,从而实现数据存算一体。

传统网与算的组织形式为由服务器完成计算,然后通过网络转发数据。目前网与算的组织形式为智能网卡计算,通过计算服务器搭配专用计算加速卡实现。中远期网与算的组织形式则是采用网络设备计算,通过定义新的设备形态和功能,从而实现数据在网计算。

3.8 算力供给参与者众多,全新算力交易模式即将出现

随着产业由云向算发展,算力服务有多方供给,为了使社会已有算力得到充分利用,有效避免算力资源的重复建设,融合多方算力服务的新的算力交易模式即将出现。

通过算力交易创新模式广泛吸纳社会算力,基于区块链的多方算力可信共享将推动算力的供给侧改革,使算力的使用成本进一步降低,实现算力普惠,同时提升社会空闲算力使用效率,最大化发挥算力的价值。数据流通服务可实现跨行业、跨主体的数据共享和开放,通过联邦学习、隐私计算等技术为多方协作模式下的数据价值挖掘提供可靠保障,推动数据合法、高效利用,助力数据产业应用升级,打造数据应用服务新范式。

4 结语

综上所述,深刻认识算力和网络融合共生、一体服务,这对全社会数智化转型具有重大意义,对算力网络的产生背景、核心理念、应用场景、发展路径以及技术创新进行深入研究,进而倡导实现“网络无所不达、算力无所不在、智能无所不及”的愿景。

猜你喜欢
算力一体架构
算力盗用:一种新型财产侵害*
中科曙光:联合发布全国首个“一体化算力交易调度平台”
基于FPGA的RNN硬件加速架构
中国电信董事长柯瑞文:算力成为数字经济的主要生产力
算力网络场景需求及算网融合调度机制探讨
功能架构在电子电气架构开发中的应用和实践
基于云服务的图书馆IT架构
一体推进主题教育同频同向
农旅一体 激情米萝
雄浑豪迈于一体灵秀磅礴熔一炉