面向算网的一体化能源算力网络技术研究

2024-04-17 14:08段俊娜项朝君郝双洋刘倩崔静魏利朋马淼娜罗望东
数字通信世界 2024年3期
关键词:东数西算

段俊娜 项朝君 郝双洋 刘倩 崔静 魏利朋 马淼娜 罗望东

摘要:文章重点研究在互联网时代,加强算网深度耦合、提升能源网络算力能力,对云、网、边进行一体化能源算力网络部署。围绕“东数西算”新型算力布局,通过算网融合,优化算力布局、优化国家/省级能源算网能力协同模型,融合算网能力,优化算力区域间东西向、南北向流量模型,进行算力端到端一体化高质量网络保障,打造算网一体的多云生态高品质能源算力网络。

关键词:算网融合;算网协同模型;一体化算力网;东数西算

doi:10.3969/J.ISSN.1672-7274.2024.03.002

中图分类号:TP 915.43          文献标志码:A           文章编码:1672-7274(2024)03-00-04

0   引言

随着“5G+AI+能源”的快速普及应用,行业数字化转型升级进度加快,全社会数据总量爆发式海量增长,各行业IT系统上云的需求已转向上云之后的数字化能力构建。云边端泛在计算模式兴起,计算进入网络内部,计算的效率、可信度与网络深度耦合,只有实现算网融合发展才能满足算网一体化业务发展需求,打造算网一体化高品质算力网络迫在眉睫。完善全国云资源池算力布局,进行全国核心资源池集约共享、省级资源池、MEC分级部署,如何基于“东数西算”国家枢纽节点新型算力布局,融合能源算网能力,打造一体化高品质算力网络,是本次研究的课题。

1   一体化算力网络整体部署

1.1 算力概述

在“5G+AI+能源”产业背景下,算法、算力、数据是AI任务的三要素。算力是基于相同的算法、成本和时间处理用户数据的能力。在图像渲染,智能推荐等应用的算力实践中,AI训练算法的演进对算力的需求增长了30万倍,可编程AI芯片的发展进一步促进了算力服务能力的提升,算力已经成为一种通用的可量化服务。数据中心EDC(Enterprise Data Center)是算力的物理承载,是数字化发展的关键基础设施[1]。国家“十四五”规划和2035年远景目标纲要中明确提出要“加快构建全国一体化大数据中心体系,强化算力统筹智能调度”。在数字经济时代,算力正在成为一种新的生产力,广泛融合到社会生产生活的各个方面[1],為千行百业的数字化转型提供基础动力。

1.2 算力网络概述

算力网络是新型数字信息基础设施,网络架构主要包含服务层、调度层、能力层。

(1)服务层:主要是一站式交付、按需供给、场景化输出、自助配置、带宽可调、网络可视的云网边一体化产品。

(2)调度层:主要是统一管控、协同编排、灵活调度的云网边一体化算力网络调度平台,进行系统编排和能力封装。

(3)能力层:主要由云、网、边组成。

1.3 一体化算力骨干网络构建

全国有多张骨干网,IT云、CT云、业务云、边缘云MEC分别承载在不同的骨干网上,多云算力割裂,需要跨网、跨多云复杂业务需求难以满足。为了改变多云算力割裂状况,算网融合下构建一体化算力网络迫在眉睫。

(1)算力融合:全国云资源池进行新型算力布局,并实施算力整合,提升整体算力能力。

(2)算网融合下打造一体化能源算力骨干网:目前几张骨干网同质化严重,算力割裂,根据算网融合要求,计划通过骨干网络融合打造一张大容量、低时延、高性能、高可靠、自动化的一体化算力网络,可以提供云业务一体化保障。

2   算网融合多云协同的一体化算力网络

过去10年云计算崛起,SDN/NFV使网络进入云网融合阶段,随着AI和边缘计算MEC的发展,需要高品质的算力网络来支撑“算网融合”时代。

根据国家战略,计划推动算力技术演进,构建算力统一调度能力,形成云边协同的算力资源布局,提供“随时、随地、随心”的算力服务,密切关注实际算网能力和市场需求,加快推进数据中心、云计算与网络的深度融合,构建布局合理、网络先进、数网、数云、云边协同发展的能源算网一体化生态体系[2]。

3   高品质算力网络部署及优化

“5G+AI+能源”的的快速普及应用,全社会数据总量爆发式增长,数据资源存储、计算和应用需求大幅提升,国家出台了《关于加快构建全国一体化大数据中心协同创新体系的指导意见》,迫切需要构建数据中心、云计算、大数据一体化的新型算力网络体系。结合国家EDC的定位,提出了带宽、时延、绕转、算力等确定性网络的要求[3]。

(1)全国一体化算力网络国家枢纽:国家在京津冀、长三角、粤港澳大湾区、成渝、贵州、内蒙古、甘肃、宁夏等地建设了全国一体化算力网络国家枢纽节点。京/长/粤/成算力节点要扩展算力增长空间;贵/蒙/甘/宁算力节点优先承接后台加工、离线分析、存储备份等面向全国的非实时算力需求。对工业互联网、金融、灾害预警、远程医疗、AI等高频实时交互业务,数据中心端到端单向网络时延原则上在20 ms范围内。

(2)城市内算力边缘MEC端:对金融、VR/AR、车/无人机联网、智慧电力等高频实时业务,数据中心端到端单向网络时延原则上在10 ms范围内[4]。

3.1 EDC东西向、南北向流量调优

随着国家“东数西算”工程的开展,国家核心EDC的流量模型不均衡问题显现了出来,因此能源算力骨干网络进行了EDC东西向、南北向流量专项流量调优工作。VPN按组网结构划分为Hub-Spoke和Full-Mesh两类。在算力时代,需将EDC东西向、南北向流量分开:东西向流量,EDC之间做数据同步或备份;南北向流量,EDC和省网之间互访。

3.1.1 EDC流量调优规划

(1)类型一:区分东西向、南北向流量。其中,东西向流量,EDC之间可以互访,VPN为Full-Mesh结构;南北向流量,EDC之间不可以互访,全国中心点可以与各省分支点互访,各省分支点之间不可以互访。VPN为Hub-Spoke结构。

(2)类型二:不区分东西向、南北向流量:全国中心点可以与各省分支点互访,各省分支点之间不可以互访。

3.1.2 流量调优具体方案

通过EDC东西向流量调优,全程端到端网络带宽扩容,保障了国家“东数西算”工程,提升了跨区域算力调度水平,加强了云算力服务、数据流通。通过EDC内北向流量模型调优,保障了省内数据中心与国家EDC之间算力级联调度,加强了算力与算法、数据、应用资源的能源一体化协同。

3.2 骨干网主备大区调整优化

根据国家EDC的定位,跨省数据中心端到端网络时延需要优化。根据东西部、南北省分之间的时延仿真推算,进行骨干网出省模型调整优化。

(1)优化方案:调整骨干网出省至东西部、南北部省分的cost值。

(2)优化效果具体如下。

① 12个省跨省流向时延下降优化达到10~30 ms,如图1所示。

② 云资源出省时延余量变化,如图2所示。

网络策略优化后,唯一导致时延劣化的流向虽然时延余量下降了,但仍大于0(约为15 ms),仍然满足业务需求。

3.3 算力端到端一体化网络保障

算力网络要求数据中心集群之间,集群和主要城市之间要部署高速数据传输网络,优化通信网络结构,扩展网络通信带宽,减少数据绕转时延,推动网络高效供给,与数据中心协同发展。

同一朵云其前后端分别部署全国不同的EDC,比如,某能源云前端部署在廊坊,需要来郑州EDC取全国的数据,再去呼和浩特EDC进行数据分析处理,最终才能形成公众可以看到的云页面。整个业务流跨多云、多网,实时性要求强,如图3所示。

能源云经多云、多网,任何一个环节出现问题,都会造成能源云打开不畅,严重影响能源相关工作,造成负面社会影响。因此,从廊坊EDC内部到郑州EDC、呼和浩特EDC,全程端到端都要保障网络轻载、设备性能优良、时延较小、路由绕转少,才能完成算力端到端一体化的网络服务保障。

4   下一步要解决的痛点

为了实现算网深度融合、算网充分协同、中心能源EDC与边缘MEC进行算力一体化调度,下一步要解决的痛点如下。

(1)能源EDC之间算力资源分配不够合理,存在前端、后端算力调度资源浪费,增加了算力流转时的故障点,降低业务稳定性。

(2)小能源EDC清退速度较慢,老能源EDC内部分设备性能不佳,能源EDC的整合速度较慢,影响算力效能,需升級换代为性能更高、运行更稳定的设备。

(3)算力承载业务没有随着网络结构调整而同步优化调整,存在算力绕转现象,时延还不够优化,高品质算力服务提供还有进步空间。

(4)需加强多云协同管理,加强多云之间、云和网络、核心与边缘云MEC之间的算网协同,进行跨行业、跨地区、跨层级的算力资源一体化调度。

5   结束语

在算网融合的背景下,致力于深化网络算力一体化技术的融合,大幅降低全国核心算力云池的时延,保障能源数据中心端到端东西向、南北向能源互联网高质量互访,可大幅提升算力网确定性品质,保障国家“东数西算”工程;深化东西部算力协同,可保障国家EDC与省内EDC之间算力级联调度,加强能源云算力服务、数据流通,提升算网资源利用效益,推动算网融合数字技术进步。

未来将立足5G展望6G,结合IPv6+、网络切片、云原生技术、可编程芯片技术,在一体化算力服务中支持服务器芯片、云操作系统等关键软硬件产品规模化应用,更积极探索算力网络与新型业务应用的深度协同,满足云游戏、千人千面直播、自动驾驶、智能安防、能源与工业机器视觉等强算力与强交互的业务需求[5],构建全国一体化的互联网创新体系。

参考文献

[1] 李正茂,雷波,孙震强,等.云网融合:算力时代的数字信息基础设施[M].北京:中信出版集团,2022.

[2] 雷波,刘增义,王旭亮,等.基于云、网、边融合的边缘计算新方案:算力网络[J].电信科学,2019, 35(9): 44-51.

[3] 刘鹏,杜宗鹏,李永竞,等.端到端确定性网络架构和关键技术[J].电信科学,2021,37(9): 64-73.

[4] 张信明,陈国良,顾钧.基于网络演算计算保证服务端到端延迟上界[J].软件学报,2001,12(6): 889-893.

[5] 栗蔚,王雨萌,立言,等.“东数西算”背景下算力服务对算力经济发展影响分析[J].数据与计算发展前沿,2022,4(6):13-19.

猜你喜欢
东数西算
“东数西算”全面启动
推进“东数西算”正当其时
“东数西算”新格局
“东数西算”,第二波炒什么?
“东数西算”大时代:布局长牛
“东数西算”投资策略:着眼双主线布局长牛股
“东数西算”工程正式全面启动
“东数西算”工程全面实施
“东数西算”优化全国数据中心布局
国家“东数西算”工程战略支点确定 我国加快构建新型算力网络体系