陈新宇 王卫斌 郭雪峰 朱 堃 何 伟
中兴通讯股份有限公司 南京 210012
算网基础设施与业务交织发展互相促进。算力和网络技术创新是应用创新的基础和使能条件,新型应用的快速发展又对算网基础技术提出挑战和需求。
当前,算力正在从通用计算向异构计算、泛在计算发展,高带宽广覆盖的双千兆网络基本建成并向智能、开放发展。但同时存在资源割裂、利用率不高、与应用需求不匹配等问题。
因此,有必要研究算网一体关键技术,通过网络将分散的算力、存储以及网络资源连接起来,基于应用需求实现一体化调度,最大化赋能应用创新,提升资源利用率。
视频业务是当前最活跃也是最有发展前景的业务之一,据统计预测,视频流量在整个IP流量的占比不断上升,2025年将达到80%以上。视频业务正在全面渗透到生活、生产的各个领域,并成为未来元宇宙、数字孪生超视频时代的核心业务。
云游戏业务未来发展空间巨大,游戏+技术是元宇宙六大技术之一。而制约云游戏业务发展的问题之一是终端设备体验差且存在笨、贵、耗电等问题,如果将算力消耗大的视频编解码、视频渲染从终端迁移到边缘或云端,同时网络对端侧到边缘、云端的连接进行低时延、高带宽保障,就可以在确保游戏效果的前提下采用轻量化终端降低成本提升体验。同样,家庭视频类应用也一直受到终端算力的限制,为了推广新业务,有时不得不大范围进行机顶盒等终端替换,成本极高。如果基于网络传输保障,将大部分计算迁移到云端,实现终端云化、存储上云、应用在云,就可以突破终端算力瓶颈,实现业务快速灵活上线开通。
视频应用正在快速进入生产现场,通过对现场视频的实时采集、处理分析来操控PLC(Programmable Logic Controller)提升生产效率。工业生产对实时性、确定性要求很高,同时还要确保数据的隐私和安全,采用加密计算和传输,往往要求多种算力及确定性网络协同运作。文献[1]中提出为满足视频应用需求,需要在云边、边边之间计算、网络资源协同,部署不同种类算力,如计算增强型、GPU渲染增强型、存储增强型等多种算力,根据应用需求以及算力分布实现算网一体协同。在视频监控场景,高清摄像头要求上行带宽在2Mb/s,超高清摄像头要求不低于4Mb/s,而部分工业高清摄像头要求高达50Mb/s。视频分辨率和帧率的提升,会带来压缩算力及存储算力的爆发式增长,利用算网一体技术将冷数据调度到云端或西部数据中心,本地只保留少量热数据,既可满足业务需求又可以降低成本,节能减排。
沉浸式多媒体业务是指能为用户提供高逼真度体验的多媒体业务。文献[2]定义了6G沉浸式多媒体业务,是指支持Tb/s级超高带宽、亚毫秒级超低时延的高可靠沉浸式多媒体业务,包括沉浸式XR、全息通信等业务类型,可广泛用于办公、医疗、社交、游戏、生产等场景。在算力需求上,包括视频编解码、视频渲染、视频分析、视频存储分发、视频显示、空间计算、多维感知等多种算力处理需求。在网络传输需求上,更是要求端到端时延不超过20ms的高可靠低时延网络。在上述报告中提出基于业务自动感知的算网一体化调度来智能实现业务与算网资源的匹配,自动识别业务对媒体编码、分析、渲染的算力需求以及时延需求,结合泛在算力资源状态和分布的实时感知,将媒体智能路由到合适的算力节点进行处理。
表1总结了关键视频业务的发展趋势及基础设施需求,其中网络指标数据参考3GPP TR26.928[3]、3GPP TS 22.104[4]、3GPP26.925[5]等标准规范给出。可以看到,随着视频业务的发展,要求构建实时、泛在、异构的多样性算力,并在新型网络及算网一体技术的支撑下实现随时、随地接入使用最佳匹配的算力资源,达到业务体验及资源利用率的双赢。
表1 视频业务发展及需求分析
中国联通在《中国联通Cube-Net 3.0网络创新体系白皮书》Cube-Net 3.0架构中提出构建“联结+计算+智能”融合服务的新一代数字基础设施[6],在《中国联通云网融合向算网一体技术演进白皮书》中,提出在未来算网一体架构中应包含运营融合、管控融合、数据融合、资源融合、网络融合、协议融合的六大融合能力[7]。中国移动在《算网一体网络架构及体系展望白皮书》中指出算网一体的主要特征应包括设备一体化、协议一体化、调度一体化及服务一体化[8]。中国电信在《云网融合2030技术白皮书》中指出云网融合的最终目标是使相对独立的云计算资源和网络设施融合形成一体化供给、一体化运营、一体化服务的体系,实现简洁、敏捷、开放、融合、安全、智能的新型信息基础设施的资源供给[9]。
我们通过误差界限法,计算得出每个动作单元需要测量的组数,然后重新按照组数进行测时,计算求得每个动作单元用时平均值X,然后通过3σ法进行异常值的剔除,计算结果如表2所示。
为了实现算网一体的发展目标需要多技术融合发展,包括算网资源标识、度量、感知、路由以及一体化的编排、调度,能力抽象封装及开放,涉及到大量设备的升级改造甚至是协议层面的演进升级,需要在做好顶层设计的前提下分阶段发展。当前阶段可聚焦在基本保持组网架构、网络协议不变的情况下,通过构建一体化编排调度能力以及一体化运营服务能力实现面向视频等新型应用的快速赋能,整体架构如图1所示。其中一体化编排调度是关键,可拆解为算力、网络、业务等领域内编排调度能力及跨层跨域的一体化编排调度能力。具体包括多要素原生的编排能力构建,多要素资源的统一建模,内生智能的业务感知及跨域编排。多要素资源原生的编排能力是指算力、网络、数据、应用等资源遵循“原生编排”的理念,具备自身独立编排能力及跨域协同编排能力,能够对基础能力不断抽象,形成标准、灵活、可编排的原子API能力,对外提供标准化封装、可自动执行的原子能力和服务,供算网一体业务编排层使用。多要素资源的统一建模是指遵循“原子层—服务层—业务层”接口模型,首先对现有算网基础设施的原子能力进行梳理,然后分层次抽取出面向资源的服务对象以及面向业务能力的业务层接口。内生智能的业务感知及跨域编排是指能够智能识别业务意图及算网资源解析,对不同应用如视频类、AI类、行业类等进行细分建模,完成应用到资源的模型映射,自动生成资源可理解的交互指令,实现业务与资源最佳匹配的编排与调度。数据驱动及内生智能将贯穿一体化编排调度的演进历程,并支撑一体化编排调度最终向意图驱动、数字孪生演进。一体化运营服务是指实现云网业务的统一受理、统一支付、统一呈现。具体包括一体化服务和一体化运营管理:一体化服务是指可供应用层按需调用的增强型服务,如面向视频领域的自适应编解码、智能路由等能力,或者终端用户可直接使用的一体化产品如云专网、云电脑、云会议等;一体化运营管理基于AI及大数据实现以用户为中心的智能运营,包括需求、设计、部署、保障、评估的智能闭环运营管理。
图1 算网一体化快速构建关键技术架构
视频算力网络是上述算网一体化架构及关键技术的实例化,为视频应用提供增强赋能。基于上节所述,通过构建一体化编排调度能力及一体化运营能力,实现面向视频领域应用的算网一体解决方案,如图2所示。通过算网资源使能层以及编排调度中心构建视频一体化编排调度能力,通过视频服务能力层及视频应用层构建视频一体化运营能力,实现视频领域算网一体化解决方案。
图2 视频算力网络架构整体架构
算力使能层:算力资源的统一管理、全局调度。通过云原生技术在多环境、多数据中心的异构资源上构建分布式的容器集群,屏蔽底层异构技术栈的差异,实现算力服务与算力资源之间的解耦。基于应用诉求、内置就近、就闲、就碳等多策略进行全局资源合理调度,实现匹配视频业务体验保障下的跨层跨域算力资源利用率最优。
网络使能层:网络资源的统一管理、全局调度。南向对接并拉通多段多类型网络,无线侧通过与NEF/SCEF对接,有线侧通过与SDN控制器对接实现端到端网络可编程可调度。面向视频领域通过QUIC等技术构建端到端视频链路加速并与CDN网络融合互通,支撑互动直播等新型视频应用对网络的双向流量需求;通过视频节点的实时感知、编排实现面向视频应用需求的智能路径计算与选择。
编排调度中心:算网资源的一体化编排与调度,视频服务的编排调度。南向分别基于算力使能层及网络使能层实现算力和网络资源的感知与编排调度,北向面向应用实现跨层跨域的一体化编排能力封装及开放。通过视频服务模板,定义视频服务及应用与算网资源需求的映射关系,实现应用与资源的解耦。对视频类业务及服务进行统一纳管、状态感知、动态弹缩及实例化部署,达到视频应用及服务最优化运行,实现基于业务SLO多属性需求智能感知的算网资源一体化编排调度。
同时,为了构建算网一体化架构,还需要对视频领域现网资源进行部分改造升级,以实现算网资源原生的感知与编排调度。
算网资源设施层包括算力资源和网络资源。算力资源层由不同类型(CPU/GPU/NPU/VPU/...)、不同级别(Mobile/Edge/Server/Data Center/Distributed Cloud)的算力体系形成位于端、边、云、网泛在、异构的视频算力,通过对算力资源虚拟化、池化改造实现资源可编排可调度。网络资源,通过光网络构建分级时延圈提升传输能力,通过5G增强技术提升上行带宽及确定性能力,通过端到端的SRv6实现网络快速部署及弹缩能力,通过RDMA、无损网络等技术提升集群算力效能。通过RTN、CDN、IMS等业务网络能力构造及升级,实现视频应用网络的能力增强及可编排。
视频服务能力层:基于算网一体的基础设施,面向视频应用赋能,实现增强型的视频服务能力,如自适应视频编解码、智能路由、分类存储、深度实时渲染、视频分析等服务化能力,赋能新型视频业务创新。视频服务能力层既可独立设置构建如视频中台类网元,也可基于已有视频网元改造合设如彩铃业务媒体服务器。
视频应用层:基于业务发展及实际需求以能力开放模式显示调用增强型视频能力,或通过网络边缘节点自动业务识别、算力路由提供增强性的视频服务,使得业务体验更好、成本更低、响应更快。
各模块之间的接口如表2所示。
表2 视频算力网络接口描述
云电脑是典型的视频类应用,随着网络和云计算技术的快速发展,进一步促进了云电脑业务的普及应用。云电脑用户只需要使用轻量化的云终端设备通过网络接入云端算力和应用,就可以轻松应对移动办公、研发测试、家庭娱乐等场景。用户操作通过远程桌面协议发送到云端,云端算力运算得到结果,计算结果以视频流推送到客户端显示。
应用场景不同、终端类型不同,所需要的云端算力有很大差异。传统方式的云电脑业务为用户静态分配云端资源,资源与需求不能很好匹配导致云端算力利用率低。此外用户的体验往往受限于网络传输质量及算力性能,在用户业务使用中会出现卡顿等情况,影响业务推广。视频算力网络基于算网业一体化编排调度可以有效提升云端算力使用率,改善用户体验。
基于视频算力网络拉通企业内多个DC算力,提供多种时延(低、中)、规格(4C8G、8C16G)、类型(CPU/GPU)的云电脑模型,结合云电脑业务开通及使用时的业务SLO需求、终端类型、潮汐效应,实现算网资源的最佳匹配编排,实现业务开通及使用。经过实际应用测试,可提升算力利用率30%以上,改善云电脑体验避免卡顿,包括以下具体场景。
1)A企业通过一体化运营平台申请采用笔记本云终端,进行家庭娱乐、多屏协同办公等业务,需要低时延、GPU加速云电脑。一体化编排系统通过算力及网络使能层实时感知算网资源,为企业分配双屏编码和CPU/GPU异构算力资源,匹配用户需求的算网资源,开通云电脑业务。
2)B企业通过一体化运营平台申请采用卡片式云终端,进行移动办公。一体化编排系统根据用户位置为用户分配距离用户位置最近的CPU算力资源,开通云电脑业务。
3)利用白天办公、晚上娱乐错峰使用的潮汐效应,不同类型云电脑共享资源,提升资源使用率。白天企业用户登录,使用云端算力进行办公,下班后云端算力空闲,一体化编排调度系统检测到算力空闲,将虚机休眠释放算力,供家庭用户晚间使用。
云电脑业务使用的最大痛点在于显示卡顿,影响用户体验。基于算网一体化调度实现客户端到服务端的智能路径选择,改善传输,为用户提供最佳体验,流程如图3所示。
图3 云电脑业务智能路径选择
1)用户登录云电脑业务,云电脑客户端通过SDK调用视频服务能力层提供的智能路径选择能力。
2)视频服务能力层转发请求到编排调度中心。编排调度中心根据媒体节点算力负载及网络拓扑拥塞信息确定备选服务路径,如路径1为媒体节点AB,路径2为媒体节点ACD,并基于路径上的媒体节点资源、网络拥塞确定采用路径2更优,然后向视频服务能力层反馈路径2信息。
3)视频服务能力层返回路径2信息给云电脑客户端,云电脑客户端启用路径2,实现云电脑业务无卡顿传输和显示 。
通过算网一体技术与视频领域的深度结合,构建视频算力网络,经过实际部署及验证,实现了基础设施对视频领域服务的能力增强,解决了业务发展及业务创新的核心痛点,同时也有利于促进算网一体技术成熟落地。