贾庆民,丁瑞,刘辉,张晨,谢人超,3
算力网络研究进展综述
贾庆民1,丁瑞2,刘辉1,张晨1,谢人超1,3
(1. 紫金山实验室,江苏 南京 211111; 2. 广东省新一代通信与网络创新研究院,广东 广州 510000;3. 北京邮电大学网络与交换技术国家重点实验室,北京 100876)
随着新型网络业务和应用的不断发展与成熟,云计算、边缘计算、智能终端设备得到了快速发展,计算资源呈现出泛在部署的趋势,如何高效协同地利用这些泛在计算资源成为当前网络领域研究的一项重要新课题。在此背景下,算力网络(CFN,compute first networking)的概念被提出,并引起了广泛的关注,其基本思想是将算力和网络深度融合,协同分布式的计算资源,提升计算资源的利用率,同时改善用户的网络服务体验。首先分析了算力网络的提出背景和研究现状,然后介绍算力网络的基本架构、工作流程,以及算力网络的关键技术,最后对算力网络发展方向以及面临挑战进行分析。
边缘计算;网络计算融合;算力网络;协同
随着5G和移动互联网技术的不断发展,AR/VR、车联网、超高清视频等新业务新应用不断出现,这些新业务新应用不仅需要更多的网络带宽资源,还需要更多计算资源来保证正常运行以及用户体验。在这种背景下,边缘计算的概念得以提出[1]。边缘计算是一种在网络边缘部署计算和存储资源,就近为用户提供云计算服务环境和能力的新型网络范式,可以极大地降低用户接入网络内容和计算服务的时延,对提升网络性能、改善用户体验具有重要意义。需要指出的是,边缘计算是一个相对宽泛的概念,雾计算[2]、多接入边缘计算[3]、微云[4]都可以认为是边缘计算的范畴。其中,多接入边缘计算通常聚焦于移动通信网络领域;雾计算最初更加注重物联网领域的研究和探索;而微云则更加侧重通过为移动设备提供强大的计算资源,及以更低的时延支持计算密集型和交互式的移动应用。
与此同时,随着边缘计算以及智能终端设备的大量部署,用户终端接入并使用这些海量的分布式计算资源变得更加方便快捷。然而,如何更加高效地利用这些计算资源成为当前亟须解决的问题。一方面,单一的边缘计算节点资源受限,难以有效快速处理计算任务,特别是对于一些计算密集型的任务,可能导致边缘计算节点负载重、计算任务处理时间长的问题;另一方面,虽然计算资源呈现出泛在部署的趋势,但是边缘计算节点之间,以及边缘计算节点与云计算节点之间缺乏有效协同机制,计算任务的分配与调度机制尚不完善,造成计算资源利用率低。
因此,为更加高效利用网络边缘的海量分布式计算资源,推动分布式边缘计算与网络的深度融合及协同处理,算力网络(CFN,compute first networking)的概念得以提出[5-6]。算力网络旨在将分布式计算节点打通互联、统筹调度,通过对网络架构和协议的改进,实现网络和计算资源的优化和高效利用。算力网络一经提出,就得到了学术界和产业界的广泛关注。本文围绕算力网络的最新研究进展,首先介绍算力网络的基本架构、流程机制,以及算力网络的关键技术,然后分析算力网络的发展趋势和面临的挑战。
当前学术界和产业界都在积极推动算力网络的研究和发展,中国移动、中国联通、中国电信以及华为公司积极参与算力网络的标准制定和技术推广。本节从产业、标准、学术3个方面对算力网络的研究进展进行介绍。
在产业方面,2019 年11月,中国联通网络技术研究院发布了《中国联通算力网络白皮书》[7],介绍了算力网络发展的产业背景,对算力网络的概念、架构、标准和生态等方面进行了分析讨论,并指出算力网络是云化网络发展演进的下一个阶段。同时,中国移动联合华为公司发布了《算力感知网络技术白皮书》[8],提出一种基于分布式系统的计算网络融合新架构——算力感知网络(CAN,computing-aware networking),旨在实现用户体验、资源利用率,以及网络效率的最优化;该网络架构体系从逻辑功能上划分为算力服务层、算力平台层、算力资源层、算力路由层和网络资源层5大功能模块,以实现对泛在计算和服务的感知、互联和协同调度。特别地,中国联通的算力网络方案和中国移动的算力感知网络方案主要是以CFN技术为基础的。其中,CFN技术的核心功能包括算力资源感知和算力任务调度,而这也是中国移动和中国联通的算力网络方案的核心。
在标准化方面,国际互联网工程任务组(IETF,The Internet Engineering Task Force)在2019年2月成立了网内计算研究组(COINRG, Computing in the Network Research Group)[9],致力于研究计算和网络的深度融合,以改善网络和应用程序性能以及用户体验。目前,COINRG研究组已经在网内计算需求、传输协议问题、工业用例、网内计算安全与隐私、以应用为中心的网内计算微服务等方面提交了多项互联网草案。其中,互联网草案[10]分析了网内计算的需求,在网络方面的需求包括高精度、并发处理和信息交互等,在计算方面的需求包括计算资源的部署、发现和调度等。同时,路由领域工作组(RTGWG,Routing Area Working Group)[11]发布了多个标准草案,主要涉及算力网络的应用场景及要求、算力网络的架构、算力网络的现场测试等。2019年10月,由中国联通、中国电信和华为公司共同推动的算力网络顶层架构标准“Framework and Architecture of Computing Power Network”在国际电信联盟(ITU,International Telecommunication Union)SG13 全会上成功立项[7,12]。在国内,中国通信标准化协会(CCSA,China Communications Standards Association)以及网络5.0产业和技术创新联盟也在积极推动算力网络的研究和标准化工作,并于2020年6月在网络5.0技术标准推进委员会(CCSA TC614)正式成立算力网络特别工作组[13],旨在聚集联合多方力量,共推共创算力网络产业影响力,构建算力网络生态圈。
在学术方面,算力网络正在引起越来越多的关注。在文献[14]中,作者研究分析了面向计算网络融合的下一代网络架构,并指出新架构需要支持网络可编程、函数能力寻址、确定性网络、算力感知的协同调度和控制等功能,以便于更加有效地满足万物互联、万物智能、万物感知的需求。在文献[15]中,作者阐述了算力网络在6G时代的重要作用,并对算力网络的分层架构、网络控制技术、异构计算资源纳管等机制机理进行了分析探讨。在文献[16]中,作者针对基础资源泛在化、网络服务智能化、业务需求多样化的未来网络发展趋势,提出了一种基于多维资源融合化的网络虚拟化架构,并设计了资源发现、资源交易与资源调配等机制流程,以保证为用户提供弹性的资源供给和敏捷连接,满足新兴业务对资源需求的快速响应。此外,算力网络不仅可以实现边缘计算节点之间的连通,还可以实现边缘计算节点和云计算节点的连通。因此,如何协同网络与云计算节点、边缘计算节点的计算资源也是一项重要的研究课题。文献[17]研究了面向云、网、边协同的算力网络方案,分析了算力网络在资源抽象、业务保证、统一管控和弹性调度方面的特征要求,并提出了基于云、网、边深度融合的方案,从而可根据客户需求,在云、网、边之间按需分配和灵活调度计算资源、存储资源以及网络资源。
另外,边缘计算、无服务器计算以及计算服务命名机制等都在算力网络的研究中发挥着重要作用。
在边缘计算方面,当前的研究工作涵盖了计算任务卸载、计算任务调度以及能效优化等方面。在文献[18]中,作者对边缘计算的计算任务卸载技术进行了研究,并从卸载决策、资源分配和系统实现3个方面进行了全面总结分析。加强边缘计算节点之间的协作对于优化计算任务的调度、提升计算资源的利用率具有重要意义;在文献[19]中,作者研究了面向智能物联网的多层算力网络,由于物联网智能应用对算力的需求不同,论文联合考虑通过云计算、雾计算、边缘计算、海计算之间的交互和算力资源协同,实现算力的智能分发。在文献[20]中,作者研究了面向自适应视频流的边缘计算能效优化问题,通过联合优化视频缓存和转码,提升边缘计算在缓存和计算方面的能效性能。
无服务器计算[21](serverless computing)技术在算力网络以及边缘计算的研究和发展中扮演着重要角色。无服务器计算是指在构建和运行应用时无须管理服务器等基础设施;无服务器计算描述了一个更细粒度的部署模型,在该模型中应用被拆解为细粒度的函数并被上传到一个平台,然后根据当前所需执行、扩展和计费[22]。在算力网络中,用户不需要知道算力服务器的部署位置或者计算资源的部署位置,只要算力网络系统能够满足用户的计算需求和服务体验即可,无服务器计算的理念为实现算力网络的愿景提供了技术支撑。在无服务器计算方面,文献[23]研究了边缘计算与无服务器计算的融合机制,并提出了无服务器边缘计算系统架构。在文献[24]中,针对分布式边缘计算节点资源受限的问题,设计了面向边缘计算的无服务器计算平台。
在计算服务命名机制方面,文献[25]提出了一种基于信息中心网络(ICN,information centric networking)的边缘计算系统——命名函数网络(NFN,named function networking),NFN可以使用函数名定位远程计算资源并执行网内计算。基于NFN的研究基础,文献[26]提出了NFaaS(named function as a service),重点研究了网络中函数的放置问题,以及在虚拟机中的执行问题。文献[27]结合信息中心网络和边缘计算,提出了一个新型网络架构——信息中心边缘(ICedge,information-centric edge),通过研究设计基于命名的计算服务发现、服务调用以及计算结果重复利用等机制,简化了网络边缘的服务调用,并提高了计算资源利用率。文献[6]结合信息中心网络技术的命名机制,研究了基于ICN的算力网络融合架构和机制,采用计算图实现对算力资源的感知,并通过任务调度器实现对计算任务的分发调度。
算力网络的核心思想是将分布的计算节点连接起来,动态实时感知计算资源和网络资源状态,进而统筹分配和调度计算任务,形成一张计算资源可感知、可分配、可调度的网络,满足新业务新应用对算力的要求,是一种云边网深度融合的新范式,也是边缘计算向泛在计算网络融合演进的新阶段。本节基于提交IETF的算力网络技术方案,介绍算力网络的基本架构和工作流程。
算力网络基本架构重点关注两个设计约束:边缘计算节点状态的实时感知和边缘计算资源的分布式协同处理及调度。
(1)边缘计算节点状态的实时感知
实时感知边缘计算节点的负载状况对于合理分配计算任务,高效利用边缘计算资源具有重要意义。例如,部署在居民区的边缘计算节点通常在工作时间段接收的请求量较低,在非工作时间段接收的请求量较高;而工业园区边缘计算节点接收请求量的规律正好相反。上述场景下,不同边缘计算节点在不同时间段的计算负载差异很大。而传统基于静态的服务调度方法不能适应不同边缘计算节点计算负载不平衡或计算负载快速变化的情况。在这种情况下,有的边缘计算节点(如最靠近用户侧的节点)可能已过载,而其他边缘计算节点可能仍有足够的计算资源满足用户请求。因此,边缘计算节点状态的实时感知是合理均衡地使用计算和网络资源、动态高效地处理调度计算任务的基础。
(2)边缘计算资源的分布式协同处理及调度
当前,边缘计算正从单一的边缘节点扩展成为网络化、协作化的边缘计算网络。算力网络支持大规模边缘计算节点互联和协作,可提供优化的服务访问和负载均衡机制,以适应计算服务的动态特性。算力网络可根据计算任务的要求,结合实时的计算负载和网络状态条件,动态地将计算任务调度到最匹配的边缘计算节点,从而提高计算资源利用率和用户体验。
基于当前学术界和产业界的研究进展,特别是IETF发布的关于CFN架构的草案[9],本小节阐述了CFN的基本架构。CFN基本架构如图1所示,主要包括CFN节点(CFN node)、CFN服务(CFN service)、CFN适配器(CFN adaptor)等3个部分。
图1 CFN基本架构
Figure 1 The basic architecture of CFN
CFN节点是CFN网络中的基本功能实体,通常集成在边缘计算节点中,可以实时提供节点的计算资源负载情况,以及向用户终端提供CFN服务访问的能力。CFN节点主要包括CFN入口(CFN ingress)和CFN出口(CFN egress)。其中,CFN入口面向客户端,负责服务的实时寻址和流量调度;CFN出口面向服务端,负责服务状态的查询、汇聚和全网发布。CFN节点可作为虚拟网络功能(VNF,virtual network function)部署于服务器,也可部署于接入环或城域网中的接入路由器等物理设备。
CFN服务是CFN节点服务注册表中的一个单位,具有唯一服务ID(SID,service ID),代表一个应用服务。在CFN中,SID用来标识由多个边缘计算服务节点提供的特定应用服务,同时终端设备也采用SID来启动对服务的访问。在当前CFN系统中,SID是一个任播地址,对某SID的请求可由不同的边缘计算节点响应;即终端设备无法预知提供服务的边缘计算节点。通过感知计算和网络的状况,决定选择响应请求的边缘计算节点的过程被称为算力服务调度。在算力服务调度期间,会选择最合适的边缘计算节点(即CFN出口),并基于该节点处理指定的计算服务请求。另外,CFN出口具有绑定IP地址(BIP, binding IP)到用户请求的SID的相关信息。BIP是一个单播IP地址,能够接入提供目标服务的特定服务节点。
通常,一个服务可以部署在多个边缘计算服务节点中,这些节点可以由运行在Pod、容器或者虚拟机上的工作负载实例实现,每个服务节点可以由 IP地址来区分。如图1所示,SID 2标识的服务可以由具有BIP22的CFN节点2或具有BIP32的CFN节点3来提供。当从终端设备到SID2的服务请求到达CFN入口(在本例中是CFN节点1)时,CFN入口节点应动态确定该请求应发送到哪个CFN出口;在确定具体的边缘计算服务节点之后,所有访问该服务且来自相同流的后续数据包都将发送到所选服务节点的BIP。
在CFN中,CFN适配器是一个重要的功能实体,并通过保持BIP信息、识别初始请求包等方式帮助终端设备接入CFN。它可以作为CFN节点(内部模式)的一部分实现,也可以在单独的设备(外部模式)上实现。图1中显示了CFN适配器的外部模式,它可以部署在客户端侧(如连接多个用户设备的虚拟网关),并作为移动网络中的用户平面功能(UPF,user plane function)或固定网络中的宽带远程访问服务器(BRAS,broadband remote access server)。采用外部模式,可以将CFN适配器放在离客户端更近的地方,同时CFN节点可以放置在某个聚合点上,并连接多个CFN适配器。与内部模式相比,外部CFN适配器可保留较少的客户端绑定信息。
算力网络的体系架构可以分为控制平面和数据平面,如图2所示。控制平面的主要作用是通告扩散服务状态信息,包括计算服务状态信息和网络服务状态信息。数据平面主要作用是基于SID进行寻址和路由转发,进而实现计算任务的分发调度。
基于上述的算力网络基本架构,本小节简要阐述算力网络的基本工作流程[28]。
(1)CFN适配器识别来自终端设备的新服务请求,可通过特定的SID任播地址范围来识别。
(2)CFN适配器将请求转发到其关联的CFN节点,即CFN入口。
(3)CFN入口基于服务节点的计算资源负载状况、网络状态和其他信息,确定最合适的CFN出口;然后,CFN入口将请求转发到选定的CFN出口;需要注意的是,CFN入口也可以选择本节点来服务请求;在这种情况下,它既是CFN入口也是CFN出口。
图2 CFN体系架构的控制平面和数据平面
Figure 2 Control plane and data plane of CFN architecture
(4)CFN出口接收来自CFN入口的请求,并使用绑定IP(BIP)作为目的地址,来接入所需的服务。
(5)CFN适配器会保持关于流的绑定信息(包括SID、CFN出口等)。
(6)CFN入口将来自相同流中相同服务的后续数据包发送到绑定的CFN出口,以保持其业务流粘性。
(7)CFN节点将服务节点的状态(如特定服务的可用计算资源)定期分发给彼此。
算力网络作为一种新型网络技术,不仅在网络体系架构方面具有突破性,而且在关键技术方面有诸多创新,特别是状态感知、任务调度等方面有关键性的技术突破。本节对各项关键技术进行简单介绍。
在算力网络中,计算资源具有异构泛在的部署特性,以及动态时变的资源特性。例如,计算资源广泛部署在智能终端侧(端侧)、边缘计算侧(边侧)、云计算侧(云侧)等,并且计算资源都在实时变化之中,计算负载各不相同。高效利用这些计算资源的前提是实时精准地感知这些异构泛在的计算资源状态。因此,异构泛在计算资源状态的实时感知是算力网络的一项关键技术。
同时,随着5G网络、Wi-Fi网络、千兆宽带网络等异构网络的广泛部署,“万物互联、万网互联”已经成为趋势,如何快速高效地通过泛在边缘网络接入边缘计算节点是亟须解决的一个重要课题。实时动态地感知边缘网络的状态,如传输时延、抖动、带宽资源利用率等网络信息,进而选择一条最优的传输路径分发计算任务对提升算力网络系统性能具有重要意义。因此,异构泛在网络状态的实时感知是算力网络中的另一项关键技术。
在CFN的系统架构设计中,充分考虑了计算与网络资源的实时感知,并将计算与网络资源的感知能力集成在了系统架构的控制平面[28]。为了保证计算与网络资源实时感知,CFN节点之间需要相互通告相关的状态信息,包括关联的SID信息以及SID对应的计算负载信息。当接收到访问SID的请求时,CFN节点就基于这些状态感知信息来进行算力服务的调度;而且这些信息可以在BGP/IGP路由协议扩展中携带。在CFN节点中可以维持一个服务状态信息表,如表1所示。
表1 服务状态信息
计算负载可以基于不同的维度进行加权计算,如使用的CPU、正在服务的会话数、每秒查询数、计算时延等。同时,这些信息需要定期更新同步。为了避免网络波动,信息更新同步仅在指标变化超过阈值或更新计时器过期时才进行。而且,CFN入口节点选择的出口节点并不一定是负载最低的出口节点;请求也可以发送到计算负载相对较低的出口节点,以避免网络波动。由于SID是一个任播地址,CFN 入口需要联合考虑计算负载和网络成本来决定将请求转发到哪一个SID的CFN出口。
图3简要地显示了CFN控制平面信息同步的工作机制流程。该图描述了CFN节点3分发服务SID2计算信息的过程。CFN节点2也以类似的方式分发服务SID 2计算信息。同时,扩展了控制平面路由协议的定义和操作以支持CFN的信息分发,并增加了从这些信息中选择CFN出口及具有任播地址的方案/标准。
图3 CFN控制平面信息同步机制
Figure 3 Information synchronization mechanism of CFN control plane
本节介绍了计算与网络资源状态感知的基本思路,主要包括计算资源状态实时感知问题、网络状态实时感知问题、资源状态感知信息同步问题等。在算力网络中,计算与网络资源状态感知机制依然存在许多科学问题和技术挑战亟须解决。例如,计算与网络资源状态信息测量是一项提升感知精度的关键技术,通过对计算与网络资源状态信息的采集或监测,实现对边缘计算节点和网络设备运行状态的精准感知,进而为计算任务的调度决策提供支撑,同时为边缘计算节点和网络设备的运营维护提供数据支撑。另外,计算与网络资源状态预测机制也是一项提升感知精度的关键技术,即通过对计算与网络资源状态信息的采集、处理和分析,结合机器学习相关算法,实现对边缘计算节点算力状况以及网络状况的预测,进而提升对计算与网络资源状态的感知能力,为资源的精细化分配、计算任务的实时调度提供支撑。
边缘计算节点的计算资源往往是有限的,而且计算能力通常各不相同;同时,边缘计算节点的计算负载状况是动态变化的。因此,一方面,当多个计算节点可以完成某项计算任务时,涉及选择哪一个计算节点来处理该计算任务的问题;另一方面,计算量较大的计算任务可能需要分派给多个边缘节点或者计算资源充足的边缘节点来进行处理,如何将计算任务分派并调度至最匹配的边缘计算节点以提升计算任务处理效率是算力网络的关键技术之一。如果将计算任务分发至计算负载过高的节点,就会影响实时计算的效果,进而影响用户应用的体验。此外,在选择了具体计算任务处理节点之后,需要以最短时间将计算任务分发至目标节点,这既需要选择匹配的接入网络类型,如5G网络、Wi-Fi网络等;又需要在协议和算法层面进行优化,如优化路由算法以保证选择最佳的传输路径,优化传输协议以保证时延确定性等。
当前,在CFN的系统架构设计中,主要考虑最优计算节点的路由选择机制[8,28]。在CFN的路由表中包含了计算资源和网络资源的状态信息数据,特别是一些关于计算资源性能的评估参数,如计算剩余能力、计算时延等,并通过对网络资源与计算资源的加权计算,选出最优的边缘计算节点进行路由转发和任务执行。当路由节点收到计算任务的数据包时,首先确定该数据包的计算任务类型,通常计算任务类型包含服务ID、流粘性需求属性等,基于预先获取的计算任务类型、其他边缘计算节点和计算资源性能的对应关系,确定该计算任务类型对应的至少一个其他边缘计算节点及其计算性能。基于其他节点的计算性能,以及本地节点与其他节点之间的网络链路状态,综合权衡后确定目标计算节点。目标计算节点的地址即数据包的路由目的地址,而后基于目标地址对数据包进行转发。
特别地,为保证CFN中计算和网络资源的统一高效调度,CFN引入了动态任播和业务流粘性保持技术[8,28]。对于某些需要保持在同一服务节点的业务流,需保持其粘性,否则将会出现断流、丢包、流量乱窜等问题。因此,可由服务向CFN提交流粘性需求,包括流粘性类型、超时时间等,生成并写入流粘性需求数据表并在CFN网内扩散。动态任播技术通过基于动态计算状态和网络状态,实现将业务请求路由到等效的服务实例。传统的任播通常用于单请求−单响应式通信,当网络状态发生变化时,可能会将不同的请求发送到不同的位置;而在CFN中,需要在终端设备和边缘计算服务节点之间进行多请求−多响应式通信。因此,在CFN的数据平面需要保持流粘性,以确保来自同一流的请求始终由同一边缘计算节点处理,并且该边缘计算节点在CFN入口接收到第一个任播请求时确定;连接到同一CFN入口的不同终端主机对同一SID的服务访问可以调度到不同的CFN出口。在CFN中,这种特性被称为动态任播。与此同时,动态任播对数据平面提出了一些要求。流粘性表需要由CFN入口维护,而且大量的终端主机需要连接到CFN节点。因此,CFN入口可能需要较大的内存空间来维护一个非常庞大的表(包含流、服务ID、CFN出口等)。因此,最好将流粘性表放在外部的CFN适配器上,因为CFN适配器只需要维护一个小得多的表,通常可以少于100个。
本节介绍了计算任务调度机制,主要包括计算节点的选择问题、网络链路的选择问题、计算任务的分派问题、动态任播问题等。在算力网络中,计算任务调度方面存在一些科学问题和关键技术亟须解决。其中,联合考虑计算和网络资源的负载均衡机制是优化计算任务调度性能的一项关键技术,即通过感知的边缘计算节点和网络链路的状态信息情况,设计实现计算和网络资源协同的负载均衡机制,对充分利用计算和网络资源,保证算力网络系统最优的性能具有重要意义。另外,边缘网络域内调度问题和域间调度问题也是计算任务调度机制需要重点解决的关键技术问题。
当前,算力网络引起了学术界和产业界的高度关注。尽管算力网络在架构和关键技术方面取得了许多进展,然而,算力网络未来的发展依然存在许多挑战亟须解决。本节对算力网络未来的发展方向和技术挑战进行简要梳理分析。
(1)结合SDN技术,构建软件定义算力网络
随着软件定义网络(SDN,software-defined networking)技术的不断发展和成熟,将SDN技术应用于算力网络基本架构的设计中是今后发展的一种趋势。软件定义网络是一种新型的网络技术[29],它的核心思想是将网络的控制平面与数据平面进行分离,并且可以对控制平面进行编程。数据平面与控制平面的分离将有助于底层网络设施资源的抽象以及管理视图的集中,并以虚拟资源的形式支持上层应用与服务,实现更好的灵活性与可控性。数据平面上的交换机等网络设备可专注于数据的转发而不用考虑决策策略;所有的决策策略都由控制平面上的SDN控制器来决定和处理,这就使网络的配置和管理变得非常敏捷高效。网络管理员可通过集中的方式配置和管理网络,而无须单独访问和配置每个网络硬件设备。
在算力网络中,计算资源的感知(或算力服务的发现)和计算任务的调度可以由SDN控制平台进行集中式处理。如图4所示,在基于软件定义的算力网络架构中,边缘计算节点需要实时向SDN控制平台通告计算资源状态,SDN控制平台基于分布式的边缘计算节点的计算资源状态,构建计算资源状态分布图。当终端设备发起算力服务请求时,SDN控制平台根据实时的算力状态分布以及网络状况,将算力服务请求调度至最匹配的边缘计算节点。结合SDN技术,算力网络在计算资源感知与计算任务调度方面都会变得更加灵活敏捷。
图4 软件定义算力网络参考架构
Figure 4 The reference architecture of software-defined computing first networking
(2)结合ICN技术,构建命名算力网络
信息中心网络[30]是一种革命性的网络架构理念,在未来新型网络体系架构的研究中扮演着重要角色。ICN强调以信息内容为中心的通信模式,而非以主机为中心的端到端通信模式。由于目前的网络架构中,信息与位置是紧耦合的关系,即要想获取信息内容,必先获取该内容所在的位置;用户关注的是获取信息内容,而不在意信息内容所在的位置。因此,在ICN中,通过对信息内容命名、泛在部署缓存、支持移动性等一系列机制,实现了基于信息内容的通信机制。
在算力网络中,用户具有类似于信息中心网络的诉求,即用户关心的是获取计算资源和计算处理能力,而并不关心计算资源的部署位置;只要计算资源和计算处理能力能够满足用户的业务和服务要求,无论计算资源部署在何处,无论计算资源以何种形态构建,用户都是可以接受的。为了实现基于算力的服务发现和路由转发,借鉴ICN对信息内容命名的方法,对计算服务进行命名,实现基于计算服务命名的算力网络是今后发展的一个重要趋势。同时,考虑到ICN实现了对信息内容的命名,这为计算服务的命名机制设计提供了重要参考。借鉴ICN的信息命名寻址机制,设计面向计算服务的命名寻址机制是开展命名算力网络研究的首要问题。
另外,当前网络的价值主要体现在对信息内容的分发和传输;由于当前的网络与内容依然是解耦的,即网络对内容是不感知的;网络要想获取内容,必须先获取内容的位置信息,即当前网络通过对位置信息的感知,实现对内容的请求获取的。这种将位置与内容进行耦合绑定,并通过位置来实现获取内容的方式,增加了信息内容分发的复杂性,随着网络内容爆炸与泛在缓存的发展,传统的内容分发模式将面临巨大挑战。而对信息内容进行命名并基于命名实现寻址是未来高效内容分发的重要途径。未来,信息内容的分发和传输将更多地借鉴信息中心网络的方法来解决。同时,网络的价值体现在对计算任务的分发和传输方面。随着人工智能技术的发展以及与其他行业的深度融合,越来越多的业务和应用需要大量的计算资源,如海量信息数据处理分析、深度学习、神经网络训练等。算力网络通过融合计算与网络资源,实现了计算资源的实时感知和计算任务的高效调度,从而推动社会的智能化发展。
因此,结合信息中心网络技术的命名寻址机制,在网络架构层面,协同融合算力与内容,实现对计算资源和内容资源的感知和调度,提升算力服务和内容服务的分发效率具有重要意义。因此,基于信息中心网络和命名算力网络,将信息内容命名和计算服务命名协同融合起来,构建基于命名的计算和内容融合网络架构也是今后需要研究的重要课题。
区块链是一种将数据区块以时间顺序相连的方式组合,并以密码学方式保证不可篡改和不可伪造的分布式数据库[31-32]。区块链的实质是分布式数据存储、点对点传输、共识机制、加密算法等多种技术的集成,可有效解决传统交易模式中数据在系统内流转过程中的造假行为,从而构建可信交易环境,打造可信社会。区块链在不引入第三方中介机构的前提下,可以提供去中心化、不可篡改、安全可靠等特性保证,因此,区块链技术在数字金融、物联网、智能制造、供应链管理、数字资产交易等多个领域有广泛应用。
在算力网络中,用户需要频繁地通过算力网络使用相关的算力服务和资源,因此,如何在用户和算力服务资源提供商之间进行可信的算力交易是算力网络研究的一项重要课题。通常用户使用算力服务资源需要向算力服务资源提供商支付一定的费用;其中就涉及服务交易和结算的问题,采用区块链技术,将算力服务交易和结算的逻辑规则部署在区块链的智能合约层,可实现高效的算力服务交易和结算。另外,由于计算资源的泛在特性,计算资源不仅可以由边缘计算节点来提供,也可能会由终端设备来提供(如家庭网关设备、智能移动终端等),通过区块链的分布式可信机制,将提供计算资源的各异构节点或设备统一纳入分布式泛在计算资源的感知和管理中,构建基于区块链的泛在计算资源可信管理机制,以保证计算资源的可信接入和可信服务,进而保证各计算资源提供方的利益以及用户的业务安全。
(4)结合确定性网络技术,构建超低时延算力网络
确定性网络技术是一种面向超低时延、超高可靠的网络新技术,通过对网络协议的设计优化,实现IP网络从“尽力而为(best-effort)”到“准时、准确、快速”,进而控制并降低端到端时延,为时间敏感型网络业务提供确定性的网络传输服务。2015年,IETF成立了确定性网络工作组,专注于在第2层桥接和第3层路由段上实现确定传输路径,这些路径可以提供时延、丢包和抖动的最坏情况界限,以此提供确定的时延[33]。
在算力网络中,很多业务需要超低时延的计算卸载和智能决策。这些业务通常需要在边缘计算节点进行计算处理后做出智能决策,然后将决策指令发送给智能终端设备,而决策指令传输对网络传输时延要求极高,传统的“尽力而为”的传输方式无法满足业务需求,如自动驾驶场景中,在对路况环境信息采集和处理之后,控制指令需要以超低的时延进行传输,以保证自动驾驶汽车对环境状态做出最优最快的动作响应;而传统的“尽力而为”的网络传输模式具有随机不确定性,难以保证指令信息快速准确的传输,进而难以保证人员与汽车的安全性。确定性网络与算力网络的融合涉及许多关键技术的突破,包括时间同步机制、资源预留机制、流量控制机制等[33]。研究探索算力网络与确定性网络的融合机制机理,对于超低时延算力网络的应用和发展具有重要意义。
(5)结合节能优化技术,构建绿色算力网络
在算力网络中,人工智能应用的普及以及计算密集型任务的处理在消耗大量计算资源的同时,也会带来巨大的能耗。根据2019年绿色和平组织和华北电力大学联合发布的研究报告表明[34],随着人工智能、物联网、区块链等技术的发展,中国数据中心的总用电量连续8年增速超过12%;其中,2018年中国数据中心总用电量为1 608.89 亿千瓦时,占全国用电量的2.35%,已经超过上海市2018年用电量(1 566.7 亿千瓦时);随着信息通信产业的不断发展,预计到2023年数据中心总用电量将达到2667.92亿千瓦时,比2019年增长66%,年均增长率将达到10.64%,功耗总量将进一步提高。因此,如何解决算力网络的能效问题,降低算力网络的使用成本关系着算力网络的大规模部署和应用推广,是算力网络发展过程中面临的一个重要课题。
如何应对算力网络的能效问题,除了研发更低功耗更高性能的计算处理芯片之外,还可以从以下几个方面开展研究。第一,计算服务实例的放置问题,根据用户的需求以及边缘计算节点的负载,合理按需地放置计算服务实例对于降低算力网络能耗具有重要意义。第二,在选择了计算服务实例的放置位置之后,需要合理地选择并构建算力网络计算载体,当前算力网络中的计算载体包括虚拟机、容器以及Unikernel,其中虚拟机镜像大小为GB 级别、容器为MB 级别,Unikernel为kB级别,它们的实例化时间也由分钟级到秒级再到100 ms级,它们除了镜像大小、实例化时间方面存在巨大差异,在能耗方面也有较大差距,选择与计算业务相匹配的计算载体具有重要意义。第三,对计算量巨大的计算任务,可能需要对计算任务进行分割,并将各个子任务卸载迁移至多个边缘计算节点,如何高效地对计算任务进行分割和分配,也是算力网络能耗优化的重要课题。
算力网络通过对网络架构和协议的改进设计,实现对计算和网络资源状态的感知,进而实现边缘计算资源的按需分配和计算服务请求的智能调度,从而提高用户的服务体验质量以及实现网络和计算资源的优化和高效利用。当前算力网络处于研究探索的初始阶段,在网络架构、关键技术等方面存在许多问题需要解决。随着人工智能、AR/VR、自动驾驶、全息通信,以及工业互联网等技术的进一步发展,网络新业务新应用对计算资源的需求越来越多,计算资源的异构泛在部署的趋势也将越来越明显,算力网络在今后信息网络变革和社会经济发展中扮演的角色也将越来越重要。
[1] MACH P, BECVAR Z. Mobile edge computing: a survey on architecture and computation offloading[J]. IEEE Communications Surveys and Tutorials, 2017, 19(3): 1628-1656.
[2] MOURADIAN C, NABOULSI D, YANGUI S, et al. A comprehensive survey on fog computing: state-of-the-art and research challenges[J]. IEEE Communications Surveys & Tutorials, 2018, 30(1): 416-464.
[3] TALEB T, SAMDANIS K, MADA B, et al. On multi-access edge computing: a survey of the emerging 5G network edge cloud architecture and orchestration[J]. IEEE Communications Surveys & Tutorials, 2017, 19(3): 16571681.
[4] SATYANARAYANAN M, BAHL P, CACERES R, et al. The case for vm-based cloudlets in mobile computing[J]. IEEE Pervasive Computing, 2009, 8(4): 14-23.
[5] IETF,Routing Area Working Group (rtgwg). Compute first networking (CFN) scenarios and requirement[R]. 2020.
[6] MICHA K, MASTORAKIS S, ORAN D, et al. Compute first networking: distributed computing meets ICN[C]//6th ACM Conference on Information-Centric Networking (ICN '19). ACM, 2019.
[7] 中国联通网络技术研究院. 中国联通算力网络白皮书[R]. 2019.
China Unicom Network Technology Research Institute. White paper on China Unicom computing power network[R]. 2019.
[8] 中国移动研究院. 算力感知网络技术白皮书[R]. 2019.
China Mobile Research Institute. White paper on computing-aware network technology[R]. 2019
[9] IETF. Computing in the network research group (coinrg)[EB].
[10] IETF. Computing in network research group, requirement of computing in network draft-liu-coinrg-requirement-02[R]. 2020.
[11] IETF. Routing area working group (rtgwg)[EB].
[12] ITU SG13[EB].
[13] 网络5.0产业和技术创新联盟[EB].
Network 5.0 industry and technology innovation alliance[EB].
[14] 姚惠娟, 耿亮. 面向计算网络融合的下一代网络架构[J]. 电信科学, 2019, 35(9): 38-43.
YAO H J, GENG L. Trend of next generation network architecture: computing and networking convergence evolution[J]. Telecommunications Science, 2019, 35(9): 38-43.
[15] 何涛, 曹畅, 唐雄燕, 等. 面向6G需求的算力网络技术[J]. 移动通信, 2020, 44(6): 131-135.
HE T, CAO C, TANG X Y, et al. Research on computing power network technology for 6g requirements[J]. Mobile Communications, 2020, 44(6): 131-135.
[16] 雷波, 王江龙, 赵倩颖, 等. 基于计算、存储、传送资源融合化的新型网络虚拟化架构[J]. 电信科学, 2020, 36(7): 42-54.
LEI B, WANG J L, ZHAO Q Y, et al. Novel network virtualization architecture based on the convergence of computing, storage and transport resources[J]. Telecommunications Science, 2020, 36(7): 42-54.
[17] 雷波, 刘增义, 王旭亮, 等. 基于云、网、边融合的边缘计算新方案: 算力网络[J]. 电信科学, 2019, 35(9): 44-51.
LEI B, LIU Z Y, WANG X L, et al. Computing network: a new multi-access edge computing[J]. Telecommunications Science, 2019, 35(9): 44-51.
[18] 谢人超, 廉晓飞, 贾庆民, 等. 移动边缘计算卸载技术综述[J]. 通信学报, 2018, 39(11): 138-155.
XIE R C, LIAN X F, JIA Q M, et al. Survey on computation offloading in mobile edge computing[J]. Journal on Communications, 2018, 39(11): 138-155.
[19] YANG Y. Multi-tier computing networks for intelligent IoT[J]. Nature Electronics, 2019, (2): 4-5.
[20] XIE R C, LI Z S, WU J, et al. Energy-efficient joint caching and transcoding for HTTP adaptive streaming in 5G networks with mobile edge computing[J]. China Communications, 2019, 16(7): 229-244.
[21] JONAS E. Cloud programming simplified: a berkeley view on serverless computing[R]. 2019.
[22] CNCF. Serverless[EB].
[23] CICCONETTI C, CONTI M, PASSARELLA A, et al. Toward distributed computing environments with serverless solutions in edge systems[J]. IEEE Communications Magazine, 2020, 58(3): 40-46.
[24] BARESI L. Towards a serverless platform for edge computing[C]// 2019 IEEE International Conference on Fog Computing (ICFC). 2019
[25] SIFALAKIS M, KOHLER B, SCHERB C, et al. An information centric network for computing the distribution of computations[C]//Proceedings of the 1st International Conference on Information-Centric networking. 2014: 137-146.
[26] KROL M, PSARAS I. NFaaS: named function as a service[C]//Proceedings of the 4th ACM Conference on Information-Centric Networking. 2017: 134-144.
[27] MASTORAKIS S, MTIBAA A, LEE J, et al. ICedge: when edge computing meets information-centric networking[J]. IEEE Internet of Things Journal, 2020: 1.
[28] IETF. Routing area working group (rtgwg)[EB].
[29] 郭中孚, 张兴明, 赵博, 等. 软件定义网络数据平面安全综述[J]. 网络与信息安全学报, 2018, 4(11): 1-12.
GUO Z F, ZHANG X M, ZHAO B, et al. Survey of soft ware-defined networking data plane security[J]. Chinese Journal of Network and Information Security, 2018, 4(11): 1-12.
[30] XYLOMENOS G, VERVERIDIS C N, SIRIS V A, et al. A survey of information-centric networking research[J]. IEEE Communications Surveys and Tutorials, 2014, 16(2): 1024-1049.
[31] 章峰, 史博轩, 蒋文保. 区块链关键技术及应用研究综述[J]. 网络与信息安全学报, 2018, 4(4): 22-29.
ZHANG F, SHI B, JIANG W B. Review of key technology and its application of blockchain[J]. Chinese Journal of Network and Information Security, 2018, 4(4): 22-29.
[32] 沈鑫, 裴庆祺, 刘雪峰. 区块链技术综述[J]. 网络与信息安全学报, 2016, 2(11): 11-20.
SHEN X, PEI Q Q, LIU X F. Survey of block chain[J]. Chinese Journal of Network and Information Security, 2016, 2(11): 11-20.
[33] 黄韬, 汪硕, 黄玉栋, 等. 确定性网络研究综述[J]. 通信学报, 2019, 40(6): 160-176.
HUANG T, WANG S, HUANG Y D, et al. Survey of the deter ministic network[J]. Journal on Communications, 2019, 40(6): 160-176.
[34] 绿色和平, 华北电力大学. 点亮绿色云端中国数据中心能耗与可再生能源使用潜力研究[R]. 2019.
GreenPeace, North China Electric Power University. Research on energy consumption and renewable energy use potential of China data center[R]. 2019;
Survey on research progress for compute first networking
JIA Qingmin1, DING Rui2, LIU Hui1, ZHANG Chen1, XIE Renchao1,3
1. Purple Mountain Laboratories, Nanjing 211111, China 2. Guangdong Province New Generation Communication and Network Innovation Research Institute, Guangzhou 510000, China 3. State Key Laboratory of Networking and Switching Technology, Beijing University of Posts and Telecommunications, Beijing 100876, China
With the development of 5G and mobile Internet technology, cloud computing, edge computing and intelligent terminal devices have been developed rapidly. Computing resources indicate a trend of ubiquitous deployment. How to use ubiquitous computing resources efficiently and collaboratively has become a hot topic at present in network field. In this context, the concept of compute first networking (CFN) has been proposed and attracted wide attention. Its basic idea is to enhance utilization of computing resources and improve user experience of network services, by converging computing and network deeply as well as coordinating distributed computing resources. Firstly the background and research status of CFN were analyzed, and then basic structure, workflow, and key technologies about CFN were explicated. Finally, future research directions and challenges about CFN were summarized.
edge computing, convergence of computing and network, compute first networking, coordination
TP393
A
10.11959/j.issn.2096−109x.2021034
2020−08−19;
2020−12−14
丁瑞,dingrui@gdcni.cn
国家重点研发计划(2019YFB1804403)
The National Key R&D Program of China (2019YFB1804403)
贾庆民, 丁瑞, 刘辉, 等. 算力网络研究进展综述[J]. 网络与信息安全学报, 2021, 7(5): 1-12.
JIA Q M, DING R, LIU H, et al. Survey on research progress for compute first networking[J]. Chinese Journal of Network and Information Security, 2021, 7(5): 1-12.
贾庆民(1990− ),男,山东泰安人,博士,紫金山实验室研究员,主要研究方向为边缘计算、边缘智能、算力网络、工业互联网。
丁瑞(1984− ),男,江苏南京人,广东省新一代通信与网络创新研究院研究员,主要研究方向为软件定义网络、网络安全。
刘辉(1983− ),男,江苏沛县人,博士,紫金山实验室研究员,主要研究方向为移动边缘计算、边缘智能技术、工业互联网。
张晨(1992− ),男,辽宁兴城人,硕士,紫金山实验室研究员,主要研究方向为未来网络体系架构、软件定义网络、云网融合、云原生网络。
谢人超(1984− ),男,福建南平人,博士,北京邮电大学教授、博士生导师,主要研究方向为信息中心网络、工业互联网、标识解析技术、边缘计算、无服务器计算。