面向6G需求的算力网络技术

2020-07-14 15:38何涛曹畅唐雄燕李铭轩李建飞
移动通信 2020年6期

何涛 曹畅 唐雄燕 李铭轩 李建飞

【摘  要】首先阐述了6G时代中算力网络存在的意义,并简要说明了算力网络分层结构,然后,结合算力网络(CPN)控制技术,详细说明了分布式控制及集中式控制的工作原理,并对算力网络中的异构计算资源纳管进行了描述,最后详细分析了整个算力网络分层架构中各层的作用及构成,并对算力网络未来的发展进行了总结与展望。

【关键词】算力网络;分布式控制;集中式控制;异构计算资源

0   引言

2019年是5G元年,虽然全球5G商用已经起步,但是5G相比于4G的杀手级应用尚未脱颖而出,整个社会对于5G的应用有待挖掘。与此同时,世界上对于6G技术的研究也已起步,虽然5G的明天及6G世界的蓝图尚未明确,但可以预见,在未来社会,尤其是步入到6G社会时,数字化程度日益增强,终端连接数量日益增多,数据驱动全球化日益加快等,许多人们期盼的服务,比如可穿戴设备和自动驾驶等,都将非常依赖实时的数据处理及超大容量的设备连接。6G时代,通信及其相关技术的发展将远远超过5G时代,包括泛在连接、泛在计算、数字孪生网络及区块链网络等,将使我们的日常生活更加便利和安全,也将显著地提高商业的效率,这一切都将以6G时代强大的信息处理能力,即算力为基础。

1    算力网络概述

由于工艺的约束,单芯片的算力在5 nm之后将接近顶峰,传统集约化的数据中心算力和智能终端的算力可增长的空间也面临极大挑战,为了满足未来6G时代整个社会对信息处理的巨大算力需求,需要将大量闲散算力进行统一管理和调度,通过网络将闲散计算资源节点连接在一起,再通过网络的方式将计算资源提供给需要的应用和服务,供用户使用。这种基于网络汇聚计算资源,对算力进行统一管理和调度,为上层业务提供算力服务,并最终为用户提供应用的系统,我们称之为算力网络[1]。

如图1所示,算力网络自下而上,可分为基础设施层、平臺资源层和业务应用层。基础设施层将计算资源、存储资源、网络资源等基础设施进行整合,以虚拟机或者容器的方式为上层提供业务承载,并可将闲散资源以服务的形式提供给最终用户;平台资源层在基础设施层支撑的基础上进行能力构建,一方面对下层进行管理和调度,一方面以组件的方式为上层应用提供服务;业务应用层以应用软件的方式为用户提供最终服务,并通过对下层能力及资源的调用来实现其业务功能。

2   算力网络控制技术

算力网络最终的目的是以应用服务的形式为用户提供计算资源,而计算资源位于基础设施层,物理位置一般也与用户不同,这就需要借助网络功能将用户需要处理的任务传送到计算资源处。在初始的网络中,计算资源的位置及其具备的资源量,对于用户和整个算力网络来说都是未知的,需要借助通信报文作为载体,按照特定的协议在网络中进行交互,完成计算资源信息的共享。

在TCP/IP的体系架构中,只要授权的计算资源IP可达,我们就可以认为这些计算资源是可用的,所以承载计算资源信息的通信协议可以位于网络层之上(包括网络层)的任意层,它们以网络层协议为基础,将计算资源信息基于IP报文进行转发。

2.1  CFN协议的设计思路

算力网络中可基于CFN(Computing First Network,计算优先网络)协议进行计算资源信息的控制分发,CFN协议的设计初衷是为了解决MEC部署复杂、效率低、资源复用率不高等问题,它使网络能够具备内建计算业务动态路由的能力。CFN协议通过将计算资源状况和网络状况作为路由信息发布到网络,并基于虚拟的服务ID将计算任务报文路由到最合适的计算节点,可以达到用户体验最优、计算资源利用率最优、网络效率最优的目的。

CFN协议继承了传统标签转发协议的设计思路,承载在IP网络之上,在相邻的支持CFN协议的路由器之间建立会话,并借助路由协议将获取的计算资源信息发布给相邻的CFN路由器,实现计算资源信息的全网扩散[2]。同时,CFN路由器根据不同的服务构建服务路由信息表,引导业务报文以服务ID为目的地址进行转发,从而以服务的方式实现分散计算资源的利用,如图2所示:

2.2  CFN协议的工作原理

在算力网络中,要实现计算资源信息的整合以及随时随地的计算资源信息使用,就必须完成信息的全网同步。CFN路由器负责本地计算资源信息的搜集,通过IP报文或者路由协议报文将信息进行全网扩散,所有的CFN路由器根据获得的完整计算资源信息并结合网络的拓扑信息在本地生成服务路由信息表,用于指导业务报文转发,具体的实现流程及详细阐述如下文所述。

例如,在图3中,CFN路由器A和D连接了本地的计算资源节点,CFN路由器B和C负责网络中A和D的连通。①CFN路由器A和D完成本地计算资源信息的搜集,搜集过程可以采用本地计算资源节点将计算资源信息注册给CFN路由器的方式,也可以采用CFN路由器周期性的进行信息采集的方式;②CFN路由器A和D将计算资源信息承载在IP协议或者路由协议中,发布给网络中的其它CFN路由器,实现信息的全网共享;③CFN路由器根据获取到的全网信息,并结合通过路由协议了解到的网络拓扑,在本地生成服务路由信息表,以指导业务报文的转发。

特别需要指出的是,在图3中,路由器B和C作为中转路由器,可以不必支持CFN协议,因为计算资源信息是承载在IP协议或路由协议中,B和C只需要将携带计算资源信息的IP报文或者路由协议报文进行转发,而对于报文中的CFN相关信息不进行解析。

2.3  集中式控制

随着IT技术的发展,各类应用层出不穷,而不同应用对计算资源的需求侧重点会有所不同,例如二维图片的处理对CPU要求更高、视频和AI的处理对GPU的要求更高、网络报文的处理对NPU的要求更高等。根据不同的应用服务及所需计算资源的不同,在算力网络路由器上会生成不同的服务路由信息条目,每台算力网络路由器上的每条服务路由信息条目都会根据计算资源需求的不同指导转发。

当应用服务数量巨大,网络规模庞大时,每台路由器针对每个应用服务都需要获取全网信息后再独立进行路径的计算,此时,整个网络维护工作量是无法接受的,而且目前对于CFN协议关于汇聚、IGP与BGP之间的交互以及AS之间的交互细节研究尚未成熟,所以为了算力网络运行的可行性,我们需要对算力网络进行统一的管理,将信息的同步及路径的计算集中化,将服务路由信息表项完成计算后再下发给路由器,路由器只负责数据层面的业务报文转发,这与SDN的思想是一致的[3]。

前文所描述的CFN协议是基于分布式架构的,集中式架构与分布式架构的不同在于路由器之间不需要直接通信,也不需要通过本地计算生成服务路由信息表,只需要根据算力网络控制器的下发表项,在本地生成表项指导转发即可。在集中式架构的设计中,为了确定是将计算资源信息直接发送给算力网络控制器,由算力网络控制器统一进行计算,还是沿用在分布式架构中的思想,将计算资源信息发送给路由器,再由路由器发送给算力网络控制器的方式,我们考虑到,相比路由器,计算资源节点数量庞大,如果每一个计算资源节点都需要与算力网络控制器进行通信,那么对于算力网络控制器来说压力过大,所以,最终我们采用的是路由器继续承担计算资源信息搜集的责任,详细的集中式控制架构下工作流程如图4所示[4]。

①路由器A和D完成本地计算资源信息的搜集,搜集过程可以采用本地计算资源节点将计算资源信息注册给路由器的方式,也可以采用路由器周期性的进行信息采集的方式;②路由器A和D将计算资源信息承载在IP协议或者路由协议中,发布给算力网络控制器;③算力网络控制器根据完整的计算资源信息,结合完成的网络拓扑计算,生成服务信息流表;④算力网络控制器将服务信息流表下发给路由器A和D;⑤路由器A和D根据接收到的算力网络控制器信息,在本地生成服务信息流表用于指导业务报文的转发。

3   异构计算资源的统一管理

在互联网刚刚兴起的时候,网页访问应用占据主导,访问量也十分有限,一般一个网站租用几台服务器就可以满足大部分时间的业务访问,但随着互联网的发展,在21世纪初期,越来越多网络应用兴起,各互联网公司为了业务的发展,需要投入大量的成本采购硬件设备,同时也要求提高运营效率,节约能源,以降低经济成本和空间浪费,从而促使VMware和OpenStack为代表的虚拟化技术应运而生。移动互联网以及电子商务的进一步飞速发展,对于云计算服务的要求进一步提升,容器技术则以其轻量化和灵活性,在大规模突发访问量的场景下逐渐替代了高资源消耗的虚拟机技术。所以,互联网发展至今,鉴于各自适用的场景,裸机(物理机)、虚拟机、容器则成为云计算中提供计算服务的三種主流形式[5]。

用户获取算力时,并不关心底层的硬件资源形态以及调用计算资源的操作系统,只关心能够随时随地方便地使用算力,所以在算力网络中,需要一个能够承上启下的中间层,对于下层,它能将各种形态的计算资源归一化,能与各种操作系统及平台对接,对于上层,它能将算力信息无差别的上报[6]。

网络协议负责计算资源信息的传播,其本身并无法直接承担与计算资源进行通信的角色,所以我们考虑在网络层之下构建一个组件来与底层计算资源进行交互,并由这个组件将计算资源信息编码加载到网络协议报文中,这个中间层被称之为算力网络代理层。如图5所示,算力网络代理层与目前主流的云平台及操作系统进行信息交互,通过云平台或操作系统获取计算资源信息,然后进行信息编码,交由上层网络协议发布,从而实现异构计算资源的统一管理[7]。

4   算力网络架构

如图6所示,算力网络从底层硬件获取计算资源,通过资源整合、网络分发、算力提取,最终通过算力共享平台为用户提供应用服务,自下而上可分为基础设施层、平台资源层和业务应用层[8]。

基础设施层是所有上层的基础,包括服务器、存储、网络设备等硬件设备以及在硬件设备基础上部署的主机操作系统、云操作系统及虚拟化网络功能等。从物理位置上讲,它不仅包括一个机柜、一个机房的物理设施,而且涵盖了一个数据中心以及多个数据中心的跨地域资源整合,通过网络提供通信确保分布式部署以及提供计算资源信息分发功能,为上层提供整体的计算能力。

平台资源层为业务应用层算力网络共享平台提供能力整合,在这一层完成计算资源的能力化,直接提供给业务应用层的应用进行使用。在平台资源层部署的控制器是为了实现路由器的集中控制,并通过算力网络编排系统,完成算力网络的资源编排以及资源调度,并通过在编排系统中进行策略设置,实现计算资源的优选。

业务应用层是直接为用户服务的一层,算力共享平台完成从平台资源层的算力获取,无差别地为应用提供服务。各类业务应用可以采取应用商店的模式在算力共享平台中部署,例如视频、游戏、VR、大数据及AI等。业务因共用层实现了整个算力网络的可视化,为用户提供友好的UI界面,用户基于应用对算力进行使用,并可在算力共享平台上实现算力交易。

5   结束语

基于对6G时代泛在计算的构想,算力网络旨在打造CPaaS(Computing Power as a Service,算力即服务)的统一化应用平台,使用户能够便利地以服务的形式随时随地获取所需的计算资源,而不需要关注计算资源实际的物理位置。

目前,在整个算力网络体系中,还存在未完全标准化的细节,例如,计算资源涉及不同类型的算力,并且对于不同物理距离的计算资源,计算能力的大小与网络资源的优劣有着很大的关系,所以完善的计算资源度量还未形成统一的标准,从某种意义上来说还不是绝对的准确,这需要随着应用与算力更为紧密的结合,实际应用的不断增多才能逐步完善。

综上所述,虽然算力网络目前还在不断发展完善中,但是可以预见,算力网络是未来6G时代数字化信息社会不断向前发展的要求,人们对于未来信息的述求不再是纯粹的单向获取,而是逐步演变为经过信息输入、信息处理、信息返回过程形成的双向信息交互。整个网络的发展,也由目前的云网融合逐步演变为算网融合,随着通信、IT技术的不断发展,算力网络会不断完善,在不远的将来必定会成为数字化信息社会的重要基石。

参考文献:

[1]   唐雄燕,曹畅,张帅,等. 中国联通算力网络白皮书[R]. 2019.

[2]    网络5.0产业联盟. 网络5.0产业联盟 CFN特设组倡议与筹备汇报[Z]. 2019.

[3]     唐雄燕,马季春,曹畅,等. 中国联通169网络SDN化改造的成果与经验[J]. 移动通信, 2019(7): 2-6.

[4]    王瑞雪,熊学涛,翁思俊. 中国移动数据中心SDN网络架构及关键技术[J]. 移动通信, 2019(7): 7-12.

[5]    李铭轩,魏进武,张云勇. 面向电信运营商的IT资源微服务化方案[J]. 信息通信技术, 2017,11(2): 48-55.

[6]    ITU. ITU-T Y 3151: High-level technical characteristics of network softwarization for IMT-2020 - part: SDN[S]. 2019.

[7]     ETSI. ETSI GR IP6 010 V1.1.1: IPv6-based SDN and NFV; Deployment of IPv6-based SDN and NFV[S]. 2017.

[8]    IETF. IETF RFC 7426: Software-Defined Networking (SDN): Layers and Architecture Terminology[S]. 2015.

作者簡介

何涛(orcid.org/0000-0001-6993-0570):

高级工程师,硕士毕业于北京邮电大学,现任职于中国联合网络通信有限公司网络技术研究院,主要从事云化网络及数据通信网络相关技术研究工作。

曹畅:高级工程师,博士毕业于北京邮电大学,现任中国联合网络通信有限公司网络技术研究院未来网络研究部高级专家、智能云网技术研究室主任,主要研究方向为IP网宽带通信、SDN/NFV、新一代网络编排技术等。

唐雄燕:教授级高级工程师,博士,现任中国联合网络通信有限公司网络技术研究院首席科学家,中国联通智能网络中心总架构师,“新世纪百千万人才工程”国家级人选,兼任北京邮电大学兼职教授、博士生导师,工业和信息化部通信科技委委员,中国通信学会信息通信网络技术委员会副主任,中国通信标准化协会物联网技术委员会副主席,中国光学工程学会光通信与信息网络专家委员会主任,中国互联网协会标准工作委员会副主任,主要研究方向为宽带通信、互联网/物联网、新一代网络等,主持了企业许多重大技术工作,担任过多个国家级科研课题的负责人。