(中国电信股份有限公司研究院,中国 北京 102209)
(China Telecom Research Institute, Beijing 102209, China)
随着新一代网络技术和信息技术的不断创新和应用,通信网络正加速向数字化、智能化转型,人工智能(AI)技术将广泛渗入新型基础设施建设,且获得越来越多元的应用场景和更大规模的受众[1]。为了应对新的业务需求,未来的通信网络需要支持快速创新和新的商业模式,将从端、管、云多维度持续深化演进,形成“无所不在、无所不含、无所不能”的泛在智联网络。
具体来看,在端的层面,终端形态从过去的手机、平板电脑(PAD)和各种比较简单的物联网终端,扩大到各种穿戴设备和无处不在的传感设备,使得感知成为终端的重要能力,即“泛在感知”;在管的层面,网络软件化、虚拟化和云化将改变传统刚性网络架构,形成高弹性、广覆盖的连接网络,即“泛在连接”;在云的层面,边缘计算和人工智能快速兴起,大量计算任务将从云端卸载到边缘,使得云端呈现边缘化、智能化、泛在化的状态,即“泛在智能”[2]。
泛在智联网络是传统通信网络与物联网、大数据、人工智能、边缘计算等新兴技术深度融合的产物,将催生许多新型应用场景,例如工业互联网、智慧交通、智慧医疗以及智慧家庭等。预计在5G/B5G时代,各类新兴应用会进入百花齐放、百家争鸣的开放阶段,将对网络提出更为苛刻的需求和挑战。
(1)工业互联网。工业互联网场景主要包括智能制造、增强现实(AR)、辅助维修、园区管理等。以智能制造为例,由于精密的自动化操作的误差需要在很小的范围内,通常带宽不低于20 Gbit/s,时延不高于10 ms,并需要构建提供快速连接、实时业务、安全保障等能力的工业边缘云平台,与部署生产智能管理平台的中心云之间存在基于专线的协同需求。
(2)智慧交通。智慧交通包括基于AI的全局自动驾驶以及交通信号配时管理、车辆路径规划引导等智慧交通运营,需要网络提供低时延、大带宽能力。例如,车联网类的应用要求车内信息娱乐类应用的带宽为10~100 Mbit/s,时延不大于 500 ms;交通安全驾驶类应用的带宽则小于1 Mbit/s,时延 20~100 ms;全自动驾驶类应用带宽要求不低于100 Mbit/s,时延1~10 ms。此外,智慧交通的边缘云与中心云需要支持云边高度协同,实现路径动态规划等功能。
(3)智慧医疗。智慧医疗场景主要包括远程手术、远程会诊、AI诊断,以及通过云边协同实现胶片的云端存储,边边协同实现不同院区的协同管理等。智慧医疗场景对网络有着极高的带宽和时延要求,如远程医疗所涉及的实时高清音视频回传的带宽不小于200 Mbit/s,实时诊疗的时延不超过10 ms。
(4)智慧家庭。智慧家庭场景包括高清/虚拟现实(VR)视频点播及直播、家庭防盗监控系统、智能照明系统、背景音乐系统、家电控制系统等。一方面要求异构设备(电视、冰箱、电灯等)及异构接口(网线、电力线、同轴电缆、无线等)统一组网,融合承载;另一方面要求互联网视频/游戏类内容及能力按需下沉至边缘云,面向特定业务提供差异化路由,保障大视频等应用高码率无卡顿播放,时延不超过20 ms,以提升用户体验。
综上分析可以看出,新场景和新业务对泛在智联网络提出了一系列新的需求:如园区、企业、场馆等自己的应用在本地闭环,需要网络提供泛在接入、路径最短转发能力;运营商高带宽内容将从中心到区域分布式部署,需要云网高度协同,算力按需分配;新型超低时延业务需要部署在边缘,实现差异化承载等,“应用本地化”“内容分布化”和“计算边缘化”的态势逐渐呈现。
为适应应用本地化、内容分布化和计算边缘化的未来发展趋势,电信运营商需要更为创新的组网理念,引入云网接入点(POP)、新型城域网、算力网络、AI能力分发平台等核心要素,构建新一代泛在智联网络架构,满足低成本、大带宽和超低时延的应用需求,如图1所示。
泛在智联网络总体架构自底向上分成:泛在基础资源层、AI能力分发层和业务应用层。其中,泛在基础资源层基于具备智能感知能力的端侧设备(如物联网节点、智能网关和终端)、网络设备(如新型城域网Spine交换机、Leaf交换机)以及云池(如边缘计算池、中心云计算池、5G核心网池)等构建泛在基础资源环境,基于云网POP将网络资源和云资源整合成统一资源平面,为上层提供弹性的资源供给和敏捷连接。
AI能力分发层基于人工智能技术,对全网资源进行统一度量及智能感知,对动态资源占用情况进行预测;针对上层应用及业务需求的动态最优路径规划,以选择合适的资源组合来匹配业务需求;通过全局资源调度与控制,实现资源与业务的动态自适应匹配,以及业务的快速部署和资源动态调配。
业务应用提供层面向工业互联网、智慧交通、智慧医疗等不同行业应用,支持应用/业务需求的逻辑资源切分,智能实现泛在资源的独立供给或者组合供给[3],支持不同应用对资源需求的快速响应,满足不同业务的差异化需求。
构建泛在智联网络架构包含4个核心要素:
▲图1 泛在智联网络总体架构
▲图2 云网POP逻辑视图
(1)构建云网POP,具体如图2所示。云网POP是为了便于云出口设备和网边缘设备的一体化规划、建设和运营,在云内网络出口区基础上纳入城域网、骨干网、光传送网(OTN)、5G等各类网络边缘设备,以满足不同客户入云和云间的业务需求。云网POP既是入云终结点,也是云间网络的端点。构建云网POP有助于云网的高度协同,推进云资源池网络和基础网络的一体化建设,实现用户端到端快速入云。
(2)以数据中心(DC)为核心建设新型城域网。新型城域网将采用通用设备组网,基于叶脊(Leaf- Spine)架构实现固定和移动网络的融合统一承载,以高效、动态的方式连接城域内大量的接入节点,逐步形成城域内以DC为核心的统一承载新平面[4]。同时引入灵活以太网(FlexE)、段路由(SR)、以太网虚拟专用网(EVPN)等技术,根据承载业务的自有特征和需求,对端到端的网络资源(网络功能、物理硬件及接口管道资源等)进行逻辑划分和封装,为不同客户群提供不同等级的切片网络,以满足不同业务对网络带宽、时延、可靠性等网络性能的服务质量(QoS)需求。
(3)引入算力网络。算力网络是为了应对算网融合发展趋势提出的,它基于无处不在的网络连接,将动态分布的计算资源互联,并通过网络、存储、算力等多维度资源的统一协同调度,使海量的应用能够按需、实时调用不同地方的计算资源,实现连接和算力在网络的全局优化[5]。网络将从提供“连接”走向提供“连接+计算”,实现算力在网络中的可管、可控、可用。
(4)建设AI能力分发平台。基于智能感知预测和各种AI赋能功能,如AI算力网络,打造灵活、高效AI能力资源调度及服务平台,整合多方、异构的网络、计算、存储等资源设施,实现一体化云网资源的新特性、新能力的敏捷开发和部署。
AI能力分发平台的逻辑功能如图3所示。其中智能感知预测功能模块从用户需求、业务属性、网络状态等多维度对全网资源进行统一度量及智能感知,通过对业务所需的上下文信息的知识抽取,获得业务关联的目标实体、对应关系和属性值,进而建立起业务需求模型。
▲图3 AI能力分发平台逻辑功能
AI能力编排系统全面分析来源于网络、终端、系统的流量数据,基于智能感知预测模块建立的业务需求模型,通过深度学习和训练以及逻辑推理,形成业务动态需求的知识库。进而根据业务需求和动态资源分布,并结合算力网络等AI新能力,为差异化业务需求规划动态最优路径,选择调度合适的资源,智能匹配业务需求。
未来新型业务将会产生更大规模的连接数据、更加丰富的数字化产品,用户也需要更加极致的应用体验。为此,需要基于泛在智联网络体系架构,进一步从端管云全方位提升承载能力,构建更为坚实的泛在智联网络基础能力。
端侧设备包括物联网(IoT)设备、智能终端设备(包括智能可穿戴设备)以及智能网关设备等多种形态。据互联网数据中心(IDC)预测,到2025年,联网的IoT设备总数将达到416亿,这些海量设备会使用多种多样的方法来连接和共享数据。其中,大多数设备将使用某种形式的无线连接:如家庭和办公室将使用Wi-Fi、Zigbee或低功耗蓝牙(如果移动性要求不是特别强的话,也可以使用以太网);其他设备使用4G(现有技术包括窄带物联网和基于长期演进的物联网,主要针对发送有限数据量的小型设备)、5G或者是卫星进行通信。
泛在智联网络需要为这些海量的端侧设备提供异构互联能力,实现边缘异构设备的灵活接入,即插即用;可基于业务分流规则,实现在多网中的灵活路径传送和无缝切换;融合利用多个网络的有线/无线资源传输高清视频等大带宽业务,提高用户业务的连续性。
异构互联的实现技术有很多种,从协议栈角度出发大致可分为网关接入技术、覆盖接入技术和可变长互联网协议(IP)接入技术这3种主要类型。其中,网关接入技术主要是在终端和网络中间部署感知网关实现互联,为异构的网络环境提供融合接入;覆盖接入技术则从修改协议栈的角度出发,通过协议栈适配实现端侧和管侧的互联[6];而可变长IP接入技术是在感知终端内部节点身份标识号码(ID)和网络侧设备IP地址之间建立一套变长的、结构化的地址映射机制。网络设备可根据任意长度的地址进行路由表查找操作并决定数据报文的下一跳,可以同时满足海量通信主体引起的长地址需求及异构网络互联带来的短地址需求[7],并支持与现有IPv4/ IPv6网络的兼容。
作为端和云之间的联络枢纽,网络需要具备高弹性、广覆盖的组网能力;而现有的封闭的、独立、刚性管道已经无法适应发展的需要。网络本身正从硬件为主体的架构向软件化、虚拟化、智能化、服务化的方向发展。
为提升连接效率,同时需要减少不必要的冗余,提供差异化的质量保障,需要基于虚拟可扩展局域网(VXLAN)、SR、EVPN、AI等多种技术手段,结合传统单层网络(Underlay)和叠加网络(Overlay)组网模式,构建端云、云云、端端之间的二层弹性、智能组网能力,如图4所示。
· Underlay网络:通过SR/SRv6实现SR与传统多协议标签交换(MPLS)的互操作,充分利用SRv6策略能力,构建端到端一跳直达、极简跨域的网络平面,并通过在设备侧引入轻量级的AI芯片支持边缘业务智能识别、业务路径可编程以及跨域端到端视图[8],为Overlay网络提供大容量、高可靠、智能化、差异化服务能力的基础网络资源。
· Overlay网络:基于 VXLAN、EVPN等技术,提供灵活可扩展的组网能力,满足每用户、每业务、每应用的连接需求,同时具备业务快速开通、按需组网、应用级监测等能力。
▲图4 结合Underlay和Overlay的弹性组网模式
▲图5 基于无损保障的HPC应用场景
泛在智联网络未来将承载高性能计算(HPC)、远程医疗、机器人看护等诸多新型智慧化应用。由于其总信息量巨大,需要云内网络在极短时间内将大量的数据转换成实时的信息以及行为,保证交互服务在后台访问的时候能够避免丢包,减少时延并提高吞吐量。而当前云内数据中心网络多采用无阻塞的多级CLOS架构,在上述新场景下面临着丢包、时延、吞吐量等多方面挑战[9],由此对泛在智联的云内网络提出了无损保障需求。
无损保障是为了解决传统网络存在有损问题而提出的理念,是一种可兼顾低延迟、高吞吐的网络技术,可满足特定应用的高吞吐、低时延和零丢包的无损要求。在实现方面,无损网络可基于AI Ready的硬件架构及AI智能无损算法(如AI ECN),采用流量控制、拥塞控制、负载均衡以及确定性转发等多种技术综合实现,从应用的角度保证网络的无性能损失。
以常用的HPC为例,在建立神经网络和深度学习模型的训练过程中经常需要用到HPC,而HPC的执行过程需要跨网络实现内存数据拷贝,网络性能要向内存访问看齐。在传统网络下会出现中央处理器(CPU)空闲等待数据,拖累系统整体并行计算性能的情况[10]。因此,需要引入无损保障技术,在满足深度学习训练等应用对网络高吞吐量的要求的同时,保障并行计算等应用对网络低时延的要求,具体见图5。
“运筹于AI,创新在边缘”,人工智能、大数据等为运营商网络赋于了智慧化能力,边缘计算则为运营商网络提供了新的应用场景。电信运营商亟待与产业伙伴一起布局未来网络的体系架构,推进宽带通信网络与物联网、大数据、人工智能、边缘计算等新兴技术的深度融合,构建更为坚实的泛在智联网络基础能力,为“泛在感知”提供“泛在连接”和“泛在智能”,以期给用户带来更大规模的连接数据、更加丰富的数字化产品以及更加极致的应用体验,助力全行业数字化转型。