王巍,王鹏,赵晓宇,徐洪磊
(中国电信股份有限公司研究院,北京 102209)
随着网络技术和云计算技术的快速发展,云和网的深度融合与协同工作越来越受到人们的关注。2020年,我国将“新基建”作为国家的战略发展方向,将网络、云和算力视为重要的基础设施,使得云网融合以及数字化平台建设成为未来技术发展的重要目标。
依托于云网融合,传统行业能够乘着云技术发展的快车,进一步在业务形态、商业模式、服务模式等层面展开融合与创新,在传统模式和承载方案的基础上进行数字化改造,实现各个行业的数字化转型。
云网融合需要适应不同应用场景的需求,因此对网络提出了更高的要求,包括以下3个方面。
(1)网随云动
行业加速数字化转型,要求网络具备灵活定制和快速交付能力,包括自主定制网络性能指标、差异化保障参数、智能化能力、网络安全能力等,并且当用户通过业务门户对现有网络能力进行调整时,网络能够快速响应。
(2)网络云化
传统网络难以实现对云业务的灵活响应,因此需要让网络从以硬件为主体的架构向虚拟化、云化、服务化的方向发展。同时,需要建设具备统一承载与调度能力的运营系统,对分布在全国范围内的网络云资源池进行敏捷、灵活、高效的统一调度与管理,为网络云化提供坚实的基础。
(3)云数联动
数字化平台和云网基础设施协同配合,能够实现对多云服务和多线接入的灵活配置和使用。云网资源及能力应能通过服务的方式提供给数字化平台,并满足数字化平台对于数据本地化存储、分布式处理、跨云调度和多云备份的需求。
为了响应国家战略,中国电信在2020年发布的《云网融合2030技术白皮书》[1]中,全面阐述了云网融合的内涵、意义、需求、特征、愿景和原则等,对云网融合未来演进的重点技术领域进行了深入剖析,并介绍了中国电信云网融合的技术架构和发展目标。
目前,运营商网络多为“烟囱式”架构,即云网业务分离、管理分散,不是统一的架构,且入云和云间互联业务多采用L3 VPN方式实现,业务配置复杂、开通速度慢、难以实现端到端运维。SRv6技术作为一种新兴的IP网络技术,具有端到端路径可编程和随流检测能力,在网络的端到端快速配置、选路和业务传输方面具有天然的优势。采用支持面向云网融合/云网一体目标的SRv6技术,有利于拉通城域网和骨干网,打通端、管、云,实现业务端到端可管可控,网络能力的开放和服务化。
SRv6将分段路由(segment routing,SR)和IPv6技术结合,通过在IPv6报头中插入段列表(segment list,SL),实现设备级的路径控制。SRv6的转发平面可直接使用IPv6协议,只需要对网络设备进行很小的改动即可使其支持 SRv6,并且对于不支持SRv6的网络设备,也可直接通过IPv6报头实现数据包的转发。对于数据平面,只需要扩展内部网关协议(interior gateway protocol,IGP)和边界网关协议(border gateway protocol,BGP),即可完成段列表的分发和同步,降低了控制平面的部署复杂度。
为了实现SRv6转发,需要向IPv6报文头中插入一个段路由头(segment routing header,SRH)的扩展头,其编码格式[2]如图1所示。
图1 SRH编码格式
其中,next header,8 bit,表示SRH之后的报文头的类型;Hdr Ext Len,8 bit,表示SRH的长度(不包括next header字段);routing type,8 bit,表示路由头的类型,SRH类型是4;segment left,8 bit,表示要到达的目的节点,仍需要访问的中间节点数;last entry,8 bit,表示段列表中最后一个元素的索引,指向segment list [0];flags,8 bit,表示数据包;tag:16 bit,表示同组数据包;segment list[n],128×nbit,表示段列表,其中包含多个SID。
每个SID(segment ID)的长度为128 bit,编码格式[3]如图2所示。
图2 SID编码格式
其中,locator表示位置标识,是网络中分配给一个网络节点的标识,可以用于路由和转发数据包。locator一般要在SR域内唯一;function表示设备分配给本地转发指令的一个ID值,该值可用于表达需要设备执行的转发动作;Args表示可选字段,转发指令在执行的时候所需要的参数。在给定流中的数据包中,Args值应保持不变。
SRv6技术可以通过SID的组合来指定数据包的传输路径,实现流量的灵活调度。同时,由于SID中每个字段的长度都是可变的,因此可以对SID进行灵活编程,增加了网络编程的灵活性。SRH后面的TLV(type-length-value)部分可用来携带一些报文头中未包含的信息,并依靠TLV的灵活组合实现多种网络功能。利用SRv6技术具有很强的可编程性、灵活性和可扩展性,使网络能够提供更加敏捷、高效的服务。
3.1.1 场景描述
(1)传统SD-WAN方案
大型企业可能存在多个企业分支,这些分支与总部之间通常需要通过广域网(wide area network,WAN)传输数据,实现统一的互联网访问管理和安全管控。随着云时代的到来,许多企业业务搬迁到了云数据中心,因此企业分支连接云数据中心也成为了一种主流的场景。当前企业WAN网络互连主要可以分为以下3个场景。
· site to site:分支到分支。
· site to cloud:分支到云(包含反向云到分支)。
· cloud to cloud:云到云(也称云间互联或多云互联)。
传统 WAN基本是基于多协议标签交换(multi-protocol label switching,MPLS)等专线进行连接,可以提供高保障的质量服务。但 WAN专线成本高,部署周期长,并且某些流量不需要走 MPLS专线,例如备份流量就可以通过普通Internet连接降低企业WAN线路租用的成本。为了解决这些问题,业界提出了软件定义广域网(software defined WAN,SD-WAN)。
SD-WAN是一种基于软件定义的WAN,其支持通过软件定义来灵活调度WAN,从而通过调度不同流量到不同质量属性的 WAN链路上来满足业务需求,同时降低了 WAN的租用成本[4]。SD-WAN组网架构如图3所示。
图3 SD-WAN组网架构
(2)传统方案局限性
SD-WAN支持将流量调度到 MPLS专线或Internet等链路。当流量通过Internet转发时,可以通过虚拟扩展局域网(virtual extensible local area network,VxLAN)隧道转发流量。但使用VxLAN隧道的缺点在于只能指定overlay的目的节点,无法指定隧道的underlay转发路径,因此无法支持严格路径转发的流量工程。这也是当前SD-WAN方案无法解决的一个大问题。
SRv6支持在头节点显式地指定数据包的转发路径,同时也支持虚拟专用网络(virtual private network,VPN)。因此基于SRv6的SD-WAN可以实现在客户终端设备(customer premise equipment,CPE)或入网点(point of presence,POP)等路径首节点显式地指定数据包转发WAN路径,同时也支持数据包的VPN隔离,是一种实现SD-WAN的优选架构。
3.1.2 技术实现
从现网业务需求和痛点出发,利用SRv6技术对传统SD-WAN进行改进。根据SD-WAN组网中是否有POP GW,此处的承载方案分为有POP GW组网和无POP GW组网两大类。
(1)有POP GW组网
1)underlay组网方案
基于SRv6的有POP GW的SD-WAN架构如图4所示。在基于SRv6的SD-WAN中,为了更好地支持后续链路的转发,建议CPE支持IPv6,并通过IPv6上联POP GW。
图4 基于SRv6的有POP GW的SD-WAN架构
从CPE1到CPE2整体上可以分为3段路径:CPE1到POP GW1、POP GW1到POP GW2、POP GW2到CPE2。在POP GW上需要维护虚拟路由转发(virtual routing forwarding,VRF),SD-WAN控制器可根据网络中设备上报的 BSID(binding SID)信息和业务需求,向CPE1下发对应的SRv6策略,其SID列表中包括POP GW1的SID、SRv6 TE(traffic engineering)路径对应的 BSID、POP GW2的SID以及CPE2的VPN SID等。
首先,CPE1到POP GW1的路径,可以采用Internet/4G/5G等多种方式进行连接。POP GW1根据 SID的值将数据包转发给运营商边缘(provider edge,PE)设备。
其次,在PE处,BSID将展开为一段SID列表,设备根据SID列表和POP GW2 VPN SID的值,将数据包转发到对应的POP GW2节点。
最后,POP GW2节点进行解封装后,将数据包传递给CPE2。
SRv6 TE路径的起点和终点均为PE,为了实现SD-WAN选路和跨域,PE、P节点均需要支持SRv6。
2)SID/locator组织与规划
SD-WAN服务提供商会在全国范围内提供几个POP GW用于用户接入,POP GW通过入云专线GW与最近的骨干网PE相连。运营商可以按照地域分布,为每个SD-WAN的POP GW规划SRv6的locator,形成尽量少的汇聚prefix。
3)对控制器的改造
SD-WAN控制器根据各差异化保障平面的预设参数,通过SR policy预先开展骨干网的差异化平面SRv6路径计算,并生成policy对应的BSID。根据上层业务编排器发送的业务订单信息(头尾节点、差异化服务需求、带宽等),SD-WAN控制器能够从预先计算好的路径中选出最优路径,并将该路径的 BSID到对应节点(骨干网PE)上。
4)差异化业务承载方案
骨干网中的 PE作为差异化路径的头、尾节点,需要每两个一组预先计算SR policy对应不同差异化平面的保障路径(candidate path对应的SID-list)并生成BSID,每个BSID对应一种服务等级。根据用户订购的服务等级,将 BSID编排进用户业务对应的路径中,实现用户业务流量的导入。
这种方案比传统SD-WAN方案更加简洁,部署复杂度更小。且端到端SRv6可以支持更多的网络编程需求,可以实现更加优化的全局路径选择,相比传统方式的多段路径拼接方案可以更好地支持SD-WAN业务。
(2)无POP GW点组网
无POP GW的组网方式,即SRv6可以从企业的CPE1开始,结束在对端分支的CPE2,实现了真正的端到端SRv6连接,其架构如图5所示。从CPE1到CPE2为一段端到端的SRv6路径。这种方案不要求路径经过POP点,因此只需运营商给 CPE分配 BSID用于选路即可。这种方式的SRv6 SD-WAN部署最简单,但将SD-WAN管理的压力转移到了CPE侧,适合企业的自主管理能力较强的中型或大型企业。
图5 基于SRv6的无POP GW的SD-WAN架构
3.2.1 传统跨域组网方案
(1)传统方案描述
大型政企用户的站点可能分布在全国范围内多个城域网,站点之间需要进行跨域组网。由于运营商骨干网的PE只部署于地市级,因此用户需要通过光纤、多业务传送平台(multi-service transport platform,MSTP)等方式连接用户站点到PE,完成跨域组网。
传统光纤接入方式导致成本较高,且开通效率低,为解决此痛点,运营商开发出MPLS跨域组网架构如图6所示。
图6 基于MPLS的跨域组网架构
企业站点可以通过城域网无源光网络(passive optical network,PON)或无线电接入网IP化(IP radio access network,IPRAN)等方式接入。跨域业务流量传输需要经过城域网,跨越骨干网,MPLS跨域可以为连接到不同城域网中的用户站点提供全国级的端到端组网服务,同时还能够降低施工成本,缩减施工周期。
(2)传统方案的局限性
MPLS协议的控制层比较复杂,标签只在单个域内有效,无法跨域,也无法提供差异化服务,并且MPLS跨域一般采用的optionA配置方式,配置复杂,资源协调困难。
随着云网融合需求的发展,在全新的云网互联场景中用户需要便捷接入、智能随选、差异化服务、一点入多云的新型组网服务。随着近年来SRv6、随路检测、网络切片等相关新技术的发展,运营商需要借助这些新技术为用户提供更好的组网产品,基于SRv6的跨域组网产品可以有效解决原有跨域组网产品中的痛点,为用户带来更好的体验。
3.2.2 基于SRv6的跨域组网技术实现方案
(1)underlay组网方案
基于SRv6的跨域组网架构如图7所示,为了实现端到端的SRv6业务传输,需要进行端到端的SRv6技术部署。
图7 基于SRv6的跨域组网架构
针对传统的组网场景,需要对骨干网和城域网分别进行升级改造。
对于城域网,SRv6跨域VPN服务需要城域网进行SRv6改造,成为新型城域网。新型城域网中的设备按照spine-leaf架构组网,增加扩展性,且新型城域网与骨干网通过路由反射器(route reflector,RR)打通VPN路由。用户站点可选择PON方式或通过 IPRAN/STN(smart transmit network)方式接入。
对于骨干网,SRv6跨域VPN服务同样需要骨干网进行SRv6改造,且PE需要直接与相邻的城域网对接互通。骨干网中的PE需要与骨干网RR建立IBGP邻居,骨干网 RR与城域网 RR之间建立MP-BGP邻居,以便VPN路由的传递。用户可以通过光纤直驱的方式,直接连接到骨干网的PE。
(2)SID/locator组织与规划
· 城域网:按照城域网POD严格划分SRLB、SRGB、BSID地址空间并进行路由汇聚,形成尽量少的汇聚prefix,通过B-leaf宣告到对接的骨干网PE,或通过城域网RR与骨干网RR对接宣告。
· 骨干网:需要为SRv6跨域组网业务在骨干网中使用的 SRLB、SRGB、BSID地址空间统一规划汇聚,形成尽量少的汇聚prefix,之后通过PE将此部分prefix宣告进入所有与骨干网对接的新型城域网。
(3)对控制器的改造
· 骨干网控制器:①差异化平面路径预先计算。控制器根据各差异化保障平面的预设参数,通过SR policy预先开展骨干网的差异化平面 SRv6路径计算,并生成 policy对应的BSID。②业务路径生成。根据上层业务编排器发送的业务订单信息(头尾节点、差异化服务需求、带宽等),将多个域的对应服务质量/路径的 BSID、尾端end.SID进行拼接,生成客户业务对应的完整 SID-list。③路径下发。控制器通过与RR对接,通过BGP-SR policy地址族下发SR policy路径到对应节点。
· 城域网控制器:业务初期,由于新型城域网内 spine-leaf架构相对简单,可以采用BE快速开通业务,此阶段对城域网控制器需求较少,跨域VPN业务可由骨干网控制器统一收集各城域网内拓扑和路由信息进行统一计算,并通过RR直接向城域网leaf设备下发SR policy;若城域网内出现路径计算和差异化承载需求,则由城域网控制器进行差异化平面预先计算,生成对应BSID;城域网控制器负责城域网内业务的计算的SID-list下发给头尾节点。
(4)差异化业务承载方案
· 骨干网差异化平面:骨干网中通过单 AS内的 SR policy技术实现差异化服务,PE每两个一组预先计算SR policy对应不同差异化平面的保障路径(candidate path对应的SID-list)并生成BSID,每个BSID对应一种差异化网络服务,如最低时延、最高可靠性、大带宽等,通过将BSID编排进用户业务对应的路径中,实现用户业务流量的导入。
· 跨域组网业务:在跨域组网场景中 VPN的头尾节点位于业务站点所在的城域网leaf设备或骨干网PE,VPN起点为城域网的用户接入设备,如城域网 leaf设备或 IPRAN-U设备,端到端业务路径通过选择不同的骨干网BSID可提供差异化的业务保障策略。
3.3.1 传统入云专线方案
(1)传统方案
随着云计算相关技术的发展,越来越多企业用户通过多云部署、高性能云边协同、一体化开通服务等帮助其提升竞争优势。大型企业用户站点可能分布在全国范围内多个城域网,用户站点需要跨域进行入云。传统方案中,用户站点和云资源池可能上联城域网,也可能通过光纤、MSTP等方式直接上联云骨干网的 PE,骨干网利用MPLS VPN提供高质量的网络传输,如图8所示。
图8 基于MPLS的入云专线组网架构
(2)传统方案局限性
目前,运营商云、网业务开通流程割裂,导致入云专线的开通流程不畅,用户可能要分别在云、网的服务提供商门户上订购相应的服务,再由服务提供商之间进行业务配置的对接。且入云专线的建立基本由项目驱动,只有用户下单后才会开始准备相关资源,导致业务开通周期长。目前骨干网中采用MPLS VPN技术,无法进行端到端的业务保障,也难以提供差异化服务。
运营商可以借助SRv6技术来解决原有入云专线产品中的痛点,SRv6技术在跨域时无需复杂的配置,能够减少业务开通时的工作量,缩短开通时间。同时,利用SRv6的路径编程能力,可以为用户提供差异化服务,满足不同用户对网络质量的需求。
3.3.2 技术实现
(1)underlay互通方案
基于 SRv6的入云专线业务组网架构如图9所示。为了实现基于 SRv6技术的端到端一跳入云,除了要对城域网和骨干网进行相应的改造以外,还需要将与公有云资源池云网关连接的 PE(此处称为云 PE)下沉到离用户更近的地方,节省在为用户开通业务时,协调物理资源的时间。并且,云资源池中的云网关(云 GW)需要通过VLAN与云PE相连,并负责将不同用户的流量映射到对应的VLAN或VxLAN隧道中。
图9 基于SRv6的入云专线组网架构
(2)SID/locator组织与规划
目前,跨域组网的用户站点分布在全国各城域网中,部分用户会选择通过城域网接入跨域业务,还有部分成本不敏感的用户会直接通过光纤、MSTP等接入骨干网PE。云资源池大多建在骨干网、城域网机房中,地理位置较分散,为减少SRv6入云专线场景中的设备路由压力,运营商可以按照地域分布,为每个云资源池规划SRv6的locator,通过locator与网络相关的业务进行隔离。
(3)对控制器的改造
骨干网控制器除了需要具备路径编程和BSID拼接能力以外,还应支持能力开放。通过对外暴露标准化应用程序接口(application programming interface,API),向第三方提供原子服务能力,支持第三方业务平台调用开放业务及网络能力。同时,骨干网控制器还应支持与云服务商控制器之间的业务参数传递,满足用户对业务的按需定制、快速开通等要求。
(4)差异化业务承载方案
在入云专线场景中业务头尾节点位于与业务站点相连的云PE,入云专线的头尾节点分别为用户接入设备和云PE,端到端业务路径通过选择不同的骨干网 BSID可提供差异化的业务保障策略。
综上所述,新方案通过骨干网云PE的下沉、提前配置好用户入云所需的线路资源、接口资源等方式,缩短因为协调物理资源而耗费的时间。同时,通过控制器进行网络能力开放,实现网络能力服务化,满足用户入云业务任意门户一点开通的需求。
3.4.1 传统云间互联方案
(1)传统方案
大型企业用户的数据可能保存在几个不同公有云的资源池中,这些资源池可能分布在全国多个地域,云资源池之间需要通过跨域的方式进行数据互通。传统方案中,云资源池可以通过虚拟局域网(virtual local area network,VLAN)方式直接上联骨干网的 PE,骨干网利用 MPLS VPN提供高质量的网络传输,实现全国级的云间互联业务,如图10所示。
图10 基于MPLS的云间互联组网架构
(2)传统方案局限性
目前,云间互联业务也存在业务开通流程不畅、周期长的问题。同时,云、网控制系统之间的对接没有统一的标准化接口,而是采用点对点开发的模式,造成效率低下、业务上线缓慢。
SRv6技术中的SR策略可以简化不同控制器之间的传输参数,降低系统对接时的开发难度,缩短业务上线周期。同时,可通过资源的预配置,提前配置好云资源池间的连接资源,可以缩短业务的开通周期,保证用户能够实现业务的一点开通。
3.4.2 技术实现
(1)underlay互通方案
基于SRv6的云间互联业务组网架构如图11所示。云网关的不同子接口对应不同租户,每个租户分配一个 SID。同时,不同子接口的流量向资源池内映射到不同VLAN或VxLAN隧道。
图11 基于SRv6的云间互联组网架构
(2)SID/locator组织与规划
公有云会在全国范围内提供几个接入点,接入点直接与最近的骨干网云PE相连,运营商可以按照地域分布,为每个公有云提供商的云资源池规划SRv6的locator,通过locator与网络相关的业务进行隔离。
(3)对控制器的改造
骨干网控制器与公有云云控制器都应对外开放标准化API,拉通控制层的流程,方便互相之间的对接以及传递业务配置的相关参数信息,保证用户可以从任意系统的门户进行云间互联业务的一点开通。同时,借助SR策略简化控制器之间传递的配置参数,降低点对点开发的难度。云侧、网侧控制器的拉通,不仅为业务的端到端开通提供了保障,还能让用户可以从后台获取全网状态视图,随时了解网络中发生的拥塞和故障。
(4)差异化业务承载方案
在云间互联场景中,头尾节点(骨干网云PE)除了需配置骨干网差异化保障的SR policy之外,还需要配置为云间互联业务引流用的SR policy。需要在 SRv6业务的头尾节点(两端为云 PE)作为业务 SR policy的起始点,此业务SR policy定义了端到端的SRv6路径,头尾节点的路由器需要为用户的业务路由打上对应的差异化服务color标记。
云网融合已成为网络技术未来长期发展的方向,且与6G网络“泛在、智联、数融、开放、安全”的愿景一致。随着大数据、人工智能、区块链、VR/AR等技术的快速发展,云网融合可以为智慧城市、智慧园区、智慧产业提供强大的推动力,促进产业升级和数字化转型。SRv6技术的灵活性和亲和性,能够加快实现云网融合。云网融合是一个长期、不断演进的过程,需要运营商、设备提供商、应用开发商、科研机构和高校的共同努力。