黄凤芝 石鸿伟
(1.南京铁道职业技术学院机车车辆学院 江苏省南京市 210031)(2.网络通信与安全紫金山试验室未来网络研究中心 江苏省南京市 211111)
随着互联网的高速发展,网络的规模不断扩大,拓扑结构错综复杂。数据报文在网络中,要在海量的、异构的转发设备上进行独立查表、转发。由于大规模网络的动态性,业务流量的不确定性,会导致网络运维异常困难,新业务上线非常复杂。如果能够将网络资源虚拟化,屏蔽底层物理网络的复杂性和差异化,统一进行资源管理和智能控制,就能够灵活满足各种多变的网络需求。
SDN(Software Defined Network,软件定义网络)[1]就是一个很好的解决方案。将传统网络设备的数据转发平面和逻辑控制平面解耦。集中式的逻辑控制平面通过标准化的南向接口对数据转发平面设备进行实时的感知和智能的控制。
目前运营商骨干承载网基本都采用传统的三层网络架构[2],分为核心层、汇聚层、接入层,如图1所示。
在网络建设初期具有一定的先进性,能够实现对承载网络业务的保障,满足业务应用的基本需求。随着网络技术和业务需求的不断发展,特别是5G 业务的接入、云网融合的发展,对传统骨干网带来新的挑战。
传统骨干网对业务的识别和管理粒度很低,无法基于业务需求规划转发路径,无法为业务提供差异化的服务保障。包含了两层含义,以语音通话和文件传输为例。
(1)语音通话和文件传输这两种业务对网络的需求不同,语音业务要求低时延,文件传输业务要求大带宽,但是当这两种业务的目的地址相同时,由于传统路由技术不能识别业务,不能把不同业务流量引流到不同转发路径上,这就可能导致网络发生拥塞。
(2)当发生网络拥塞后,传统网络技术无法让低优先级的文件传输业务避让高优先级的语音通话业务。例如把文件传输流量调整到其他链路上,降低原有链路的负载,保障语音通话质量。
传统骨干网所使用路由协议(ISIS/OSPF 等)通常根据数据报文的可达性,采用最短路径算法(SPF,Short Path First)进行路径计算[3],没有将差异化的业务需求作为路径计算的约束条件。这就导致了网络运维管理和业务应用体验之间存在差距,只能靠网络运维人员根据业务需求,补丁式配置网络。在业务质量或者链路质量发生变化时,通过手工方式调整网络流量路径,无法实时根据网络质量的变化情况,智能的做动态调整。
由于传统骨干网无法识别业务的承载质量,网络的运维管理主要还是基于传统的网元和链路的故障管理,无法做到基于业务的高效感知与智能分析。当网络承载的业务(例如视频会议)出现故障时,无法及时准确的诊断业务详细的故障原因。
另外,传统骨干网当前还是主要采用人工运维模式,开局、升级、维护需要人工保障,极其容易出错。而且人工的维护和操作成本高、效率低,无法满足未来业务快速上线、网络快速保障的需求。
从传统骨干网存在的问题可以看到,骨干网需要一种可以识别业务能力,且能够提供保障用户体验的方案。基于SDN 的骨干网解决方案综合利用应用识别、智能选路、QoS(Quality of Service,服务质量)、网络优化等关键技术,提供网络的差异化服务能力,提高链路带宽利用率,解决骨干网中业务质量的保障问题,降低网络建设成本和运维成本。
SDN 解决方案主要包括业务编排器、SDN 控制器、SDN 监控系统以及受控转发设备组成,如图2所示。
图1:骨干网示意图
图2:基于SDN 技术的骨干网示意图
系统功能如下:
通过WEB 方式对用户呈现,提供物理网络、虚拟网络、网络监控等功能,将业务逻辑进行拆分,分别调度SDN 控制器和SDN监控系统。通过标准的Restful API 接口实现北向能力开放。
管理控制骨干网络设备,提供虚拟网络切片、流量逐跳可控、故障快速检测、性能数据采集等功能。主要采用Netconf 协议、BGP 协议和网络设备进行对接。
NetConf 协议:下发基础配置、隧道配置、转发路径等。
BGP 协议:转发面网络拓扑信息实时通过BGP-LS(Link State)协议传递给SDN 控制器[4],如果网络拓扑发生变化,IGP协议会在转发面泛洪拓扑信息,通过BGP Speaker 通告给SDN 控制器。
管理和呈现设备端口、链路、隧道等的性能数据,设备状态告警、实时和历史数据,流量数据的挖掘及分析等信息。主要采用Telemetry 协议[5],用来订阅设备的上报消息,毫秒级获取网络的数据信息。
SDN 控制器支持获取网络的二层拓扑和三层拓扑。
二层拓扑是OSI 参考模型中第二层的网络拓扑,称为链路层网络拓扑。体现了网络的物理连接情况,可以呈现物理节点和物理链路。物理拓扑信息通过LLDP(Link Layer Discovery Protocol,链路发现协议)进行收集[6],并通过Netconf 协议上报给控制器,当物理拓扑发生变化时,路由器会及时上报控制器。
三层拓扑是OSI 参考模型中第三层的网络拓扑,称为逻辑网络拓扑。它描述的是路由器、子网之间的连接关系。可以呈现转发选路相关的信息,包括接口名称、接口IP、链路带宽(可用带宽、总带宽)、时延等。三层拓扑通过BGP-LS 协议获取,当拓扑发生变化时会重新上报给控制器。
在网络设备上运行了一些检测协议。例如,采用TWAMP(Two-Way Active Measurement Protocol,双向主动测量协议)[7]检测物理链路的时延、抖动、丢包率,采用NQA(Network Quality Analyzer,网络质量分析)检测隧道的时延、抖动、丢包率。网络设备和SDN 控制器之间建立Telemetry 通道,设备采用主动推送的方式,实现毫秒级获取网络的性能数据,并且展示在SDN 系统界面上,实现对网络的性能可视。
基于SDN 技术的骨干网络,路径编排通常使用SR(Segment Routing,分段路由)协议实现[8],可以结合多约束算路算法的方式,满足不同业务不同场景的需求,例如对时延敏感的业务,可以采用时延优先的算法;对带宽敏感的业务,可以采用带宽优先的算法。
SDN 控制器使用的KSP 算法(Top-k-shortest paths,K 条最短路径)进行算路,控制器根据隧道的类型,基于当前拓扑计算出K条从源节点到目的节点的路径,并按照权重大小排序。
在多重约束的条件下,控制器需要从K 条路径中选出符合约束条件的路径:
(1)带宽约束。路径经过的所有链路需要满足剩余可用带宽符合业务需求的带宽约束条件,即剩余可用带宽(链路配置带宽-链路已用带宽)大于等于业务需求的带宽大小,如果不满足条件,需要从K 条路径中剔除。
(2)时延约束。计算路径经过的所有链路的时延之和小于时延约束的大小,如果当前路径所有链路的时延不满足条件,那么从K 条路径中剔除。
(3)跳数约束。路径经过的所有链路的跳数需要小于业务请求中的跳数,如果不满足条件,那么从K 条路径中剔除。
(4)显式路径约束。显式路径约束包括三种,严格必经,松散必经,排除。严格必经是指下一跳和前一跳直接相连。松散必经可以指定路径上必须经过哪些节点,但是该节点和前一跳之间可以存在其他路由器。排除则是指路径必须不能经过指定的链路或节点,必经链路和节点与排除链路和节点必须是互斥的。不符合条件的路径均会从K 条路径中剔除。
网络调优指的是基于不同的网络需求提供最为合适的优化策略,例如链路带宽利用率不超限策略、全局带宽利用率最小策略、基于时延最优策略等。网络调优的方式可以基于自动或者手动模式,当网络拓扑发生变化时,也可以触发调优。
链路带宽利用率不超限方式,用户可以设置带宽阈值,当某条链路带宽超过限定值后,SDN 控制器会计算出多条绕开带宽利用率较高的链路,用户可以直观的对比新旧路径的走向,选择调整避开拥塞的链路或者进行负载分流,把流量负载到其他链路上,降低该链路的带宽利用率。
全局重优化方式,当网络规模较大时,新增链路或者网络拓扑的动态调整,人工调整每一条转发路径变得非常困难,通过SDN控制器提供的全局重优化能力,实现全网流量转发路径按照业务的需求进行重新计算(例如时延最短、带宽优先保障等),保证当前业务转发路径都是最优的。
SDN 技术作为一种新的网络架构理念,其集中控制、可编程、控制和转发分离的特性为业务快速开通、网络实时调整、资源灵活调度提供了无限可能。
首先,基于SDN 的全网流量统一管控技术,通过动态的业务流量调整可以实现广域链路的负载均衡,提升网络设备和传输链路的利用率降低了网络扩容的成本。其次,SDN 技术的智能和可视运维能力,大大提高了网络整体维护效率,降低了过去长时间业务故障识别、定位带来的成本压力。另外,SDN 技术的应用将业务部署的时间由周、天提高到小时和分钟,显著降低了业务部署成本。
随着SDN 技术的应用推广和使用,特别是随着骨干网向下一代IPv6 网络的演进,SDN 技术[9]会得到新的发展。