纵向部署下的SD-EON控制平面稳健性研究

2021-09-15 11:20:16吕守向汤紫雄
计算机应用与软件 2021年9期
关键词:网元子网全网

吕守向 汤紫雄

(福州理工学院 福建 福州 350506)

0 引 言

SD-EON继承了软件定义网络(SDN)转发与控制[1]解耦的优势,在应对云计算环境下随机突发数据流承载方面发挥出了显著的服务质量(QoS)成效。尤其在大数据等众多新型业务快速发展的背景下SD-EON上的多波长业务流类型和数量都将呈现多元化,此时不可避免地出现大象流和老鼠流[2]并存的局面。为了提供优质QoS保障,SD-EON架构中的控制层必须实施全网状态侦测、基于流特征区分的节能局向方案制定、基于业务等级(CoS)波长通道动态配置等一系列关于QoS的管控策略。然而在高效调度多媒体流期间一旦遭遇控制信道故障势必引发部分交换机转发数据失效的局面。若该控制信道肩负着全网控制单元和全网交换机之间调度指令重任,那么无疑将会使整个SD-EON陷入瘫痪[3]。可想而知,在云计算和大数据背景[4]下SD-EON架构在发挥QoS优势时,其控制平面的稳健性也同样面临潜在的危机。因此在当前云计算和大数据等新型技术广泛部署的背景下研究一个稳健性较高的SD-EON与之协作很有必要。

虽然此前也曾有过不少关于SD-EON稳健性问题的相关探讨,但是受限于这些研究的瓶颈而总是未能被高效地推广实施。以文献[5]为代表的研究就曾提出一个多维度管控策略来增强SD-EON应对海量流媒体业务的控制能力。该策略原理是在以太网络中定义一个保护机制并交由专用的主机来控制,然后将该保护机制嵌入到因特网协议层和数据链路层中用于实施控制信令的转发配置。此举虽在一定程度上良好地保障了控制平面在调度流媒体业务期间的可靠性,却不足以应对云计算环境下海量大数据业务的承载。可见该策略下的SD-EON控制平面仅在有限规模的网络中才具备可靠的保障性,因此并不具备普适性。

为弥补上述策略的不足,文献[6]在SD-EON上规划了重路由高速自愈和1∶1备份保护自愈两种抗毁技术来应对大数据背景下重载网络的集中式管控问题。然而实际部署过程却发现两种抗毁技术均存在预置资源过度冗余的弊端。为了克服该弊端,文献[7]试图通过对多种拓扑网络的控制层展开大量分析,求证控制单元的放置对全网管控的效力。实验表明在SD-EON中科学放置控制单元的前提下全网仅需部署唯一的控制单元即可最小化网络资源的冗余度并且具有良好的控制时效性。受限于控制单元数量的唯一性,该情形下的全网业务调度对该控制单元产生很高的依赖性。尤其在调度大规模波长业务时,全网对控制资源偏好度更为凸显。为了避免该控制单元超负荷开销导致计算精度失效的潜在风险,文献[8]提出SD-EON多控制器放置和交叉保护算法。该算法虽良好地取得了双效却忽略了交换转发单元在某一个时隙同时执行来自不同控制单元下发的控制信令时可能存在冲突的情形。究其原因在于缺乏对控制单元优先权的定义。为了避免控制单元在下发控制信令时对交换转发单元造成指令冲突,文献[9]提议将权威交换转发单元设置为优先权较低的控制单元,通过这种方式弱化SD-EON对那些优先权较高的单控制器的好感度。然而该提议始终只讨论权威交换转发单元在固定网络状态下的部署情况。同时文献[10]在研讨SD-EON控制单元安置的科学性与控制平面可靠性的关联度基础上构思了一种基于图切理论的分区安置方案。实践表明在该分区安置方案下控制单元仅在域内才表现出良好的可靠性,不足以在域间可靠地实施控制作业。文献[11]所建立的基于整数线性模型的可靠性算法旨在探索SD-EON中控制单元和交换转发网元间符合局向分离的最大光通道规模以便优化控制单元部署的科学性。但该模型应用在云计算环境下开展大规模数据计算时所求的解缺乏全局性。甚至在大规模网络中较为突出的由网元和控制单元之间物理间距引发的控制时效性问题,在所规划的算法模型中并未被提及。文献[12]结合帕累托理论为SD-EON设计的控制单元边缘部署算法在一定程度上解决了前述文献研究中无法兼顾控制平面可靠性、时效性和全局性等问题,然而对于交换转发单元执行多控制指令的冲突问题依旧束手无策。

综上所述,目前围绕SD-EON控制层面的主流研究仍有较大的可持续改进空间。可通过设计分布式提升方案来实现稳健性目标。具体思路为:(1) 在基于一定的约束前提下从逻辑上将整个SD-EON网络进行纵向切割,割离出多个分区。(2) 在每个分区子网内引入分区控制单元(SCU)和低优先权交换转发单元(LPT)。SCU负责对分区子网内的多波长颗粒和跨层调度作业的局部性管控,以及将控制平面对携带大数据的多波长业务实施集中式管控期间潜在的可靠性风险分派[13]到各分区子网,从而使控制平面的故障风险在可化解范围内。同时在每一个分区子网内配置若干个LPT用于应对控制平面因遭遇故障引发可靠性风险问题时,能够实施较小范围内的波长颗粒管控,从而使控制平面的可靠性风险问题在最短时间内被排除。(3) 在全网范围内配置一个统筹控制单元(OCU)用于实施全局网络中多波长颗粒和跨层调度作业的全局性管控。(4) 结合跨层调度模型为控制平面的信令设计出具有良好生存能力的局向信道并将其嵌入到SD-EON中为云计算环境下携带了大数据的多波长业务调度提供可持续性部署方案。根据所述的分布式立体化设计思路,本文构思了一种纵向管控部署下的嵌入式SD-EON稳健性算法,旨在从全局角度出发规划一种既能突破资源偏好度约束又能克服传统研究方案所不能兼顾的多指标问题的方法。

1 纵向切割模型

部署控制单元必须在符合SD-EON集中管控的情形下进行。在此约束下通过在控制平面上放置一定数量的控制单元,并对全网执行纵向切割将SD-EON分割出具有不同优先权[14]的控制平面。自低向高依次为低优先权控制平面、中优先权控制平面、高优先权控制平面。其中:将LPT定义为低优先权控制单元,用于管控多波长业务颗粒和控制指令的配置并确保控制平面在遭遇故障后实施自愈的时间周期最小化;将SCU定义为中优先权控制单元以降低整个控制平面对OCU资源的偏好度,并确保分区内的故障修复能力;将OCU定义为高优先权控制单元,用于提取跨分区、跨层等多波长颗粒调度期间的全网实时参量状态。所设计的纵向管控部署模型如图1所示。通过建立基于不同管控优先级纵向模型为控制平面选取合适的位置植入相应数量控制单元的优势不仅在于可规避SD-EON在调度多波长业务时出现多个控制单元指令冲突的风险,并可缓解在此期间对某一特定控制单元产生过度的资源偏好现象。具体而言,其风险规避思想为若存在多个控制单元同时向某一个交换转发网元下发控制信令,则优先级较低的控制单元信令首先被该交换转发网元丢弃。显然该纵向切割模型不仅解决了控制指令冲突问题也能降低海量求解运算对单一控制单元的计算资源偏好。为了避免SD-EON中OpenFlow交换设备和控制平面链接出现失效,要求OpenFlow交换设备在和一个主用LPT建立链接的同时也要和至少一个以上的备用LPT建立链接。同时定义一个可获取分区内部网络参量和拓扑信息的感知交换节点(SE)用于配合SCU收集分区子网的状态。由于多个LPT和SE所放置的位置均不同,确保了网络状态提取通道和控制单元下发流表项通道具备无相关性。也就是说控制平面在双向路由期间遭遇同时失效风险的概率极其低,这样的设计思想在一定程度上提高了控制平面的稳健性,同时也有别于传统研究设计。

图1 纵向管控模型设计

2 纵向管控思想

由纵向管控模型设计所述可知,控制平面的稳健性与控制单元的方位和规模息息相关。为更好地提升纵向管控效力,在制定纵向管控目标之前首先对该模型的相关参数做如下定义:令SD-EON中的网元vLPT、网元vSE、网元vSCU、网元vOCU形成的网元集合为V;令全网各网元之间的链路集合为E,则整个SD-EON的拓扑结构可表征为G=(V,E);同时,定义分区子网x内的节点集合为Nx,其中网元SE的节点集合为vx→SE,于是有vx→SE∈Nx。将Nx内的vx→SE之外的网元节点集合记作Nx -(vx→SE),并假设网元vx -(vx→SE)∈Nx-(vx→SE)。要提高全网波长业务调度期间的管控效率,要求SE在最短时间内侦测到网络实时参量并令LPT迅速将流表项下发给交换转发网元,同时让SCU以最小的时间成本在分区子网内形成低优先权的管控。若要实现这样的部署目标,则需同时满足以下四个目标函数。

相比较文献[15]所提支配极小化机制,纵向管控方案采用极小化覆盖方式为控制单元规划数量和方位,对于SD-EON控制平面稳健性而言更符合全网集中管控的要求,更具优势。其原因可通过下列证明过程获悉。

首先,假设网元子集I为网元子集V的一个子集,且I定义为全网节点规模最小化覆盖。对于那些不属于I的随机网元m而言,将和其建立链接状态的链路集合记作K=(m,n),且m∈E,n∈E。将集合K内除m以外的网元集合记作L=(n),且m∈K,n∈K。则|K|=|L|。若集合K和集合L规模均在两个以上,且随机网元m不属于全网节点规模最小化覆盖I,那么n∈I,于是有L⊆I。据此可知对于网元子集I而言,将存在超过两个以上的网元和I集合以外的随机网元m建立链接。因此在以无向图G=(V,E)为代表的SD-EON拓扑结构中,若I为全网节点规模最小化覆盖且所有网元均存在两个以上连接度,则对随机的I之外的网元m而言,最少存在两个来自于I的网元和m邻接。据此论证,纵向管控部署方案也就会出现两个以上的控制网元和单个交换转发网元节点建立链接的情况。这在很大程度上保证了SD-EON控制层面的稳健性。此优势是支配极小化机制[15]所不具备的。以网元A-F构建的两个拓扑为例做如下比较。假设每个拓扑中的六个网元所建立的光链路集均有lA-B、lB-C、lD-C、lD-F、lF-A、lB-F、lF-C、lE-C、lE-F、lE-B。支配极小化机制下的拓扑图中的网元F以vLPT形式存在并执行流表转发操作,同时将该网元定义为极小支配集合。其他五个网元均以OpenFlow交换机[16]的形式存在。纵向管控方案下的拓扑具有相同的链路集。同样假设网元B、网元C、网元F以vLPT形式存在并执行流表转发操作,同时将这三个网元视为极小化覆盖。其他三个网元均以OpenFlow交换机的形式存在。在这样的拓扑前提下假定网元D和网元F间的光链路遭遇失效,那么对于纵向管控方案下的拓扑而言,因其任意一个网元均存在与超过两个以上的vLPT保持链接状态使得网元D可经由另外的vLPT接收到控制层面向其转发的流表指令。相比而言,支配极小化机制下的拓扑因不具备此保障特性而使网元D未能接收到控制层面向其转发的流表指令。为让分区网络中的SCU以最低时间成本侦听到分区网络状态参量进而实施高度统筹管控,那么在规划部署方案时将网元LPT和网元SE进行融合考虑是有必要的。

其次,既然I被定义为图G全网节点规模最小化覆盖,意味着网元子集I和图G整个网络中的边具备关联性。且图G内所有网元可受网元子集I来支配,因此网元子集I可以是图G的支配集合。据此可知多个图G中的最小支配集合可以视为网元集合I内的子集。因此在以无向图G=(V,E)为代表的SD-EON拓扑结构中,若I为全网节点规模最小化覆盖,那么I可视为图G的支配集合,同时多个图G的极小支配集合都将作为I的子集来存在。据此论证,要使控制层面在最短时间内侦测到故障风险参数将可能遭遇到的故障风险降到极限,控制单元的部署过程应先参照第一论证中最小化覆盖I的准则来规划网元LPT,再参照第二论证I中的支配集合规划出网元SE并将网元SCU部署在网元SE上。然后再将网元OCU放置在所有网元SCU的中心地带。

3 纵向管控方案

根据所述的纵向管控思想设计出如图2所示的纵向管控方案。

图2 纵向管控方案实施过程

使SD-EON具备良好的稳健性不仅需要为控制单元统筹规划出一个如前文所述的方位配置方案,同时也要考虑为那些向上提供网络状态侦听传输、向下提供流表项更新的控制信道设计一个科学的资源路由规划机制才能够在保证控制单元稳健性的同时也兼顾到整个控制平面的稳健性。对于控制信道而言,其承担着网络状态数据的收集和流表项资源的下发任务,该信道内的交互式信令规模虽小但生存等级却是最高的。基于此对控制平面展开资源冗余规划也是必要的。假设将SD-EON全网从资源的角度分为五个层,自顶向下依次为转发层、接入层、光口层、时隙层、频隙层。在此分层级结构设计中,网络资源因颗粒规模渐大而使其使用率逐渐降低,同时规划配置资源的时间开销也相应降低。为最大程度降低因实施控制指令传输的光路由通道规模问题引发的控制层面故障风险,资源冗余规划机制将那些在频隙层中执行路由计算的控制指令统一调度到光口层后再送至频隙层。此举旨在缩小实施信令承载调度的介质规模以降低控制平面遭遇故障的可能性。整个资源冗余规划机制的步骤为:首先根据前文所述的全局纵向配置方案思想自底向上依次配置出网元LPT、网元SCU、网元OCU并设立分区子网,初始化链路集B(B为空)和OCU集λ′。为集合λ′范围外的每一个SCU和LPT统计出到达集合λ′范围内网元间距最小的个体,并将这些SCU或LPT个体纳入λ′,随即把SCU / LPT与相应网元间的路由局向存入链路集B内同时置其权重为零。如果得到的集合λ′和λ等同,那么保存该链路集B;如果不等同,那么重复执行上一步骤。其次,从所保存的链路集B内寻找某一个分区子网内所有LPT与该分区子网的SCU最短路由局向,以及每一个分区子网中SCU和OCU的最短路由局向。根据多径广播防护策略[18]从全网中搜索出一个圈[19]中的路由用于为那些承载了OCU流表资源的链路集B内的链路提供保护用途的防护局向。如果光口层在调度资源时出现紧缺情形,那么先从时隙层再从频隙层调度更多的资源为前两个步骤计算出的链路集B中的主用局向和防护局向分别调配充足的工作和防护资源。一旦控制层面遭遇失效风险,在局部分区子网内开启恢复策略。依次由次选分区子网、第三分区子网对应的LPT立即给受灾网元vb转发相应的流表资源;同时受灾网元vb通过该流表转发路由向其上层网元SCU提交所侦测到的网络状态参量。要是控制层面并未出现险情则默认由首选分区子网对应的LPT向vb传输相应的流表资源,同时该vb将所侦测到的网络状态参量提交至该分区子网所对应的SCU。不难看出,整个资源冗余规划机制的目标有两个:(1) 为交换机到SCU之间的上行单工控制路由、LPT到交换机之间的下行单工控制路由提供低时延的恢复自愈保障;(2) SCU到LPT之间的下行单工路由、SCU到OCU之间的双工通信提供低时延的保护自愈保障。此双自愈策略旨在为控制信道提供稳健的生存能力和科学的资源调配方案。

4 方案考察

图3 平均恢复率1

图4 平均恢复率2

图5 平均失效风险率1

图6 平均失效风险率2

此外,控制时延也是衡量SD-EON稳健与否的重要标准。不同的组网结构对控制时延的要求有所差异。理想情况下,方案的部署需控制在相应的时延门限范围内,尽可能以最低的控制成本把时延代价降至最小。图7所示的时延代价示意图内纵坐标三个时延参量从小到大分别表示控制平面生存性时延代价要求[20]、环形网自愈技术门限、网状网自愈技术门限,其中H、AVE、L分别指部署稳健性策略时付出的最高、平均、最小自愈时延值。显而易见,稳健性策略下的控制时延总体比可靠性算法、分区安置方案都要低。不仅如此,稳健性策略下的时延代价在满足生存性指标要求的同时,其峰值参量和均值也明显地远低于临界指标10 ms。这表明稳健性策略能够以绝对性优势嵌入到SD-EON实施更可靠的服务。相比之下,奉行控制单元和交换转发网元间符合局向分离的最大光通道规模的可靠性算法所安置的节点处具有较大的连接规模,且基本上位居全网的中心地带。因这样的区域内节点密度较大且距离交换设备遥远,控制指令在路由过程中产生的时间成本也就最高,故在本项考察中表现出了最弱的稳健性。

图7 时延代价

5 结 语

通过对比传统研究在SD-EON可靠性设计方面存在的可持续改进空间,提出一种普适性较强稳健性策略。该策略兼顾了控制单元在局部网络中和全局网络中的集中管控作用。主要通过多元化部署网元节点来区分控制单元的权限,避免底层交换机出现执行指令冲突的同时也为控制信道提供稳妥的资源配置方案和故障防护方案。测试结果显示所研究的纵向管控部署下的嵌入式SD-EON稳健性策略具备良好的科学性。

猜你喜欢
网元子网全网
一种简单子网划分方法及教学案例*
计算机时代(2023年1期)2023-01-30 04:08:22
《唐宫夜宴》火遍全网的背后
双十一带货6500万,他凭什么?——靠一句“把价格打下来”,牛肉哥火遍全网
子网划分问题研究及应用
一种全网时钟同步管理方法
电力系统全网一体化暂态仿真接口技术
电子制作(2018年14期)2018-08-21 01:38:28
王天戈首支中文单曲《心安理得》全网首发
青年歌声(2017年6期)2017-03-13 00:58:48
子网划分的简易方法
光网络设备ECC常见问题解决思路剖析
中国新通信(2014年5期)2014-10-17 01:49:03
基于安全协议的虚拟专用子网研究
河南科技(2014年16期)2014-02-27 14:13:04