全局视域下基于流特征的约束性QoE算法

2021-01-15 08:22
计算机应用与软件 2021年1期
关键词:数据包链路时延

林 国 勇

(广西民族大学相思湖学院 广西 南宁 530008)

0 引 言

为加速各产业领域的融合推广,近年互联网+技术得以部署,与之相关的大数据[1]业务也随之兴起。为了顺应产业发展对网络应用的要求,作为承载大数据的DCN,在疏导数据流量载荷方面也就面临局向机制的革新。在当前新型DCN应用环境中,服务器节点对的频繁交互在很大程度上已远超传统网络中数据通信端与服务器的呼叫连接频率。尤其在引入云计算后,剧增的服务器节点对规模使得DCN面临着QoE考验。虽然DCN可在较短时间内建立新的计算与储存实例,却无法保证计算策略是否具备全局适应性,进而导致全局网络在应对随机突发数据流量载荷时的QoE受到潜在性损伤。基于此,提出了一种有利于数据流高效转发管理的网络架构——软件定义胖树结构数据中心网络。从架构上看,软件定义网络(SDN)采用控制和转发解耦的设计理念[2]来管理随机突发数据流,取代了传统网络中将流量调度机制集中于单个网元节点的设计。将随机突发数据流载荷的局向流表计算作业部署到控制域中的控制器,并将流表项的局向决策通过南向接口[3]更新到转发域中的交换机,再由交换机对随机突发数据流实施转发。

据文献[3]统计,软件定义胖树结构数据中心网络上的随机突发数据流规模状态呈现两极分布:约九成的大流主要来源于虚拟机的转移和数据容灾备份。其承载带宽之大、承载时延之长的特性决定了一旦遭遇流局向瓶颈,势必引发全网大数据阻塞风暴;剩下的小流主要来源于在线交互式应用型业务[4]。与大流相反,其承载带宽较小,但规模较多,对流时延较为敏感。同时,在大流遭遇大数据风暴时,势必影响到既有小流的局向成效,导致全网二次局向风险。可见,能否高效地对不同规模特征的随机突发数据流量载荷实施局向管理,关系到SDN顶层业务应用层的QoE。因此,围绕QoE展开相关局向管理方案的思考成为业界亟待解决的重要问题。

文献[5]提出的等开销多径路由机制,其核心思想是在信源和信宿对之间计算出权值相同的链路集合来对随机突发数据流的载荷流量实施均衡局向分流。该机制虽能在某种程度上缓解某一个网元节点的故障,但突发特性的随机大小流令网络参数呈现实时多变的情形是等开销多径路由机制所无法适应的。这其中包含了一系列与QoE密切相关的流承载时延、吞吐量、可靠性等动态参数指标。此时,仍一味坚持从相同最小开销的链路集合中规划出备用的局向用于管理随机突发数据流,显然不科学。这种固定模式的多径路由机制并不适合部署在现有的突发网络上。因此,文献[6]探讨了一种动态调度算法,首先为大流定义一个比特率门限,并在一个拟定的周期内从随机突发数据流载荷中遍历出符合特征的大流,然后评估大流的带宽规模,最后根据链路的实时承载度为该大流规划出合适的转发局向。相比之下,调度算法的动态性与突发网络的实时性保持了良好的同步,使得网络流业务的QoE得以改善。然而受限于周期性遍历大流期间控制器和交换机的频繁交互引发的开销资源的枯竭,使得该算法对硬件资源形成了较强的依赖性。同时数据流的随机突发特性制约了遍历的效能度。比如:遍历结果必须在遍历周期期满后才提交,从而忽略了遍历周期外出现网络阻塞的情形。鉴于随机流量载荷的特发特性,当达到遍历周期时网络实时参量或许已动态变化。此外,该算法的动态调度对象仅限于随机突发大流。与之相反,文献[7]的流均衡算法旨在解决随机突发小流的拥塞问题。其均衡理念是为所有的原始随机突发小流分别生成一个仿真流,当有一条小流完成一次传输作业时,信宿则顺利获取所有的数据信息。由于原始流的源端口编号是通过对仿真流的源端口编号执行减1操作而来,因此仿真流和原始小流的区分可通过读取源端口编号来识别。该算法有效地改善了随机突发小流的承载时延,但依然存在不足之处:(1) 在随机突发大流和小流并存的网络中,很难在短时期内遍历出良好的路由局向为小流提供承载保障;(2) 在忽略网络实时载荷程度和实时载荷数量的前提下,机械地为所有随机突发小流生成仿真流的策略将严重消耗带宽资源。

源于上述传统研究的局限性,本文结合软件定义胖树数据中心网络在载荷动态调度方面的结构性优势,从全局视域角度出发构思一种可区分随机突发大小流特征的QoE算法,用于实施大小流局向的科学规划,以提升网络业务的QoE。

1 方案设计

参照文献[8],本文对随机突发流做如下定义:单位时间内某一条数据流所承载的数据量不超过局向链路带宽资源的10%,定义该流为随机突发小流;反之,则定义该流为随机突发大流。据此定义,算法可通过解析单元经由控制域统计全网参量来实施随机突发大小流的甄别。鉴于两种流特征对承载要求的差异化,研究基于流特征区分的并存保障方案便是本文QoE算法所要完成的目标任务。

针对该任务,业界此前开展过相关研究工作但依旧存在一些不足:(1) 在主机规模较大的全网中需逐个配置主机内核;(2) 以大量交换转发单元和控制单元的交互频率为代价降低某一个控制单元的重载度等。而本文QoE算法则可在不依赖网络和节点开销资源的前提下实施基于流特征的个性化局向,主要通过定义一个基于流特征的个性化局向权衡度。然后参照该权衡度从多径选项中分别规划出基于不同流特征的最短局向链路,以此为双流的并存承载提供局向可靠性保障。这种在随机突发环境下为数据流动态地寻找一个基于QoE的局向,可视为一个基于约束的最短局向问题的求解。这正是QoE算法的目标。故在算法设计中为不同流定义一个科学的约束性和合理的权衡度是本文算法的重点。

基于流特征的约束性QoE算法的部署是通过在软件定义胖树数据中心网络中的控制域植入侦听单元、解析单元和局向单元来实现,其中:侦听单元通过调用statistics()来监视全局视域下网络的动态参量,包含端口比特率等,并移交至解析单元;解析单元基于所监视的全局动态参量自适应地定义门限[9],根据侦听单元搜集到的端口比特率值大小解析出大小流,并将解析结果提交给局向单元;(3) 局向单元结合解析数据结果,以及侦听单元提供的链路实时时延参量、链路实时丢包参量、链路实时可支配开销资源等一些与QoE相关的指标,统筹为大小流制定流表项策略,再经由南向接口下达给转发域中的交换转发网元内存中,为良好地局向大小流、改善业务应用的QoE提供依据。由上述三个单元构成的QoE算法系统,实施过程如图1所示。

图1 基于流特征区分的约束性QoE算法步骤

软件定义胖树数据中心网络对于随机突发流的区分和局向策略的制定等核心数据处理环节主要通过控制域来响应。控制域中的控制器经由南向接口连向底层转发域中的交换机,而交换机又直接面向终端服务器,因此控制器可顺利获取全域性网络实时参量状态,对交换机实施集中式管理。同时,控制域中的控制器经北向可编程接口可对顶层的网络应用层进行随机突发业务的自定义。在底层交换机首次承载随机突发数据流时,交换机将向上层的控制域提交流表项计算请求,待控制器启动基于流区分的局向算法响应出基于流特征的局向策略后,再将该策略以局向流表项形式写入交换机内存的流表中。此后转发域中的交换机将参照其内存中流表内的流表项对随机突发流进行局向转发作业。整个QoE算法从全局参数侦听到流表项响应一系列部署过程,始终与全网数据流的随机突发特性保持动态同步,因此基于流特征区分的局向方案具备良好的自适应能力,更有助于改善网络应用层中与QoE有关的一系列指标。

2 算法设计

QoE算法的核心思想是在软件定义胖树数据中心网络平台上通过一定的机制从随机突发数据流中解析出大小流,并启动局向算法从全局中规划出最优[10]局向分别用于疏导随机突发大小流,以确保全局吞吐量、带宽利用率、流承载时延等参量的优化状态。算法的焦点在于如何从全局多径选项中计算出具有约束性的低代价链路。在此情形下,QoE可视作是一个和上述网络状态参量相关的函数架构。为将此函数架构和约束局向拓展到SDN用于求解路由问题,文献[11]提出了定义流规模、可靠性和局向距离等作为流调度的基本要素,并提出了基于词义叠加或直接叠加的复合权衡度概念,同时也验证了局向度量的单调性。基于此度量模型基础,文献[12]主张运用改进的Dijkstra计算策略搜索出最优局向,其思想为通过定义局向权值函数来确保每一条路由的畅通。然而该方案未顾及到流局向的约束前提条件。针对此问题,文献[13]提出了流在不同约束前提条件下进行局向的收敛问题,但是却未能保证每一跳局向的收敛性。基于此,本文构思一个新的度量属性函数来衡量基于流大小区分的局向稳定程度。构思前需首先规划一个有向拓扑结构模型,通过引入基于随机突发流规模特征的个性化权衡度来求解局向目标函数,进而实施基于约束的局向链路代价评估。该拓扑结构的数学模型如下:

根据上述关于随机大小流特征描述可知,在网络中小流占据较大数量规模且持续时长较短,对时延较为敏感。故在混合权衡函数中引入丢包率和时延这样的具有代表性的小流特征参量作为局向的权衡参数。将路径L中k条链路的混合权衡度表征为:

3 算法评估

3.1 评估方案

QoE算法旨在通过识别流特征来制定适用于不同流的载荷转发方案,以此保障全网业务的QoE。本文对QoE算法的评估安排在Mininet环境中来开展。首先在该环境中构建一个k=4的软件定义胖树数据中心网络拓扑结构。整个网络共有4个pod,每一个pod设置4台主机和4台交换机。此外,核心层共4台交换机。全网链路局向资源为103Mbit/s。

根据引言所述,软件定义胖树数据中心网络上的随机突发大流约占10%。本次实验通过灌包软件模拟生成该比例下的随机突发大小流。同时定义每个小流最大长度为500 000 Byte。鉴于以太数据最大长度为1 518 Byte,为了便于分析,评估将每个数据包长度简化至1 500 Byte,则每个小流含有333个包。为全方位考察数据流的随机特征对QoE算法的动态效能度,体现算法的全局视域性,评估方案为所有的主机对增设了Stride(i)和Random(i)两种流发送模式。其中:前者指下标标识符为x的主机往下标标识符为(x+i)modn的主机发送数据流;后者指一个主机以相同的概率任意往全网中其他主机发送数据流。实验过程使每一个主机对之间的TCP流发送遵从Stride(i)和Random(i)模式,所有的随机突发数据流规模遵循指数级递增趋势且流生成时间遵循泊松分布。定义每两个流持续间隔10 s,每个流的承载时延为2 min。

评估过程中将拟定三个指标[18]来考察QoE算法相对于传统研究的优势,分别为:随机突发流持续时延,流传输规模,平均吞吐量。若对时延较为敏感的小流在局向上承载的时延持续较短,说明算法可为小流的承载提供良好保障;流传输规模能够较好地反映出全网链路的阻塞情况。若遭遇阻塞,将由于该流中数据包的丢失而导致流出现频繁传输的情形。一旦重新传输的流中含有较多的数据包时,将付出较大的时延代价。这种情况显然无法为时延敏感的小流提供局向承载低时延的保障。平均吞吐量也是考察验QoE的重要指标,可在保证随机突发小流低时延的同时大幅度地提高网元节点在单位时间内收发流的数据量。在经过40次测试后对各指标数据进行搜集比对。

根据QoE算法方案目标任务所述,该算法重点在于为DCN上随机突发大小流制定一个基于流特征区分的个性化局向保障策略。当前,针对DCN上随机突发流开展局向安全性评估的主流研究有等开销多径路由机制、动态调度算法、流均衡算法等。这些研究基本都是在总结等开销多径路由机制缺乏动态自适应性能力的基础上改进而来。即便如此,改进后的算法仍存在一定的片面性,如动态调度算法的目标仅限调度随机突发大流;流均衡算法的目标仅解决随机突发小流的载荷评估。因此,为考察QoE算法制定的局向策略兼具全局性和个性化特征,测试过程将与上述三种算法进行对比。

3.2 数据考察

3.2.1随机突发流持续时延

经测试与统计[19],六种流量通信模式下随机突发流持续时延的数据结果如图2-图7所示。可见,不同算法机制下流量承载时延表现出显著差异。

图2 Stride(1)通信模式

图3 Stride(2)通信模式

图4 Stride(8)通信模式

图5 Random(1)通信模式

图6 Random(2)通信模式

图7 Random(3)通信模式

以等价开销多径路由机制为例,在图2通信模式下,QoE算法相对其在改善持续时延方面的贡献度仅优化了10%~16%。由于过半的随机突发数据流量载荷集中于某一个交换网元,剩余流量载荷位于POD之间或者某一个POD里面,所以隶属于该交换网元下的主机集合在实施流承载业务时无须占用其他交换网元链路资源,从而大幅减少随机突发数据流冲突的可能性。因此突发大流良好有序的承载状态对突发小流承载时延并未造成明显的影响。当流量通信模式调整为图3和图4,此时信源和信宿分别位于不同的交换网元节点,在流量呈现指数级增长的态势下,随机突发大流的承载状态不再保持有序,势必影响到小流的承载。从图2和图3中可见,等开销机制下的小流承载时延优势不再。而此时QoE算法发挥了优势,相对于等开销机制,该算法在小流承载时延上改善了23%~44%。当流量处于图5通信模式下,因主机之间交互的随机性使得流量的承载状态无可预估。随着随机模式参量状态从图5变化为图6和图7,POD彼此之间的流量规模陡增,等价开销多径路由机制的效能性未能得到有效发挥,显著增加了大流冲突的可能性进而导致较高的小流承载时延代价。而此时QoE算法以0.9 s的相对时延优势,比等开销机制下的小流承载时延提升了23%~53%。

其次,对于动态调度算法而言,在图2通信模式下大流冲突可能性较低,此时QoE算法在小流承载时延方面的贡献度相对提升了7%~13%。但是随着交换网元节点数量规模的增加以及POD之间流量的陡增,大流开始遭遇频繁冲突。此时动态调度算法发挥的时延承载性能下降,相对于等价开销多径路由机制较为缓慢。相比之下,QoE算法比动态调度算法在小流承载时延方面发挥的优化效果达到29%~47%。

观察图2-图7可知,在流量规模较小的全局网络中,流均衡机制对小流承载时延的保障效果良好。此时QoE算法下的小流时延优化效果仅8%左右,差异不显著。但其均衡过程中为所有的原始随机突发小流分别生成一个仿真流的思想,并不适合用在大流规模陡增的、链路带宽资源有限的网络环境中。故根据不同流量通信模式下所收集到的数据曲线,不难看出流均衡机制下的小流承载时延代价逐步增加。尤其在图7随机流量通信模式下,QoE算法下的小流承载时延指标比该机制显著改善了32%。

综合分析上述数据曲线可知,在随机突发数据流量载荷遵循1∶9的情形下,两种流量传输模式中局向链路在承载小流时产生的时延总体上并无较大区别。实验结果充分说明了本次评估环境的设置与DCN中的流特征是大致吻合的。在此前提下观察到随着流频繁发生冲突,相对于其他三种方案,QoE算法能够最大限度地保障基于时延敏感的随机突发小流承载要求。

3.2.2流传输规模

因为链路阻塞而对流实施重新传输将导致该流数据包承载时延的增加。尤其对于小流而言,频繁的流数据包重新传输势必增加时延代价。对于以解决小流承载问题的流均衡机制而言,通过为每条小流建立仿真流数据包的思想使得小流承载过程较为顺利,出现流重新传输的概率相对于其他算法机制最少,因此时延代价最小。这样的情形在图8-图13中得到了体现。由图8-图10可见,相对于传统研究的等价开销多径路由机制和动态调度算法,QoE算法下的小流数据包重新传输规模分别降低了40%和20%。但是在图11-图13随机通信模式下,随着大流规模增加导致全网重载情形的出现,有限的链路资源不再允许流均衡机制快速地搜索到合适的链路承载小流数据包。这导致数据包出现持续性重新传输,且重传的数据包规模随着时间推移还将呈现递增态势。相比之下,QoE算法能够显著地降低小流数据包重新传输的规模。不仅如此,相对于传统研究的等价开销多径路由机制和动态调度算法,QoE算法将小流数据包重新传输的规模分别降低了50%和40%,有效保障了小流的承载质量。

图11 Random(1)通信模式

图12 Random(2)通信模式

图13 Random(3)通信模式

对于大流而言,流数据包的重新传输将严重占用链路资源,进而导致全局网络出现阻塞。其阻塞程度和流量通信模式的复杂度成正比。尽管如此,纵观六种流量通信模式可见,本文设计的QoE算法依然能够发挥良好的调度性能,有效降低大流数据包重新传输规模,保持了相对优势。尤其在图11-图13更为复杂的随机通信模式下,阻塞情形降低大流承载质量的现象显得愈加明显。由图13可见,等价开销多径路由机制的调度效能最弱,大流数据包重新传送规模最大,此时QoE算法将大流数据包重新传送规模显著地降低了35%。对于以调度大流为主的动态调度算法,大流数据包重新传输的规模虽小于其他两种算法机制,但仍不及QoE算法。其中流均衡机制的核心在于调度小流,未能保障大流的承载质量,故该机制下的大流数据包重新传输规模较大。

3.2.3平均吞吐量

对于以稳定调度大流为中心思想的动态调度算法能够适应各种流量通信模式,具有良好的适应性。该算法在目前关于大流调度的研究中成效较为突出。因此该算法下的链路资源利用率较高,相应的平均吞吐量也最大。从图14所搜集的测试数据可以明显看到,算法部署在六种流量模式下的全网平均吞吐量中动态调度算法最为突出。相比之下,本文设计的兼顾大小流调度的QoE算法在平均吞吐量指标上的表现较为接近于动态调度算法,因此也发挥了良好的调度效果。但对于动态自适应能力较弱的等价开销多径路由机制,在调度大流时一味地主张将其数据流量载荷规划到相同的路由局向,极易引发网络阻塞。由此引发的阻塞将继续随着网中数据流量通信模式复杂度的增加进一步约束全网的平均吞吐量。这样的趋势在图14中的三种随机通信模式情形下表现尤为突出:QoE算法下的全网平均吞吐量是等价开销多径路由机制的1.5倍。同时,对于以调度小流为主的流均衡机制,虽有一定的动态适应能力,但终究由于缺乏大流承载保障策略而使得该机制下的全网平均吞吐量不具备优势。即便如此,其平均吞吐量指标仍然达到动态适应性极弱的等价开销多径路由机制的1倍。

图14 算法部署在六种流量模式下的全网平均吞吐量

4 结 语

鉴于在数据中心网络上开展随机突发数据流量载荷局向风险评估效率不足的现状,本文借助软件定义胖树架构在调度随机突发大小流过程中能够为策略的实施提供参量更新的优势,构思了一种全局视域下基于流特征的约束性QoE算法。通过甄别机制识别不同特征的大小流,并参考全网链路可用资源、业务流承载时延等实时参量状态分别疏导大小流,在最小化全网资源开销的前提下来兼顾不同特征流的承载质量。评估数据表明,QoE算法相对于传统算法具备良好的全局性和优化性。

猜你喜欢
数据包链路时延
一种移动感知的混合FSO/RF 下行链路方案*
二维隐蔽时间信道构建的研究*
天空地一体化网络多中继链路自适应调度技术
计算机网络总时延公式的探讨
计算机网络总时延公式的探讨
基于物联网的IT运维可视化管理系统设计与实现
《舍不得星星》特辑:摘颗星星给你呀
C#串口高效可靠的接收方案设计
一种IS?IS网络中的链路异常检测方法、系统、装置、芯片
网络数据包的抓取与识别