杨藤星 谢四江 冯 雁
北京电子科技学院,北京市 100070
作为新一代移动通信技术,5G[1]将实现真正的“万物互联”,支持大量来自垂直行业的多样化业务场景,如智能安防、高清视频传输、远程医疗、智能家居、自动驾驶等。 为应对在一个物理网络上同时支持多种具有不同性能要求的业务场景,且能够满足不同业务的需求,网络切片技术应运而生[2]。
作为逻辑网络,网络切片需要部署到物理网络上才能实现切片的服务价值。 为了降低切片部署成本,网络服务供应商一般会选择将多个切片部署在同一物理网络上,服务器资源和链路带宽的共享和复用带来了过度竞争问题,可能造成切片服务的性能下降。 文献[3 ~5]的研究表明物理网络资源利用率和切片性能之间存在互斥关系。 文献[6]提出采用切片隔离保障共存VM(Virtual Machine,虚拟机)性能,通过安装多个网络适配器,降低共存VM 间的性能干扰。 文献[7]针对虚拟化环境中资源超额分配导致的性能下降问题,从网络吞吐量和服务响应时间出发提出了一种基于服务等级和性能感知的控制策略。 文献[8]针对切片间竞争物理资源影响切片服务质量的问题,提出采用弹性资源管理策略避免资源竞争带来的传输拥塞,提升切片流量传输性能。 文献[9]针对网络切片共享物理资源的VNF(Virtual Network Function,虚拟网络功能)间因资源竞争带来的性能下降问题,提出了一种基于性能感知的网络切片部署方法。 其中,文献[6]和文献[9]具备较高的参考性,文献[9]所提方法仅考虑了服务器上资源竞争导致的性能下降,忽略了物理链路上带宽竞争可能带来的网络拥塞,进而导致切片整体性能的下降。
基于此,本文提出了一种基于性能隔离的网络切片部署方法。 使用性能隔离因子来反映切片服务的整体性能下降程度,结合K短路径算法[10],选择性能隔离因子最小的网络作为映射网络, 最后采用GA-PSO (Genetic Algorithm-Particle Swarm Optimization,基于遗传算法改进的粒子群优化算法)算法求解映射结果。 仿真结果表明,本文所提方法能够较好地维持切片整体性能,有效保障切片部署在相同物理基础设施上的性能隔离。
3GPP[11]从标准层面给出了网络切片的定义:网络切片可由运营商使用,基于同客户签订的SLA(Service Level Agreement, 服务等级协议)为不同垂直行业、不同客户、不同业务,提供相互隔离、功能可定制的网络服务,是一个提供特定网络能力和特性的逻辑网络。 网络切片有两个关键技术:SDN(Software Defined Network,软件定义网络)和NFV(Network Function Virtualization, 网络功能虚拟化)。 SDN 和NFV 相互独立,相互补充,实现网络切片的动态、灵活部署和按需扩展[12]。
逻辑的网络切片由NSI(Network Slicing Instance, 网络切片实例)承载,NSI 是一个部署的网络切片,包括网络功能实例及所需的计算、存储和网络资源,和链路所需的带宽资源[13]。 NSI的具体细节如图1 所示,其中NS 指的是网络切片(Network Slicing),RAT 指的是无线接入技术(Radio Access Technology),CP 指的是控制面(Control Plane), UP 指的是用户面(User Plane)。
图1 网络切片实例
网络切片部署具体细节如图2 所示,其中SFC 是指服务功能链(Service Function Chain)。
图2 网络切片部署细节
当第三方发起网络服务请求时,网络服务供应商根据客户需求选择或设计VNF,按照一定顺序将VNF 组成具备专用服务功能的链;随后将物理网络的节点资源和链路资源分配给服务功能链,激活专用功能;当服务功能正常接入后,流量开始流过切片;系统通过持续监测端到端时延、资源利用率等指标,按照实际需要进行资源重配[14]。 这是网络切片的一个完整生命周期,其中将物理网络资源分配给服务功能链的过程就是网络切片到物理网络的映射过程(即网络切片部署),包括虚拟节点(VNF)到物理节点(服务器)的映射和虚拟链路到物理链路的映射。
本方法的具体过程如下:首先,从资源供需角度出发,使用节点资源利用率总和、链路带宽利用率总和分别度量节点、链路的性能下降程度,并将二者加权处理为反映切片整体性能下降程度的性能隔离因子;然后,将最小化切片性能隔离因子作为本研究优化目标,明确相关隔离约束条件;最后,利用整数线性规划方法对网络切片映射问题进行数学建模,使用GA-PSO 算法对映射结果进行求解。
当多个切片部署到同一物理网络上时,必然存在多个虚拟节点(VNF)部署到同一物理服务器、多条虚拟链路部署到同一物理链路上的情况,如图3 所示。 VNF b 和VNF e 映射到Server C 上,VNF b 可能过载占用大量物理资源造成VNF e 无法正常工作,进而影响VNF e 所属切片服务;VNF ab 间虚拟链路和VNF de 间虚拟链路的映射链路均涉及Server BC 间物理链路,VNF ab 间流量异常可能会导致Server BC 间带宽紧张,导致VNF de 间通信出现故障,影响VNF de间链路所属切片服务。 可以看出,不论是映射节点还是映射链路出现资源竞争,都会造成切片性能的下降。
图3 性能隔离问题描述
在5G 网络切片中,3GPP 提出采用切片隔离技术来保障不同切片的独立运行。 切片隔离一般可以分为切片级隔离和网元级隔离两种[15],切片级隔离采取的是类似于专网的策略,不同切片之间有天然界限,具备各自独有的物理资源和安全策略,性能和安全都能得到极高保障,主要适用于军队、公安等高安全需求场景;网元级隔离则通过共享底层物理资源,在一定性能保障下尽可能降低部署成本,方便切片进行快速部署,适用于大部分应用场景。 本文采取的是网元级隔离,其中节点间的隔离主要是虚拟机间的隔离,因为VNF 是承载在VM 上进行工作;链路间的隔离则可以通过VPN(Virtual Private Network,虚拟专用网络)或FlexE(Flexible Ethernet,灵活以太网)技术来实现[16]。
因此,本文考虑结合切片隔离技术来应对资源竞争导致的切片性能下降问题,如何对切片性能下降程度进行度量和性能隔离条件的确定是本研究的关键。 在文献[9]使用性能感知因子(节点资源利用率总和)度量切片节点性能下降程度的基础上,提出使用链路带宽利用率总和来度量切片链路性能下降程度,切片整体性能下降程度则通过两者加权的性能隔离因子来进行度量。 在本研究中,性能隔离因子值越低,切片性能下降程度越小,切片性能保障水平越高。
2.2.1 网络模型物理网络模型:物理网络us可以表示为GS= (NS,LS,CN,CL),NS是物理节点集合,LS是物理链路集合,CN={ccpu,cmey,cnet} 是物理网络us所有物理节点剩余物理资源集合,ccpu,cmey,cnet分别代表us所有物理节点剩余的计算资源集合、存储资源集合、网络资源集合,CL是物理网络us所有物理链路剩余带宽资源集合。ns∈NS表示物理网络us上一物理节点,ls∈LS表示物理网络us上一物理链路。
2.2.2 映射变量
网络切片部署实质上是一个映射过程,可以视为0- 1 规划问题,0 代表映射失败,1 代表映射成功。 节点和链路映射变量相关定义如式(1)和(2)所示。
2.2.3 优化目标
在本研究中,将反映切片vi整体服务性能下降程度的性能隔离因子per_isoiv作为目标函数,其值越低,性能下降程度越小,性能保障水平越高。 其计算方式如式(3)所示。
2.2.4 约束条件
节点不可分割约束:一个虚拟节点只能映射到一个物理节点上,不能对其进行分割映射,如式(7)所示。
节点全映射约束:所有虚拟节点全部映射到物理网络上,如式(8)所示。
安全约束:出于一定的安全考虑,同切片下不同虚拟节点不能映射到同一物理节点上,如式(9)所示。
网络切片部署是一个NP-hard 问题,在多项式时间内很难利用传统方法进行求解。 鉴于此,本文使用GA-PSO 算法[17]求解映射结果。 在粒子更新速度和位置后,GA-PSO 进行交叉和变异操作。 改进后的算法有效增强全局寻优能力、提高问题求解精度、克服PSO 早熟问题。 本研究中GA-PSO 算法的具体使用流程如算法1 所示。
式中,t指的是迭代次数,λ为惯性权重,c1和c2是两个学习因子(调整学习因子值可以控制粒子在全局探测和局部开采的有效平衡),r1和r2为相互独立的伪随机数(服从[0,1]上的均匀分布)。
→→1.初始化vi ,用算法2 求解适应度值,并求出局部最优粒子pi、xi→和全局最优粒子pg→;2.for 1 ≤i ≤Maxg do 3. for 1 ≤j ≤Scope do 4. 利用式(11)和式(12)更新种群粒子速度vi→、粒子位置xi→;→依概率pc 和pm 分别进行交叉和变异操作;6. 使用算法1 求解适应度值,更新pi 5. 对xi→、pg→;7. end for 8.end for 9.输出GiV 部署结果pg→
算法1 中关于适应度值求解的算法如算法2 所示。
1.初始化参数U= Inf,最大路径长度hopmax = n/10;2.if xi→满足式(6)&& 式(7)&& 式(8)&& 式(9)do 3. 使用式(4)计算节点资源利用率总和;4. for 1 ≤k ≤length(xi→) - 1 do 5. 获取节点ni,k v 和ni,k+1v的映射位置nAs 和nB s ;6. 最短路径算法求得nAs 和nB s 间最短路径跳数为hop;7. while hop ≤hopmax do 8. 用K 短路径算法求出nAs 和nBs 传输跳数为hop 的所有路径;9. if 满足式(10)do 10. 链路映射成功,获得映射链路带宽利用率;break;11. else 12. hop = hop + 1;13. end if 14. end while 15. if hop >hopmax do
→) = U;break;17. end if 18. 计算链路带宽利用率总和;19. end for 20. 用式(3)计算fitness(xi 16. fitness(xi→) (性能隔离因子);21.else 22. fitness(xi→) = U;23.end if 24.输出映射网络的适应度值fitness(xi→)
在配置为AMD A10 PRO-7800B R7 @3.50 GHz,8.00 GB 内存的PC 机上进行仿真实验,使用对称化的[0,1] 均匀分布邻接矩阵生成需要的物理网络(如图4 所示)和网络切片请求的网络拓扑,然后使用MATLAB 对部署方法进行仿真验证和结果分析。 本文所选网络均为随机网络,仅用于对本文方法进行仿真验证。 实际部署过程中,根据实际网络拓扑进行相关网络设定。
图4 物理网络拓扑
仿真实验中,网络参数参照文献[9]进行设定,仿真参数参照文献[17]进行设定,具体取值分别如表1 和表2 所示。
表1 网络参数
表2 仿真参数
将本文提出的方法(记为方法1)和文献[9]提出的节点性能保障方法(记为方法2)、以及链路性能保障方法(方法3)进行比较。 方法1 是为了保障切片整体服务性能提出,以最小化性能隔离因子作为优化目标;方法2 是为了应对切片节点性能下降提出,以最小化节点资源利用率总和作为优化目标;方法3 是为了应对切片链路性能下降提出,以最小化链路带宽利用率总和作为优化目标。 下面主要从收益开销比、节点资源利用率总和、链路带宽利用率总和、性能隔离因子4 个方面对3 种方法进行对比分析。
4.2.1 收益开销比
图5 是3 种切片部署方法的收益开销比对比图。 从平均收益开销比来看,方法3 优于方法1 和方法2,能够更好的控制切片部署成本。 部署初期,方法1 和方法3 从链路带宽利用率总和出发选择更短的可达链路,随着切片部署规模的增加,可达链路路径变长,部署成本升高,收益开销比降低。 而方法2 是在最小化节点资源利用率总和的前提下进行选路,对路径选择条件更加宽松,随着可用资源的集中,部署成本逐步下降,收益开销比升高。 随着部署切片数量的增加,方法3 成本友好型的特性开始显现。
图5 收益开销比
4.2.2 节点资源利用率总和
首先需要明确的是,节点资源利用率总和越低,对节点性能下降抑制能力越强,切片节点性能保障水平越高。 3 种方法的节点资源利用率总和情况如图6 所示。 从平均节点资源利用率总和来看,方法1 和方法2 的值低于方法3。 这是因为方法3 没有考虑节点资源竞争导致的性能下降问题,在节点性能保障上效果更差。
图6 节点资源利用率总和
4.2.3 链路带宽利用率总和
同样需要明确的是,链路带宽利用率总和越低,对链路性能下降抑制能力越强,切片链路性能保障水平越高。 链路带宽利用率总和对比图如图7 所示,可以看出,方法1 和方法3 在链路性能保障上显著优于方法2。 这是因为方法2在部署时并未考虑链路带宽竞争导致的性能下降问题,因而链路性能保障水平更差,在数值表现上也就显著高于方法1 和方法3。
图7 链路带宽利用率总和
4.2.4 性能隔离因子
图8 是3 种方法在性能隔离因子的对比图。作为本研究的核心指标,性能隔离因子是切片服务性能下降程度的整体反映。 性能隔离因子值越小,对切片性能造成的下降程度的越低,整体性能保障水平越高。 从图中可以看出,方法1 的值低于方法2 和方法3,在切片整体性能保障上具备更大的优势。 这是因为方法1 对节点性能下降和链路性能下降问题进行了综合分析,而方法2 和方法3 都只考虑对部分问题进行应对。
图8 性能隔离因子
网络切片基于SDN 和NFV 而实现,二者的引入提高了切片部署效率、降低了切片部署成本,但是共享物理资源的网络切片间的资源竞争也带来了切片服务性能下降的问题。 针对该问题,本文提出在切片进行部署时,将性能隔离因子最小化作为优化目标,通过GA-PSO 算法进行迭代寻优,最终的映射网络能够最大限度地降低资源竞争对切片性能造成的性能下降影响,保障切片的整体性能水平。 仿真实验结果表明,本文所提方法能够更好地保障切片的整体性能。 不过,在成本控制上稍显不足,收益开销比偏低。下一步,将考虑对收益开销比进行提升。