曾菊玲 张春雷 蒋砺思 夏 凌
①(三峡大学 宜昌 443002)
②(University of California,Irvine,CA,USA)
无线网络虚拟化是5G的主要组网模式[1,2]。合适的网络架构和有效的资源分配策略是虚拟化的关键技术。文献[3-5] 提出了资源提供者(Infrastructure Providers, InPs)直接向UEs(Users)提供资源的2级架构模型,由于未将移动虚拟网络操作者 (Mobile Virtual Network Operators, MVNOs)包含在内,InPs直接面向所有UEs,计算复杂度高,且无法实现虚拟资源管理。文献[2,6] 提出了3级架构模型,中间层MVNOs向UEs提供服务,InPs与UEs解耦并被MVNOs共享,计算复杂度、资源利用及管理、系统效用及用户体验得到改善,被广泛采用。基于3层架构的多种分层联合优化资源分配模型被提了出来且常用分层博弈求解,文献[7] 给出了一种通过机会频谱共享实现虚拟化的机制,但非完全隔离降低了在虚拟网络中的可实用性,文献[8,9] 分别给出了基于合同理论及破产博弈的虚拟资源分配策略,分别采用 MVNOs与UEs或MVNOs与InPs 2级架构以及仅MVNOs效用最优难以保证整个网络性能,文献[10,11] 提出了3级架构下2层联合的分层拍卖机制,保证了整体效用最大和资源分配次优,但不能保证个体效用最大,特别地,对于无线虚拟网络,作为卖方的MVNO需要全部信道信息进行中心决策,信道反馈开销大,系统复杂,计算量大。文献[12] 采用MVNOs与InPs以及UEs与MVNOs联合分层匹配博弈机制,保证了各层及个体效用最优,去中心化的实现方法也使系统相对简单,但还存在以下不足:(1)上、下两层博弈不相关联的效用函数及随机价格导致一致收敛困难、层间循环迭代次数多、计算复杂度大;(2)信道状态信息仅出现在InPs、未出现在MVNOs与UEs的效用函数中,导致整个博弈无法跟踪信道变化;(3)分层匹配博弈仅实现了MVNOs控制下UEs与切片匹配,并未对功率、带宽进行优化分配,不能实现基于信道特征的最大效用及较高资源利用率。因此,建立基于信道特征的优化模型和具有耦合关联的分层博弈以及切片选择与资源分配同时实现的新博弈结构,寻找跟踪信道、收敛快的自适应策略是目前具有挑战性的工作。
在分层博弈的下层,基于匹配实现UEs对切片的选择,在上层,基于UEs与切片匹配关系,采用Stackelberg博弈实现基于信道特征的资源分配,将使效用及资源利用率优化,策略更加完善[13]。
对于优化模型,在用户级以基于流带宽的用户满意度定价效用函数,既符合未来5G通信中以用户为中心、以流媒体为主要承载模式的趋势[14,15],也与分别以带宽和功率为效用函数的MVNOs及In-Ps建立关联,加速循环迭代一致收敛,提高跟踪信道能力。在MVNOs,根据其在上、下层博弈中的完全信息状态和非完全信息状态,分别基于局部信道信息和平均信道信息对购买功率非对称定价,不仅使系统简单易行,而且进一步提高了跟踪信道能力,特别是服从统计分布的局部信道信息在迭代中较快收敛于平均信息,进一步加速循环迭代收敛。
本文提出一种基于信道定价的无线虚拟网络资源分配策略:匹配/Stackelberg分层博弈。分别以基于流带宽的用户满意度、系统带宽及切片功率作为报酬函数建立3级联合优化模型,并采用匹配/Stackelberg分层博弈求解。在博弈下层,定义MVNOm--InPn对 mn及其与UEs的1对1匹配博弈以代替UEs与MVNOs的多对1匹配,对 mn定义基于信道平均信息的切片功率价格,加速上、下一致收敛并使UEs根据信道特征选择最优 mn,证明均衡点存在并给出低复杂度的分布式拒绝-接收算法;在博弈的上层,基于UEs与 mn已匹配关系,形成InPs与 mn的Stackelberg博弈,给出基于信道局部信息的优化功率定价和分配策略,使系统效用及资源利用率基于信道特征最优。最后给出双层循环过程图及稳定条件并仿真验证。
如图1是3级架构的无线虚拟网络。考虑一个由NB个基站(BSs)组成的下行网络,最高层是InPs,不失一般性,假定1个InP包含1个基站,基站的每个信道抽象成1个切片,1个InP包含 NS个切片,每切片带宽相同,功率可调,假定每切片只能以不同价格同时服务1个MVNO。中间层是MVNOs,根据网络状况和资源价格等因素动态向InPs购买无线资源,每MVNO可以不同价格购买多个切片,以不同的价格向UEs提供服务,第 m个MVNO(m ∈M )向1组UEsKm提供服务,K =UmKm为UEs总数,| K|表示集合K的基数。最底层是UEs,以业务流模式向MVNOs提出带宽请求,每UEs可向多个MVNOs提出服务申请。系统工作流程为:UEs向MVNOs提出带宽申请,再由MVNOs向InPs申请切片。
图1 无线虚拟网络3级架构及分层博弈示意图
系统需要优化。当切片带宽相同时,UEs与切片间需要根据信道质量最优匹配,才能使资源效率最高。另一方面,根据效用,UEs存在大带宽带来的良好用户体验与购买带宽付出更大代价之间的矛盾,MVNOs存在向UEs提供更多带宽获得更大收益与付出更大代价向InPs购买带宽的矛盾,总功率受限时,InPs存在切片提高功率获得更大报酬与付出更大代价的矛盾。因此,UEs, MVNOs, InPs之间需要优化选择及合理定价,才能使效用和资源利用率最大,需要建立一个基于信道的3阶段联合优化模型。
在虚拟无线网络中,流是业务的主要模式,基于流带宽的用户满意度作为用户层质量度量,通常可分为语音流、视频流、数据流,由于本文仅针对2层业务,所以选择数据流。满意度函数
MVNO m 购买切片n 向UEk 提供带宽的报酬函数
上述式(4)、式(8)、式(15)分别以用户满意度、系统带宽收入、切片功率收入作为报酬函数,再通过式(3)、式(6)、式(7),三者融合在信道质量上,使上、下两层都基于信道质量博弈,相比文献[12],信道信息仅出现在下层而上层完全基于随机价格博弈,更容易加速循环迭代收敛,提高跟踪信道能力。
上述3个优化目标式(4)、式(8)、式(15)需要联合优化才能达到系统最优,但涉及到相互关联的3个层次,需要循环迭代,且是一个混合整数非线性规划问题,具有NP-hard复杂度,要获得中心化解决方案,需要较大的计算量和复杂的控制过程。因此,本文引入匹配/Stackelberg分层博弈进行分解,得到一个分布式次优方案。考虑到MVNOs向用户提供带宽与向InPs购买物理资源两个方向具有一定独立性,以MVNOs为中心,将原问题分解为分层博弈,如图1所示,下层是UEs与MVNOs的匹配博弈,上层是MVNOs与InPs的Stackelberg博弈。
推论 已有文献证明,具有严格偏好的1对多或1对1匹配博弈一定存在稳定匹配,可采用拒绝-接收算法求解。
5.2.1 UEs与MVNOs之间多对1的匹配博弈
如图1所示,UEs向MVNOs租用带宽,形成多对1的匹配博弈,但不能形成UEs与切片的精确匹配,且MVNOs向UEs提供的带宽由MVNOs向InPs购买的切片到UEs的信道特性决定,将MVNOs与切片关联起来作为整体参与匹配博弈更有实际意义。
5.2.2 UEk与mn之间1对1的匹配博弈
形成了MVNO m -切片n 对mn后,UEs集合K与mn的集合Mn形成如图1所示的1对1匹配博弈。
(c) 传统分层匹配博弈:文献[12]中分层匹配博弈、mn在上、下层均采用随机功率策略、随机价格。
式(28)为完全信息状态下基于局部信道信息最优功率价格,只能作为上层博弈 mn购买功率的价格, mn与 UEs在下层匹配博弈中处于非完全信息
为了描述分层匹配/Stackelberg博弈的稳定性,定义匹配阻断集合 Ψ(k,mn) :设Ω (k,mn)是UEs与 mn1对1匹配形成的既有匹配对集合,若新匹配对集合 Ψ(k,mn) =Ω (k,mn),则匹配被阻断,达到稳定。
基于信道定价的分层匹配/Stackelberg博弈实现过程如下:
(1) mn均等功率条件下,进行分层博弈;
(2) mn重新分配功率后,进行分层博弈;
(3) 重复(2),直至稳定。
考虑用户均匀分布的一个区域,3个MVNOs向1个InP租用资源,向8个UEs提供业务,InP的信道抽象成8个切片,切片到UEs的信道包含大尺度衰落和小尺度衰落,大尺度衰落由 d−2决定,8个用户的损耗根据距离基站的距离分别为1 (3个)、0.1(3个)、0.05 (2个),所有信道的小尺度衰落服从均值相等的Rayleigh衰落,假定任一MVNO可以租用任一切片,但每一切片只能接受1个MVNO,形成24个 mn,UEs以随机价格向MVNO购买带宽,一经确定,博弈过程中不再变化。仿真对6.1节中定义的基于信道定价的分层匹配/Stackelberg博弈、随机定价的分层匹配/Stackelberg博弈、传统分层匹配博弈3种策略进行了性能比较。图2比较了3种机制跟踪信道的能力,当信道变化时,本文基于信道定价的分层匹配/Stackelberg博弈上、下层循环迭代2~3次达到稳定,随机定价的分层匹配/Stackelberg博弈则需要3~6次,传统分层匹配博弈百次左右迭代达到稳定占比大概2/10,多数需要更多次循环,因此,图2未画出。可见本文策略跟踪信道能力最好。
为了比较各种机制对频谱效率的改善程度,定义切片功率均等条件下、UEs-MVNOs-InPs不经匹配且信道最坏的情况为最坏情况。图3比较了6.1节定义的3种策略与最坏情况当信道变化时的系统和速率。相比最坏情况,3种匹配机制的系统和速率都有较大提高,本文策略的系统和速率最优,高出最坏情况大约60%,高出居中的随机定价的分层匹配/Stackelberg博弈大约15%,传统分层匹配博弈系统和速率改善最少。
图2 不同价格机制跟踪信道能力比较
图3 不同机制的和速率比较
考虑到传统分层匹配博弈价格完全随机,与本文所提机制进行效用比较意义不大,而随机定价的分层匹配/Stackelberg博弈为了保证功率为正,功率价格必须大于某一定值,虽然随机,但有一定范围限制,具有比较价值。因此,图4-图6比较了本文策略与随机定价分层匹配/Stackelberg博弈系统的效用,前者效用明显高于后者。综上所述,本文策略在信道跟踪、系统和速率及效用上均优于其他策略。
图4 信道定价策略与随机定价策略UEs效用比较
图5 信道定价策略与随机定价策略MVNOs效用比较
图6 信道定价策略与随机定价策略InPs效用比较
针对分层博弈策略不能跟踪信道变化以及上、下层循环迭代导致的计算量过大问题,基于用户满意度、系统带宽收益及切片功率收益建立了3级联合优化模型,进而用分层博弈求解,提出了基于信道定价的匹配/Stackelberg分层博弈机制。通过定义 mn及其与UEs的1对1匹配博弈以及与InPs的Stackelberg博弈,实现资源分配,通过信道信息非对称定价 mn购买功率价格,跟踪信道,加速收敛。给出了双层循环流图及稳定条件。仿真表明本文策略在跟踪信道、资源效率、效用方面均优于其他分层博弈策略,为进一步研究高动态、高移动性环境下的无线虚拟网络资源分配策略提供了基础。