徐昌彪,刘雪亮,鲜永菊
(重庆邮电大学 测控与信息传输实验室,重庆400065)
随着无线通信技术的发展,尤其是随着无线局域网WLAN(Wireless Local Area Network)及无线区域网络WRAN(Wireless Regional Area Network)等技术的发展,人们对无线通信业务需求的不断增加与无线频谱资源的匮乏之间的矛盾越来越尖锐。针对频谱资源的不足,认知无线电网络中的动态频谱分配技术能够灵活地使用空闲频谱[1],实现空闲频谱的再利用,从而提高频谱利用率。为了达到这一目的,认知无线电需要拥有感知周围环境以及根据周围环境的变化自适应地调整系统参数的能力,从而能够感知到授权用户的空闲频谱并利用其进行通信。然而,授权用户和非授权用户在授权频段的和平共存是一个具有挑战性的课题。目前,认知无线电系统的频谱分配研究方法很多,基于博弈论[2]的频谱分配方法是研究的热点。参考文献[3,4]中用博弈论分析了主用户相互竞争提供频谱的行为,主用户根据次用户的频谱需求大小以及其他主用户所采取的策略动态调整自身的策略,从而使得自己的效用达到最大化,而对次用户之间竞争频谱的博弈行为没有考虑。参考文献[5,6]中应用寡头市场模型来解决频谱分配中授权用户的博弈问题,并用Bertrand均衡理论提出了授权用户信道竞价的Bertrand博弈算法。参考文献[7]中考虑了基于用户业务需求的频谱分配,根据用户的业务等级不同进行频谱分配。参考文献[8]中用博弈理论分析认知网络中多个策略主用户与多个策略次用户的博弈问题,主用户的频谱价格是通过AP唯一确定的,但在实际的认知无线电环境中,主用户的频谱价格是不断变动的。参考文献[9]中提出基于Cournot博弈的次用户频谱分配模型,目前,有很多工作基于该文献进行改进,如在次用户的频谱分配中考虑了频谱差异性对次用户的影响[10],考虑频谱拍卖的多买家、多卖家博弈模型[11]等。在以上模型中,都没有考虑到主用户的频谱价格函数受到主用户和次用户之间的频谱供需关系的影响。
本文用博弈论方法解决认知无线电网络中的动态频谱分配问题,将次用户的频谱分配模型转换为相应的博弈论模型,在完全信息和不完全信息环境下,分别用静态博弈和动态博弈对次用户的频谱分配进行分析,并考虑了频谱可置换参数v对次用户纳什均衡以及动态博弈稳定性的影响,最后给出改进博弈模型的仿真分析结果。
在认知网络中,认知用户能够伺机利用授权用户的空闲频谱。当授权用户重新占用该频谱时,认知用户需要切换到其他授权用户的空闲频谱上进行通信。文中考虑有M个授权用户和N个次用户的模型,每个授权用户拥有一个授权频谱,授权用户的频谱占用情况会随着时间及其空间变化而发生变化。次用户的行为是自私、理性的,次用户为了最大化自己的效用相互竞争并最终达到纳什均衡。纳什均衡点即为次用户的最佳频谱分配结果。如图1所示,基站把所有主用户的空闲频谱汇聚成一个频谱池,将频谱池中的频谱划分为若干个子信道,子信道是频谱分配的基本单位。主用户以每单位带宽价格p向次用户收费,p是频谱价格函数,与主用户提供的频谱数量以及次用户的频谱需求数量有关。
通过采用自适应调制编码(AMC)技术,次用户可以根据信道质量情况动态调整传输速率从而适应周围的环境。采用正交幅度调制技术(如4-QAM和16-QAM),在单输入单输出高斯信道噪声中误码率可以近似为:示接收机信噪比,k为所用调制方式的频带利用率。不失一般性,设频带利用率为非负实数。为了满足特定的应用需求,BER需要维持在一个目标水平(即目标误码率BERtar),次用户i频谱传输效率为:ki=log2(1+Kγ)。其中K为一个常
首先假定所有次用户都知道其他次用户在博弈中所采取的策略以及各自的效用函数信息,并用静态博弈模型分析次用户的行为。然而,由于在实际的认知无线电网络中,次用户并不知道或只知道一部分次用户的策略和效用信息,次用户需要不断调整自己的策略从而使自身的策略达到最优,因此,用动态博弈模型对次用户的策略调整行为进行分析。
在上面的系统模型中,博弈的参与者是次用户,策略是次用户的频谱请求大小,用bi表示,每个策略用户的效用函数与它所获得的总收益以及成本有关,用Ui表示。对参考文献[9]中的频谱价格函数进行改进,在主用户对频谱价格满意的基础上,考虑了频谱价格受到频谱供需关系的影响,即与主用户空闲频谱的数量以及次用户的频谱需求相关。频谱价格函数为:
其中,w为主用户单位频谱的成本价格,N为次用户的数量;M为主用户的数量;τ为非负常数,当 τ≥1时,频谱价格函数是凸的;bi为次用户i的频谱请求;qj为主用户j的空闲频谱。
次用户的效用函数选择不是唯一的,本文要保证频谱分配算法能够达到均衡收敛。根据参考文献[10]中给出的二次效用函数做出适当修改如下:
其中,ri为次用户i单位传输速率获得的收益,ki为次用户i的频谱传输效率,B为所有次用户的策略集合,B={b1,b2,…,bN},c 为一常量。
效用函数中考虑了频谱置换参数 v,v∈(-1,1)。当v=0时,次用户不能发生切换;当v=1时,次用户可以在工作频段自由切换;当v<0时,次用户共享的频谱是互补的,即当一个次用户使用一段频谱时,它需要同时购买一个或多个额外的频谱(也就是说,一段频谱用于上行链路传输,另一段用于下行链路传输,这些频谱可能来自同一个主用户或不同主用户的频谱)。
根据式(3)中得到的效用函数,将次用户i的效用函数对bi求偏导,即可得到次用户i的边缘收益函数:
令边缘收益函数等于0,即可求得次用户i的最佳响应函数为:
B-i表示除次用户i之外所有次用户的策略集合,当且仅当bi*=BRi(),∀i,次用户的博弈达到纳什均衡,纳什均衡解为 B*=,…,),表示除次用户 i之外所有次用户的最佳策略组结合。
其中,bi(t)为次用户 i在时刻 t的频谱请求,αi为次用户i的速率调整参数(即学习速率)。当bi(t+1)=bi(t)时,次用户的动态博弈达到均衡,此时,次用户的策略不再发生变化。
由于在实际的认知无线电环境中,次用户只能观察到主用户的频谱定价信息,并不知道其他次用户所采取的策略以及它们的效用信息,所以每个次用户只能根据历史博弈信息选择自己的策略。这意味着,次用户采用分布式算法动态调整自己的频谱请求大小并最终达到纳什均衡。在这种不完全信息的情况下,次用户需要不断调整自己的策略从而使得自身的策略达到最优。次用户的频谱请求可以用动态博弈来描述:
在动态博弈算法中,次用户之间的博弈最终将达到纳什均衡,纳什均衡的稳定性与学习速率αi有关。通过使用雅克比矩阵和本征值的概念,可以研究文中提出的动态博弈算法的稳定性。当所有的本征值(λi)都位于单位圆内时(|λi|<1),博弈的结果是稳定的。
雅克比矩阵定义如下:
假定有两个次用户存在的情况下,通过求解下面方程得到雅克比矩阵的本征值:
文中假设在一个认知无线电系统中有4个空闲的主用户频谱和多个次用户,每个主用户拥有的频谱为6 MHz。主用户单位频谱的成本价格w为5,目标误码率BERtar为 10-4,采用线性定价,参数 τ设置为 1,c为 0.5,次用户每单位传输速率所获得收益为ri=10,∀i。
图2是两个次用户的最佳响应函数曲线,一个次用户的最佳响应是其他次用户策略的线性函数,纳什均衡点位于次用户最佳响应函数曲线的交叉点。
图中纳什均衡点的位置与信道质量有关,信道质量越好,次用户的效用越大,频谱需求也越大。由于次用户之间是自私的并相互竞争频谱,所以,一个次用户的信道质量的好坏会影响其他次用户的策略。当一个次用户的信道质量变好时,它希望得到的频谱更多。而在实际的认知无线电系统中,主用户的空闲频谱是有限且随时间发生变化的,所以,次用户之间的频谱竞争会更加激烈从而影响它们所采取的策略。
图3中显示了在次用户1的信道质量一定的情况下,次用户1和次用户2的效用与次用户2的信道质量相关,随着次用户2的信噪比不断增加,次用户2的信道质量越好得到的频谱会越多,因此次用户的收益会随着次用户2的信噪比的增加而增加。由于次用户1与次用户2之间是竞争的关系,次用户2得到的频谱越多,次用户1得到的频谱相应就会减小,因此,次用户1的收益会随着次用户2信噪比的增加而随之减小。
在实际的认知无线电中,由于次用户的策略和效用等信息相互之间不知晓,次用户根据历史博弈信息动态调整自己的策略并最终收敛到纳什均衡。图4显示了次用户策略的动态调整过程。从图中可以看出,动态博弈算法的收敛性与学习速率αi有关,设置合适的学习速率可以使博弈快速收敛到纳什均衡,当学习速率过大时,次用户的策略波动很大,甚至不能达到纳什均衡。当α1=α2=0.15时,次用户1和次用户2的策略能够较快地收敛到纳什均衡,而当α1=α2=0.22时,次用户1和次用户2的策略一直上下波动,不能较快收敛到纳什均衡。图5显示了多个次用户存在时动态博弈的收敛情况,可以得出,当次用户的数量增加时,每个次用户得到的频谱数量减少,博弈达到收敛的时间随之增加。
图6和图7分别从频谱利用率和次用户收敛到纳什均衡的时间与参考文献[9]的博弈算法进行比较,不难得出,本文提出的算法的频谱利用率高于参考文献[9]中的算法,并且能够更快收敛到纳什均衡。这里的频谱利用率定义为认知无线电系统中所有次用户得到的总频谱与所有主用户的空闲频谱之比。
根据式(7)中得到的雅克比矩阵本征值,可以得到α1与α2之间的关系。从图8中可知频谱置换型参数ν对稳定区域的影响:ν值越大,次用户动态博弈的稳定区间越小,稳定区域指的是α1与α2之间的关系曲线和坐标轴之间所围成的区间。图9显示了稳定区间还与信道质量有关,信道质量越好,稳定区域会越小。当α1与α2在稳定区间内取值时,次用户间的频谱共享是稳定的并最终可以达到纳什均衡,而在区间外取值时,次用户的策略会上下波动进而导致无法收敛到纳什均衡。
文中提出了一种改进的基于博弈论的动态频谱分配方案,考虑了存在多个主用户和次用户共享频谱的情形,在保证不对主用户产生干扰的前提下,利用Cournot博弈模型对次用户间的竞争频谱行为进行了分析。改进了现有的频谱定价函数,并在次用户的效用函数中考虑了频谱置换参数v。最后分别用静态博弈和动态博弈分析了次用户的频谱分配行为。通过仿真验证证明,次用户的策略能较快收敛到纳什均衡,并且频谱利用率有一定的提高。
[1]MITOLA J.Cognitive radio for flexible multimedia communications.in Proc.MoMuC’99,1999:3-10.
[2]FUDENBERG D,TIROLE J.GAME T.Mit Press,1991.
[3]MOHAMMADIAN H S,ABOLHASSANI B.Optimal quality competition for spectrum sharing in cognitive radio networks[C].Electrical Engineering(ICEE),2010:231-236.
[4]Zu Yunxiao,Li Peng.Study on spectrum allocation of primary users for cognitive radio based on game theory[C].in IEEE WiCOM.2010:1-4.
[5]谭学治,刘玉涛,魏守明.基于博弈理论的认知无线电频谱分配[J].华南理工大学学报,2010(5):22-26.
[6]NIYATO D,HOSSAIN E.Competitive pricing for spectrum sharing in cognitive radio networks:dynamic game,inefficiency of nash equilibrium and collision[J].IEEE Journal on Selected Areas in Communications,2008,26(1):192-202.
[7]He Shibiao,Zhang Xinchun,Ge Lijia,et al.Research of dynamic spectrum allocation based on service demand[C].in IEEE NSWCTC,2010:348-351.
[8]Lin Peng,Jia Juncheng,Zhang Qia.Mounir ham di dynamic spectrum sharing with multiple primary and secondary users[J].in IEEE Transactions on,2011(60):1756-1765.
[9]NIYATO D,HOSSAIN E.Competitive spectrum sharing in cognitive radio networks:a dynamic game approach[J].IEEE Transaction on Wireless Transaction on Wireless Communications,2008,7(7):2651-2660.
[10]Zhang Xinchun,He Shibiao,Sun Jiang.A game algorithm of dynamic spectrum allocation based on spectrum difference[C].in IEEE WOCC,2010:1-4.
[11]NIYATO D,HOSSAIN E,HAN Z.Dynamics of multipleseller and multiple-buyer spectrum trading in cognitive radio networks:a game-theoretic moeling approach[J].Mobile Computing,IEEE Transactions on,2009,8(8):1009-1022.