求解广义Nash均衡问题的同伦方法

2021-10-28 02:13范晓娜
关键词:广义数值方程

范晓娜, 陈 燕, 蒋 俐

(南京邮电大学 理学院, 江苏 南京 210023)

广义Nash均衡问题(GNEP)由经典Nash均衡问题发展而来. 不同之处在于广义Nash均衡问题中的每一位博弈者的决策都不仅依赖于自身的决策变量,还取决于其他博弈者所做的决策. 因此广义Nash均衡问题更具有现实意义,更适用于模拟竞争市场的真实状况. 随着对广义Nash均衡问题的深入研究,广义Nash均衡在金融经济、政治、军事、电子通信、生物科技、工程技术、环境和交通运输等众多社会领域都有其广泛的应用价值. 不可否认的是,当前对广义Nash均衡问题的研究还远不如对经典Nash均衡问题的研究那样丰富和完善. 2009年,Xu、Yu[1]等人在有界域内用同伦方法对GNEP进行研究和求解,该方法克服了已有方法(文献[2—5])的收敛困难、收敛条件强等缺点,得到了较好的收敛结果. 2019年,Fan[6]等在文献[1]的基础上给出一种新的同伦方法求解GNEP,该方法扩大了初始点的选取范围,为问题的解决带来了方便. 本文考虑改进文献[6]的结果,通过引入两个辅助映射,从而扩大收敛的范围并加快收敛的速度.

1 预备知识

考虑一个共有N人的非合作博弈,每个博弈者的决策集不仅依赖于自身的决策变量,还取决于其他博弈者所做的决策.给定一个集值映射Xi:

x=(x1,…,xi,…,xN)T=(xi,x-i)T,xi∈Rni.

对任意x-i∈Rn-i,gi:Rn→Rmi,hi:Rni→Rli,第i个博弈者的决策集记为Xi(x-i)≡{xi∈Rni:gi(x)≤0,hi(xi)=0}.记指标集为

其中

Xi(x-i)的内部记为Xi(x-i)0≡{xi∈Rni:gi(x)<0,hi(xi)=0},边界集记为∂(Xi(x-i))≡{xi∈Rni:gi(x)=0,hi(xi)=0,j∈Ii(x)}.

对于GNEP,每个博弈者做出的决策都依赖于其他玩家的决策.当其他竞争对手的决策确定以后,第i个博弈者的目标就是要选择一个决策xi解决最优化问题:

其中ui称为第i个博弈者的效用函数.

为了简化起见,本文引用以下符号

其中m=m1+…+mN,l=l1+…+lN,n=n1+…+nN.

2 同伦方程的构造

基于KKT系统:

(1)

H(ω,ω(0),μ)=

(2)

在一定的假设条件下,同伦路径的存在性和收敛性可以得到证明.

从而得到x=x(0),β=β(0)=h(x(0)),由于g(x(0))<0,故λ=λ(0).因此,方程H(ω,ω(0),1)=0有唯一解ω=ω(0).当μ=0时,上述同伦方程即简化为GNEP中的KKT系统.

为得到本文的主要结果,先介绍以下引理.

则y∈Rp是φ的一个正则值.

引理3(一维光滑流形分类定理)[8]一维光滑流形与单位圆或单位区间同胚.

假设1

3 主要结果

(4)

将(4)式的第1个方程变形,并在等式两边同时乘以(x(k)-z),z∈C,则有

(x(k)-z)T(□u(x(k))+μkα(x(k))V(k)2em+

μkγ(x(k))U(k)2el)=

(x(k)-z)T□g(x(k))V(k)em-

(x(k)-z)T□h(x(k))U(k)el,

(z-x(k))T(□u(x(k))+

μkα(x(k))V(k)2em+μkγ(x(k))U(k)2el)=

(x(k)-z)T□g(x(k))V(k)em+

(x(k)-z)T□h(x(k))U(k)el≥

(g(x(k))-g(z))TV(k)em+

(h(x(k))-h(z))TU(k)el=

μkg(x(0))TV(0)em-g(z)TV(0)em+

μkelTU(k)TU(k)el≥

μkg(x(0))TV(0)em+μkelTU(k)TU(k)el=

(1-μk)g(x(0))TV(0)em+

(1-μk)elTU(k)TU(k)el]=

(1-μk)g(x(0))TV(0)em+

(1-μk)elTU(k)TU(k)el].

根据函数g的凸性和h的线性性质可推出第一个不等式,即

(x(k)-z)T□g(x(k))=

(x(k)-z)T□h(x(k))=

由方程(4)的第2个式子可推出第2个等式,推导如下:

(g(x(k))-g(z))TV(k)em=

(g1(x(k))-g1(z),…,gm(x(k))-gm(z))×

(1-μk)g(x(0))TV(0)em+

(1-μk)elTU(k)TU(k)el>M,

故(z-x(k))T(□u(x(k))+μkα(x(k))V(k)2em+

μkγ(x(k))U(k)2el)>0,即(x(k)-z)T(□u(x(k))+μkα(x(k))V(k)2em+μkγ(x(k))U(k)2el)<0,这与假设(C4)矛盾,因此ω的分量x是有界的.

(1-μk)(∇xiui(x(k,-i),x(k,i))+∇xigi(x(k,-i),x(k,i))λ(k,i)+

μkαxi(x(k,-i),x(k,i))(λ(k,i))2+∇xihi(x(k,i))β(k,i)+

μkγxi(x(k,-i),x(k,i))(β(k,i))2)+μk(x(k)-x(0))=0.

(5)

对于μ*∈[0,1],分以下两种情况讨论β(k)的有界性:

方程(5)可改写为

(1-μk)∇xiui(x(k,-i),x(k,i))+μk(x(k,i)-x(0,i))+

μkγxi(x(k,-i),x(k,i))(β(k,i))2]=0.

(6)

(ⅰ)当μ*=1时,将(5)式改写为

μk(x(k,i)-x(0,i))=

(7)

根据引理5以及上述分析,令k→∞,x(k)→x*,β(k)→β*,由(7)式得

(8)

与假设(C2)矛盾.

从而x(*,i)+υαxi(x(*,-i),x(*,i))=x(0,i),与假设(C5)矛盾.

这与假设(C2)矛盾.

(9)

拆分(9)式的第1个等式,我们得到以下结果.

定理2同伦路径Γω(0)由以下常微分方程组的初值问题决定:

且对于μ(s*)=0,方程(9)的解(ω(s*),μ(s*))的分量x是GNEP的解.

根据定理1和定理2,可以用标准预估矫正法对同伦路径Γω(0)进行数值追踪,从而找到同伦方程(3)的解.

4 数值例子

在MATLAB中用Euler Newton算法对同伦路径进行追踪,并将产生的结果与已有的同伦方法作比较.对以下所有算例,选取相同的精确度参数:ε1=10-4,ε2=10-1,ε3=10-6,μ0=1.0.数值结果见表1和表2,其中A1表示本文构建的同伦方法,A2表示文献[6]中所用的同伦方法.IT表示迭代次数,CPU表示程序运行时间,x0表示初始点,x*表示问题的近似解. 数值结果表明本文的同伦方法对于求解GNEP是有效的.

表1 例1的数值结果

表2 例2的数值结果

例1

例2

例3

x1+x2=1;

x3+x4=1.

表3 例3的数值结果

5 结语

对于求解带有等式和不等式约束的GNEP,本文通过引入2个二次连续可微映射α(x),γ(x) 构造出一个新的同伦方程,并在给出的假设条件下,证明了同伦路径的存在性和全局收敛性.相较于文献[1]中的同伦方法,本方法同样减弱了收敛的条件,扩大了初始点的选取范围,并且相较于文献[6]中的同伦方法具有更高的计算效率. 数值例子证明了新的同伦方法的有效性.

猜你喜欢
广义数值方程
解析几何中的轨迹方程的常用求法
体积占比不同的组合式石蜡相变传热数值模拟
数值大小比较“招招鲜”
舰船测风传感器安装位置数值仿真
铝合金加筋板焊接温度场和残余应力数值模拟
The Last Lumberjacks
关于几类二次不定方程的求解方法
一类特别的广义积分
任意半环上正则元的广义逆
圆锥曲线方程的求法