许 洁,张 瑞,蔺瑞强
随着最优控制理论的不断深入研究,微分对策问题也得到了人们的广泛关注,穆蕊[1]研究了多人非零和随机微分博弈理论及其相关的高维倒向随机微分方程,证明了相关的高维倒向随机微分方程解及纳什均衡点的存在性.魏庆萌[2]研究倒向随机微分方程理论在随机控制及随机微分对策理论中的发展与应用,并分别从两个方面刻画了最优控制.杨依芸等[3]讨论了在部分信息下带跳线性二次平均场类型的二人零和微分对策问题,得到其相应最优控制的反馈表示.WANG等[4]利用倒向随机微分方程讨论了一种新的非零和微分对策,建立了开环纳什均衡点的必要条件和充分条件.WANG 等[5]推导了一类新的非零和随机微分对策的最大原理.WANG等[6]讨论了倒向随机系统的微分对策问题,证明了开环平衡点的一个Arrow 充分条件.CHEN 等[7]讨论了一个带时滞的非零和随机微分对策,并建立了时滞对策问题的必要条件和充分条件.YANG 等[8]处理了一类随机时滞系统的部分可观测信息下的非零和微分对策问题,推导了该问题的最大值原理和验证定理.受此类问题的启发,许洁等[9]在前期探讨倒向重随机系统非零和微分对策问题中纳什均衡点存在必要条件的基础上,进一步探讨纳什均衡点存在的充分条件及其相关应用.
文中的基本符号:AT表示转置矩阵,Rn×d表示n×d矩阵空间,表示范数,Rn表示n维欧氏空间.文中所给符号和不等式在dt× dp意义下在[0,T] × Ω 中几乎必然成立.
对任意的t∈[0,T],集合不递增也不递减,无法构成信息流. 假设M2(0,T;Rn)={φ(t)|φ(t) 为n维可测随机过程且设是一个概率空间,[0,T]是个任意大的时间区间,{W(t):0 ≤t≤T},{B(t):0 ≤t≤T}是两个独立且标准,取值在Rd、Rl的布朗运动过程.定义正向伊藤积分和倒向伊藤积分,其中:ϕ(t),φ(t)属于M2(0,T;Rn).
系统的状态可以由此倒向重随机微分方程刻画:
其中:v1(⋅)和v2(⋅)分别表示控制双方的控制过程,设为控制者1 和控制者2.设Ui(i= 1,2)为Rk的一个非空凸子集.Ui(i= 1,2)为控制双方控制过程集合,满足的条件如下:
①Ui是ℱt-适应的,vi(t) ∈Ui,t∈[0,T].
控制双方在共同关心T时刻获得共同期望结果ξ时,也关心各自的利益.控制双方的目标泛函为:
本文用到的假设条件:
(A1)存在常数c> 0 和0 <σ< 1,对于任意的(y1,z1,u1),(y2,z2,u2) ∈Rn×Rn×d×Rk,有
(A2)对于(y,z,v1,v2),f和g是连续可微的,并且(y,z,v1,v2)关于f和g的偏导数是一致有界的.
(A3)Li对于(y,z,v1,v2)是连续可微的,存在正常数C使得偏导数被界住.Φi对于y则是连续可微的(i= 1,2).
引理1[3]假设(A1)~(A2)成立,对于给定u(⋅) ∈U(0,T),方程(1)存在唯一解(y(⋅),z(⋅)),且
控制双方都想选择最优的容许控制vi(⋅)(i= 1,2) 来优化自己的价值泛函,即寻找容许控制(v1(⋅),v2(⋅)) ∈U1×U2使其满足:
满足式(3)的容许控制(u1(⋅),u2(⋅))被称为纳什均衡点.
定义系统对应的伴随方程:
定义哈密顿函数为Hi:[0,T] ×Rn×Rn×d×
哈密顿形式的伴随方程如下:
进一步补充文章的假设条件(A4)~(A7),其中(i= 1,2).
(A5)伴随方程(7)有解(pi(⋅),qi(⋅)).
定理1 假设(A2)~(A7)成立,(u1(⋅),u2(⋅))∈U1×U2是给定的容许控制,是对应的轨线,那么(u1(⋅),u2(⋅))是一个纳什均衡点.
证明对于任意的v1(⋅) ∈U1,假设,是对应于(v1(⋅),u2(⋅))的状态轨迹,利用哈密顿函数和价值泛函的定义可得:
即
结合不等式(13)(14),可得:
结合不等式(15)(16),有
采取同样的过程来处理i= 2 的情况,有
将得到的结果应用于一类特殊的线性倒向重随机微分对策问题,设
式(19)中t的所有函数是有界的,其中Mi(t)、Ri(t)和Qi是对称非负正定的,Ni(t)是对称均匀正定的.
此时系统的状态方程和伴随方程如下:
定义哈密顿函数如下:
考虑以下线性控制系统:
应用定理1,可得
同样的,对于任意的v2(⋅) ∈U2,有
故可以得到容许控制满足式(19),从而得到期望的纳什均衡点.
定理2 当且仅当u1(t) 和u2(t) 为如下形式,(u1(t),u2(t)) 是一个满足上述问题的纳什均衡点.
其中(yi(t),p1(t),p2(t),q1(t),q2(t)) 是如下方程的解.
证明 通过纳什均衡点的定义和引理1,可以知道以下三个条件是等价的,
(I)(u1(⋅),u2(⋅)) 是这个博弈问题的纳什均衡点.
(II)ui(⋅)是以下控制问题的最优控制.
价值泛函为:
结合i= 1,2,可以将式(30)转化为式(27),继而可得(u1(t),u2(t))是一个满足上述问题的纳什均衡点.
本文研究了由倒向重随机微分方程刻画的非零和微分对策问题,得到了纳什均衡点存在的充分条件,将所得结果应用于一类特殊的线性倒向重随机微分对策问题并得到期望的纳什均衡点,同时得到了满足上述问题的纳什均衡点的具体形式并以定理的形式给出了证明.