基于N维非合作博弈

2015-07-05 14:15卢丰周会红
2015年27期
关键词:大圆均衡点效用

卢丰 周会红

一、绪论

1.目的

本文从二维非合作博弈①出发,推广至N维,人为地改变影响博弈的量,改变原博弈均衡②,使结果朝着有利于资源利用的方向变化,解决社会中存在的资源在众人中合理分配问题。

二、理论基础

1.n维非合作博弈均衡点存在性

由角谷静夫定理可推断有均衡点存在。基于角谷静夫不动点定理而对存在性定理给出的证明(发表在:Proc.Nat.Acad.Sci.U.S.A.pp.48-49),该方法直接由布劳维尔不动点定理得出。证明的是在n维空间里构建一个连续变换的T,使得T的不动点就是博弈的均衡点。由于n维混合策略空间是一个胞腔,且由布劳维尔不动点定理可知映射T至少有一个不动点ε,该点一定是一个均衡点。③

三、乘车博弈

1.乘车问题

AB两理性人住在两个房间(信息不对称④),居住处仅有1辆车仅能容纳1人(资源稀缺性⑤),明天为假日,AB都想出行,由于无法交流,他们只能在有限的时间里,进行博弈。假定效用⑥最大值为1,最小值为0,中间值为0.5。

第一种情况:AB都选择明天去,车无法满足需求,资源配置不足。效用和为1.5(最大值为2)。

第二种情况:A认为B选择明天去,所以A不准备明天前往,而B没有考虑到这种情况,从而选择了明天前往,AB中一人明天前往,一人后天前往,资源合理配置⑦,此时效用和为1+1=2,为最大效用和。

第三种情况:AB都认为彼此明天前往会给对方带来威胁,于是都选择了后天前往,这种情况就造成了明天空车现象与后天超载现象,带来的效用和为1.5。

第四种情况:A若考虑到“B若认为A明天前往从而B选择后天前往”的情况,也许A就选择明天前往,但同时,若B也考虑到“A若认为B明天前往从而A选择后天前往”的情况下,B就会选择明天前往,这样,明天又会造成超载的情况,此时的效用和为1.5。

第五种情况:考虑到彼此的三步潜在决定从而做出的决定。

第n中情况:考虑到彼此的N步潜在决定从而做出的决定。

双方会陷于无尽的博弈循环中。不交流则不了解,只有靠判断做出决定。考虑的潜在决定步数决定了是否能达到效用和最大的情况。双方出现相差为奇数的情况,如A考虑一步,B考虑了两步,就会出现效用和最大的情况,但出现偶数的情况,如A考虑一步,B考虑三步,那么,资源仍然分配不均,不能帶来效用最大化的情况。所以,只要他们分开前往,所得到的总效用为最大2。

四、二维博弈模型分析

1.总效用的模型表示

将以上效用表达如下:

任何有限的非合作博弈至少存在有一个均衡点,而且非合作博弈均有可解性与强可解性⑧,证明来自John F. Nash,Jr论文。

2.博弈斗争性模型

基于以上的分析,可以得出以下结果:

(1)A考虑1+X步,B考虑2+X步,那么所得的博弈结果是一个明日前往,一个明日不前往,这时候所得的效用是最大的。

(2)A考虑1+X步,B考虑3+X步,那么所得的博弈结果是一个明日前往(不前往),一个明日前往(不前往),这时候所得的效用是最小的。

另外:无论X为多少,它不影响博弈的结果,“A考虑1+X步,B考虑2+X步”这种情况与“A考虑1步,B考虑2步”的结果是一样的。“A考虑1+X步,B考虑3+X步”与“A考虑1步,B考虑3步”所得的结果也是一样的。

X在这里只不过是一个循环数,本研究将其称为“循环因子”。

把A的博弈动态转化在圆上,把B的博弈过程转化在另一平面的圆上。相切于a、b两点。

假定前提:

(1)两个圆都只是AB各自的博弈过程,AB两人是两个质点。

(2)A循着大圆作博弈结果,而B则循着“椭圆”作博弈结果,他们在环上所做的半个循环步数(每半圆)即为前面说过的考虑潜在决定的步数。

(3)a、b都只能容纳下一个质点,a表示明天不前往,b表示明天前往。同时,椭圆可围绕a、b转动,即a、b是“椭圆”的轴。我们以θ来表示“椭圆”的偏转角度,0≤θ≤π2,θ受理性人的心理偏好与外界因素的影响,θ越大,表示对“前往”的心理偏好越大,反之亦然。

(4)A、B只有a、b两个停靠点,也就是博弈的决定点。

(5)心理偏好是相对的,我们固定大圆固定不变,“椭圆”进行旋转。

描述AB博弈过程:

(1)AB同时停留在a点,这就导致资源未达到合理分配,表示A、B两人都做出了明日不前往的决定。

(2)AB同时停留在b点,这也导致资源未达到合理分配,表示AB都做出了明日前往的决定。

(3)A停留在a点,B停留在b点,或者A停留在b点,B停留在a点,资源都能达到合理的分配,表示一个明日前往,一个明日不前往(后天前往)。

(4)该模型也符合循环因子X的假设,即只要A选择其中一个停靠点,那么B是经过几个循环才选择到停靠点都跟X无关。

θ的意义:

1、

θ取值为π2,“椭圆”已经围绕ab两点旋转至与大圆重合,极端情况,表示AB两人都具有极强的明天前往的心理偏好,只会做出前往的决定,阴影面积为圆面积,它为大圆面积的100%,即表示,AB明日同往的概率为100%。

2、

θ取值为0,“椭圆”已经围绕a、b两点旋转与大圆垂直,极端情况,表示AB两人是互相完全排斥的,他们都做出不前往的决定,而且一直不前往。阴影面积为0,也就表示AB明日同去的可能性为0。

3、

AB对明天“前往”具有不同心理偏好,θ取值在0与π2之间。将θ作为常量处理,即不受其他因素影响,考虑AB共同前往的可能性。“椭圆”偏转角度θ越大,AB的心理偏好越强,同去的可能性越高。

阴影部分占大圆面积比例m:

m=阴影面积大圆面积=πr2sinθπrr=sinθ

阴影占大圆面积的比例m仅仅与θ有关。

3.假设前提

m=sinθ,反映的是AB两人在非合作博弈中最终一同前往的可能性,这也间接地反映了AB两人的心理偏好与预期效用⑨。

效用函数,就是赋予个体的每一预期一个实数。效用函数并不唯一,如果U是这样一个函数,那么a>0时,au+b也是这样一个函数。如果用大写字母表示预期,小写字母表示实数,这样的效用函数满足下列性质:

(1)uA>uB等价于A优于B,以此类推。

(2)若0≤p≤1,则u[pA+(1-p)B]=pu(A)+(1-p)u(B)⑩

对一人单独分析,引入“潜在前往因子”和“非排斥因子”。

用m=sinθ来间接表示这种预期效用与偏好的动态过程。θ增大,AB两人共同前往可能性越大。用sinθ曲线间接表示预期效用,则沿着sinθ所作的切线即为预期边际效用MU,切点处与原点所围成的图形面积即为预期效用。随着所作决定时考虑的潜在决定的步数的不断增加,预期边际效用MU逐渐递减,符合边际效用递减规律。等同于 “非排斥因子”的概念,即随着A前往的概率越来越大。同时,A也总会考虑B的前往决定从而对自己的决定产生犹豫,而对B的犹豫又会与自己想得到最大的预期效用相违背,于是产生了这种博弈。这时候两人相互的排斥力也越来越大,即“非排斥因子”越来越小。我们可以用sin′θθ = t 来表示“非排斥因子”。

另一方面,由于理性人都想让自己的满足程度达到最大,所以A前往的潜在决定越来越大,即A前往的可能性也越来越高,∫t0sinθdθ 在0≤θ≤π2时它的值在0-1之间呈概率分布。θ偏转角度越大,∫t0sinθdθ 的值也就越大,前往的可能性也就越高,把它看做“潜在前往因子”。

4.博弈均衡

(1)非排斥因子>潜在前往因子,A的预期效用很大,因为他觉得B与他之间的“排斥力”很小,所以A前往的可能性极高,在原点时达到最大,他会有很强的心理偏好来引导他做出“前往”的这一决定,直到他的非排斥因子不能承担为止。

(2)非排斥因子”<“潜在前往因子”时,A的预期总效用已经很大,同时,由于他的非排斥因子已经小于潜在前往因子,那么,由于对B的决策的犹豫,他们之间的“排斥力”很大,A作为一个理性人不会再产生“前往”的心理偏好,这时候,A的决定就会停留在一个自己能接受的点上。

(3)所以,理性人会把决策均衡点放在非排斥因子=潜在前往因子的时候,只有在这个时候,没有任何其他的“排斥力”会使得决定人的心理偏好发生改变从而做出重新选择前往的决定,这时候,决定人的心理趋向于一种既安全又满足的状态。

假设存在t,使得“潜在前往因子”=“非排斥因子”成立。

∫t0sinθdθ =sinθ′θ = t

∵∫t0sinθdθ =sinθ′θ = t

∴ -cost-1=cost

∴ cost=12

得t=π3,均衡点的角度为θ=π3,m=sinπ3=32

在AB博弈过程中,最终有cosπ3=12的预期边际效用,使得AB在明天共同前往的可能性为sinπ3=32≈0.866。在二维非合作博弈中,如果两人都将对方的潜在决定作为自己下决定的依据,想得到最大效用,则做出共同“前往”的可能性约为0.866。但均衡解未必是最優解。

五、二维到N维非合作博弈

1.N维非合作博弈模型

多维博弈的模型图表示的是不同人的彼此之间的非合作博弈过程。此时,均衡角度依然是θ=π3,事件之间相互独立,但他们要一同做出“前往”的可能性就被影响因子缩小了,小于0.866。当维数趋于非常多的时候,阴影部分共同区域的图形就越可测量。

2.模型讨论

θ对实验的影响:

当θ=π2 时,所有平面的圆都旋转与大圆重合,这时候n = 1,表明在所有人都具有相同的极端强烈的心理偏好的情况下,N人都将会选择第二天“前往”。这是一种极端情况。

2、

维数等于圆个数,它们彼此相切相互影响。维数越趋向于正无穷,其结果越接近真实值。强调两个前提:(1)凡是在一个模型中,所有参与非合作博弈的人具有相同的心理偏好B11;(2)旋转角度θ是基于对某特定事件的心理偏好B12。

3、

如果每个人都具有相同的“不前往”的心理偏好,那么此时,旋转角度θ=0,同时n = 0,即明天将不会有任何人前往。

3.N维非合作博弈模型的总结

表述:

(1)宏观上,同心理偏好群体(N维)一定前往的话,他们同去的可能性为sin2θ=1。微观层面上,两个人的博弈,一同前往的可能性也为100%。此时旋转角度θ=π2。

(2)宏观上,同心理偏好群体非常想去的话,他们同去的可能性为sin2θ=34。微观层面上,两个人的博弈,一同前往的可能性为sinθ=32,此时旋转角度θ=π3。

(3)宏观上,同心理偏好群体都可能前往的话,他们同去的可能性为sin2θ=12。微观层面上,两个人的博弈,一同前往的可能性为sinθ=22。此时旋转角度为θ=π4。

(4)宏观上,同心理偏好群体都无所谓前往不前往的话,他们同去的可能性为sin2θ==14。微观层面上,两个人的博弈,一同前往的可能性为sinθ=12。此时旋转角度为θ=π6。

(5)宏观上,同心理偏好的群体都不前往的话,他们同去的可能性为sin2θ=0。微观层面上,两个人的博弈,一同前往的可能性为sin2θ=0。此时旋转角度为θ=0。

六、應用

1.二维博弈

AB分别为此次假设中的乘客,他们彼此将对方的想法作为自己做出决策的基础,由第四章可知,若AB一定前往,则两人有100%的概率相撞;若AB可能去,则会有22的概率相撞;若AB都无所谓,则有0.5的概率相撞。若事先得知二人的偏好程度,可以调整公交车数量。

2.多维应用

国庆前,抽样得知,国庆节将有4000人去华山,他们彼此间都担心对方的前往会不会给自己造成不便,且他们只对具有相同心理偏好的人产生博弈。抽样显示,一定前往1000人,非常想去1000人,可能去1000人,无所谓1000人,那么,国庆那天,预计会去的人数为:

1000+1000×34+1000×12+1000×14=2500

若华山承载上限为2000人,则应及时考虑降低群体的偏好即θ,如提高票价,或者安排部分去泰山游玩等来降低他们的预期效用,使资源达到最佳配置;若华山的承载上限为3000人,则应及时考虑提高群体的偏好即θ,如降低票价,提供更多的宣传和服务以及开放华山其他游玩项目等,从而使资源达到最佳配置状态。

注解:

① 该词摘自:Robert S.Pindyck,Daniel L.Rubinfeld. 微观经济学[M].北京:中国人民大学出版社,2009:467

② 博弈均衡指n个参与人的一组策略(纯策略或者混合策略)选择,在其他人策略选择不变的情况下,任何人都不能通过改变策略来使其期望支付得到改善。

③ 引自:John F.Nash,JR.纳什博弈论论文集[C].北京:首都经济贸易大学出版社,2012:33-34

④ 信息不对称:不同经济主体缺乏信息的程度往往是不一样的。

⑤ 资源的稀缺性:一些资源的数量是有限的,具有排他性或竞争性。

⑥ 引自:Robert S.Pindyck,Daniel L.Rubinfeld.微观经济学[M].北京:中国人民大学出版社,2009:76

⑦ 合理配置:即帕累托最优状态。

⑧ 强可解性:具有特殊性质的解。

⑨ 预期效用:心理上所认为会得到的效用,是一种计划效用,非实际效用。

⑩ 引自:John F.Nash,JR.纳什博弈论论文集[C].北京:首都经济贸易大学出版社,2012:4

B11 前提(1)来源于阿罗不可能定理。该定理是这样表述的:如果众多的社会成员具有不同的偏好,而社会又有多种备选方案,那么在民主的制度下不可能得到令所有的人都满意的结果,即博弈无解。所以必须要有这样的假设前提。

B12 为了方便计算所给出的一种标准,也可以以“事件的反面”来进行计算。

参考文献:

[1] John F.Nash,JR.纳什博弈论论文集[C].北京:首都经济贸易大学出版社,2012

[2] Robert S.Pindyck,Daniel L.Rubinfeld. 微观经济学[M].北京:中国人民大学出版社,2009:467

[3] Kakutani S.Duke Math.[J].8,457-459(1941)

[4] Von Neumann J,Morgenstern O.The Theory of Games and Economic Behavior.Chap.3.Princeton:Princeton University Press,1941

[5] Nash J F.,Shapley L S.A Simple Three-Person Poker Games.Annals of Mathematics Study No.24.Princeton University Press,1950

猜你喜欢
大圆均衡点效用
画大圆
小学美术课堂板书的四种效用
交易成本理论在油田企业小修业务自营和外包决策中的应用分析
三级供应链投资模型的评价管理
填数
填数
纳米硫酸钡及其对聚合物的改性效用
均衡点移动的直观图示及其例析
几种常见叶面肥在大蒜田效用试验
玉米田不同控释肥料效用研讨