基于N维非合作博弈

2015-07-05 14:15卢丰周会红

商 2015年27期

关键词：大圆均衡点效用

卢丰周会红

一、绪论

1.目的

本文从二维非合作博弈①出发，推广至N维，人为地改变影响博弈的量，改变原博弈均衡②，使结果朝着有利于资源利用的方向变化，解决社会中存在的资源在众人中合理分配问题。

二、理论基础

1.n维非合作博弈均衡点存在性

由角谷静夫定理可推断有均衡点存在。基于角谷静夫不动点定理而对存在性定理给出的证明（发表在：Proc.Nat.Acad.Sci.U.S.A.pp.48-49），该方法直接由布劳维尔不动点定理得出。证明的是在n维空间里构建一个连续变换的T，使得T的不动点就是博弈的均衡点。由于n维混合策略空间是一个胞腔，且由布劳维尔不动点定理可知映射T至少有一个不动点ε，该点一定是一个均衡点。③

三、乘车博弈

1.乘车问题

AB两理性人住在两个房间（信息不对称④），居住处仅有1辆车仅能容纳1人（资源稀缺性⑤），明天为假日，AB都想出行，由于无法交流，他们只能在有限的时间里，进行博弈。假定效用⑥最大值为1，最小值为0，中间值为0.5。

第一种情况：AB都选择明天去，车无法满足需求，资源配置不足。效用和为1.5（最大值为2）。

第二种情况：A认为B选择明天去，所以A不准备明天前往，而B没有考虑到这种情况，从而选择了明天前往，AB中一人明天前往，一人后天前往，资源合理配置⑦，此时效用和为1+1=2，为最大效用和。

第三种情况：AB都认为彼此明天前往会给对方带来威胁，于是都选择了后天前往，这种情况就造成了明天空车现象与后天超载现象，带来的效用和为1.5。

第四种情况：A若考虑到“B若认为A明天前往从而B选择后天前往”的情况，也许A就选择明天前往，但同时，若B也考虑到“A若认为B明天前往从而A选择后天前往”的情况下，B就会选择明天前往，这样，明天又会造成超载的情况，此时的效用和为1.5。

第五种情况：考虑到彼此的三步潜在决定从而做出的决定。

第n中情况：考虑到彼此的N步潜在决定从而做出的决定。

双方会陷于无尽的博弈循环中。不交流则不了解，只有靠判断做出决定。考虑的潜在决定步数决定了是否能达到效用和最大的情况。双方出现相差为奇数的情况，如A考虑一步，B考虑了两步，就会出现效用和最大的情况，但出现偶数的情况，如A考虑一步，B考虑三步，那么，资源仍然分配不均，不能帶来效用最大化的情况。所以，只要他们分开前往，所得到的总效用为最大2。

四、二维博弈模型分析

1.总效用的模型表示

将以上效用表达如下：

任何有限的非合作博弈至少存在有一个均衡点，而且非合作博弈均有可解性与强可解性⑧，证明来自John F. Nash，Jr论文。

2.博弈斗争性模型

基于以上的分析，可以得出以下结果：

（1）A考虑1+X步，B考虑2+X步，那么所得的博弈结果是一个明日前往，一个明日不前往，这时候所得的效用是最大的。

（2）A考虑1+X步，B考虑3+X步，那么所得的博弈结果是一个明日前往（不前往），一个明日前往（不前往），这时候所得的效用是最小的。

另外：无论X为多少，它不影响博弈的结果，“A考虑1+X步，B考虑2+X步”这种情况与“A考虑1步，B考虑2步”的结果是一样的。“A考虑1+X步，B考虑3+X步”与“A考虑1步，B考虑3步”所得的结果也是一样的。

X在这里只不过是一个循环数，本研究将其称为“循环因子”。

把A的博弈动态转化在圆上，把B的博弈过程转化在另一平面的圆上。相切于a、b两点。

假定前提：

（1）两个圆都只是AB各自的博弈过程，AB两人是两个质点。

（2）A循着大圆作博弈结果，而B则循着“椭圆”作博弈结果，他们在环上所做的半个循环步数（每半圆）即为前面说过的考虑潜在决定的步数。

（3）a、b都只能容纳下一个质点，a表示明天不前往，b表示明天前往。同时，椭圆可围绕a、b转动，即a、b是“椭圆”的轴。我们以θ来表示“椭圆”的偏转角度，0≤θ≤π2，θ受理性人的心理偏好与外界因素的影响，θ越大，表示对“前往”的心理偏好越大，反之亦然。

（4）A、B只有a、b两个停靠点，也就是博弈的决定点。

（5）心理偏好是相对的，我们固定大圆固定不变，“椭圆”进行旋转。

描述AB博弈过程：

（1）AB同时停留在a点，这就导致资源未达到合理分配，表示A、B两人都做出了明日不前往的决定。

（2）AB同时停留在b点，这也导致资源未达到合理分配，表示AB都做出了明日前往的决定。

（3）A停留在a点，B停留在b点，或者A停留在b点，B停留在a点，资源都能达到合理的分配，表示一个明日前往，一个明日不前往（后天前往）。

（4）该模型也符合循环因子X的假设，即只要A选择其中一个停靠点，那么B是经过几个循环才选择到停靠点都跟X无关。

θ的意义：

1、

θ取值为π2，“椭圆”已经围绕ab两点旋转至与大圆重合，极端情况，表示AB两人都具有极强的明天前往的心理偏好，只会做出前往的决定，阴影面积为圆面积，它为大圆面积的100%，即表示，AB明日同往的概率为100%。

2、

θ取值为0，“椭圆”已经围绕a、b两点旋转与大圆垂直，极端情况，表示AB两人是互相完全排斥的，他们都做出不前往的决定，而且一直不前往。阴影面积为0，也就表示AB明日同去的可能性为0。

3、

AB对明天“前往”具有不同心理偏好，θ取值在0与π2之间。将θ作为常量处理，即不受其他因素影响，考虑AB共同前往的可能性。“椭圆”偏转角度θ越大，AB的心理偏好越强，同去的可能性越高。

阴影部分占大圆面积比例m：

m=阴影面积大圆面积=πr2sinθπrr=sinθ

阴影占大圆面积的比例m仅仅与θ有关。

3.假设前提

m=sinθ，反映的是AB两人在非合作博弈中最终一同前往的可能性，这也间接地反映了AB两人的心理偏好与预期效用⑨。

效用函数，就是赋予个体的每一预期一个实数。效用函数并不唯一，如果U是这样一个函数，那么a>0时，au+b也是这样一个函数。如果用大写字母表示预期，小写字母表示实数，这样的效用函数满足下列性质：

（1）uA>uB等价于A优于B，以此类推。

（2）若0≤p≤1，则u[pA+（1-p）B]=pu（A）+（1-p）u（B）⑩

对一人单独分析，引入“潜在前往因子”和“非排斥因子”。

用m=sinθ来间接表示这种预期效用与偏好的动态过程。θ增大，AB两人共同前往可能性越大。用sinθ曲线间接表示预期效用，则沿着sinθ所作的切线即为预期边际效用MU，切点处与原点所围成的图形面积即为预期效用。随着所作决定时考虑的潜在决定的步数的不断增加，预期边际效用MU逐渐递减，符合边际效用递减规律。等同于 “非排斥因子”的概念，即随着A前往的概率越来越大。同时，A也总会考虑B的前往决定从而对自己的决定产生犹豫，而对B的犹豫又会与自己想得到最大的预期效用相违背，于是产生了这种博弈。这时候两人相互的排斥力也越来越大，即“非排斥因子”越来越小。我们可以用sin′θθ = t 来表示“非排斥因子”。

另一方面，由于理性人都想让自己的满足程度达到最大，所以A前往的潜在决定越来越大，即A前往的可能性也越来越高，∫t0sinθdθ 在0≤θ≤π2时它的值在0-1之间呈概率分布。θ偏转角度越大，∫t0sinθdθ 的值也就越大，前往的可能性也就越高，把它看做“潜在前往因子”。

4.博弈均衡

（1）非排斥因子>潜在前往因子，A的预期效用很大，因为他觉得B与他之间的“排斥力”很小，所以A前往的可能性极高，在原点时达到最大，他会有很强的心理偏好来引导他做出“前往”的这一决定，直到他的非排斥因子不能承担为止。

（2）非排斥因子”<“潜在前往因子”时，A的预期总效用已经很大，同时，由于他的非排斥因子已经小于潜在前往因子，那么，由于对B的决策的犹豫，他们之间的“排斥力”很大，A作为一个理性人不会再产生“前往”的心理偏好，这时候，A的决定就会停留在一个自己能接受的点上。

（3）所以，理性人会把决策均衡点放在非排斥因子=潜在前往因子的时候，只有在这个时候，没有任何其他的“排斥力”会使得决定人的心理偏好发生改变从而做出重新选择前往的决定，这时候，决定人的心理趋向于一种既安全又满足的状态。

假设存在t，使得“潜在前往因子”=“非排斥因子”成立。

∫t0sinθdθ =sinθ′θ = t

∵∫t0sinθdθ =sinθ′θ = t

∴ -cost-1=cost

∴ cost=12

得t=π3，均衡点的角度为θ=π3，m=sinπ3=32

在AB博弈过程中，最终有cosπ3=12的预期边际效用，使得AB在明天共同前往的可能性为sinπ3=32≈0.866。在二维非合作博弈中，如果两人都将对方的潜在决定作为自己下决定的依据，想得到最大效用，则做出共同“前往”的可能性约为0.866。但均衡解未必是最優解。

五、二维到N维非合作博弈

1.N维非合作博弈模型

多维博弈的模型图表示的是不同人的彼此之间的非合作博弈过程。此时，均衡角度依然是θ=π3，事件之间相互独立，但他们要一同做出“前往”的可能性就被影响因子缩小了，小于0.866。当维数趋于非常多的时候，阴影部分共同区域的图形就越可测量。

2.模型讨论

θ对实验的影响：

当θ=π2 时，所有平面的圆都旋转与大圆重合，这时候n = 1，表明在所有人都具有相同的极端强烈的心理偏好的情况下，N人都将会选择第二天“前往”。这是一种极端情况。

2、

维数等于圆个数，它们彼此相切相互影响。维数越趋向于正无穷，其结果越接近真实值。强调两个前提：（1）凡是在一个模型中，所有参与非合作博弈的人具有相同的心理偏好B11；（2）旋转角度θ是基于对某特定事件的心理偏好B12。

3、

如果每个人都具有相同的“不前往”的心理偏好，那么此时，旋转角度θ=0，同时n = 0，即明天将不会有任何人前往。

3.N维非合作博弈模型的总结

表述：

（1）宏观上，同心理偏好群体（N维）一定前往的话，他们同去的可能性为sin2θ=1。微观层面上，两个人的博弈，一同前往的可能性也为100%。此时旋转角度θ=π2。

（2）宏观上，同心理偏好群体非常想去的话，他们同去的可能性为sin2θ=34。微观层面上，两个人的博弈，一同前往的可能性为sinθ=32，此时旋转角度θ=π3。

（3）宏观上，同心理偏好群体都可能前往的话，他们同去的可能性为sin2θ=12。微观层面上，两个人的博弈，一同前往的可能性为sinθ=22。此时旋转角度为θ=π4。

（4）宏观上，同心理偏好群体都无所谓前往不前往的话，他们同去的可能性为sin2θ==14。微观层面上，两个人的博弈，一同前往的可能性为sinθ=12。此时旋转角度为θ=π6。

（5）宏观上，同心理偏好的群体都不前往的话，他们同去的可能性为sin2θ=0。微观层面上，两个人的博弈，一同前往的可能性为sin2θ=0。此时旋转角度为θ=0。

六、應用

1.二维博弈

AB分别为此次假设中的乘客，他们彼此将对方的想法作为自己做出决策的基础，由第四章可知，若AB一定前往，则两人有100%的概率相撞；若AB可能去，则会有22的概率相撞；若AB都无所谓，则有0.5的概率相撞。若事先得知二人的偏好程度，可以调整公交车数量。

2.多维应用

国庆前，抽样得知，国庆节将有4000人去华山，他们彼此间都担心对方的前往会不会给自己造成不便，且他们只对具有相同心理偏好的人产生博弈。抽样显示，一定前往1000人，非常想去1000人，可能去1000人，无所谓1000人，那么，国庆那天，预计会去的人数为：

1000+1000×34+1000×12+1000×14=2500

若华山承载上限为2000人，则应及时考虑降低群体的偏好即θ，如提高票价，或者安排部分去泰山游玩等来降低他们的预期效用，使资源达到最佳配置；若华山的承载上限为3000人，则应及时考虑提高群体的偏好即θ，如降低票价，提供更多的宣传和服务以及开放华山其他游玩项目等，从而使资源达到最佳配置状态。

注解：

① 该词摘自：Robert S.Pindyck，Daniel L.Rubinfeld. 微观经济学[M].北京：中国人民大学出版社，2009：467

② 博弈均衡指n个参与人的一组策略（纯策略或者混合策略）选择，在其他人策略选择不变的情况下，任何人都不能通过改变策略来使其期望支付得到改善。

③ 引自：John F.Nash，JR.纳什博弈论论文集[C].北京：首都经济贸易大学出版社，2012：33-34

④ 信息不对称：不同经济主体缺乏信息的程度往往是不一样的。

⑤ 资源的稀缺性：一些资源的数量是有限的，具有排他性或竞争性。

⑥ 引自：Robert S.Pindyck，Daniel L.Rubinfeld.微观经济学[M].北京：中国人民大学出版社，2009：76

⑦ 合理配置：即帕累托最优状态。

⑧ 强可解性：具有特殊性质的解。

⑨ 预期效用：心理上所认为会得到的效用，是一种计划效用，非实际效用。

⑩ 引自：John F.Nash，JR.纳什博弈论论文集[C].北京：首都经济贸易大学出版社，2012：4

B11 前提（1）来源于阿罗不可能定理。该定理是这样表述的：如果众多的社会成员具有不同的偏好，而社会又有多种备选方案，那么在民主的制度下不可能得到令所有的人都满意的结果，即博弈无解。所以必须要有这样的假设前提。

B12 为了方便计算所给出的一种标准，也可以以“事件的反面”来进行计算。

参考文献：

[1] John F.Nash，JR.纳什博弈论论文集[C].北京：首都经济贸易大学出版社，2012

[2] Robert S.Pindyck，Daniel L.Rubinfeld. 微观经济学[M].北京：中国人民大学出版社，2009：467

[3] Kakutani S.Duke Math.[J].8，457-459（1941）

[4] Von Neumann J，Morgenstern O.The Theory of Games and Economic Behavior.Chap.3.Princeton：Princeton University Press，1941

[5] Nash J F.，Shapley L S.A Simple Three-Person Poker Games.Annals of Mathematics Study No.24.Princeton University Press，1950