静态博弈和动态博弈

2018-06-11 07:50黄梓佳张豪
今日财富 2018年36期
关键词:囚徒坦白纳什

黄梓佳 张豪

一、博弈论概述

最早开始了解到博弈论是从电影《美丽心灵》里,纳什与他的四位同学在酒吧遇见了一位美丽的金发女郎,大家纷纷表示自己很有欲望和她谈恋爱,可惜科学家似乎都有色心没色胆,他们互相推诿,却没有人敢于实践。如果所有的人都去追求金发美女,那么他们都会失败,当他们再转而追求她的女伴们时,就会惨遭拒绝,因为没有谁会愿意屈居第二;但如果他一开始就去追求她的女伴们,那么就会成功,而金发美女则会遭到冷落,纳什便能乘虚而入,这样所有人就都得到了和金发女郎谈恋爱的机会。博弈论已成为当今分析经济问题的两种最有力的方法之一,必将使问题的分析以更加符合现实的方式揭示经济活动的内在规律。

什么是博弈论,博弈论的教材中的定义是“研究决策主体的行为在直接相互作用时,人们如何进行决策,以及这种决策如何达到均衡的问题”。博弈论分析的关键步骤是找出在别人选择既定策略的情况下找到自已的最优反应策略,也就是给自已带来最大收益的策略。博弈论在当今社会已经成为经济学的标准分析工具之一。

二、博弈论的划分

博弈论的划分可以从两个角度进行。第一个角度是参与人行动的先后顺序。从这个角度,博弈可以划分为静态博弈和动态博弈。第二个角度是參与人对有关其他参与人的特征以及策略空间的认识。从这个角度,博弈可以划分为完全信息博弈和不完全信息博弈。将上述两个角度的划分结合起来,就可以将博弈论划分为四种不同的类型:完全信息静态博弈,完全信息动态博弈,不完全信息静态博弈,不完全信息动态博弈。

三、完全信息静态博弈

关于纳什均衡最经典的例子就是囚徒困境的例子。我们先通过分析囚徒困境从而对后面的五星级酒店在节假日如何定价等内容做一些铺垫。通过下图我们可以看到,两个嫌疑犯作案后被警察抓住,分别关在不同的屋子里接受审讯。警察知道两人有罪,但缺乏足够的证据。警察告诉每个人:如果两人都抵赖,各判刑一年;如果两人都坦白,各判八年;如果两人中一个坦白而另一个抵赖,坦白的放出去,抵赖的判十年。于是,每个囚徒都面临两种选择:坦白或抵赖。然而,不管同伙选择什么,每个囚徒的最优选择是坦白:如果同伙抵赖、自己坦白的话放出去,抵赖的话判十年,坦白比不坦白好;如果同伙坦白、自己坦白的话判八年,比起抵赖的判十年,坦白还是比抵赖的好。结果,两个嫌疑犯都选择坦白,各判刑八年。如果两人都抵赖,各判一年,显然这个结果好。囚徒困境所反映出的深刻问题是,人类的个人理性有时能导致集体的非理性聪明的人类会因自己的聪明而作茧自缚,或者损害集体的利益。

从上面的内容看出,首先,囚徒A和囚徒B都是具有完全信息的,每个囚徒对另外一个囚徒的特征(包括可选择的策略、可能的结果)有完全的了解。其次,无论是囚徒A还是囚徒B,“坦白”总是最好的策略,即个人的占优策略。最后,当两方都选择了“坦白”策略时,即为“均衡”。

但在重复的囚徒困境中,博弈被反复地进行。因而每个参与者都有机会去“惩罚”另一个参与者前一回合的不合作行为。这时,合作可能会作为平衡的结果出现。欺骗的动机这时可能被惩罚的威胁所克服,从而可能导向一个较好的、合作的结果。反复的、接近无限的重复次数时,纳什均衡趋向于帕累托最优,从互相背叛趋向于互相忠诚,这在之后的现实应用中也一样会出现。

四、完全信息动态博弈

上文的内容主要介绍的是完全信息下的静态博弈,但现实生活不仅仅只有这一种情况,如果再加入动态博弈的话可能会更符合现实生活中的应用。而两者的区别之处在于,静态博弈是所有参与人同时行动(或许有先动,但没有人在所有行动之前能观测到别人的行动)。而动态博弈则是参与人的行动有先后顺序,且后行动者在自己的行动之前能观测到先行动者的行动。

中国的很多节假日 (如十一国庆节)是酒店(尤其是五星级酒店)生意最好的时候(而酒店工作日的生意比较冷清),在节假日之前就会开始预订房间,此时假设在一个景点附近只有二家五星级酒店A和B(事实上一般不止二家),A与B这两家酒店在节假日会出现二种不同的定价可能,即一种是提价,但可能影响的客房量,另一种是少提价(提价比例不那么高),虽很可能满房但赚到超的额利润不多。我们从静态博弈的视角来分析,产生了四种不同的组合。第一种情况是A和B两家酒店都少提价(提价比例不那么高),所以两家酒店赚超额利润都较少,即两家酒店超额利润都是2。第二种情况是两家酒店都提价了,即两家酒店超额利润都是8。还有二种情况都是一家酒店提价了而另一家酒店少提价,结果是提价的酒店超额利润是-10(可能游客不订,但节假日酒店成本会更高些),而另一家酒店生意火爆,并赚到了超额利润10。

假设A和B两家酒店经营者都是理性的,从表中可以看到,显然选择少提价的方案对自身更有利,即不论对方如何选择,“不提价”总是最好的策略,即占优策略。从上面的例子可以看出,两家酒店都提价并不是纳什均衡,因为只要另一家酒店选择少提价就可以得到更多的超额利润。所以,这个状态不是一个纳什均衡——因为有一方可以通过改进策略多赢钱。最后双方非合作博弈的纳什均衡状态一定是两家酒店都无奈选择了“少提价”的方案。

我们再从动态博弈(即是参与人的行动有先后顺序,且后行动者在自己的行动之前能观测到先行动者的行支动)的视角来分析,上表中假设B酒店在第1次选择了“提价”,而A酒店选择“少提价”,那么A酒店的超额利润应该是10+2(T-1)(这里的T代表时期)。如果当B酒店是非理性的(选择“提价”),而A酒店也选择“提价”,那么A酒店的超额利润应该是8T。还有另外一种可能就是,B酒店是理性的(选择“少提价”),则此时A酒店正常情况下也会选择“少提价”的方案,此时A和B酒店的超额利润都是2T。

但在重复的每年的酒店节假日定价过程中,博弈被反复地进行。尽管节假日酒店在选择合作时都可能冒着被其他酒店抢生意的风险,但如果他们不选择合作,就会暴露了自己是非合作型,从而很有可能失去了长期合作收益的可能性。因为国内节假日酒店在定价上博弈几乎一直在发生,即博弈次数足够多,未来收益的损失就会远远超过短期的损失。因此,五星级酒店之间的节假日定价策略仍可能会出现合作博弈的结果。(作者单位为1 The University of Nottingham NG7 2RD;2 电子科技大学)

第一作者:黄梓佳(1993.09--);女,湖北人,硕士,毕业于The University of Nottingham ;研究方向:会计与金融;

猜你喜欢
囚徒坦白纳什
THE ROLE OF L1 IN L2 LEARNING IN CHINESE MIDDLE SCHOOLS
THE ROLE OF L1 IN L2 LEARNING IN CHINESE MIDDLE SCHOOLS
审案中的策略
机智的囚徒
中文的魅力,老外理解不了
被释放的囚徒
爱,纳什博弈人生的真理
死里逃生的一句话