叶红心
摘 要:本文首先论述了合作博弈机制建立的思想基础,其次,在此基础上给出合作博弈机制的建构方法,并应用该方法讨论了囚徒困境博弈。
关键词:博弈;合作;机制
一、合作博弈机制建立的思想基础
对于一个作为系统的群体,如何实现其利益最大化及公平合理地履行分配措施至关重要。但由于群体成员追求个人利益最大化,竞争冲突的出现会造成群体利益的损失,这就导致了个人理性与集体理性的冲突问题。为了保证群体的有效运行和目标的实现,必须有某种机制来约束群体成员以使其决策朝着群体利益的方向走,以实现整个系统的Pareto最优,这就需要群体成员的有效合作。
促进合作的各种机制在操作上实际是通过博弈规则而起作用,并且最终成为博弈成员共同遵守的一种共同知识,博弈成员通过遵守它来弥补理性的不足,从而减少背离合作目标的可能。另一方面,由于非完全共同利益群体成员之间存在利益冲突和协调交织的错综复杂的关系,而群体成员又无法理解或预期他人的行动,那么群体合作秩序就无法形成。因此,机制化的合作博弈规则起到了使群体成员能正确预期他人行为的作用,在博弈规则的作用下,在博弈过程中群体成员就能正确预期他人可能的战略选择,从而减少群体成员互动中的不确定性,降低由战略冲突引发的各种交易成本。正如刘易斯(Lewis,D)提出:“作为不断重现的情况,S中的行为者P,其行为的规律性R在有仅在以下情况下成为规则,而且在P中这是一种共识,即在任何一种S的场合下,P的成员:①每个人都遵守R,②每个都希望其他人遵守R,③每个人在其他人都遵守R,也心甘情愿地遵守R,因而只是一个协作问题,对R的一致性遵守是在S中的一个协作性均衡。”因此需要这些促进合作的机制形成的规则在群体成员之间能得到重新理解和交流。
当然,合作后的利益分配问题不容忽视,因为它直接影响群体成员的合作积极性以及以后长期的合作。因此,我们这里将通过机制设置改变博弈的支付结构,使群体的Pareto最优组合成为预期博弈的Nash均衡。
二、合作博弈机制的建立
1、基本概念
假设战略式博弈是n人博弈,Si是i的战略空间,Pi是i的支付函数
记,是第i个博弈方的最优战略,即
Nash均衡若是唯一的,则是一个可自动执行的協议,即其他方没有积极性偏离均衡,该方也没有积极性偏离。
战略组合是Pareto最优组合,即满足
定义 通过引入机制λ的博弈称为预期博弈,即
假定原博弈的Si、Pi是公共知识,机制λ也是公共知识,机制化的预期博弈Gλ正是博弈方赖以决策的依据。
机制λ作如是设置:它能保证Pareto最优战略组合是预期博弈的Nash均衡。这样就能保证博弈方不会偏离Pareto最优解,达到促进合作的目的。为方便讨论,我们假定原博弈G有唯一的Nash均衡,不然可分别讨论,进行机制集成。
2、建立方法
构造如下:
这里ΔPi称为合作附加收益。λ=(αi)称为机制,或惩罚函数。显然
所以是i的占优战略。因此是博弈Gλ的严格Nash均衡,即给定其他方不偏离合作结果,没有博弈方有积极性偏离该均衡。
三、应用示例
为了演示上述方法的实用性,我们应用它分析众所周知的囚徒困境博弈。
(C,C)是非合作Nash均衡 存在合作Nash均衡(N,N)
综上所述,在博弈结构是群体成员(博弈参与人)的公共知识的前提下,我们建立机制以保证原博弈的Pareto最优组合是机制化后的预期博弈的Nash均衡。由Nash均衡的哲学内涵知,只要其他成员不偏离,系统成员无积极性单独偏离这一均衡结果。因此,该机制可通过细致的谈判以法律或契约的形式实现。
参考文献
[1]张维迎,博弈论与信息经济学,上海:三联书店,1997.
[2]尼尔·瑞克曼,合作竞争大未来,经济管理出版社,1998.
[3]Lewis,D.,Convention:A Philosophical Study.Oxford:Basil Blackwell,1986.
(作者单位:中共河南省委党校)