考虑公平与道德条件的博弈论理性决策

2010-12-13 03:30戴菊贵
统计与决策 2010年22期
关键词:博弈论参与者福利

戴菊贵

(1.温州大学 商学院,浙江 温州 325035;2.上海财经大学 国际工商管理学院,上海 200433)

考虑公平与道德条件的博弈论理性决策

戴菊贵1,2

(1.温州大学 商学院,浙江 温州 325035;2.上海财经大学 国际工商管理学院,上海 200433)

博弈论中一个基本假设是参与人是理性的,即在面临即定的约束条件下最大化自己的效用。这种假设称之为理性选择理论(RCT),是一种仅考虑收益绝对值的理性。文章从收益绝对性和收益相对性两个角度阐述了理性的含义;并在新的理性范畴内重新解释了RCT简单地归结为“非理性”或“高尚品德”的行为;最后讨论了理性与公平、道德的联系和其社会意义。

理性选择理论;风险占优;道德博弈;帕累托最优

0 引言

博弈论中的一个关键假设是参与人是理性的,即在面临即定的约束条件下最大化自己的偏好或效用。这种最大化个人效用的行为假设被称为理性选择理论(RCT)[1],否则就称参与人的选择是非理性的。但参与人的选择真的是非理性的吗?考虑一个简单的分配博弈,规则如下:假设有一笔钱(如100元),甲首先提出分配比例,乙其次选择接受还是拒绝。如果接受则按提议的比例分配,如果拒绝则甲乙两人都什么也得不到。那么甲应该提出一个什么比例呢?按照标准博弈理论,只要甲的提议使乙的所得大于0,乙就会接受甲提议的分配方案。但根据不同国家所做实验,甲提出的分配比例大致都在40~50%之间,而且低于一定比例则乙会选择拒绝而使双方什么也得不到[2]。理性选择理论(RCT)既无法解释为什么甲会提出40~50%的比例而不是略大于0,也无法解释乙为什么会拒绝低于一定比例的分配而宁愿双方的收益都为0。因为他们的行为都不符合理性选择理论的假设。大部分经济学家对理性选择理论的批判集中在 “有限理性”、“有限意志”、“有限自利”三个限制性条件上,从这三个条件上解释这些所谓的 “非理性行为”,或则把甲的行为归结为“高尚的道德”。但笔者认为,这些看似非理性的行为其实是参与人理性的选择,因为理性选择理论只是从参与人收益绝对值的角度考虑而认为这些行为是非理性的,但如果从收益相对值的角度分析则甲、乙的行为其实都是理性的。正如阿马蒂亚.森(2002)所言“…但我们不能错误地认为这种博大的关怀并不包含在理性之中。理性中仍有许多空间来置放这些关怀,绝不可幼稚地将它们付给所谓的‘非理性’”[1]。

1 占优策略均衡与风险占优策略

博弈论中常用重复占优策略求解均衡。但是占优策略均衡是最优的吗?Beard和Beil(1994)[3]通过一个二次重复占优博弈实验检验占优策略均衡。其实验如表1所示。

表1 Beard and Beil的重复剔除占优博弈

博弈顺序如下,参与者1先行动,参与者2其次行动。这个博弈实验是检验参与者1是否相信参与者2服从占优策略。从支付矩阵可以看出:r是参与者2的弱占优策略,因为理性是共同知识,所以在参与者1选择R后,参与者2只能选择r,(R,r)就是占优策略均衡,两者的收益分别为10和5。但是如果参与者2在参与者1选择R后选择m而不是r,那么参与者1的收益为3,而参与者2的收益却为4.75。如果参与者1选择M,不管参与者2选择m还是r,都可以得到9.75。参与者是否值得为了多得0.25(10-9.75)的收益,而承担失去6.75(9.75-3)的风险呢?

在这个实验中,66%的参与者1选择了M,说明有34%的参与者1对参与者2的“理性”是怀疑的。如果参与者1选择R,有83%的参与者2会选择r回应。这看起来大部分参与者2的选择似乎还是理性的。但如果参与者2选择r的比例只有83%,那么参与者1的最优策略是选择M而不是R。为什么呢?假设参与者1是风险中性的,阈值P(r|R)为参与者1对选择R与M的偏好程度相同的概率,我们可以求出阈值为0.97。在实验中只有83%的参与者2在参与者1选择R的情形下选择r,低于97%,即参与者1选择R的期望收益低于选择M的期望收益,因此参与者1的理性选择应该是M而不是R。按照Zelten的“颤抖手均衡”[4]概念,即使参与者2是理性的,参与者2也可能有犯错误的时候,如果他的手“一颤抖”,本来打算选r的时候却不小心选择了m,只要犯错的概率超过3%,那么参与者就应该选择M而不是R。所以M是参与者1的“风险占优策略”(risk-dominance strategy),选择R对参与者1来说是有较大风险的。

Beard和Beil通过变化支付函数,检验影响子博弈完美均衡的各种因素,以及影响参与者1对于参与者2违反理性占优可能性的信念的因素。表2总结了各种实验的结果。

在方案5中,参与者1如果选择R而使参与者2丧失了获得收益6的机会,那么参与者2很可能会选择m作为报复。意识到这一点,参与者1选择M的比例最高,达到86%。参与者2通过这种“报复威胁”迫使参与者1选M而不选R。那么参与者2的威胁是可信的吗?

表2 Beard and Beil各种支付方案及实验结果

2 理性与公平

理性选择理论是一个“绝对值”的概念,仅考虑使自己的收益最大化。但是这种“收益最大化”的理性选择理论显然无法解释以上这些行为,更不能简单地归结为“非理性”。阿马蒂亚.森(Amartya Sen)反对哪种只追求自己自私目标而不考虑其他人福利的理性假设,称他们为“理性的傻子”[5]。在方案5中如果参与者1选择R,那他就是个“理性的傻子”。参与者在做选择时不仅要考虑到自己的绝对收益,还要考虑自己与其他人之间的收益差距和 “收益位置”,因而理性不是一个“绝对值”的概念而是一个 “相对值”的概念。

参与者的选择策略不仅取决于自己支付函数绝对值的大小,还取决于于自己的支付函数与其他参与者的支付函数比较的相对大小。一个人的效用不仅取决于自己的绝对收入,还取决于自己的相对收入和自己的收入在社会总体收入中的位置,以及收益分配的公平程度。我国居民现在的绝对收入水平都比以前高了许多,为什么大家的生活压力反而比以前增加了呢?甚至社会上产生了“仇富”现象。原因即在于虽然绝对收入大家都增加了,但相对收入的差距拉大了,使人心理产生不平衡。在大家的收入都低的时候,收入与社会地位相差不大;在收入差距拉大后,人的社会地位也拉大了。人的效用在许多时候是取决于其在整个分配体系中的位置或者分配制度是否公平,而不是分配数额的多少。

在Beard和Beil的基准方案中,在参与者1选择R的条件下,参与者2如果选择r,那么他的收益就比参与者1少5个单位;而如果选择m,则他的收益反而比参与者2多1.75个单位。对于参与者2来说,选择策略r的绝对收益虽然比选择策略m高(0.25),但他在这个分配体系中是“相对穷人”(-5),处于相对劣势位置;选择m的绝对收益虽然比选择r少一点(0.25),但他在这个分配体系中却是“相对富人”(+1.75),处于相对优势位置,也就是说他的“收益位置”在这两个分配体系中刚好倒置了。所以对参与者2来说,在参与者1选R的条件下选择m是理性的。意识到参与者2很可能由于“仇富”选择m,参与者1的理性选择是M而不是R。所以在方案5中,参与者2的威胁是可信的。从这个意义上来讲,参与人的理性选择包括两个含义:一是收益的绝对性;二是收益的相对性。收益的相对性含有公平性的意思。参与者的效用函数不仅包括收益的大小,也包括收益的比较。从这里就不难理解为什么现在人们的收入虽然提高了,但压力却增加了,效用有可能反而降低了。

Rabin(1993)[6]建立了一个“公平博弈”模型,认为参与者会善待对自己友善的人,而敌视伤害过自己的人。Jolls,Sunstein和Thaler(1998)[7]认为人是有限自利的,不仅有利他主义行为,而且希望得到公平对待,并且如果他人都公平行事的话,那么其也必将公平对待他人。Fehr和 Schmidt(1999)[8]提出了避免不均等的一个 “嫉妒或内疚”模型。在他们的模型中参与者不仅关心自己的收益而且关心自己的收益与其他参与者收益之间的差别。参与者i对社会分配X(x1,x2,….,xn)的效用函数如下:

其中,0≤βi≤1,βi≤αi从效用函数看到,参与者会本能地产生嫉妒和内疚的感觉:他们不愿意获得比别人低的分配(这时表现为嫉妒,用αi衡量),但也不愿获得比别人高的分配(这时表现为内疚,用βi衡量),内疚的程度比嫉妒的程度稍轻(βi≤αi)。 Bolton 和 Ockenfels(2000)[9]提出了另一个解释避免不均等的模型。在他们的模型中,参与者不仅关心自己的收益而且关心他的相对份额的比例。参与者i对社会分配X(x1,x2,….,xn)的效用函数如下:

参与者严格偏好一个等于平均值1/n的收益,意味着参与者的选择使他们的相对收入达到均衡。这些模型背后的哲学原理都是罗尔斯的公平主义。只是Fehr和Schmidt模型假定参与者关心绝对差异,而Bolton和Ockenfels模型假定参与者关心的是其相对收益。

3 道德博弈

在实验1到5中,如果参与者1选R而参与者2选m,参与者2的行为看上去是“损人不利己”的,在道德上似乎要受到谴责。但是在博弈论中,博弈的最后均衡结果是参与者最优反应函数的解,是参与者之间相互作用的结果。一个参与者的收益需要另一个参与者的配合策略才能获得。参与者在博弈中应该有“利他主义”的考虑,因此我们不能责怪后行动者不配合先行者。为什么先行者不能替后动者考虑一下呢?在分配博弈中,如果甲的提议是1%而乙拒绝使双方收益都为零,那么是甲还是乙应该受到谴责?如果因为甲提出的比例太低而使乙拒绝这种情形发生的话,道德上受到谴责的是应该甲,他应该为自己的多得而感到“内疚”(Fehr和Sohmidt)。正是因为有乙的拒绝威胁使甲提高分配比例,使两人的分配比例比较均衡。在Beard和Beil的方案5中,有86%的参与者1选择M。如果参与者1选择了R而使参与者2失去了获得6个单位收益的机会,那么参与者2在参与者1选择R后会选择m而不是选择M,参与者1想得到收益10的愿望就会落空。参与者1“损人利己”在先,所以只指责参与者2显然是有失公平的。

经济学的另一个评判标准是衡量均衡策略带来的社会总福利的大小。在Beard和Beil的基准方案中,占优均衡策略(R,r)的社会总收益为 15,而相对公平均衡(M,m)的社会总收益是12.75,比(R,r)的社会总收益少了2.25个单位。即由于参与者2的报复威胁而达成的公平均衡使社会总收益降低了。但社会总收益减少了就说明社会总福利下降了吗?前面我们分析过,参与者的效用函数不仅取决于收益的绝对值大小,还取决于收益分配差距和公平程度,因此均衡(M,m)虽然比均衡(R,r)的社会总收益少了2.25个单位,但由于其分配更公平,其社会总福利很有可能更高。在方案5中,均衡(M,m)的社会总收益是 15.75,反比(R,r)多了 0.75单位的总收益。均衡(M,m)不仅比均衡(R,r)的社会总收益更高,而且分配更公平,收益的差距更小,因而其社会总福利肯定比(R,r)更高。因此参与者2的“报复威胁”行为不一定会减少社会总福利,其“损人不利己”的行为反而可能会增加社会总福利,达到帕累托最优。

4 结论

理性包含有收益的绝对值和相对值两重涵义。参与者要避免做一个“理性的傻子”,在选择策略时不是仅考虑自己的绝对收益,而且还要考虑对手的收益,同时兼顾收益的差距和收益的公平,这样才能减少“仇富”现象,避免两败俱伤的局面发生。我国现在提倡建立“和谐社会”,就是要减少“自私的理性”而做到“公平的理性”,不仅要达到个人福利的最大化,而且要达到社会总福利的最大化。

[1]阿马蒂亚.森.理性与自由[M].李风华译.北京:中国人民大学出版社,2006.

[2]科林.凯默勒.行为博弈——对策略互动的实验研究[M].贺京同等译.北京:中国人民大学出版社,2006.

[3]Beard.T Randolph,Richard Beil.Do People Rely on the Selfinterested Maximization of Others?An Experimental Test[J].Management Science(S0025-1909),1994,40(2).

[4]Fudenberg,Drew, Jean Tirole.GameTheory[M].Cambridge:MIT Press,1991.

[5]肯.宾默尔.博弈论与社会契约——公平博弈(第1卷)[M].王小卫等译.上海:上海财经大学出版社,2003.

[6]Rabin,Matthew.Incorporating Fairness into Game Theory and E-conomics[J].American Economic Review(S0002-8282),1993,83(5).

[7]Jolls Christine,Cass Sunstein,Richard Thaler.A Behavioral Approach to Law and Economics[J].Stanford Law Review(S0038-9765),1998,50(7).

[8]Bolton,GaryE,AxelOckenfels.ERC:A TheoryofEquity,Reciprocity,and Competition[J].American Economic Review(S0002-8282),90(1).

[9]Fehr,Ernst,Klaus M Schmidt.A Theory of Fairness,Competition and Cooperation[J].Quarterly Journal of Economics(S0033-5533),1999,114(4).

F224

A

1002-6487(2010)22-0045-03

戴菊贵(1976-),男,江西吉安人,博士研究生,讲师,研究方向:产业组织理论、博弈论应用。

(责任编辑/亦 民)

猜你喜欢
博弈论参与者福利
休闲跑步参与者心理和行为相关性的研究进展
台胞陈浩翔:大陆繁荣发展的见证者和参与者
浅析打破刚性兑付对债市参与者的影响
那时候福利好,别看挣几十块钱,也没觉得紧巴巴的
SZEGÖ KERNEL FOR HARDY SPACE OF MATRIX FUNCTIONS∗
海外侨领愿做“金丝带”“参与者”和“连心桥”
无知之幕与博弈:从“黄灯规则”看博弈论的一种实践方案
樊畿不等式及其在博弈论中的应用
博弈论视角下的建筑工程外包道德风险
博弈论视角下医疗纠纷解决方式选择