关于公共品博弈的文献综述

2016-11-24 20:12鲁怡雪
2016年33期
关键词:囚徒困境合作

鲁怡雪

摘 要:本文通过对传统公共品博弈实验的描述和相关文献整理,试图寻找影响合作均衡解的部分因素,并在其中详细论述强互惠理论,由此引出一些关于建立合理惩罚机制的想法,希望能对解决现实中公共品供给困境有所帮助。

关键词:公共品博弈;囚徒困境;合作;强互惠

一、传统公共品博弈的均衡结果

1944年冯·诺依曼和摩根斯特恩合著了《Theory of Games and Economic Behavior》(博弈论与经济行为)[1],它标志着现代博弈理论的形成,博弈论思想也由此被正式引入到经济学领域。随后几年,纳什(Nash)在1950年和1951年提出了纳什均衡理论[2][3],泽尔腾(selten)于1965年发表了关于完全性的研究成果,哈萨尼(Harsanyi)则于1967年展开了对不完全信息的研究,而这些成果都使博弈理论的发展上了一个新台阶。尽管博弈论被引入经济学界的时间很早,但经济学家们真正开始重视博弈论却是在上世纪70年代左右,这时他们的研究重心已逐渐由一般均衡转向对拥有有限信息的个人行为的分析,而将博弈论应用于公共品问题的论文也是在这之后才大量出现的,且由于公共品非竞争性非排他性的特征,公共品问题一直都是历代学者试图解决的难题之一。

传统的公共品博弈可以描述如下:

假设共有n个人参与到公共品的供给过程之中,每人都有y单位的钱且同时决定投资某个公共产品,gi表示参与人i投资的数额,a表示个体的边际报酬率(0

πi=y-gi+a∑nj=1gi(陈叶烽,何浩然,2012)[4]

在完全理性人假设的条件下,每个参与人都会选择搭便车,因为只有这种选择才能使个人利益最大化,此时gi=0,但若所有人都采取这种选择,那么必然会导致公共品供给失败,使集体陷入无人合作的均衡结果中,而这种博弈均衡结果一般被称为囚徒困境(prisoners dilemma)。

囚徒困境是博弈论非零和博弈的经典例子,它反映了个人选择与集体选择的差别与矛盾。我国自上世纪八九十年代才开始引入囚徒困境的概念,那时很多学者都对此产生了浓厚兴趣,张维迎(1985)[5]曾在文章中写到,囚徒困境反映了个人理性与集体理性的矛盾。李子江(1995)[6]也指出,囚徒困境的纳什均衡点不是帕累托最优的,当所有人都采取自己的最优策略时,整个系统的收益却将处于低点。

做为经典博弈理论关于完全理性假设的最经典应用,囚徒困境这种博弈均衡结果排除了任何合作的可能,即每一个理性人在面临选择时都会以个人利益最大化为标准从而做出背叛的行为。但在现实生活中,无论是遥远的历史还是现在,个体间的合作现象却是普遍存在的,无关民族无关国家更无关教育程度,没有契约保障的合作显然具有普遍性,农村居民可以共同筹资修水渠,城市居民也会达成一致共同购买保洁服务以确保住宅共有部分的干净卫生,而这显然与理论上的公共品博弈均衡结果不符。

二、对完全理性假设的质疑

事实上,传统博弈论中的完全理性假设自诞生时起就不断遭受质疑,例如,Daniel Kahneman于上世纪六十年代发表的论文中就详细研究了人的认知能力[7][8],并得出人某种情况下会存在认知不足的结论。Fehr与Schmidt(2005)[9]指出,人既有理性自利的一面也有不同程度的利他之意。Cardenas和Carpenter(2008)[10]总结的大量公共品博弈实验数据更证实了人的行为会偏离完全理性假设。

国内学者陈叶烽(2010,2012)写到[11][12],近几十年来的大量实验结果表明,现实个体并非都是理性人,而是具有异质社会偏好的个体。蔡晶晶[13]在2010年的文中也介绍过此类研究,并说明那些完全不了解搭便车概念的人,往往能在互信互惠的基础上形成复杂的合作系统。

现实中的人之所以不是完全理性的经济人,除了受限于本身的认知能力外,还受到诸如自我形象、社会评价和个人信仰等等因素的影响,人们在乎的不仅仅是物质,还有各种各样的心理需要。正如马斯洛对人的需求所进行的分层,人们不仅在乎生理上的需要,安全、爱、他人尊重以及自己的社会实现也都非常重要,而这些需要共同驱使个体的行动,也正是因此,现实中的囚徒困境才不是绝对存在的。姜树广与韦倩(2013)[14]曾说,在博弈过程中,参与者的效用不仅取决于最终物质支付,还受参与者的心理状态影响。唐兵(2009)[15]曾指出,社区内部长期形成的社会机制,诸如声望、信誉、道德、舆论等,都形成了对其成员的无形约束,而这种约束的存在,使得个体间合作提供公共品成为可能,并在面对搭便车和机会主义等因素的诱惑下,取得集体的共同利益。

三、能解释公共品博弈合作均衡解的一些理论

目前理论界有很多解释现实个体间合作行为的理论,这些理论从多个角度阐释了合作现象出现与维持的原因,其中的群体反复博弈理论(Fudenberg D,Maskin E,1990)、亲缘选择理论(Hamilton W.D,1964)和群体选择学说(Traulsen.A,Nowak M.A,2006)等都是不错的理论成就。在我国也涌现出了很多类似理论,其中于显洋在1991年发表的论文中,就指出了我国城市单位小区的特点,他说在这种单位小区中,个体意识更多地表现为私人关系意识、盲目服从意识和追求身份意识等[16],而这种显著的同群意识[17]建立起来后很容易形成合作解,并使个体较顺利地提供集体所需的公共品。同样地,在乡村社会中,乡村居民相较城市居民更倾向于长期生活在一个基于血缘、亲缘、地缘的熟人社会中,长期重复博弈使个体更看重长期效用,也更看重自己的声誉,这在一定程度上避免了在公共品供给上的困境[18]。

在诸多对合作现象进行解释的理论中,基于对未来利益的期望而采取合作选择的互惠机制最引人瞩目,它包括直接互惠、间接互惠[19]和基于奖励或惩罚的强互惠理论[20]。这种互惠理论并非只停留在理论层面,经济学界很多学者都对此进行了实证研究,Croson[21]就利用公共品博弈实验进行了检验,认为个体间合作行为中存在着互惠关系,他在2007年的分析结果也表明个人的互惠偏好能得到有力支持[22]。周业安,宋紫峰[23]也曾运用公共品博弈数据进行研究并得出结论,认为互惠理论可以部分解释显著存在的公共品供给。

互惠理论中的强互惠概念为,人类之所以能维持合作关系,是因为很多个体在采取合作抉择后,常常会不吝惜成本而去惩罚不合作者或者奖励合作者,作为一种具有明显正外部性的利他行为且惩罚机制较奖励机制更为普遍,它也被称为利他惩罚。早在1992年,人类学家就发现惩罚不合作者是早期人类社会维持合作的重要机制[24]。1995年动物学家也证实,惩罚是社会性动物维持合作的重要手段[25]。2004年8月《科学》杂志的研究报告更显示,人们已经通过正电子断层扫描(PET)技术发现了利他惩罚的神经基础[26]。

国内学者也进行过惩罚机制的相关研究,蔡晶晶在2010年[27]的论文就表明,惩罚的作用在可以交流的实验对象中较之不能交流的对象中更为显著,这说明人们能通过交流建立有效的惩罚机制。宋紫峰[28]就曾指出,当群体中不同个体获得不均等公共品单位收益时,会增加个体合作难度,但惩罚对合作的影响仍然明显。

强互惠较之其它理论具有更高的可操作性,对于任何一个无法形成合作均衡的公共品博弈,似乎都可以通过构建合理的惩罚机制来形成并维持合作,但这种惩罚机制必须尊重个体意愿,且经济惩罚这种方式显然并不具备普适性,除了有益物品等被政府认定为必须保证供给的可以强制征税外,普通公共品并不适用经济惩罚。但无论是城市集体还是农村集体都可以参考以上诸多理论,将惩罚机制建立在保证反复博弈的长期性、形成熟人社会、形成同群效应或共同信仰等基础上,在此时,惩罚也将演变为一种心理上的效用,只要人们在意自我形象、他人评价、声誉或者集体信仰,自然会被他所生活的集体所约束,为了共同利益而自愿参与到公共品的供给过程之中。

其实这种惩罚机制在城市居民社区中已经出现雏形,例如在某些居民互相熟识且没有物业管理的老旧社区中,业主们往往会共同筹资雇人打扫社区内部共有部分,以保证所有人的卫生健康需求。尽管这种筹资方式不具备强制性,但因为居民间的熟识程度和保洁费用的小额性,使得搭便车成为一种为人不齿的贪小便宜行为,这就造成社区内大部分居民最终都会选择一起负担这种公共品。

由以上例子可以看出,惩罚机制维持合作的作用其实是明显的,政府完全可以建立相应平台针对不同的社区进行引导和培养,只要发现某个集体拥有共同需要,就可以采取相应引导措施,指导集体自发提供他们所需的且个体自愿并有足够能力承担的公共品,只要合理的惩罚机制建立起来,这种自发供给就能在一定程度上补充政府供给公共品的不足,并在更高程度上满足集体需要。但同时,政府也需要做好对公共品供给状况的监控工作,惩罚机制虽然能在促进合作方面起到明显效果,但却需要政府的管控力才能被束缚在合理的范围内,一旦惩罚演变成过分谴责或恶意诽谤,就会对公民的名誉权造成侵害甚至造成严重的心理创伤,这就违背了公共品供给最开始的自愿原则,因此政府管控也是必需的。(作者单位:兰州财经大学经济学院)

参考文献:

[1] Neumann,Morgenstern.Theory of Games and Economic Behavior.N J Princeton University Press,1944

[2] Nash.J,Equilibrium Points in n-person Games.Proceeding of the National Academy of Science,No.36,1950

[3] Nash.J,Non-cooperative games.Annals of mathematics,54(2),1951

[4] 陈叶烽,何浩然.是什么影响了人们的自愿合作水平.经济学家,2012

[5] 张维迎.从九四年诺贝尔经济学奖看主流经济学的新发展,《理论经济学》,1985年第6期

[6] 李子江.《关于纳什均衡点的研究》.《学术研究》,1995年第2期

[7] Kahneman.D,Beatty.J,Pupil diameter and load on memory.Science,1966

[8] Kahneman.D,Beatty.J,Pollack.I,Perceptual deficit during a mental task.Science,1967

[9] Fehr.E,Schmidt.K.M.,The Economics of Fairness.Reciprocity and Altruism——Experimental Evidence and New Theories.Munich Discussion Paper,2005

[10] Cardenas J.C.,Carpenter J.,Behavioral Development Economics:Lessons from Field Labs in the Developing World.Journal of Development studies,2008

[11] 陈叶烽.社会偏好的检验:一个超越经济人的实验研究.浙江大学博士论文,2010

[12] 陈叶烽,叶航,汪丁丁.超越经济人的社会偏好理论:一个基于实验经济学的综述.南开经济研究,2012

[13] 蔡晶晶.公共资源治理的理论构建.东南学术,2010

[14] 姜树广,韦倩.信念与心理博弈:理论、实证与应用.经济研究,2013

[15] 唐兵.公共资源的特性与治理模式分析.重庆邮电大学学报,2009

[16] 于显洋.单位意识的社会学分析.社会学研究,1991

[17] 汪汇,陈钊,陆铭.户籍、社会分割与信任:来自上海的经验研究[J].世界经济,2009

[18] 叶文辉.中国公共产品供给研究.四川大学博士论文,2003

[19] Nowak.M.A,Sigmund.K,Evolution of indirect reciprocity.Nature,2005

[20] Rand.D.G,Dreber.A,Ellingsen.T,Positive interactions promote public Coop- eration.Science,2009

[21] Croson.R,Theories of Commitment,Altruism and Reciprocity,Evidence from Linear Public Goods Games.Economic Inquiry,2007

[22] Croson.R,Fatas.E,Neugebauer.T,Reciprocity,Matching and Conditional Coop- eration in Two Public Goods Games[J],Economics Letters,2005

[23] 周业安,宋紫峰.公共品的自愿供给机制:一项实验研究.经济研究,2008

[24] Boyd.R,P.Richerson,Punishment Allows the Evolution of Cooperation(or Anything Else)in Sizable Groups.Ethology Sociobiology and Evolutionary Psychology,1992

[25] Clutton-Brock.T,G.Parker,Punishment in Animal Societies.Nature,1995

[26] Deuervain.D,U.Fischbacher,V.Treyer,M.Schelhammer,U.Schnyder,A.Buck,E.Fehr,The Neural Basis of Altruistic Punishment.Science,2004

[27] 蔡晶晶.公共资源治理的理论构建.东南学术,2010

[28] 宋紫峰、周业安.收入不平等、惩罚和公共品自愿供给的实验经济学研究.世界经济.2011

猜你喜欢
囚徒困境合作
“囚徒困境”在贿赂犯罪审讯中的运用
高职图书馆与系部合作共建文献资源新模式
大学英语创造性学习共同体模式建构案例研究