博弈论视野下发展方式转型难题的破解

2019-07-12 02:45詹宏伟
重庆三峡学院学报 2019年4期
关键词:局中人坦白囚徒

詹宏伟

(重庆工商大学马克思主义学院,重庆 400067)

习近平同志在十九大报告中指出:“我国经济已由高速增长阶段转向高质量发展阶段,正处在转变发展方式、优化经济结构、转换增长动力的攻关期。”[1]转变发展方式是我国经济发展面临的紧迫任务,但转型的阻力很大。突破阻力、促进发展方式转型是需要进一步研究解决的重大现实难题。本文认为,现代博弈论可以为我们解决这个问题提供有益的启示。

一、博弈论及其对分析发展方式转型难题的适用性

博弈论(Game Theory)又称对策论,已经成为一门世界性显学,应用十分广泛。博弈论是研究不同社会主体在给定约束条件和互动背景下,为获得最大化利益,选择最优策略的决策方法。其实质是具体地研究不同利益主体如何分配社会利益并构建利益格局的问题。可以从三个方面把握博弈论的含义:其一,参与博弈的局中人(players博弈参与人)要解决的问题是如何决策才能最大化自己的利益;其二,不同主体在一定约束条件下做出争取利益最大化决策;其三,一定的社会主体在与他者互动的过程中争取最大化利益。著名博弈论学者罗伯特·奥曼(Robert J.Aumann)和瑟吉由·哈特(Sergiu Hart)认为:“博弈论研究那些决策会相互影响的决策者们[参与人(players)]的行为。术语‘博弈’一词来自互动决策问题。”[2]14也就是说,博弈论是研究互动行为的理论。博弈论的贡献大大深化和具体化了互动背景下人类行为的研究,富有极强的启发性和可操作性。

由上可知,博弈论的理论前提是经济人假设。其实,博弈论还有另一个前提:利益多元化。如果人们的利益完全一致,就不存在不同利益主体围绕利益进行博弈和争夺的情形了,也就不存在研究博弈问题的博弈论了。在公有制为主体、多种所有制共同发展的社会主义市场经济体制下,合理的局部利益和个体利益得到承认和肯定。在根本利益一致的前提下,人们之间的具体利益出现分歧,利益多元化是不争的事实。竞争是市场经济的灵魂,而竞争的本质就是博弈。这样,博弈论在我国具备了应用的前提条件。

例如,我们可以运用博弈论研究当代中国的发展方式转型问题。从政治经济学的角度看,传统发展和科学发展分别对应不同的发展方式,形成两种不同的利益关系和利益格局,这两种利益关系和利益格局是对立的,科学发展的利益障碍来源于传统发展方式下形成的利益关系和利益格局,依靠传统发展营生的生产关系主体或利益主体阻碍科学发展,因为科学发展损害其利益,威胁其生存。可见,发展方式转型的难题在于如何突破与传统发展相应的利益格局[3]。那么,如何破解这一难题呢?博弈论可以给我们很多有价值的启发。

二、零和博弈、共赢博弈与发展方式转型策略

(一)零和博弈与共赢博弈

从博弈结果来看,可把博弈分为零和博弈和共赢博弈。零和博弈即博弈双方一方的收益意味着另一方的损失,即一方所得正好是另一方所失、一方的幸福建立在另一方的痛苦之上。博弈双方的收益之和是“零”,而且永远是零,双方利益是根本冲突和对立的,双方没有合作的可能。“在(两人)零和博弈中,局中人2的盈利正好是局中人1盈利的负值。因此,两局中人的奖励是截然相反的——一局中人赢当且仅当另一局中人输。”[4]129历史上的大国关系,几乎所有新兴大国的崛起都是通过战争手段获取财富和领地,通过战争取代老牌大国的地位。古希腊历史学家修昔底德在其名著《伯尼奔尼撒战争史》中提出了著名的“修昔底德陷阱”理论[5],揭示的就是历史上强国之间的零和博弈,结果两败俱伤。

与零和博弈相对的是共赢博弈,即在博弈的局中人之间通过竞争达到共赢的局面,共赢的结果是利人利己,至少是利己不损人,通过合作赢得皆大欢喜的结局。比如两人分割一块蛋糕,其中一人多得另一人必然少得,此为零和博弈;如果转换思路,两人在竞争过程中把蛋糕做大,每人分得的蛋糕因此不断增加,则这种博弈是共赢博弈。

(二)积极利用共赢博弈推动利益格局的优化和发展转型

利益调整的方法有激进的方法,也有渐进的方法,激进方法一般是零和博弈的方法,渐进方法一般是共赢博弈的方法,这两种方法各有利弊,应根据实际情况搭配使用。调整利益格局的一个稳妥的做法是增量调整激进为主、存量调整渐进为主,这是改革开放以来比较成功的策略[6]。为什么成功呢?因为采取了共赢性改革策略,阻力较小。共赢性改革的本质是帕累托改进,“在福利经济学里,帕累托改进指的是在不损害其他人的前提下改善某个人的福利的资源配置变动”[7]。帕累托改进型的利益格局调整可减少阻力。

在发展方式转型调整利益格局的过程中,要慎重决策,努力通过共赢博弈的方式实现帕累托改进型的利益格局调整。发展方式的转型,往往需要进行多方面的利益调整,理性的做法是首先选择和挖掘共赢性的帕累托改进,为改革和利益调整聚集人气,赢得社会的拥护。这是利益格局调整和改革必须坚持的一个重要策略。在我国企业并购案例中,政府鼓励兼并企业安置被兼并企业职工。这种做法曾经受到自由主义人士的指责,认为政府干预企业是不对的,不符合构建现代企业制度的改革的定义。其实,从社会大局来看,这种干预是必要的,它保证了市场博弈的共赢结果,实现了帕累托改进,减少了产业升级的阻力和震荡。再比如,如何解决产能过剩问题?按照新自由主义人士的办法,就是让市场竞争自然淘汰了事,政府不用操心。但是政府必须考虑过剩产能淘汰导致经济增长下滑和失业增加及其引起的种种问题。而产能转移与合作可以减少震荡和争取共赢,即把具有一定价值的过剩产能转移到落后国家或地区去,如从东部地区转移到中西部地区,可以消化一部分过剩产能;特别需要指出的是,近几年我国政府大力推动国际产能合作,创造条件,使中国与其他国家进行产能合作,是一个十分经典的帕累托改进——“目前,许多国家对基础设施建设和推进工业化的需求很大,而中国很多装备和产能质优价廉,综合配套能力强。李克强指出,支持中国装备走出去和推进国际产能合作,在扩大产品进出口的基础上叠加产业出口,不仅注重消费品更注重投资品出口,既利当前、更惠长远,能实现各方共赢。这有助于顶住经济下行压力、拓展中国发展新空间,有利于相关国家加快发展、扩大就业,并可为中国与发达国家合作开拓第三方市场创造更多机遇。”[8]中国倡导和推进的“一带一路”倡议和组建“亚洲基础设施投资银行”的意义是多方面的,其中一个重要方面是可以消化改革开放以来中国形成的巨大的并正在日益过剩的产能,同时可以有力促进“一带一路”沿线国家和地区的发展。这也是典型的帕累托改进。

(三)零和博弈条件下如何推动利益格局转变和发展转型

调整利益格局不可能总是共赢结果和帕累托改进,也有许多零和结果,这种利益调整就是零和博弈式的。当不破除一些既得利益就无法实现发展方式转型的时候,就要积极集聚“势能”,在风险可控的情况下,果断采取激进的方式突破既有利益格局,大胆调整存量利益格局,勇敢改革,破旧立新,构建新的、符合科学发展方式的利益格局,从而促进发展方式转型取得实质性进展。例如,对于污染型企业的增长、对于权钱勾结形成的利益链、对于“假冒伪劣”和“坑蒙拐骗”的获利等,必须采取强硬措施加以解决;对于行政垄断形成的利益和国企高管不正常的高薪等,要坚决改革和调整。当然,动这样的“奶酪”需要巨大的勇气和高超的智慧。所谓巨大的勇气就是不能惧怕阻力,不被风险吓住;所谓高超的智慧,就是要在风险可控的条件下动手,以免引起社会动乱和打乱经济发展步伐。

对于一般性的有违发展方式转型的既得利益,也要积极调整,但要尽量想办法将零和博弈转变为共赢博弈。例如,我国资源价格严重扭曲,价格被人为压低,导致价格不能反映资源的稀缺情况,使得浪费资源和破坏环境的粗放型增长方式长期得不到根本改变。因此,为了科学发展和可持续发展,资源价格改革势在必行。但资源价格改革涉及的面太大,其关涉到的对象不仅有大量企业,而且有广大低收入群众和贫困群众。如果资源价格理顺,那么对于科技实力强的企业和资源开发企业和地区是有好处的,也有利于发展转向集约型的科学发展方式;但必定增加低收入群众的经济压力。此时,可以考虑把这种一方赢而另一方输的零和博弈转换为共赢博弈,具体做法是:在理顺资源价格的同时,为利益受损的一方或几方提供帮助或补贴,即给低收入群众提供一定的补贴,具体操作上可采取类似阶梯水价的机制,使得低收入人群基本生活不受影响。这样,本来是零和博弈的利益调整,变成了“使每个人的利益都增加,或者至少使一部分人的利益增加同时又不损害其他人的利益”的帕累托改进,即共赢博弈。这样,为促进发展方式转型进行的利益格局调整就会得到全社会成员的拥护。

零和博弈的典型情形是所谓的“囚徒困境”,下面进一步分析如何突破发展方式转型的“囚徒困境”。

三、突破发展方式转型的“囚徒困境”

(一)囚徒困境[9]

囚徒困境是一种重要而常见的博弈,其中的囚徒A和B,是博弈中的两个局中人,当然,现实生活中往往不止有两个局中人,但为了简化和便于分析,这里选择两个局中人的博弈类型,三个及以上的局中人的情形原理与此类同。

图1 “囚徒困境”矩阵

囚徒困境的内容是,假设警察抓住了两个犯罪嫌疑人A和B,并告知他们政策:他们可以选择坦白或不坦白,但后果不一样:如果一个人坦白而另一个不坦白,那么坦白者立即释放,不坦白者判刑6年;如果两人都坦白,那么每人都判刑3年;如果两人都不坦白(抵赖),那么由于证据不足,每人关押1年后释放。在这种情形下,两个囚徒会如何选择呢?

博弈论假设局中人都是理性经济人,即都追求自己利益的最大化(当然包括追求自身损害的最小化)。那么追求利益最大化和损害最小化的局中人A和B会如何决策呢?“囚徒困境”示意图(图1)显示了分析过程,先来看看A的决策,他会思考和权衡:如果B不坦白,自己也不坦白,则自己判刑1年,而自己坦白则免于判刑;但A自己无法保证B不坦白,万一B坦白了,而A自己选择不坦白,则自己就惨了,要判刑6年,B却无罪释放;显然,A的最优决策是选择坦白。可见,无论B作何选择,A选择坦白是最安全和最有利的。作为同样是理性经济人的B,其思考和决策过程与A完全一样,即无论A作何选择,B选择坦白是最安全和最有利的。这样,形成了(坦白、坦白)这样的博弈决策组合,其支付结构是(-3,-3)。这样的支付结构或利益分配格局,比起策略组合(不坦白,不坦白)的支付结构(-1,-1)要差。可以看到,作为两个理性经济人,各自处心积虑算计和权衡,最后的收益却不是最理想的,而是两败俱伤。可见,每个人都追求自身利益最大化,结果不一定最佳,集体利益和每个人的利益没有实现最大化,损失没有实现最小化。这就是“囚徒困境”揭示的悖论,它在社会生活中具有普遍性,发展方式转型也面临这样的困境和悖论。

(二)发展方式转型面临的囚徒困境及其化解

在我国发展方式转型过程中,遇到大量囚徒困境之类的难题,需要寻求破局之法,以调整和优化利益格局,促进发展方式的转型。下面分析两个典型案例:

案例一:企业环保囚徒困境及其破解

发展方式转型要求保护环境,由高碳发展转向低碳发展,由黑色发展转向绿色发展;但是由于囚徒困境的局限,经济发展往往很难实现这种转型。美国著名经济学家保罗·萨缪尔森在《经济学》一书中,提供了一个著名的囚徒困境例子。在不受管制的环境下,每一个追求利润最大化的企业都宁肯污染环境,也不愿意安装昂贵的污染处理设备。在这种环境下,如果一个企业采取利他主义态度,率先安装处理污染的设备,那么,它就会增加生产成本,产品价格上升、客户也会因此减少。如果该项成本增加到足够高,则企业甚至会破产。这样,为了降低成本,所有的企业都不安装污染处理设备。但是环境污染得不到治理,越来越恶化,最后整个社会成员(包括那些排污的企业主及其员工)都是环境恶化的受害者。[10]

怎样破除这一囚徒困境呢?办法是制定和实施奖惩的法规或措施。具体做法可以这样:其一,对不进行污染处理的企业实行处罚,处罚引起的成本高于其不安装或不运行排污设施节约的成本。其二,对于环保模范企业,可以政府采购优先,从而扩大产品销量,获得更大的利润;可以由新闻媒体报导,提高其社会声誉,引起消费者的关注和信赖,从而扩大销量,获得更大的利润。实行这些环保措施后,积极增加环保投入,实行清洁生产、绿色生产,就是每一个理性的企业的自觉选择了,这样经济增长与环境保护实现双赢,包括企业主和企业员工在内的所有社会成员,都从中受益。

案例二:企业创新囚徒困境及其破解

创新驱动是发展方式转型的重点和根本,而企业是创新的主体。但是企业往往陷入创新囚徒困境,严重制约创新。这里的创新包括技术创新、商业模式创新等。不创新的经济很难持续增长,效益和效率很难提高,但创新是需要付出高昂成本的,而且失败的几率很大,这是所谓的“不创新等死、创新找死”之说的由来。因此,一般的企业都等着别人创新,如果失败了,自己规避了风险;如果成功了,自己可以跟进和模仿。这一决策看来是很理性的,但是大家都这样思谋和决策,结果是都没有行动,谁也不愿意第一个“吃螃蟹”,创新无法进行,陷入创新囚徒困境。

怎样破解这一困境呢?第一,政府切实地保护知识产权,保护创新成果;第二,政府资助创新失败者,率先创新者如果失败了,政府给予补偿,如成立创新失败补偿基金,减少创新失败造成的损失;第三,运用市场的办法,推动社会和市场风险投资的形成和发展,通过风险投资分摊和分散创新失败的成本;第四,推动形成创新文化;第五,倡导和推动形成宽容失败的文化,摈弃“成者为王败者为寇”的传统观念。创新失败者是光荣的,不仅不应该受到歧视,而且应该给予精神的安慰和实际的帮助。失败是成功之母,创新失败者得到精神的安慰和实际的帮助,就有机会在以后的创新活动中取得成功。

如果真正采取上述各种措施,创新囚徒困境一定会被打破,并形成企业和社会成员竞相创新、人人创新、万众创新的可喜局面,那么创新驱动的发展方式就能形成。

四、推动有利于发展方式转型的纳什均衡的形成

我国政府为推动发展方式转型可谓殚精竭虑,做出了巨大努力,出台了各种措施,但一些措施的效果却差强人意,其重要原因是,我们针对问题推出措施的时候,往往没有充分考虑到措施的可行性、可落实性问题,没有充分考虑到解决问题的措施的落实需要付出成本的问题,从而导致很多措施要么束之高阁,要么大打折扣。怎样解决这一问题呢?博弈论启发我们,制定推进发展方式转型的政策措施和制度安排,要尽量形成有利于发展方式转型的纳什均衡。

所谓纳什均衡(Nash equilibrium)是一种所有局中人的最优决策组合,给定这一组合中参与人的选择,没有任何人积极改变自己的选择。就是说,如果在博弈之前,所有的局中人达成一个协议,在不存在外部强制执行的情况下,每一个人都积极遵守这个协议,那么这个协议就构成一个纳什均衡[11]。

当我们推出促进发展方式转型的措施和制度安排构成纳什均衡时,相关各方和人员就会自觉执行有关制度,相关措施就容易落到实处,有利于发展方式的转型。

但是,需要特别指出的是,并不是所有纳什均衡都是好的,即不是所有的纳什均衡都有利于促进发展方式转型。事实上,有一些坏的纳什均衡,虽然大家都遵守,甚至是很自觉地遵守,但是却不利于发展方式转型。例如前文说到的环境保护囚徒困境、创新囚徒困境,都是坏的、不利于发展方式转型的纳什均衡。再比如,为了适应知识经济发展趋势和创新驱动的发展要求,我国早就提出了从应试教育转向素质教育的理念,并且政府、有关方面和许多专家都充分论证和说明了素质教育对个人、家庭和国家的巨大意义,启发了人们的认识,家庭、学生、学校也都认识到了应试教育的危害性,对其提出了严厉的批判,希望素质教育理念得到贯彻。但是,在当下中国,素质教育理念只是引起人们头脑一阵骚动,实践中几乎没有任何改变,应试教育反而越演越烈,家庭、学生、学校都全力投入应试教育,乐此不疲,素质教育理念已经被大多数人抛诸脑后了。原因是什么呢?从博弈论的视角来看,原因在于我们的教育体制已经形成了一个与应试教育相适应的纳什均衡。具体来说,中考和高考仍然是唯分数论,这一制度安排决定了应试教育的纳什均衡。就是说,补课、灌输式教学、题海战术、牺牲综合素质提升将几乎所有时间投入应试科目的学习。这些应试教育措施,如果一部分人抵制,但其他人不抵制,那么不抵制者升学考试得高分、进入名校,而抵制者相反,升学考试分数不高、无法进入名校。那么,理性的人怎么选择呢?学校、家长、学生都不约而同地选择应试教育,不需要谁去动员和监督,大家会自动做出如此决策或选择,从而形成了一个应试教育的纳什均衡。但是,这是一个坏的纳什均衡,一个不适应创新驱动发展要求的纳什均衡,必须打破!思路是:重新设计有关制度,把素质教育设计成为一个纳什均衡,破解应试教育纳什均衡。当然这种新制度设计还在探索之中,很艰难,但方向是正确的,应该坚持下去。

下面分析发展经济如何让保护环境成为一种纳什均衡。前文提到环境保护的囚徒困境,政府可以采取奖惩措施予以破解。但是,环保法却几乎形同虚设,被戏称“没有长牙齿的环保法”。为什么环保法无法有效落实呢?从博弈论的角度看,就是现有制度和政策下,环保法无法形成一个纳什均衡,导致各方面执行的积极性不高。环保法的执行涉及到中央政府、地方政府、相关企业、企业员工、企业周边居民等。中央政府站在全局高度希望环保法得到贯彻,污染企业的周边居民是直接受害者,也希望真正落实环保法。但是,作为局中人的企业出于成本的考虑,同时担心如果其他企业不遵守而自己遵守,自己就会吃亏,所以企业的决策或选择就是不执行或假执行环保法。再来看另一个局中人地方政府,在目前的财税体制和政绩考核体制下,如果因为污染而关停企业,地方政府的税收会受到损失、政绩考核会较差、关闭企业带来的失业也会给地方政府带来巨大的压力,因此,作为理性人的地方政府,自然不会认真、严格执行环保法,对所辖地的企业尽力偏袒和保护。这样,各方就不可能自觉遵守环保法了[12]。

如何突破困局?博弈论启发我们,必须改革相关的规则或制度:第一,改革地方官员政绩考核制度[13],降低GDP在政绩考核体系中的权重,较大提升环境保护的权重,从而促使地方政府自觉地在不污染环境的前提下发展经济和增加GDP。第二,加大对企业污染环境的处罚力度,使得企业受到的处罚大于排放污染物节约的成本,企业就会自觉地在保护环境的前提下发展生产,例如,构建生态环境损害赔偿制度[14],该制度能够促使造成生态环境损害的企业承担相应赔偿责任,企业便会因利益受损而自觉减少对生态环境的损害[15]。第三,设置排污产权,将排污权商品化,可交易化,通过市场方法激励企业节能环保。于是,环境保护的纳什均衡就可以形成了。

猜你喜欢
局中人坦白囚徒
基于可信度方法在严格优势策略中的算法研究
张一山、潘粤明联手 演绎《局中人》
机智的囚徒
2×2型博弈决策均衡的归一化解法
中文的魅力,老外理解不了
超对策模型中多形式结局偏好认知信息融合的0—1规划方法
囚徒
真情告白
论坦白的处遇
论男性出轨者的囚徒困境