蔡鑫桦,孙亚南,陆凌凡
(1.中共南通市纪委,江苏 南通 226000;2.南通大学 商学院,江苏 南通 226019)
博弈论对廉政教育的启示
蔡鑫桦1,孙亚南2,陆凌凡1
(1.中共南通市纪委,江苏 南通 226000;2.南通大学 商学院,江苏 南通 226019)
博弈论是研究复杂条件下人类行为的一种工具,廉政教育过程中教育者与被教育者行为之间也存在着博弈现象。廉政教育者应重视运用博弈理论的方法与策略,寻求积极主动的方式,顺势而为、因势利导,充分考虑受教育者“对策”选择,作出相应的“政策”调整,让教育者的“政策”与受教育者的“对策”在思想交流交融中趋同。运用博弈论分析廉政教育过程,为廉政教育研究提供了新的视角与路径方法。
博弈论;廉政教育;理性人;均衡状态
社会是由不同群体的人组成的,不同的群体形成了不同的结构,一个群体之间的相互作用的结构形成一个博弈。党员干部就是由不同类型的人构成的一个集合体,这个群体之间的相互作用同样会构成博弈。廉政教育的目标是通过教育者的教育活动,形成教育对象稳定的思想道德品质,促使廉政教育对象廉洁从政、从业,从而在社会生活中表现出良好的行为。本文运用博弈论的方式,力求从经济学中理性人的视角,解析廉政教育过程中的博弈现象,分析廉政教育中存在的博弈困惑,以期提高廉政教育的针对性和实效性。
博弈论(Game Theory)研究的是各个理性决策个体在其行为发生直接相互作用时的决策及决策均衡问题。[1]1928年,冯·诺依曼证明了博弈论的基本原理。博弈论属于应用数学的一个分支,博弈论主要研究人们如何运用已有的信息进行决策的问题,为实现自己的目的,寻找出最佳合理的解决方案,即所谓的均衡状态。当然这些博弈论分析是有前提条件的,如:“博弈的目的是为谋取个人利益最大化;博弈双方都具有充分的理性,并具有充分的选择的自由;博弈的规则是平等的,因而可以保证合理的预期能够实现。”[2]
博弈我们经常翻译为“游戏”,但实际意义上是一种策略选择。博弈论是指某个人或一个团队组织,处于特定的外部环境和选择条件下,遵循一定的规则,依靠自身已经拥有的信息,同时或先后,若干次从各自允许选择的行为或策略进行选择和并加以实施,并从中各自获得相应的结果。博弈论通常包括四个基本要素:博弈者或称为局中人;策略选择;博弈双方的利益;相关信息。人们常常讨论的“囚徒困境”就是典型的例子。
博弈论的对象被认为是理性的,在目标选择上,博弈双方都应该追求自己的利益最大化。博弈论不仅在经济学中被广泛应用,而且被广泛运用于管理学、社会学等人类行为分析的学科中。在零和博弈和多人的合作关系中,博弈的一个合理的结果是一个组合的策略,每个博弈都不能通过单方面改变自己的战略利益,双方都不愿意调整自己的策略,在对方给出的策略,每一场比赛的策略是其他游戏的选择策略最好的响应。这就是所谓的纳什均衡。考虑别人的策略,自己选择最佳的策略。博弈论是研究复杂条件下人类行为的一种工具,博弈论研究人类行为时着力关注两方面的问题:一类是信息问题,即博弈双方掌握对方信息和规则的情况,在现实社会中,由于信息不对称带来的博弈问题随时可见,如卖方向市场推出低质量商品;国有企业由于产权所有者实际缺位,往往带来监督缺失、产权管理不清晰等问题。第二类是时序方面,即博弈双方的行动策略先后给对方带来的影响,换句话说是你的决策将影响对方,对方的决策也将影响你,这是一个相互带来影响的问题。
廉政教育是构建“不敢腐、不能腐、不愿腐”机制中的一个重要环节,也是预防腐败现象产生的第一道防线。加强对党员领导干部的廉政教育,是营造风清气正环境的重要途径,也是减少和解决腐败问题最高效最经济的手段。习近平同志始终突出廉政教育的重要作用,在多个场合阐述了加强廉政教育的重要作用。他指出,一名领导干部的蜕化变质往往就是从生活作风不检点、生活情趣不健康开始的,往往都是从吃喝玩乐这些看似小事的地方起步的。如果领导干部生活作风上不检点、不正派,在道德情操上打开了缺口,出现了滑坡,那就很难做到清正廉洁,很难对社会风气起到正面引导和促进作用。[3]肯·宾默尔认为,一个社会契约要想具有可行性,必须是一个生存博弈的均衡。然而,这种生存博弈的均衡可能是非唯一的,道德博弈则可能是附着在其中的某个均衡上的。因此,人们的道德博弈也就是在生存博弈中选择出符合社会规范的均衡。[4]
当前,由于廉政教育面临日益多变的形势,挑战日益增多,将博弈论引入廉政教育无疑具有现实意义。将博弈思想引入廉政教育,是因为廉政教育活动与博弈活动具有类似性,通常情况下。廉政教育是把廉政教育说服与制度约束规范结合起来,以促进廉洁从政为目的的多形式感化、教化活动。教育者与被教育者在廉政法律制度规定的要求下,通过相互影响,使受教育者树立起廉洁诚实守正的信念,形成廉洁的感觉,培养一种廉洁的意志,提高诚信的意识,养成廉洁的习惯。教育不是一个自然而然的过程,而是通过一个有意识的过程来达到最好的效果;不是一个简单对原则制度的诠释,而是一个动态的过程,动态的调整;不是一个具体的目标,而是通过教育者与被教育者思想交锋与互动,使一个受过教育的人从被动到主动的接受过程,是一个多重选择的博弈。
一般来说,廉政教育的过程是让人学会正确选择,做到这一点关键在于按照教育者的要求去做,廉政教育过程中双方采取的行为和策略都受到对方的影响,二者之间既有合作又有对抗。廉政教育者和受教育者的主、客体关系中双方都是平等的,均可假设为理性人。现实生活中,廉政教育者往往遇到这样的疑惑:一些党员干部非常清楚违纪违法的后果,理应遵规守纪,以党和国家的利益为重,但结果往往知行不一,最终走上违纪违法的道路。这种情况不能简单地定义为教育失灵或教育无效,是各种因素影响的结果。教育过程常常表现为教育者与被教育者面对面的思想交融、交流、交锋,如果运用博弈论的方式表达这种情形,就是教育者与被教育者的博弈,这种包围与反包围、渗透与反渗透构成了一种博弈关系。这里我们不妨借用博弈理论架构来进行分析:
1.廉政教育过程中的局中人。是指参与廉政教育过程的教育者和受教育者。这里的廉政教育者既包括廉政教育实施主体,也包括廉洁从政的环境。廉政教育的教育者和受教育者都是社会群体的一部分,主要是同志之间的关系,当然有时候也包含一部分管理与被管理的关系。既然双方当事人总体上是平等的主体,可以在思想上互相交流交锋,通常情况下这种博弈是非零和博弈。在纪检监察机关践行“四种形态”时,尤其是第一种形态的谈话函询过程,教育则表现为非此即彼的零和博弈。
2.廉政教育过程中的策略。是指廉政教育双方即局中人在实际行动组合中选择一种行动,所以行动表现为一种决策。对于局中人来说,还有一个行动顺序问题,比如甲和乙同时行动,或甲行动后乙再行动。人们常说的上有政策、下有对策,说的就是这个道理,受教育者对于廉政施教者的思想是否定还是接受,是选择性接受,还是全盘同意。对于教育者来说,不能回避博弈思路,应当顺势而为、因势利导,让教育者的“政策”与受教育者的“对策”在思想交流交融中趋同,所以,廉政施教者应当寻求积极主动的方式,吸收博弈策略思想,充分考虑受教育者“对策”选择,作出相应的“政策”调整。
3.廉政教育过程中的信息。这里的信息是个集合体概念,既包括教育者和受教育者各自的“围地”环境信息,诸如在日常工作、学习、生活中接受的廉政方面的咨询信息,也包括对对方的知晓程度,如心理状态、个性特征、气质类型,以及对方是对抗、竞争还是合作的行动选择等。一般来说,廉政教育过程中的信息是不对称的,廉政教育过程实际上是一个信息传输的过程。
4.廉政教育过程中的行动策略。是指廉政教育双方即参与人在一定信息条件下的决策内容,是博弈各方可以选择的全部策略或策略选择。对受教育者来说,是遵从廉政制度规定,还是采取对抗的举措,或者是表面上的遵从,例如一边贪腐一边装出两面人。对教育者来说,是采取灌输教育,还是采取激发内心的平等交流等诸如此类的举措。
5.廉政教育过程中的均衡状态。是指廉政教育双方即局中人在博弈结束后取得的最佳策略的结合。在廉政教育的过程中,教育者通过感化引导,受教育者的思想产生变化直至内化的过程,是一直在不断作出调整的过程,从而在最后一次实现了现状的平衡。然而,这种平衡不一定等于双方所期望的目标。这很好解释了一些贪污腐败分子边收钱、边上缴的两面人的心理。这说明廉政教育发挥了一些作用,但是仍然采取不合作的态度,
6.廉政教育双方的博弈结果。是指廉政教育者和被教育者经过博弈之后所达到的结局。这种结局既含有了一系列最佳战略的组合,也包括了达成博弈结局的最佳目标组合等。它通常表现为廉政教育双方的实际行动、目标战略处于相对均衡的一种状态,即教育者和被教育者的任何一方均没有要改变现状的意愿。
我们把上述基本分析概念置于一个统一的分析框架中,意味着我们在分析任何一次廉政教育过程时,都必须具体分析这六个基本方面的情况。上述的理论模型充分说明了廉政教育过程的多变性、多样性和多面性,教育者竭尽所能,采取各种办法开展廉政教育,但教育效果总是难以如愿,甚至有时还事与愿违,这是廉政教育最大的困境。引入博弈论可以对此进行有效的解释,为增强廉政教育实效性提供新的路径和方法。
运用博弈论研究廉政教育过程,更加注重从教育双方互动的角度去建构逻辑一致的理论模型,它能够为廉政教育指明新的研究路径:
1.研究廉政教育双方在教育过程中理性行为反应。社会上绝大多数人都以理性来规范自己的思想与行为。从某种意义上说,廉政教育效果与受教育者的偏好关联,在廉政教育过程中,潜在的违纪违法者在违纪违法行为的“收益”高于“成本”的情况下,更有可能选择实施违纪违法行为,在压力小、机会多的情形下,受教育者可能对违纪违规问题进行自我合理化;否则,就更有可能选择遵纪守法。与违纪违法者的斗争,是一场非合作的不完全信息动态博弈。因此,要加强对受教育者理性判断基础的研究,在具体设计、制定和实施廉政教育时,要全面把握廉政教育中博弈各方的战略目标、优劣势、成本与收益等,最大限度地发挥廉政教育的优势,最大限度地减少腐败方的“收益”,使潜在违纪者在确立的政策、制度和规则范围内作出理性的选择。同时也要尊重被教育者理性选择的事实,在利己与利他做出选择时,给予适当的利己,即维护一定的自身利益,这符合价值观固化条件下成年人廉政教育的规律和特点,从而实现个人理性与集体理性相统一。
2.研究廉政教育过程中存在的一些普通性问题。一些反腐败教育的研究结果表明,反腐败教育过程中存在着一些问题:(1)在教育过程中的冲突表现了理性人无处不在的困境。在思想教育的过程中,教育者和受教育者的一致行动会导致一个双方都是最优的结果。然而,在实际过程中,它可能会采取相反的一致的行为,导致非最佳结果。(2)廉政教育过程中搭便车的行为。教育过程中,教育者不是真正做到入心、入脑式的施教,而是搞形式上的走过场;受教育者不是认真开展批评与自我批评,采取消极抵触或者回避态度,以求蒙混欺骗教育者,这样的廉政教育效果必然是大打折扣的。(3)廉政教育的主体形象、自身的威信和清廉度欠佳。教育者自身不够廉洁,难以取得受教育者的信赖和认同,甚至可能导致产生排斥的心理。教育者与受教育者之间互相不合作,这样的廉政教育根本难以进行下去,廉政教育的效果可能是负面的。(4)教育的方式方法问题。苏联教育家苏霍姆林斯基说:“教育者的教育意图越是隐蔽,就越是能被教育对象所接受,就越能转化为教育对象自己的内心需求”[5]。要抓住博弈双方理性一面,在利己与利他中寻找最佳的均衡点,寻求最佳的结果。寻找那个均衡点,就是要依靠恰当的教育方式,注重教育内容的选择,挑选合适的教育者,配以有力的廉政制度设计和高明的教育艺术。
3.研究信息这个要素在廉政教育过程中的作用。博弈双方的行动策略受到对外部环境信息的影响。一方面要提高博弈双方对党纪法规的知晓度,形成清晰的认知,改变一些党员干部通过大众媒体或微信、微博等网络媒体获得的资讯往往不够正确真实、客观全面的现象。另外一方面,注意受教育群体之间的信息交流,亲友之间在“小圈子”中的信息传递,相互之间产生的影响。边际效用递减规律告诉我们,消费者在消费物品时,每一单位物品对消费者的效用是不同的,它们呈递减的边际效应。就廉政教育而言,党员干部作为廉政教育的“消费者”,他们的需求也在逐渐递减:从幼儿时期开始,就接受到思想道德方面的教育,到了成年人则已经达到了“需求”的最低值。因此,要努力通过教学方法的改进,进行“供给侧”改革,激发受教育者的兴趣。
4.研究廉政教育中的重复博弈的情形。在实践中,廉政教育者都有过反复做某个被教育者思想工作的现象,是多次博弈的结果,亦称之为重复博弈,最终达到均衡结果。长期的重复博弈经验使每个博弈方对别人的行动积累了一定的经验,熟悉对方策略选择的惯有倾向。博弈方凭借这些经验,修改自身的预期,制订不同情况下的行动策略,这就要求我们从博弈论角度研究这种反复。这些重复博弈是如何发生的?教育者与被教育者是否存在合作的可能?博弈双方策略选择倾向的预期与其行动规则如何达成一致,使得博弈各方的策略选择趋于稳定?对这些的研究将有助于深化廉政教育理论。
5.研究廉政教育过程中机制设计问题。教育者作为理性经济人,面对有限的时间和精力,倾向于以最小的投入换取最大的收益。廉政教育工作通常是由一级组织委托某个代理人或组织来实施,该一级组织与教育者构成了典型的委托代理关系。由于信息不对称,委托人无法从表面上看出教育者的努力水平,但工作的最终成果是可观测的。应设计有利的激励机制促使教育在实现个人效用最大化的同时,实现预期收益的最大化。
总之,运用博弈论方法,有利于帮助我们适应反腐败新常态,开拓廉政教育工作的新领域,探索反腐败教育工作新的模式,进一步提高廉政教育的创新性、实效性和针对性。当然,使用博弈理论来研究廉洁教育的过程,不能直接用经济学分析中的博弈方法分析,需要借助于统计概率论和行为研究学以及心理研究等理论与方法,对博弈行动做定量和定性分析。只有这样,才能找到真正科学管用的方法。
[1]胡希宁,贾小立.博弈论的理论精华及其现实意义[J].中共中央党校学报,2002(2):48-53.
[2]张维迎.博弈论与信息经济学[M].上海:上海人民出版社,2003.
[3]习近平.之江新语[M].杭州:浙江出版联合集团,2013.
[4]肯·宾默尔.博弈论与社会契约:第1卷[M].王小卫,钱勇,译.上海:上海财经大学出版社,2003.
[5]郑付海,当代大学生思想政治教育策略的研究[J].枣庄学院学报,2009(4):94-96.
责任编校 王学青
Enlightenment of Game Theory to the Education of Honest and Clean Government
CAI Xinhua1,SUN Yanan2,LU Lingfan1
(1.Commission for Discipline Inspection,CPC Nantong Committee,Nantong 226000,Jiangsu,China;2.School of Business,Nantong University,Nantong 226019,Jiangsu,China)
Game theory is a tool applied in the studies of human behaviors under complicated circumstances.A similar phenomenon to that of a game can be found in interactions between the educator and the educated during the process of clean governance education.Application of the means and strategies in game theory should be paid enough attention to by educators in their exploration for some active means in accordance with the situation with due consideration of the“reactions”of the educated.Relevant adjustments in“policies”will channel the“policies”of the educators and the“reactions”of the educated into a same medium.When game theory is applied in analyzing the educating process of clean governance,a new perspective and means can be found for further exploration into the education of clean governance.
game theory;education of clean governance;rational individuals;state of balance
D630.9
A
1674-9170(2017)01-0075-05
2016-12-10
蔡鑫桦(1978-),男,江苏启东人,中共南通市纪委干部;孙亚南(1978-),男,江苏南通人,南通大学商学院副教授;陆凌凡(1984-),女,江苏启东人,中共南通市纪委干部。
南通廉政研究中心资助项目(2014YB09)