□陈建先
☆公共行政☆
“选择实验”的博弈分析
□陈建先
博弈价值取向涉及许多方面,而最为重要的应该考虑两个:一是风险收益,二是理性判断。以下从“交换实验”和“诚实实验”来分析人们的博弈思考。
笔者曾经在教学中多次与学生做“交换信封”实验。实验分两次做,第一次让他们(两个学生)把自己的钱包拿出来给我。我在他俩的钱包里分别抽取一部分钱(50元或100元),即学生甲的钱是学生乙的钱的一倍。然后告诉他俩,一个人的钱是另一个人的钱的两倍(但不知道谁是谁的两倍),试问:你们是否愿意交换钱包?做完第一次后,紧接着做第二次:我给两个学生各自一个信封,这两个信封放着不同数额的钱(50元或100元),并且告诉他俩,一个信封的钱是另一个信封的钱的两倍(但不知道谁是谁的两倍),试问:你俩是否愿意交换钱包?你认为,学生是愿意交换或是不愿意交换,为什么?
从表面上看,第一次情况与第二次情况是一样的,但细致思考,会发现二者是不一样的。因为,前者收益与风险并存,后者只是收益的大小。在信息不完全时,人们不是谋求自己的支付最大化,而是尽量使自己的风险最小化,即当会损失自己的利益时,人们会选择规避风险的策略;当不会损失自己的利益时,人们会选择承担风险的策略。在完全信息状况下,人们追求收益的最大化;在不完全信息状况下,人们注意其风险性。从一般理性进行分析,其所确立的观点在理论上是合理的,但在现实中却是相悖的;从博弈理性进行分析,其所确立的观点,在理论与现实中是吻合的。
第一,风险与收益。只要是博弈,都存在着“收益”或“风险”。在现实社会里,其实人们总是在预期的收益和风险中不断地进行选择,是收益大于风险或是风险大于收益。这其中与人们的价值取向、对收益与风险的理解以及社会风险机制的设置有关。行为科学研究表明,对未来预期是影响人行为的重要因素:一种预期收益,即这样做将会有什么好处;一种预期风险,即这样做将会面临什么问题。对未来没有明确的预期,是引发机会主义的关键要素。而只有在稳定性机制作用下的未来,才会有较为明确的未来,才会有相对确定的预期。而人们在利益博弈过程中,更多看到的是“收益”,而不是“风险”,更没有将“风险”与“收益”进行一些测算。在第一次交换的情况下,俩人唯一的信息就是自己手中的钱(数额)。从一般思考(用概率来思考),学生甲肯定知道自己钱包里的钱是多少,但不知道学生乙的钱是多少。那么,怎么来判断?学生甲会这样来设想:对方要么是自己的两倍(如果自己愿意交换,会赢得一倍的收益),要么是自己的一半(自己会输掉一半的钱)。假设学生甲的钱是100元,学生乙的钱是200元。学生甲愿意进行交换,将会有100元的预期收益;假设学生甲的钱是100元,学生乙的钱是50元,将会有50元的预期损失。即预期收益(100元)-预期损失(50)=50元,即预期收益大于预期损失(50元)。通过以上分析,学生甲进行交换是划算的,所以他愿意进行交换。同理,学生乙也愿意进行交换。但是,从博弈思考(用倒推来思考),其结果就不一样了。俩人是否愿意交换有一个基本思路:对方钱的数额小,就愿意“交换”,对方钱的数额大,就不愿意“交换”。如果双方都愿意交换:一是基于自己钱的数额很小;二是基于认为对方钱的数额比自己大;三是基于他的对方愿意交换。假如学生甲有800元,他会假设对方一般情况下不会有1600元(因为毕竟是学生),最多只有400元,因此选择“拒绝”交换;假设学生甲只有200元,而对方又愿意交换,说明对方很可能只有100元,因此学生甲也应该选择“拒绝”交换。所以,学生甲总是会选择“拒绝”交换……反之则然,学生乙也会选择“拒绝”交换。最终,学生甲和学生乙都会选择“拒绝”交换。因为,他们通过倒推,发现选择交换的风险很大。
第二,收益与信息。在第二次交换的情况下,两人唯一的信息也是自己手中的钱(数额),但有所不同的是这些钱不是自己的。两个学生是选择“交换”或“拒绝”?其实,俩人都会想到,自己拿到数额大的那份钱的可能性是50%。既然自己赢得数额大的可能性和损失一半数额的可能性各占50%,那为什么不去试着交换一下,反正自己本身也没有什么损失,可以去博一下。选择“交换”就成为俩人(学生甲和学生乙)的必然选择。笔者通过对学生(硕士研究生)的多次实验表明:在第一次交换的情况下,学生不愿意进行交换。因为他们更多的会考虑风险问题(这些钱是自己的);在第二次交换的情况下,学生基本上都愿意进行交换。因为他们认为这些钱不是自己的,愿意用这些钱去冒风险,搏得更多的钱。从表面上看,两种情况似乎很相近,但实质上是有区别的。不论第一次或第二次选择(“不愿意交换”和“愿意交换”),都是运用了博弈理念来思考这个问题,才会得出正确的选择。由此可见,一般理性思考与博弈理性思考的最大不同——是否考虑风险与收益之比、是否考虑对方策略和是否考虑人们的价值取向。
人们在进行“囚徒困境”选择时,最大的困惑是:好的结果(“不坦白”)被否定,坏的结果(“坦白”)被采纳。因此,人们始终不愿意承认自己会选择“坦白”。但是,现实社会大量的事情都说明了,人们最终是选择“坦白”,如教育中“应试教育”与“素质教育”的选择,落后农村在计划生育中“累累超生”的选择,其实都是选择的“坦白”(应试教育、超生养老)。
笔者在培训中,运用“诚实选择”实验,来提升学生对这个问题的认识。所谓“诚实选择”讲的是,以前有一个教博弈论的教授,带了两个学生,第二天要考试了,而学生要去参加一个“聚会”。聚会晚上八、九点钟才开始,半夜才是高潮。如果玩下去,可能会影响第二天的考试;如果回学校,他俩又不甘心,怎么办?俩人商量后,给教授打了一个电话,“教授,我们学习博弈论这门课,非常认真,临考前还进行调研。但很不幸,回学校的路上,车轮胎爆了,始终修不好。如果修好后回来,可能已经是深更半夜,定会影响第二天的考试。教授能不能考虑考虑,把考试的时间延一、二天。”教授回答:“行”。于是,俩人放心地玩了个通宵。
考试那天,俩人翻开试卷,教授就只出了一道题:你们那天出去调研,车轮胎爆了,是哪个车轮胎爆了。诚实回答,可以及格;不诚实回答,就“挂科”。学生选择“坦白”,自然就会及格;选择“不坦白”,就面临两人各自都有四种选择(左前轮胎,右前轮胎,左后轮胎,右后轮胎)。假如两人都选择“不坦白”,就必须对四个轮胎进行选择,如要获得成功,其概率只有6.25%(依照排列组合,16次能选对一次)。因此,在现实中理性也是应该选择“坦白”。
“囚徒困境”及“诚实选择”,这组博弈选择笔者近几年的培训中,曾经做过上百次。两个博弈选择看似很相近,当人们在处于“困境”的状况下,进行选择的结果却差别非常之大。对于“囚徒困境”的选择时,学生90%以上是选择“不坦白”(一个班,往往选择“坦白”的,一般只占6-12%);对于“诚实选择”,学生85%以上是选择“诚实”。
实验表明:第一,“囚徒困境”的选择,是一种追求个体理性的范式,是一种较为抽象、理论理性的思考选择,而“诚实选择”,是一种追求集体理性的范式,是一种较为具体、现实理性的思考选择。在实际选择过程中,学生很难将其分辨,因为这需要很强的理性思维能力。同时,人们在选择过程中,在他人有风险时,往往比较忽略、忽视,呈现出非理性,而自己有风险时,选择相对理性一些。这就给我们一个启示,实施者应与其责任相联系,否则实施者会缺乏风险意识。
第二,在“囚徒困境”选择中,选择坦白的人少,原因是他们没有更多的思考其后果。在进行“诚实选择”实验过程中,每每进行情景模拟时,都要告戒他们,你的四种选择(有四个轮胎的选择)与他的四种选择(有四个轮胎的选择),按排列组合,其概率仅只有6.25%,既使少部分人选择了“不诚实”,当两两相对时,上百次的选择都以“失败”告终。使学生在进行选择时,具有一些风险与收益的预判,且理性细致思考的选择。
第三,在“囚徒困境”选择中,为什么不坦白的比例高,因为他们选择时是处于“非理性”状态的。在“诚实选择”中,为什么选择“诚实”的比例非常大,其根本原因是教授充分运用了信息不对称,使得选择者的选择风险很高,如选择不诚实,其风险:收益比是极其不经济的。所以,这给人们一个非常重要的启示,要使全社会是“诚实”、“理性”,那么,“不诚实”、“非理性”选择的机制风险就应该很高。只有这样,才能引导人们的选择是“诚实”而“理性”的。
1978年诺贝尔经济学奖获得者西蒙认为,人的理性能力是有限的,不可能对所有的可能选择作出精确的利益计算。人在作决策时,采用的是由局部到整体的实验方法,这时要求集体选择达到个体都无法到达的理性是不可能。原因是人的理性能力是有限的:信息是不完备的,个人不知道全部备选方案;环境存在不确定性,外生事件随时可能发生;人的认识能力和计算能力是有限的。而且,人的理性在政治领域表现得更加弱化,一是与经济活动相比,政治活动有更大的不确定性,人的政治行为难以理性化;二是与经济活动相比,人们在政治活动中对自己行为结果所承担的责任并不总是直接的,而且往往不是很确定的,这也淡化了人们进行理性计算的动力。
作者:中共重庆市委党校公共管理教研部教授
责任编辑:张波
重庆市研究生教育优质课程项目“管理博弈论”;重庆市研究生教育教学改革研究项目“现代培训方式与理念研究”。