“美人投票”背后的故事

2020-04-07 17:47李世佳
读者 2020年7期
关键词:坦白纳什博弈论

李世佳

日本漫画家麻生羽吕的作品《弥留之国的爱丽丝》中,有一个叫作“美人投票”的游戏:每位参赛者会在游戏开始前分得一部平板电脑,全员要在1分钟的限制时间内,从1~100中选出一个整数。接下来,求出全员选择的数字的平均数。如果参赛者输入平板电脑里的数字,与平均数乘以0.8所得到的数字最接近,他就获胜。

你会选择哪个数字?

要了解这个游戏背后的玄机,让我们先来谈点儿经济学。

凯恩斯选美大赛

1936年,著名的英国经济学家约翰·梅纳德·凯恩斯在他的著作《就业、利息和货币通论》的第12章里,提到一个选美大赛的例子。

假设现在有一场选美大赛,你需要从100张照片中选择6张最吸引人的面孔,而那些选择了最受欢迎面孔的人将会获得奖励。当然,最简单的办法是选择你认为最吸引人的面孔(1級推理),但是,你如何能够保证其他人和你的想法一致呢?如果你略有心机,可能就会思考什么样的面孔比较符合大众审美,然后基于你自己对大众审美的了解来进行判断(2级推理)。但是,这就是正确答案吗?未必。一个更加老谋深算的人会进一步去思考其他人对大众审美的了解是怎样的,在其他人的思考中,这种平均化的审美到底有哪些不同(3级推理)。

这种思维方式有点儿像俄罗斯套娃,你可以一直不停地去揣测别人是怎样根据其他人的想法来调整自己的想法。就像凯恩斯所说:“我们不是根据自己的判断去选择那些我们认为更漂亮的面孔,甚至也不是根据那些我们所认为的他人的平均意见去进行判断的。我们已经达到第3级水平,即将智慧用于预测那些平均意见是如何预测其他人的平均意见的。我认为这还不是全部,还会有人继续进行第4级、第5级,甚至更高水平的预测。”

凯恩斯因此推论道,类似的行为在股票市场上也起着作用——人们对股票的定价不应该基于他们自己所评估的价值,而应该基于其他人所评估的平均价值,或者其他人对大多数人的估价的预测。

“美人投票”游戏正是基于这样的原理。1981年,阿兰·勒杜首先在他的法语杂志中设计了以“猜数字”为规则的游戏,获胜者是猜出最接近平均猜测数值2/3的人。1995年,西班牙经济学家罗斯玛丽·内格尔首先在实验经济学领域,用“美人投票”的方法来分析人们的经济决策过程,从而研究人们的推理深度。

保持理性与放弃理性

“美人投票”到底有没有必胜的规律可循呢?

我们常常听到博弈论,它是经济学的一个分支,最早出现于1944年匈牙利裔美国数学家冯·诺伊曼与德国经济学家奥斯卡·摩根斯特恩合著的《博弈论与经济行为》一书中。博弈论考虑经济学相关的游戏中的个体可以预测的行为与其实际行为之间的关系,并研究游戏的最优破解策略。1950年,在年仅22岁的美国经济学家约翰·纳什以“非合作博弈”为题的博士论文中,诞生了一个博弈论中的重要概念——纳什均衡。

纳什均衡的基本观点并不复杂:在一场两个人或多人参与的非合作博弈中,无论对方选择什么样的策略,自己只要选择能够让自己的收益最大化的策略(支配性策略)即可;与此同时,其他所有的博弈者也遵循这样的原则,选择自己的支配性策略。这种各自的支配性策略的组合就会形成纳什均衡,并且没有任何一个博弈者可以通过“独自行动”(即单方面改变自己的策略)而增加收益。

加拿大数学家阿尔伯特·塔克于1950年讲述的“囚徒困境”的故事,常常被用来解读纳什均衡。假设警察逮捕了A和B两名嫌疑人,由于没有足够的证据指控二人有罪,于是警方分别向两个人给出同样的选择:第一,两个人都保持沉默(二人相互合作),每人都被判半年;第二,两个人都坦白(二人相互背叛),每人都被判5年;第三,一人坦白而另一人保持沉默,坦白的人立即释放,沉默的人被判10年。对甲来说,由于不知道乙会怎么选,无疑选择坦白是最好的,因为无论乙怎样选择,要么立即被释放,要么被判5年徒刑,都比关上10年要好;而乙八成也会这么想。因此,在这场博弈中,唯一可能达到的纳什均衡就是双方都坦白,同样服刑5年。但是从全体利益来看,两个人都保持沉默其实才是最优选择,这样他们都只需要服刑半年——但是,要做出这样的选择,需要两个人都保持绝对理性。而讽刺的是,虽然我们常常自诩为最理性的动物,现实中的我们却往往是最任性的:我可以保持理性,可我也有放弃理性的自由意志。

“美人投票”的最优解亦是如此。从理论上讲,如果全员都选100,那么平均数乘以0.8就是80,所以选择80以上的数字是没有意义的。但是,这么简单的道理所有人都能想通,大家自然都会选80以下的数字,那么此时平均数乘以0.8就不会超过64,所以选择64以上的数字都是没有意义的。如果一直这么思考下去,推测的次数越多,这个值就会越接近0。

那么问题来了,你会选择0吗?你有足够的信心认定其他人也会选择0吗?

有限的理性

2009年,法国认知神经科学家乔治·科里塞利和内格尔在核磁共振成像仪里再现了“美人投票”的游戏。根据参与者在13轮游戏中的表现,他们被分为低级推理深度、高级推理深度和随机行为(不属于前两种)。他们发现低级推理深度激活了吻侧前扣带回,而高级推理深度激活了内侧前额叶皮层。因此,当我们试图思考其他人是如何思考他人(包括我们自己)的思想和行为时,内侧前额叶在这个过程中起到十分重要的作用。

1978年获得诺贝尔经济学奖的美国心理学家赫伯特·亚历山大·西蒙,提出了有限理性的概念。有限的理性意味着人们会根据自己拥有的信息做出相对合理的决定,但问题的关键在于,我们很难拥有完美的信息,就好像我们永远无法预测别人是如何思考别人,或者无法预测别人是如何思考别人如何思考别人的。这并不是一个绕口令,在这个复杂的社会中,人与人的行为彼此交织,相互影响,尽管预测他人的行为对于做出我们自己的决定至关重要,但是,我们每个人都能够进行多层次的深度推理,就连我们自己也无法确定我们会止步于哪一级的推理,更别提去推理别人的思维模式了。行为科学家常常说,我们甚至无法完美地解释我们所拥有的不完美信息,这也是社会心理学和经济学最让人头痛的地方:我们甚至没有做出最大程度优化我们个人利益的决策,更不用说关系到整个社会和系统的利益的决策了。

不过,这种思维的复杂性和深度,不也是人类思想最让人着迷的地方吗?

(格 致摘自《新发现》2020年第1期,黎 青图)

猜你喜欢
坦白纳什博弈论
THE ROLE OF L1 IN L2 LEARNING IN CHINESE MIDDLE SCHOOLS
PBL教学法在博弈论与信息经济学课程改革中的应用初探
THE ROLE OF L1 IN L2 LEARNING IN CHINESE MIDDLE SCHOOLS
博弈论下电动汽车充电站的产量规划模型
博弈论下电动汽车充电站的产量规划模型
基于博弈论视角的山陕商人合作分析
基于博弈论视角的山陕商人合作分析
审案中的策略
中文的魅力,老外理解不了
爱,纳什博弈人生的真理