董志强
该不该改变最初的选择
下面要讲到的例子与美国20世纪70年代的一个电视节目有关,其中的概率计算曾困扰着成千上万的大众。在节目中,节目参与者将在三扇门之间选择其中一扇。这三扇门中有且仅有一扇门的后面放着奖品,另外两扇门则放着讽刺性礼品比如鸡崽或者笨驴。当节目参与者选定一扇门之后,主持人就会打开另外两扇门中没有奖品的一扇。然后在剩下的两扇关闭的门中,主持人会问参与者要不要改变最初的选择。
这里的问题就是:参与人希望获得奖品,而不是获得讽刺性礼品,那么现在仍关闭的两扇门中,他应当坚持最初的选择呢?还是改变主意选择另外一扇门?
大多数人凭直觉认为,剩下的两扇门中,每扇门后有奖品或没有奖品的概率各占50%。因此,改变主意选择另外一扇门和坚持最初的选择不改变,预期的赢利是一样的。的确,这种思路看来是没有什么错。因为在做最初的选择时,选择“碰巧是”正确的概率为三分之一,而一旦选择之后,剩下两扇门,参与者从主持人的行为中所能得到的信息就只是将信念修正为自己选择正确的概率为二分之一,选择失误的概率也是二分之一。此外没有任何其他的信息改善。因此,他坚持原来的选择似乎可以说得过去。
但是,上述看法并不符合真实的情况。真实的情况是,若参与者改变自己最初的选择,那么获得奖品的概率是三分之二,若不改变最初的选择,则获得奖品的概率仅为三分之一。他应该改变自己最初的选择。
奇怪的是,将这个结果告诉参与者后,他们还常常难以理解为什么会这样。一种比较浅显的解释是这样的:在最初的选择中,选择了错误门的概率是三分之二。如果参与人一开始的确选择了错误的门,那么主持人随后必然打开空门,而没有被打开的那一扇就必然有奖品,此时参与人显然应该改变主意转换到自己没选择也没有被打开的那扇门。如果最初的选择中参与人的确选正确了(概率为三分之一),那么他显然应该坚持,并因此获得奖品。也就是说,如果参与人一开始就选错了,则参与人应该换门并一定获得奖金,如果参与人一开始就选对了,则应该坚持并一定获得奖金——于是,转换门获得奖金的概率与不转换门获得奖金的概率实际上就是最初选择是正确和错误的概率。而一开始,选择错误的概率是三分之二,正确的概率是三分之一。因此,在不知自己选择是正是误的情况下,在第二阶段改变主意转换到另一扇门,的确增加了获得奖品的概率。
对于有些喜欢做实验的读者,如果你不明白上述道理,那么我建议你做这样一个游戏:准备三张扑克和一枚硬币,让你的朋友来当节目主持人将三张牌铺在桌面上(并将那枚硬币放在其中一张之下);然后你来选择一张牌;你的朋友从你没选取的牌中拿走没有硬币的一张,再问你是否改变你当初选的牌。为了证明转换选择比不转换选择更有可能获得奖品,你可以尝试以“转换选择”为策略进行数十次(比如50次)实验,再以“不转换选择”为策略进行同样多次数(比如50次)的实验。结果你会发现什么?你将发现“转换选择”的策略中得到硬币的次数基本上是“不转换选择”策略中得到硬币的次数的两倍,而这两种策略中硬币出现的频率也基本上分别接近三分之二和三分之一。
当然,在一次性节目中,并不允许这样的重复实验。而且大多数人的确也不明智地选择了“不转换选择”。我曾在学生中做过这个实验,结果32人中有20人坚持“不转换选择”。这说明大多数人不清楚这样复杂的概率思考。更有意思的是,我跟我太太玩这个游戏时,她也是坚持“不转换选择”。当我告诉她如果转换可以成倍提高获奖概率时,她却说:如果我开始选对了,转换后结果错了就会后悔,所以心理素质好的就不应该转换。当然,她说的已经不是纯粹的概率计算,但也不是没有道理的。人们的行为的确不仅受制于各种精心的算计,也往往受制于某些心理因素(比如后悔)。不过,我对她的答案疑问在于:“如果开始选择对了,那么后来转换了选择会令人后悔。但是,如果后来你知道开始的选择错了,而你又没有转换选择,你就不后悔没有转换吗?”太太的回答更经典:“一开始选择错了,我只认为是运气不好,没什么可后悔的;如果开始对了,后来转换错了,才是后悔的。”这让我立即想到人们日常生活中常提到的道理:从没得到的东西,也就不会有失去它的痛苦,而已经得到的失去了,就会深感创伤。从太太的回答中,我突然明白了为什么行为博弈理论现在大行其道。
为什么不允许选择
不知道读者朋友有没有逛蔬菜瓜果市场的经历?我虽很少去逛,但偶尔有空的时候也会陪太太去买菜。在市场里,可以很容易发现某些水果或其他物品是事先装袋并明码标价的;或者虽然事先没有装袋,但是卖家不允许买家进行挑选,如果要挑选则要提高单位售价。这是什么原因呢?
一种非常直观的解释可以是:有些水果不适宜太多翻动,比如樱桃,如果挑选行为太多可能会导致樱桃被弄伤,不好看也不好卖。这固然可以成为原因之一,但还不能解释全部的原因。有些干果(如花生)和水果(如苹果),翻动次数基本上不会影响其外观和内在质量,但是也不允许挑拣;而有些干果(如核桃)和水果(如西瓜)则允许挑拣。这是为什么?
更好的一种解释是卖家为了避免逆向选择问题。花生、苹果之类,虽然挑拣行为不影响其外观和内在质量,但是每一粒花生、每一个苹果的内在质量是可以直接观察到的,而卖家的定价是按照其平均内在质量给出的,因此不允许挑拣,卖家就可以平均质量的价格卖出平均质量的物品,不会吃亏。如果允许挑拣,那么人们挑拣购买的物品质量将超过待售物品的平均质量,若他们还支付平均质量的价格,卖家就会亏损。所以,卖家不会允许买家挑选,如果买家非要挑选就必须支付高于平均质量价格的价格。
相反,核桃、西瓜之类,其内在质量不可直接观察,买家难以使得挑选出的物品之平均质量超过待售物品的平均质量,卖家便不会亏损。或者,不排除有些非常有经验的精明买家,他们的确可以使得自己挑选的核桃或西瓜比待售的核桃或西瓜平均质量要高,而他们也只付出了待售物品的平均质量价格,所以他们赚了;但是只要不是所有的买家都有此识别能力,那么卖家也不会亏损,因为被挑选之后的核桃和西瓜平均内在质量难以观察,那些没有经验的买家无法得到额外的信息来修正待售物品内在质量的信念,所以他们还是支付平均质量价格(这会使他们成为亏家)。实际上,存在有经验的买家和大量无经验买家的时候,允许对核桃、西瓜之类难以观察质量的物品进行挑选,卖家也并不亏损,有经验买家的额外赚得只不过是无经验买家的额外损失而已。■