除了自己,还培养出三位诺奖得主

2020-10-15 15:28张苏
南方周末 2020-10-15
关键词:纳什威尔逊博弈论

南方周末特约撰稿 张苏

罗伯特·威尔逊(左)是保罗·米尔格罗姆(右)的老师。视觉中国 ❘图

★威尔逊提出的理论问题是,一个频段既有私有估值也有公共估值,如何设计一个既能有效分配射频频段,又能最大限度地让纳税人受益的拍卖会?

当美国联邦通信委员会在1994年7月首次使用同步多轮拍卖时,在47轮竞标中以6.17亿美元的价格出售了10个许可证,而这些许可证是美国政府以前几乎免费分配的。

当地时间2020年10月12日,瑞典皇家科学院常任秘书戈兰·汉松宣布,将2020年诺贝尔经济学奖授予保罗·米尔格罗姆(Paul R.Milgrom)和罗伯特·威尔逊(Rob-ert B. Wilson),以表彰他们“对拍卖理论的改进和发明了新拍卖形式”。

其中的威尔逊可谓“一代宗师”,不仅自己获得诺奖,还培养出三位诺奖得主。除了今年共同获奖的米尔格罗姆,还有2016年因契约理论获奖的本特·霍姆斯特罗姆(Bengt Holmstrom),以及2012年因市场设计实践而获奖的埃尔文·罗斯(Alvin E. Roth)。

威尔逊于1937年出生于美国,从本科到博士都是在哈佛大学度过的,毕业后一直在斯坦福大学任教,讲授微观经济分析等课程。现在是斯坦福大学商学院的荣誉退休教授。

本文将着重谈谈拍卖理论有何价值以及威尔逊的经济学成就。

博弈论贡献

拍卖机制与两位诺奖得主在博弈论上的贡献有着密切的联系,博弈论研究是基础。

威尔逊在博弈论上最为重要的贡献是,他与戴维·M·克雷普斯(David M.Kreps)共同提出了序贯均衡思想,该思想对博弈论产生了重大影响。克雷普斯也是威尔逊的学生。

序贯均衡的思想与纳什均衡、完美均衡的思想有着密切的联系。纳什均衡很好理解,但完美均衡不好理解,用威尔逊的话来说,序贯均衡会使得完美均衡更好理解。

1994年诺贝尔经济学奖获得者之一纳什的思想是:给定对方的战略,我选择的战略在我的战略空间中能够最大化我的效用;对于每一个参与人,都实现了这一点。换句话说,如果每一个参与人的战略是其他所有人战略的最优反应,则该战略被称为纳什均衡。

这一均衡解释了为什么很多时候不是最优组合最稳定,而是相互妥协能带来稳定结构。比如,如果人人都追求效用最大化,应该是俊男美女的家庭组合多,而且更稳定。事实显然不是这样。

纳什的思想之所以受到重视,是因为他的理论暗示是非常直观的:如果所有参与人要形成“一致同意”的行为协议,这些行为必须构成纳什均衡;否则,会有人发现背叛这一协议将是有利可图的。

一对稳固的夫妻,应该是满足纳什均衡特征的:妻子爱看芭蕾舞,丈夫爱看足球赛,应该要么丈夫陪妻子去看芭蕾舞,要么妻子陪丈夫去看足球赛;而不能是“你去看你的,我去看我的”,这样迟早会散伙。

当年一起与纳什获奖的泽尔腾教授,进一步发展了纳什均衡的概念,提出了更为严格的“一致同意”的行为协议,即所谓的“完美均衡”。但泽尔腾的思想让经济学界以外的人非常难以理解,这个抽象的思想让经济学家也暂时找不到应用价值。

威尔逊和自己的学生提出了比“完美均衡”更宽广并且非常有应用价值的“序贯均衡”的概念,大力推进了博弈论的研究。

我们先看“完美均衡”的思想。以英式拍卖为例,大家在竞拍一件文物,价高者得。这个博弈中会有无数纳什均衡,只要再也没有人报价了,就是一个纳什均衡。这个过程中,只单纯地需要每个竞拍人对于其他所有竞拍人的行为进行最优反应。

泽尔腾提出了更加严格的均衡标准:对于这件文物,每一个竞拍人会有一个估价;人们对于自己的估价在所有竞拍人中以多大概率处于一个什么地位有一个估计(其学术术语是“信念”);对于自己报价之后的拍卖如何发展又会有一个概率估计(也是一种“信念”)。

“完美的均衡”要考虑所有竞拍人在拍卖机制下的这两种信念,不能仅仅是对于其他竞拍人的行为的最优反应,还应该是对其他竞拍人的不同信念下的战略的最优反应。在这个完美的均衡下,人们不会有后悔的情绪。

这种复杂的均衡是一个非常理想的状态,事实上是在要求每一个竞拍人准确地知道其他所有竞拍人的私人信息(比如对于这件文物的估价)。或许泽尔腾认为多轮次的拍卖中这些信息总会被暴露出来。

威尔逊和克雷普斯在这一点进行了重大改进:提出了序贯均衡的概念,允许一个竞拍人对于其他竞拍人的支付(比如上述文物的估价)的认识存在不确定性;均衡只要求某个竞拍人的战略是对于其他人的“不安的战略”(perturbed strat-egies)的最优反应。

举例来说,拍卖会上,一个参与人知道自己比别人更懂得这件文物的价值,他适当报低价格对自己是有利的。因为对方不了解这件文物的价值,生怕自己报高了价格,买回去了再卖出去亏本,所以会压低报价。

在泽尔腾的研究中,对均衡路径的偏离被称为“颤抖手”(想着要把线穿过针孔,但手会发抖),而威尔逊和克雷普斯提出的“序贯均衡”概念不需要对均衡路径的偏离提出额外的概念进行解释,只需要用含在“序贯理性”中的“信念”概念进行解释即可,使得理论更加简洁了。

这里蕴含的“序贯理性”的思想是:开始于每一个信息集的每一个战略是余下所有博弈中的最优战略。

四种经典的拍卖形式

正是由于威尔逊对博弈论的深入研究,使得他在拍卖机制的设计上游刃有余。

在西方社会,传统的农场拍卖,高端艺术品拍卖,随处可见。总结起来,经典的拍卖形式有如下四种:

荷兰式或钟表式拍卖,价格从卖方设定的较高水平开始,逐渐降低,直到有竞买人接受并支付该价格。荷兰的阿尔斯梅尔花卉拍卖会依靠这种方式每天卖出约2000万朵鲜花。

英式拍卖,竞拍者公开报价,直到竞拍者出价最高为止。比如eBay在线平台上的私人单品拍卖。

一级密封投标拍卖,参与者用密封的信封报价,最高的出价者获胜并支付其出价。比如政府的采购以及分配采矿租约等。

二级密封投标拍卖或维克瑞拍卖,即竞拍人用密封的信封递交投标书,出价最高者获胜,但支付第二高的出价。比如互联网搜索引擎对于广告空间的销售。

这里有一系列的问题值得研究:参与者如何出价? 价格如何更新? 拍卖何时结束? 如何选择“中奖者”规则? 参与者对拍卖标的的价值了解对竞拍结果有什么影响?进一步来说,竞拍人对标的物的特殊估价(私人价值组成部分)和共同估价(共同价值成分)的差异如何影响拍卖结果? 一个竞拍人的行为如何影响其他竞拍人? 拍卖如何尽可能多地创造价值?

纳什、维克瑞等人对这些问题中的一些进行了卓越的研究。但对这些问题进行系统的研究,特别是对于竞拍品的价值依赖于竞拍人行为的研究,用诺奖官网的话来说,是威尔逊“迈出了第一步,也是至关重要的一步”。

威尔逊证明,一般来看,通过竞争性拍卖形成的价格满足大数定理:对于一件具有确定货币价值但没有人确切知道的拍卖品,在密封报价拍卖中,拍卖人将拍卖品出售给最高报价者。这个最高报价正好是该拍卖品的真实价值。

由此,虽然没有任何一个竞拍人知道该拍卖品的真实价值,但这种机制使得出售人获得的出售价格正好是其真实价值。

不过,当仅有参与人知道自己的“类型”,拍卖机制的目标是最大化交易量时(比如拍卖行会这么想),如果需求大于供给,价格有被抬高的倾向;相反,价格有被压低的倾向。

在这种机制下,人们的竞价和报价行为会自动地促进经济效率的形成:不会再有一个新的价格,使得竞拍人和出售者中有任何人的预期收益会提高而不会减损其他人的预期收益。这就说明,不同的拍卖机制,带来的结果很可能是完全不同的。

在有关价值依赖于竞拍人行为的研究中,威尔逊观察到的一个基本现象是,每个竞拍人对拍卖标的的共同价值常常存在不确定性,所以常常对其出价进行限制。均衡结果常常是,最乐观的竞拍人将赢得拍卖,赢家很可能高估了真实价值,最终导致出售时发生损失。

威尔逊的政策建议是,要有战略思维,竞拍者应该“隐藏”他们的出价,以避免出价过高。

后来威尔逊证明了信息不对称是如何在共同价值拍卖中形成均衡竞价的:其中一个竞买人知道被拍卖物的共同价值,而另一个竞买人只有一个不那么准确的估计值。即在密封竞价拍卖中,知情的竞拍人常常能获胜,并有望获得最大的利润。

获诺奖的拍卖理论

威尔逊不仅致力于拍卖基本理论的研究,还为无法使用现有经典拍卖形式的出售行为发明了新的、更好的拍卖形式。

20世纪90年代,随着移动电话市场的扩大,美国联邦通信委员会开始意识到选择“好公司”来给予无线电频段不是一个好的办法。因为,他们发现,自己主动找来的“好公司”,怎么会愿意支付高昂的价格呢?

美国联邦通信委员会后来改用抽彩票的方式来分配频段,也就是完全随机分配执照。这同样也没有为政府带来什么收入:我这么幸运被抽中了,为什么要支付高价呢?

两种模式还都导致了运营商在彼此之间买卖频段,以至于出现了一个庞大的二手牌照市场。这些牌照的市值高达数十亿美元,最终落入频段投机者手中,而不是美国财政部,最终支付损失的是美国纳税人。

后来威尔逊等人提出了一种全新的拍卖形式,即同步多轮拍卖,很好地解决了这里的问题。

威尔逊提出的理论问题是,一个频段既有私有估值也有公共估值,如何设计一个既能有效分配射频频段,又能最大限度地让纳税人受益的拍卖会?

威尔逊等人的设计是:拍卖会上,同时提供所有物品(不同地理区域的无线电频段);从低价开始报价,允许重复出价,以便减少不确定性,减少赢家诅咒带来的问题。

当美国联邦通信委员会在1994年7月首次使用同步多轮拍卖时,在47轮竞标中以6.17亿美元的价格出售了10个许可证,而这些许可证是美国政府以前几乎免费分配的。1994年的频段拍卖为美国联邦政府筹集了大约200亿美元,是预测金额的两倍。

这一结果引起了媒体的极大关注,并导致其他国家的政府设立了自己的拍卖会。2000年度英国3G频谱拍卖为英国政府筹集了约340亿美元。在加拿大、芬兰、英国和美国等国家,这种拍卖方式已经为政府创收了数千亿美元。

当然,这个机制不是完美的,比如,竞拍人可能进行操纵和串通。米尔格罗姆进行了改进,提出了所谓的组合时钟拍卖:在第一轮,竞拍人从目前的执照持有者那里购买无线电频段。在第二轮中,将其中一些频段卖给其他能够更有效地管理它们的参与者。

在斯坦福大学商学院网站上,威尔逊的简历中列出的第一个学术出版物,是他于1993年出版的《非线性定价》。这本书已经成为理论界和工商界重要的参考书目。因而,非线性定价理论也是威尔逊的重要贡献。

他所提出的“二维非线性定价规则”,也就是厂商要掌握整个市场上消费者的“偏好结构”,利用消费者的“自我选择性质”,使不同偏好的消费者自动在“最优价格方案”中对号入座;厂商对具有异质性的消费者进行价格歧视,从而实现垄断利润最大化,已经得到了大量的应用。

在下班高峰,明明有很多车,你却叫不到,而且一上车发现收费比平时高很多,你不觉得是一个很好的非线性定价的例子吗?

(作者系中央财经大学经济学院教授、博士生导师)

猜你喜欢
纳什威尔逊博弈论
THE ROLE OF L1 IN L2 LEARNING IN CHINESE MIDDLE SCHOOLS
PBL教学法在博弈论与信息经济学课程改革中的应用初探
THE ROLE OF L1 IN L2 LEARNING IN CHINESE MIDDLE SCHOOLS
刺角蜥的智慧
博弈论下电动汽车充电站的产量规划模型
博弈论下电动汽车充电站的产量规划模型
基于博弈论视角的山陕商人合作分析
基于博弈论视角的山陕商人合作分析
爱,纳什博弈人生的真理
评博弈论在反垄断中的应用