稳定配置的理论与市场设计的实践——2012年诺贝尔经济学奖评介

2013-04-11 09:24何德旭王朝阳

湖北经济学院学报 2013年1期

何德旭，王朝阳，张捷

（1.中国社会科学院，北京 100732；2.中投证券公司，广东深圳 518048）

2012年10月15日，瑞典皇家科学院宣布，将2012年诺贝尔经济学奖授予哈佛商学院经济与工商管理学教授埃尔文·罗斯（Alvin E.Roth）和加州大学洛杉矶分校教授劳埃德·沙普利（Lloyd S.Shapley）两位美国经济学家，以表彰他们在“稳定配置的理论和市场设计的实践”研究方面所做的突出贡献。为此，他们将分享800万瑞典克朗（约合120万美元）的奖金。

一、获奖的理论背景

在传统的经济学分析中，仅依靠价格调整就能使市场实现供需平衡。理论和实践证明，市场机制在大多数情况下是运行良好的。例如，高薪能够将劳动者吸引到特定的职业，高的能源价格会让消费者节约能源。但是，在某些情况下，价格体系会遭到来自法律和道德方面的阻力，因此并不能完全配置资源。比如很多学校和大学都会禁止收费，再如人体器官移植在道德层面上通常会排斥货币支付。此外，在很多市场上，价格体系尽管能发挥作用，但并不满足完全竞争的传统假设。事实上，在上述情形和其他更多的情况中仍然会出现分配。那么，这些过程是如何运行的？又是怎样使结果更有效的呢？

本年度两位获奖者的工作包括资源分配的理论框架、实证研究以及现实世界的相关实践，比如劳动市场清算和学校录取流程的重新设计等。这个理论框架的基础产生于1962年，由大卫·盖尔（David Gale）和劳埃德·夏普利在他们解决特定分配问题的数学研究中提出。[1]他们考虑了一个包括两组主体的模型，比如工人和厂商，即他们必须是配对的。如果一个特定的工人被雇主A雇佣，但这个工人可能更倾向于雇主B，雇主B也想雇用这个工人（但是没有），那么这个交易中尚有未开发的收益存在。如果雇主B雇佣了这个工人，那么他们双方将会更好。据此，盖尔和夏普利把在交易中不存在这种可开发收益的配对定义为稳定的。在一个理想的市场中，工人和厂商没有严格的时间限制并且具有完成交易的能力，因此结果总是稳定的。当然，现实世界的市场可能在一些重要方面与这个理想市场有所不同。但盖尔和夏普利发明了一种“递延接受算法”，这种算法易于理解并总能导出稳定的结果。这个算法规定，市场的一方（比如雇主）为市场的另一方报价，而另一方可以根据一定的规则接受或拒绝这些报价。

上述理论框架的实证分析由埃尔文·罗斯给出。在其1984年发表的论文中，罗斯发现美国医生市场在历史上经历了一系列的市场失灵，但是一个集中交易所通过应用一个本质上相当于盖尔和夏普利的递延接受算法的进程改善了这个情况。[2]在这篇文章中，罗斯阐述了市场执行的目标，并且针对市场时而运行良好时而又失灵的现象，展示了稳定性的概念如何提供相应的组织原则来帮助我们理解这种现象。随后，罗斯和他的同事运用这个框架，联系实证研究，控制实验室研究和计算机模拟来检验其他市场的功能。他们的研究不仅说明了这些市场是如何运行的，而且在如何为市场建立更好的运行体系方面很有帮助。他们的研究通常是基于盖尔—夏普利算法的原型或扩展，进而就引出了经济研究一个新的分支：市场设计。需要说明的是，这里所说的“市场”没有假设价格体系的存在；而且货币转移在很多重要应用中也都被排除了。

值得一提的是，本年度获奖者的研究工作运用了来自非合作博弈和合作博弈中的工具。如果从1994年诺贝尔经济学奖授予3位博弈论专家开始，至今已有6届的诺贝尔经济学奖与博弈论的研究有关。①非合作博弈的出发点是对独立决策者所面临的策略问题进行详细描述；合作博弈理论的出发点是描述每个团体都能获利的情况，重点是研究个体的集合（或联盟）如何通过共同协作深化他们的利益。在很多情况下，合作和非合作博弈是互补的。劳埃德·夏普利是合作博弈理论得以进一步发展的代表人物，埃尔文·罗斯则是实验经济学领域的突出贡献者。②尽管两位学者的研究是独立完成的，但夏普利的基础理论与罗斯的实验性实践相结合之后，创造出一个繁荣的经济学研究领域，并且使许多市场的表现得以大幅提升。

二、劳埃德·夏普利：稳定匹配理论演进及应用

在很多现实中的市场上，商品是私有的且是独立、多元的，而且完全竞争市场的传统假设也不能保持，典型例子比如熟练工市场。在这些市场中，为了能和其他人进行交易，参与者必须相当匹配才行。1962年，盖尔和夏普利共同研究了双边配对市场理论，即一个市场中有两方参与者——比如消费者和销售者、工人和厂商，或者是学生和学校——他们为了达成某项协议必须彼此配对。[1]在这个市场中，他们排除了支付，即工资（和其他配对属性）不是转让的对象。按照他们的概念，所谓稳定是指不存在这样两个市场主体，使它们都更中意于他人，胜过它们当前的匹配对象。夏普利和他的同事找到了所谓的GS算法（Gale-Shapley算法），这种方法能确保匹配稳定，并且还限制了市场主体操纵匹配过程的动机。沙普利所设计的方法能系统性地对两个市场主体中的至少一方有利。

盖尔和夏普利在一个抽象、一般的层面上来分析匹配。他们将婚姻作为他们研究的一个案例，即如何使10男10女在尊重各自偏好的情况下完成配对。主要的挑战在于设计一个能引致稳定匹配的简单机制，在这个机制中，没有伴侣会分手而且不能通过改变配对而过得更好。盖尔—夏普利的“延期接受”算法能够解决这个问题，是能够直接得到稳定匹配的一系列简单规则。简单地说，盖尔—夏普利算法能够通过两种途径建立：不仅男人可以向女人求婚，而且女人可以向男人求婚。在后一种情况中，这个进程开始以每个女人向她最喜欢的男人求婚。每个男人在他收到的不同的求婚中（如果有的话），保留他认为最有吸引力的（但与接受不同），然后拒绝其他。第一轮被拒绝的女人然后向其第二偏好选择求婚，然后男人保留最好的求婚而拒绝其他。这一直持续到没有女人想做进一步的求婚为止。然后，每个男人接受他所保留的求婚，这个进程就结束了。盖尔和夏普利在数学上证明了这个算法总会得到稳定的匹配。

在非合作博弈论中，夏普利的贡献包括大量的动态博弈的创新研究。奥曼（Aumann R.J.）和夏普利的“完美无名氏定理（Perfect Folk Theorem）”显示，任何可行的支付向量（在这里，每个参与者至少得到他对自己设立的最低标准）都可以作为一个包含非常有耐心的参与者的重复博弈的战略均衡的支付。[3]这个重复博弈的理论由夏普利（1953）提出，他引入了随机博弈的重要概念。[4]在随机博弈中，任意阶段行为的选择可能都会影响未来博弈的走势，这就引起了广泛的研究。在进一步研究中，夏普利（1964）展示了一个明确分组的动态学习（Learning Dynamics）是不能达到均衡点的，[5]这个结果又引发了对博弈中学习的研究。此外，夏普利和舒比克（1977）的论文是战略市场博弈领域中很重要的研究成果。[6]

夏普利还是合作博弈论领域最重要的研究者。夏普利和舒比克（1969）建立了一个可转让效用市场博弈，得出这种博弈有非空的核心。[7]可转换效用联合博弈中单值解决方案的概念现在称为夏普利值，这一概念由夏普利（1953）[8]引入并基于逻辑公理的特征进行了研究。此后，海萨尼（1963）[9]和夏普利（1969）[10]扩展了夏普利值在无转换效用的博弈中的应用。夏普利（1971）[11]证实在凸博弈中，夏普利值占有核心的中心位置。以此为基础，夏普利值发展出很多应用。尽管起初的目的是作为对参与者期望从博弈中得到的预期，但通常被认为是对一个公平结果的合理解释。在奥曼和夏普利（1974）[12]的著作中，包含了无限参与者的博弈中的夏普利值的主要理由、解释和计算的扩展延伸，同时还包含了埃奇沃思的猜想：在确定的大的市场上，夏普利值和核心在竞争的均衡分配方面均保持一致。在政策分配博弈中，夏普利值为人所熟知的是夏普利—舒比克权力指标（夏普利和舒比克，1954），[13]它特别适用于由投票体制变化引起的权力转换的评估中。

三、埃尔文·罗斯：市场设计的理论与实践运用

罗斯意识到夏普利的理论和计算可让实践中重要市场的运作方式变得更加清晰。在一系列的实验性研究中，罗斯和他的同事表明，为了认知某个特定市场制度为何成功，研究其稳定性是关键所在。罗斯后来成功地通过系统性的实验支持了前述结论。在其1984年发表的论文中，[2]罗斯发现美国医生市场历史上经历了一系列的市场失灵，但是一个集中交易所通过应用一个本质上相当于盖尔和夏普利的递延接受算法的进程改善了这个情况。在其文章中，罗斯阐述了市场执行的目标，并展现了稳定性的概念如何帮助我们理解市场运行的不稳定性，比如市场时而运转良好时而失灵。他还帮助重新设计了现存的一些制度，比如帮助医生和医院、学生和学校、器官捐赠者和接受者之间进行配对。这些改良都是基于盖尔—夏普利算法并做了各种修正，同时还考虑到了特定情境的要求和伦理道德限制，比如避免出现转移支付的情况。他们的研究通常基于盖尔—夏普利算法的原型或扩展，不仅能够阐述这些市场是如何运行的，而且还能够对如何为市场建立更好的运行体系提供帮助。罗斯的这些研究引发了经济研究一个新的分支：市场设计。

在美国，医学院毕业的学生一般先在医院当实习医生，他们是劳动力市场的一个有效组成部分。20世纪早期，这个市场在很大程度上是分散的。到1940年代期间，为了争夺稀缺的医学院学生，医院不得不提前招收实习生，有时在毕业前好几年就开始招收。换言之，匹配在他们取得资格之前就已经产生，甚至在他们知道他们想要从事哪个领域之前就已经匹配。当一个实习生被拒绝之后，对其他候选人来说通常已经太晚了。这些问题驱动的市场不能产生稳定的匹配，因为没有足够的实习机会能够及时被提供以保证相互获利的交易。为了快速提供更多的实习机会，医院会严格要求学生对实习机会的回应期限。这反过来迫使学生在没有弄清楚以后是否还有其他机会的情况下，就过早做出决定。

为了应对这些问题，在1950年代早期建立了一个集中的 “清算所”，称为国家居民匹配项目（NRMP）。在1984年的文章中，罗斯研究了这个清算所运用的算法，发现它与盖尔—夏普利算法很相似。他然后假设，NRMP成功的基本原因在于产生了稳定的配对。在20世纪90年代早期，罗斯继续研究与此相似的英国医药市场。他发现不同的地区采取不同的算法，一些地区产生了稳定的配对而另一些则没有。那些产生稳定配对的结果被证明是成功的，而其他算法则以不同的方式失效。尽管很成功，但NRMP仍然遇到问题，女医生的人数开始增长，而且学生夫妇在同一领域寻找职位越来越普遍。NRMP不能解决这些问题。1995年，罗斯被要求帮助设计一个能够消除这些问题的改进算法。于是，他与艾略特·皮纳森共同建立了一个根据申请人的提议能够接受夫妇的算法。这个新的算法在1997年被NRMP所采纳，实践证明该算法运行良好，并且每年提供与申请人相匹配的岗位超过20000个。事实证明，罗斯的改进研究促进了这个理论的发展。

盖尔—夏普利算法在其他应用中同样被证实是有效的，比如高中的选择问题。直到2003年，纽约公立高中的申请人都被要求列出他们的前五个选择，然后这些首选列表被送到学校，由学校来决定一个学生被录取、拒绝或放在待定名单中。这个流程在重复了两轮之后，没有被任何学校录取的学生在第三轮会通过行政程序进行分配。然而，这并没有为申请人提供足够多的机会来列出他们偏好的学校。因为学校更喜欢录取那些填报第一志愿的学生，那些不太可能被他们最喜欢的学校录取的学生从他们最佳利益的角度考量会将更现实的选择作为第一志愿，而那些填写了他们真实偏好的学生则遭遇了不好的结果。在2003年，罗斯和他的同事基于一个盖尔—夏普利算法的申请人，帮助重新设计了这个录取程序。新算法被证明是成功的，那些表示没有特别择校偏好的学生的数量减少了90%。现在，越来越多的美国大城市都在使用不同形式的盖尔—夏普利算法。

到目前为止，匹配设置都是双方做出积极的决定。然而，在一些现实情况中是单方的，在某种意义上另一方完全是被动的。一个现实的例子是肾脏（或者其它人体器官）与那些需要的病人之间的配对。这个配对是如何以一种有效的方式完成的呢？这个问题被夏普利与其合作者所研究，同样是抽象的、基于稳定的概念。他们提出的算法——所谓的顶级交易循环（Top Rrading Cycle）——实际上非常简单，主要基于对象的初始分配和随后的交换。对于人体器官的例子来说，挑战在于肾脏和病人之间的配对可能并不兼容，这个多边交换过程可能会相当耗时。因此，日益复杂的肾脏捐献供应链的共同特点是，价格都不是这些过程的一部分。在基本的盖尔—夏普利算法中，价格机制的存在会限制它的适用性吗？答案是不一定，夏普利和其他人检查了将价格（在医生市场中的工资）纳入职位提供的一部分的原模型的扩展模型中，算法包括价格以相同的方式运行以及产生类似特征的稳定匹配。事实上，罗斯和索托马尔（1990）[14]早就阐述了双边配对理论，包括罗斯及其合作者的很多关键成果。

此外，罗斯（1991）[15]还描述了用博弈论如何使实验室研究和区域观察互相作用。通过他自己的实验室研究，罗斯对这个研究领域同样做出了巨大的贡献。在一系列的实验中，罗斯和他的同事检验了合作议价理论的预测结果。合作议价模型被用来修正风险厌恶情绪变化的定性效应的预测。这些检验通过罗斯和马罗夫（1979）[16]的设计得到优化，他们用彩票作为激励来控制主体内生的风险厌恶情绪。通过变化传递给一个主体的另一个主体支付的信息，这个实验显示了焦点效应和公平问题的重要性。欧克斯和罗斯（1989）[17]所做的一系列实验检验了非合作议价模型的预测结果，这项工作接着延续到罗斯等（1991）[18]所做的重要的跨文化的研究中，这项研究调查了四个不同国家的议价行为。一般来说，实验研究解释的是主体随着时间如何转变他们的行为。罗斯和埃尔文（1995）[19]创建了一个巩固学习模型，其参与者常常重复那些会产生好结果的选择。这个模型在一系列实证博弈中被证明与实际行为是一致的。斯洛尼姆和罗斯（1998）[20]用这个模型来解释一个简单的非合作议价博弈，他们证明巩固学习模型能够事前预测行为（而不仅仅是事后解释）。这一系列有影响的论文表明，如果将现实认知的局限性考虑在内，博弈论的解释和预测能力完全可以得到进一步发展。

四、简要评价

劳埃德·夏普利推动了合作博弈论的发展，他的工作不仅是增强了合作博弈的理论基础，而且提高了该理论在实际应用及政策制定中的实用性。在与其同事的合作中，他创立了匹配市场理论。在该理论创立之时，盖尔和夏普利就希望有一天能够将它应用到实际中去。在市场设计的文章出现之后，这一设想终于成为现实。阿尔文·罗斯综合运用经验的、实验的和理论方法提高了我们对市场如何运行的认知，并和同事一起研究了如何改善和提升市场表现，从而阐述了稳定性和激励相容这两个关键问题。这些贡献直接引导了大量重要的现实市场的成功再设计。可以预计，这个领域将会持续成长并且在未来会有更广阔的前景。

博弈论在现实中的大量运用可谓人尽皆知，博弈论教学和研究在我国也可谓方兴未艾。但总体来说，稳定配置和市场设计领域的理论在国内还比较前沿，对相关理论的研究学习和具体运用仍有待深入。上述诸如器官移植、学生入学等问题的研究和相关案例在国内也同样存在，特别是，当前国内大城市的就业、入学等问题日益成为矛盾聚集的社会问题，如何运用本年度获奖者的理论提出创新性的解决方案，仍是值得进一步研究的问题。但毫无疑问，本年度获奖者的理论成果为我们提供了研究思路。

注释：

① 1994年，授予美国伯克利加利福尼亚大学的约翰·海萨尼（J.Narsanyi）、普林斯顿大学约翰·纳什（J.Nash）和德国波恩大学的赖因哈德·泽尔滕（Reinhard Selten）。1996年，授予英国剑桥大学的詹姆斯·莫里斯（James A.Mirrlees）与美国哥伦比亚大学的威廉·维克瑞（William Vickrey）。2001年，授予美国加州大学伯克莱分校的乔治·阿克尔洛夫（George A.Akerlof）、美国斯坦福大学的迈克尔·斯宾塞（A.Michael Spence）和美国纽约哥伦比亚大学的约瑟夫·斯蒂格利茨（Joseph E.Stiglitz）。2005年，授予美国马里兰大学的托马斯·克罗姆比·谢林（Thomas Crombie Schelling）和耶路撒冷希伯来大学的罗伯特·约翰·奥曼（Robert John Aumann）。2007年，授予美国明尼苏达大学的里奥尼德·赫维茨（Leonid Hurwicz）、美国普林斯顿大学的埃里克·马斯金（Eric S.Maskin）以及美国芝加哥大学的罗杰·迈尔森（Roger B.Myerson）。

② 控制实验室实验被频繁运用于市场设计领域。弗农·史密斯由于其在实验经济学方面的贡献分享了2002年诺贝尔经济学奖。

[1]Gale，D.and L.S.Shapley.College Admissions and the Stability of Marriage[J].American Mathematical Monthly,1962，（69）:9-15.

[2]Roth，A.E.The Evolution of the Labor Market for Medical In-terns and Residents:A Case Study in Game Theory[J].Journal of Political Economy， 1984，（92）:991-1016.

[3]Aumann，R.J.and L.S.Shapley.Long Term Competition-a Game Theoretic Analysis[M].Mimeo.1976.

[4]Shapley，L.S.Stochastic Games[J].Proceedings of the National Academy of Sciences of the USA， 1953，（39）:1095-1100.

[5]Shapley，L.S.Some Topics in Two-person Games.In Advances in Game Theory.Edited by M.Dresher，L.S.Shapley，and A.W.Tucker.Princeton[M].NJ:Princeton University Press.1964.

[6]Shapley，L.S.and M.Shubik.Trade Using One Commodity as a Means of Payment[J].Journal of Political Economy， 1977，（85）:937-968.

[7]Shapley，L.S.and M.Shubik.On Market Games[J].Journal of Economic Theory，1969，（1）:9-25.

[8]Shapley，L.S.A Value for N-person Games.In Contributions to the Theory of Games[M].Vol.2.Edited by.W.Kuhn and A.W.Tucker.Princeton NJ:Princeton U-niversity Press.1953.

[9]Harsanyi，J.C.A Simplied Bargaining Model for the N-person Cooperative Game[J].International Economic Review，1963，（4）:194-220.

[10]Shapley，L.S.Utility Comparison and the Theory of Games.In La decision:Agregation et dynamique des ordres de préférence[M].Paris:Editions du CNRS.1969.

[11]Shapley，L.S.Cores of Convex Games[J].International Journal of Game Theory， 1971，（1）:11-26.

[12]Aumann，R.J.and L.S.Shapley.Values of Non-atomic Games[M].Princeton:Princeton University Press.1974.

[13]Shapley，L.S.and M.Shubik.A Method of Evaluating the Distribution of Power in a Committee System[J].American Political Science Review， 1954，（48）:787-792.

[14]Roth，A.E.and M.Sotomayor.Two-sided Matching:A Study in Game-theoretic Modeling and Analysis.E-conometric Society Mono-graph Series[M].Cambridge:Cambridge University Press.1990.

[15]Roth，A.E.Game Theory as a Part of Empirical Economics[J].Economic Journal 1991b，（101）:107-114.

[16]Roth，A.E.and M.Malouf.Game-theoretic Models and the Role of Information in Bargaining[J].Psychological Review 1979,（86）:574-594.

[17]Ochs，J.and A.E.Roth.An Experimental Study of Sequential Bargaining[J].American Economic Review 1989，（79）:355-384.

[18]Roth，A.E.A Natural Experiment in the Organization of Entry Level Labor Markets:Regional Markets for New Physicians and Surgeons in the U.K[J].American Economic Review，1991a，（81）:415-40.

[19]Roth，A.E.and I.Erev.Learning in Extensive-form Games:Experimental Data and Simple Dynamic Models in the Intermediate Term [J].Games and Economic Behavior 1995（8）:164-212.

[20]Slonim，R.and A.E.Roth.Learning in High Stakes Ultimatum Games:an Experiment in the Slovak Republic[J].Econometrica， 1998，（66）:569-596.