合作博弈、匹配理论与市场设计实践及其政策启示——2012年诺贝尔经济学奖得主的主要研究贡献述评*

2013-08-15 00:55张成科植璟涵朱怀念
社会工作与管理 2013年1期
关键词:理论设计学生

张成科,植璟涵,朱怀念

(广东工业大学1.经济与贸易学院;2.管理学院,广东广州,510520)

2012年10月15日瑞典皇家科学院宣布,将2012年诺贝尔经济学奖授予美国哈佛大学哈佛商学院教授阿尔文·罗思(Alvin E.Roth)与美国加利福尼亚大学洛杉矶分校教授罗伊德·沙普利(Lloyd S.Shapley),以此嘉奖两位教授在合作博弈理论、稳定匹配理论与市场设计实践上的成就。

合作博弈理论主要研究个人集合团体(“联盟”)如何通过合作扩大自己的利益,因此,合作分析的出发点是对每个联盟所能达成的结果进行分析。对合作博弈理论的发展做出主要贡献的是罗伊德·沙普利。

2012年获得诺贝尔经济学奖的成就主要还包括一个用于分析资源配置的理论框架,以及对现实世界中的体系(如劳动力市场交流中心和学校招生程序)进行的实证研究和真实再设计。经济学家在研究社会资源如何分配的问题时发现,一些分配问题可以在价格体系中获得解决,例如,某一职位用高工资吸引劳动者,高能源价格引导消费者去节约能源。但在许多情况下,使用价格体系会遭致法律和道德上的异议,如人体器官在需要移植的病人中的分配。并且,许多市场中虽然存在价格体系运作,但传统上假设的完全竞争仍未接近于实现。尤其是许多商品是由不同的商品组成且是不可分割的,而每一分类商品的市场十分稀薄。这些稀薄的市场如何配置资源取决于管理这些交易的体系。解决这一问题的理论框架的基础是1962年戴维·盖尔(David Gale)和罗伊德·沙普利建立的对特定一类分配问题进行的数学探讨。自1984年始,罗思和他的同事利用这个理论框架,结合实证研究、对照实验室实验和计算机模拟,对其他市场的运作进行了研究。这些研究以及实证分析已经促使一门被称作“市场设计”的新兴经济学分支的出现。那么它对于中国经济问题的研究以及对解决中国现今发展中出现的问题将有哪些启示和借鉴作用呢?

以下,将首先简要介绍罗伊德·沙普利和阿尔文·罗思这两位诺奖得主的主要研究贡献。随后对这两位经济学家的主要理论——合作博弈理论、稳定匹配理论与市场设计实践成果的学术价值和实践意义进行简单回顾和梳理。在此基础上讨论这些理论的政策启示。

一、两位诺贝尔经济学奖得主的主要贡献

(一)罗伊德·沙普利的研究贡献

罗伊德·沙普利,1923年6月2日生于美国,1953年在普林斯顿大学获得博士学位,目前仍是加州大学洛杉矶分校数学及经济学名誉退休教师。他对数理经济学,特别是合作博弈理论做出过杰出贡献,被很多专家认为是合作博弈论的化身。

1.合作博弈的基石——沙普利(Shapley)值

与非合作博弈着重个人理性不同,合作博弈强调的是集体主义、团体理性,故而合作博弈也称为联盟博弈。理性主体往往为了利益与其他理性主体订立协议,形成联盟。这个联盟形成后,能够使博弈双方的利益都有所增加,或者至少是一方的利益增加,而另一方的利益不受损害,因而整个社会的利益有所增加,所以这是一种正和博弈。若不带来更大的利益,联盟是不可能形成的。但联盟形成后如何分配获得的收益呢?这是合作博弈所关心的核心问题。

收益分配,取决于博弈各方的力量对比和技巧运用。因此,妥协必须经过博弈各方的讨价还价,达成共识,进行合作。在这里,合作剩余的分配既是妥协的结果,又是达成妥协的条件。长期以来,经济学家对求解这种多重理性手足无措,只能避而远之。合作博弈在理论上的重要突破及其以后的发展在很大程度上起源于沙普利的研究及其公理化刻画。

沙普利将“核(core)”发展为合作博弈的一般利益分配集合,即它是一种所有成员均无法提升自身效用的稳定联盟状态。由于“核”这个概念不能给出联盟内成员效用分配的唯一预测,沙普利进一步在合作博弈框架中加入了一些着眼于“公平”分配合作利益的公理。沙普利首先对“公平”、“合理”等概念给予了严格的公理化描述,然后寻求是否有满足人们想要的那些公理的解。当然,如果对一个解的性质或公理要求太多,则这样的解可能不存在;另一方面,如果这些性质或公理要求得少,则又可能有许多解,即解存在但不唯一。

沙普利证明,在这些公理的约束下,存在唯一的效用分配方案,这就是沙普利值。沙普利值是根据各人给联盟带来的增值来分配,在直观上是所有边际贡献的平均值。沙普利值计算方法简单,而且能得到合作博弈的唯一解,使用较为广泛。到目前为止,这个解仍然是合作博弈领域内最重要的结果之一。不仅如此,沙普利的工作具有方法论上的重要意义,他的公理化方法使我们可以研究讨论合作博弈中其他各种各样的解。[1,2,3]

2.稳定匹配理论——盖尔和沙普利的双边匹配算法

在许多市场中,商品是私人的,但是由不同的商品组成且是不可分割的,传统上假设的完全竞争是无法维持的。在这样的市场中,参与者必须适当匹配才能相互交易。例如,考虑到一个市场有两个不相交的对象集(如买家和卖家,劳动者和公司,学生和学校)必须互相匹配以进行交易。盖尔和沙普利研究的就是这种双边匹配市场。

(1)稳定匹配(stable matchings)

为了说明何谓稳定匹配,本文先介绍“改进”这个概念。若某个联盟的成员可以利用自己的资源让自身的境况更好,那么就可以说这个联盟能够“改进”支付向量。一般来说,一个匹配如果不能被任何联盟“改进”,那么它就是稳定的匹配。事实上,没有联盟能够通过利用自己的资源,带来令所有成员更青睐的结果,就是所谓的稳定匹配。具体而言,假设市场的一方为医学院学生,另一方为医疗机构,每个机构需要一名实习生,每个医学院学生都想获得一个实习职位。很自然,学生和医疗机构对对方都有偏好的选择(为了方便起见,我们假设偏好是严格的)。对于双方的任何一个对象来说,如果匹配之后不如未匹配之前,那么这个匹配就是“不可接受的”。如此稳定的匹配必须满足以下两个条件:一是没有一个对象认为匹配不可接受;二是没有任何一对机构和学生希望是他们之间匹配,而不是各自目前的匹配。条件1即“个体理性”(individual rationality),条件2则是“成对稳定性”(pairwise stability)。两个条件意味着没有一个联盟、没有一对机构和学生能对目前的配对进行改进。

(2)盖尔-沙普利算法(the Gale-Shapley algorithm)

盖尔和沙普利为了寻找一个稳定匹配,设计出了“延迟接受算法”(deferred-acceptance algorithm)。市场一方中的对象(医疗机构)向另一方中的对象(医学院学生)提出要约,每个学生会对自己接到的要约进行考虑,然后抓住自己青睐的(认为它是可接受的),拒绝其他的。该算法的一个关键之处在于,合意的要约不会立即被接受,而只是被“抓住”(hold on to),也就是“延迟接受”。要约被拒绝后,医疗机构才可以向另一名学生发出新的要约。整个程序一直持续到没有机构再希望发出新的要约为止,到那个时候,学生们才最终接受各自“抓住”的要约。在这个过程中,每个医疗机构首先向被自己列为第一位的求职者发出要约,也就是最想接收为实习生的那个医学院学生。如果这个要约被拒绝,这家机构才能向被自己列为第二位的学生发出要约,依次类推。因此,在该算法的操作中,医疗机构的预期随着要约对象所处偏好排序降低而下调(当然,医疗机构不会对不可接受的求职者发出要约)。反过来说,由于学生总是抓着所接收要约中最合意的那个,且要约不能被撤回,因此,每个学生的满意度在该算法的操作中是单调递增的。当医疗机构下降的预期与学生提高的志向变得相一致时,该算法停止。

盖尔和沙普利证明,延迟接受算法是稳定的,也就是说,它总能产生一个稳定的匹配。该算法为这种类型的双边匹配问题提供了一个存在性证明:既然它总会终止于一个稳定匹配,那么稳定匹配是存在的。这些方法同时也限制了市场主体操纵匹配过程的动机。[4]

沙普利的其他重要贡献还包括沙普利-舒贝克(the Shapley-Shubik)权利指数、奥曼-沙普利定价(Aumann-Shapley pricing)、海萨尼-沙普利解(the Harsanyi-Shapley solution)、沙普利-福克曼定理(the Shapley-theorem)以及对随机博弈理论的研究成果,等等。

(二)阿尔文·罗思的研究贡献

阿尔文·罗思1951年12月19日出生于美国,1971年本科毕业于哥伦比亚大学,获得运筹学学士学位,1973年获斯坦福大学运筹学硕士学位,1974年获斯坦福大学运筹学博士学位,目前在哈佛商学院担任经济及工商管理教授。罗斯主要在博弈论、市场设计和实验经济学等领域进行研究,并做出显著贡献。从1995年应用理论改革美国医学院毕业生分配体系开始,他一直着手于解决现实问题,是少见的既有精深理论贡献,又非“纸上谈兵”的经济学家。

1.市场设计理论与微观经济工程学

“市场设计理论”最早由美国经济学家赫维奇提出,马斯金和迈尔森则进一步发展了这一理论,他们因此共同摘得了2007年诺贝尔经济学奖。该理论研究的核心问题是,在信息不完全、决策分散化、自愿选择和交换的条件下,如何设计出一套经济机制,以实现资源的最优化利用。

罗斯2002年发表的一篇题为“经济学家作为工程师:博弈论、实验法、计算作为设计经济学的工具”的文章中提出,经济环境不仅是“演化”出来的,一定程度上也是“设计”出来的,一门新学科——设计经济学正在诞生。而市场的设计,仅靠高度简化的理论模型是不够的,须考虑到现实生活中种种细节的复杂。为此,罗斯认为,有必要使用实验经济学和计算经济学作为博弈论的补充,因此,该新兴学科也被一些学者称为微观经济工程学。[5]

2.匹配和市场设计的应用

虽然匹配理论的研究在20世纪60、70代就得到了学界的重视,但是它的实际应用却一直到80年代才逐渐为人们所重视。匹配和市场设计的应用主要归功于罗思,他在1984年的研究中清楚地表明类似于GS的算法是美国住院医生制度得到改善的根本原因。[6]

在1940年代,美国的住院医生制度是非常糟糕的。医院为了竞争优秀的医学院学生,不断将给学生提供岗位的日期提前,甚至提前到学生毕业前几年,而且为了让自己心仪的学生和医院签约,医院给学生考虑的时间日渐缩短,这样做的恶果很多:一是这个匹配结果本身未必是有效的;二是学生在压力下的签约通常会导致后悔;三是医院在被学生拒绝的情况下,不能给其他合适的学生提供更多的机会。

罗思在1984年发表的研究文章中发现,美国的新医生市场长久以来受到一系列市场失灵因素的影响,但一家集中的交流中心由于采用了本质上相当于盖尔和沙普利的延迟接受的程序而大大改善了当时的情况。罗思的这篇文章阐明了市场所执行的任务,并说明这个稳定概念如何提供了一个组织原则,帮助我们理解为何市场有时运转正常,有时不正常。[7]

罗思关于匹配和市场设计实践的第二个著名例子是美国的肾脏交换项目。每年等待肾脏捐赠的患者名单上有8.5万人,而每年有约4 000名患者因器官短缺而死亡,一个重要原因是捐赠匹配系统的效率太低。2003年,罗思开始负责设计新系统。对于想捐肾给亲人,但由于血型不匹配无法实现的案例,该系统可以帮助他们与其他不匹配的捐赠组交换器官。目前,虽然利用这一系统进行肾脏移植的患者还不多,2009年只有不到1 000例,但是它的前景仍为许多人看好。而这个成功在很大程度上要归功于研究匹配和市场设计的学者们,特别是罗斯教授这样的人。[8]

二、获奖者学术成果的理论价值、实践意义以及对中国经济的启示

(一)经济学诺奖成果的理论价值和实践意义

诺贝尔经济学奖不仅可以为我们解决现实经济问题提供思路和方法,而且能够为经济学研究在方法、手段、分析工具等方面提供最有价值的理论模型,同时还能激励人们不断创新,加深人们对经济学理论和经济系统本身的认识与理解。

1.沙普利值的理论价值和实践意义

“沙普利值”提出了一个好的方法和机制,可以帮助企业根据边际贡献进行分配。由于“沙普利值”强烈的直观吸引力及数学上的易处理,它已成为很多研究的应用焦点,尤其是在大型经济模型中。“沙普利值”在经济理论上的其他应用包括税收模型,其中,政治权力结构建立在交换经济或生产经济的基础之上。此外,确定“沙普利值”的那些公理可以方便地转换为适合于解决诸如以一种“公平”的方式考察配置联合成本的问题。[9]

2.罗斯的市场设计理论与实践开创经济研究新领域——经济工程学

市场设计的核心问题是市场如何运作。对于竞争的商品市场,经济学家已经掌握了其中的一些基本要素。当价格发现和价格调整顺利进行时,经济主体根据他们看到的价格来选择自己想要的东西。但是许多市场要复杂得多,价格所起的作用似乎和商品市场有所不同。另外一些市场之所以未能获得有效的结果,是因为市场参与者不能安全地透露必要的私人信息。罗斯的系列市场设计理论与实践已经逐渐了解了市场为何失灵以及如何对其进行修复。沙普利的基本理论与罗斯的实证实验相互结合,各类实验和实际设计产生了一个研究和改善众多市场性能的研究领域。对于经济学学科而言,市场设计对最基础的经济学问题,包括市场如何运作以及当市场失灵时如何修复,提出了新的理论问题,提供了新的经验数据。随着市场设计的不断发展,它将越来越像一门工程学科,既需要设计知识,也需要在特定领域应用的知识。[5,10]

(二)经济学诺奖成果对中国经济的启示

随着2012年11月党的十八大顺利召开,我国将进一步推进社会主义市场经济体制改革,在许多体制和制度方面将发生重大变革。要解决改革中出现的问题,成功实现制度转型和资源有效配置,今年的诺奖理论无疑具有重要的借鉴和指导意义。因为获奖者观察问题的方式、思考问题的角度以及解决问题的建议可以给我们一些借鉴和启示。

1.合作博弈和稳定匹配理论引导公平合理分配机制设计

分配是任何时代、任何社会的重要问题。当前中国正向和谐社会迈进。一个和谐社会不仅要具有建立在完善法制基础上的公平竞争机制,同时也要建立各种各样的公平合理的分配机制。沙普利的公理化方法提供了讨论“公平”或“合理”的分配机制的一个理论框架。公平的并不是平均的,尽管有时是平均的。一个公平的分配遵循的原则是:所得与自己的贡献相等。合作博弈最大的价值在于其作为一个研究公平或合理分配机制的有效理论工具。匹配理论的一项重要功能,即把市场一方的代理人与另一方的代理人匹配起来。在经济体系中,代理人之间通常形成“对”或“集团”:工人和企业、医生和医院、学校和学生。这种划分本身就蕴涵合作。[11]

从经济学的角度看,当下全球的经济环境仍然十分复杂、变幻莫测,金融危机的影响尚未完全消除,世界经济走向如何?人们期待着能够实现经济稳定均衡发展。稳定配置是经济社会发展的一种最佳状态,也是人们所期待的一个目标。而通过市场设计是实现这种状态的一种手段或者方法,它是人们对经济均衡的一种构想。目前,中国尚且缺乏这种市场设计机制,因此,在一些关键市场建设中不妨借鉴该思路。如目前反复探讨的实体经济与金融业的匹配关系。中国已经步入自主性经济周期阶段。中国实体经济的要务已从“输血”转向“造血”。中国金融业一样处于增长的十字路口,要从助力实体经济中重新获取动能。只有为实体经济的长期均衡增长奠定坚实的基础,才能更大程度地保证金融资源的安全和收益。具体到银行信贷市场,匹配理论也大有用场。信贷市场的功能是把作为信贷需要方的企业和作为信贷供给方的商业银行匹配起来。[12]当前,我国银行信贷市场出现了二元结构——大企业客户信贷市场和中小企业客户信贷市场。这两个市场有着不同的运行机制。大企业客户信贷市场的分散化议价过程存在一个企业“求婚”的递延接受程序,市场的匹配结果稳定。中小企业客户信贷市场的分散化议价过程不存在导致稳定结果的匹配程序,市场效率低下,并且存在大量的策略行为。这种二元性导致信贷资金从中小企业客户信贷市场不断流向大企业客户信贷市场。根据GS算法,把中小企业客户信贷市场中的分散化议价过程变成中央化的匹配过程,有助于提高中小企业客户信贷市场的稳定性和运行效率。这需要政府管理层供给更多的机制建设。[13]

2.要重视通过市场机制设计来提高特定市场的效率

2012年诺奖得主的研究表明:很多市场失灵的问题,不能简单都归纳为“价格破坏”带来的后果,相反,却是因为市场存在“不匹配”的摩擦所致。罗斯通过一系列实验,发现“稳定”是了解特定市场机制成功的关键因素。因此,为修复资产价格、创造就业空间而采取的量化宽松的货币政策,不仅没有效果,反而会产生更大的未来通胀和资产泡沫的后遗症。不如采取针对性的“机制设计”,比如,引导“合作博弈”的模式,缓解至为关键的“供求不一致”的矛盾,效果可能会更好。具体到中国的房地产市场而言,房价一路飙升,引发了政府对房地产市场的多次宏观调控。其实,房价不单是一个价格问题,而是经济增长方式和收入分配方式等体制性障碍在房地产市场的集中体现。在住房已成为居民财产结构中最重要资产的背景下,调控房价不是遏制房地产业的发展,而是要通过适当的“机制设计”引导社会财富分配,缩小收入分配差距。[10,14]

当然,基于西方价值体系的合作博弈、匹配理论与市场设计实践要在中国得到有效应用,尚需对中国社会的一些典型因素进行分析。理论不必然成为解决问题的灵丹妙药,但它毕竟为中国的经济改革与实践推开了另一扇门。[9,15]

[1]LLOYD S SHAPLEY.“A Value for n-Person Games,”in Contributions to the Theory of Games:Vol.Ⅱ[M]//H W KUHN,A W TUCKER.Ann.Math.Studies 28.New Jersey:Princeton U-niversity Press,1953:307—317.

[2]LLOYD S SHAPLEY.Additive and Non-Additive Set Functions[D].Princeton:Department of Mathematics,Princeton University,1953:12—59.

[3]史晨昱.用合作博弈理论设计有效匹配方案——2012年诺贝尔经济学奖思想评述[EB/OL].(2012-10-17).http://www.chinavalue.net/.2012

[4]D GALE,SHAPLEY L.College admissions and the stability of marriage[J].Am.Math.Mon,1962,69:9—15.

[5]ALVIN E ROTH.The Economist as Engineer:Game Theory,Exerimentation,and Computation as Tools for Design Economics[J].Econometrica,1990,58:1475—1480.

[6]ALVIN E ROTH.The evolution of the labor market for medical interns and residents:A case study in game theory[J].J PolitEcon,1984,92:991—1016.

[7]ALVIN E ROTH.Misrepresentation and stability in the marriage problem[J].J Econ Theory,1984,34,383—387

[8]ALVIN E ROTH.Two-Sided Matching:A Study in Game-Theoretic Modeling and Analysis[M].Cambridge:Cambridge University Press,1990:49—121.

[9]杜丽群.稳定配置与市场设计实践理论为什么会获诺贝尔经济学奖[EB/OL].(2012-10-23).http://www.dfdaily.com/html/8762/2012/10/23/882465.shtml.

[10]张鑫.诺贝尔经济学奖越来越注重实践意义[EB/OL].(2012 - 10 - 17).http://business.sohu.com/20121017/n355012536.shtml.

[11]兰晓萌.罗思与沙普利的稳定分配理论[EB/OL].(2012-10 - 17).http://finance.sina.com.cn/roll/20121017/224313399251.shtml.

[12]姚树洁.2012年经济学诺奖关注资源分配[EB/OL].(2012 - 10 - 16).http://finance.qq.com/a/20121016/001600.htm.

[13]孙立坚.“机制设计”比“修复价格”更重要——看2012年经济学诺奖的政策意义[EB/OL].(2012-10-17).http://district.ce.cn/zg/201210/17/t20121017_23763130.shtml.

[14]钟鸿钧.2012诺贝尔经济学奖成果及其现实应用[EB/OL].(2012 -10 -17).http://finance.sina.com.cn/review/jcgc/20121022/101713435627.shtml.

[15]史晨昱.匹配理论引导公平合理分配机制设计[EB/OL].(2012 -10 -17).http://www.21cbh.com/2012/shzjb_1017/489272.html.

猜你喜欢
理论设计学生
坚持理论创新
神秘的混沌理论
理论创新 引领百年
相关于挠理论的Baer模
赶不走的学生
瞒天过海——仿生设计萌到家
设计秀
有种设计叫而专
学生写话
聪明的学生等