应急救灾三方博弈模型研究

2011-11-07 07:00:41张昊宇中国科学院科技政策与管理科学研究所北京100049

电子科技大学学报(社科版) 2011年3期

□张昊宇陈安 [中国科学院科技政策与管理科学研究所北京 100049]

应急救灾三方博弈模型研究

□张昊宇陈安 [中国科学院科技政策与管理科学研究所北京 100049]

基于大型灾害应急救灾的特征，提出了用于研究中央政府、地方政府和灾民行为的三方博弈模型。首先证明了在满足一定的假设条件下，此三方博弈存在纳什均衡并对均衡点进行分析，其次，研究了此模型框架下的道德风险问题，指出由于政府和灾民的相互不信任导致救灾效率未达到帕累托最优，并同时给出改进效率的一些建议，最后对此三方博弈模型的优缺点进行分析。

三方博弈; 纳什均衡; 应急救灾; 应急管理; 道德风险

引言

近年来，地震、火山以及海啸等大规模突发事件在全球频繁发生，不仅造成了巨大的物质财产损失，而且对人们的生命健康和安全造成了严重威胁。

在现阶段频发的大规模突发事件中，绝大部分突发事件具有地域性特征，即发生在某一地方政府管辖的区域内，如汶川地震等，这使得地方政府要在极短短时间内筹集大量的救灾物进行应急救灾工作。但是，考虑到突发事件爆发的偶然性、突然性以及强破坏性等特点，地方政府不可能独自完成大量应急救灾物资的筹备、存储和运输工作，这必然要求具有更加强大的资源筹措和调配能力中央政府的援助[1]。然而，考虑到政府提供的人力资源相对于庞大的救灾需求来说总是不足的，数量庞大的灾民群体在整个应急救灾过程中的作用也是不能忽略的。除此之外，政府和灾民间高效的信息沟通以及良好的合作对于提高救灾效率也起到重要作用。但是，并不是所有的灾民都会选择尽最大努力配合政府救灾工作，这种主观能动性除了受个人性格、道德等因素影响外，还受到多种因素的制约，如政府对于救灾的重视程度、投入救灾资源的多少以及对灾民的态度等。

已有许多学者应用博弈理论来研究应急救灾和恢复重建过程中各个主体的行为[2]。这些研究可分为两类：一类是关于应急管理论中博弈论的理论研究，另一类是直接利用博弈论对具体的突发事件（如电力、交通事故等）中各方行为进行分析的实践研究。

在理论研究方面，姚杰、计雷等构建了一个用来描述和分析“决策者”和“突发事件”之间相互作用的博弈论模型。在此模型中，“突发事件”被假设为“理性人”，其根据“效用最大化”准则选择自己的行为，并且假设“突发事件”获得的“效用”与其造成的损失成正比关系，即“突发事件”总是向最坏方向发展，总是选择“损失最大化”的行为。同时，本模型还尝试分析了动态应急决策方案如何生成的问题[3]。陈安、赵淑红将应急管理的参与者分为“主体”和“客体”两类，其中，“主体”主要指那些在应急管理过程中具有主观能动性的参与者，包括政府、救灾者、灾民和媒体等，而“客体”主要指“突发事件”本身。除此之外，他们还基于贝叶斯后验概率对模型进行了改进，并利用模型对任何两个参与者博弈行为进行分析[4]。徐兵在博弈论框架下，运用囚徒困境模型，以SARS为例分析了我国公共危机管理组织体系中存在的困境问题，提出破解方法，同时，运用委托代理模型分析公共危机管理中地方政府的虚假智力问题，并基于机制设计理论和锦标制度机制给出建立科学的激励和评估机制的方法[5]。

现阶段，关于博弈论在应急管理中的实践研究很少，田廓，曾鸣基于对电网应急管理典型环节的分析，定义了电网事故与电网管理者的博弈关系，并构建了以决策者期望效用最大化为目标的期望效用函数，根据贝叶斯法则解得电网动态应急管理方案决策的精练贝叶斯均衡解，由此提出电网应急管理的动态决策框架[6]。向红艳，张卓在分析高速公路交通事故特点的基础上，采用动态博弈技术将交通事故过程分为若干个阶段，研究了每一个阶段交通事故状态的变化及状态转移的概率矩阵，对救援决策者与交通事故之间的博弈过程进行了分析，根据动态博弈的路径，计算了每条博弈路径的救援保障率与救援成本，在满足一定的保障率约束的条件下，按照成本最低的原则，选择最优博弈路径作为救援预案[7]。

上面提到的研究绝大部分是围绕两个参与者展开，但是，应急管理中大部分的博弈过程不仅仅局限在两方，通常是在多方之间进行。基于此，本研究试图将两方博弈推广到三方博弈，即研究地方政府、中央政府和灾民之间三者的行为特征。之所以选择中央政府、地方政府和灾民作为博弈的参与者，一方面考虑到这三者是应急救援和恢复重建过程中最容易产生利益冲突的群体，另一方面，中央政府、地方政府和灾民是应急管理过程中最基础、最核心的参与者，可以作为三方博弈向n方博弈扩展的基础。与此同时，本研究对存在于模型中的道德风险问题进行了深入分析，并提出了减弱道德风险的负面影响，提高救援效率的几条可行性建议。本研究还引入了中央政府对地方政府的“惩罚变量”，并对惩罚变量如何影响救援效率进行分析，从而为应急管理中的奖惩机制设计提供理论基础。

一、三方博弈模型

（一）模型要素

区域性巨灾：发生在某一区域的，损失极为严重的特大型自然灾害。一般来说，在这类灾害发生后，地方政府无力独自应对救灾工作，需要中央政府在人力、物力和财力上予以支持。汶川地震即为典型的这类灾害。

参与者：本模型假设应急救灾过程中有且仅有三方参与博弈，包括中央政府、地方政府和灾民。在灾害发生后，中央政府在迅速做出反应，派出专家组赶赴灾区，进行灾害评估和救援工作。与中央政府相比，地方政府的行动较为迟缓，之所以给定这种反应速度上的假设，有以下几方面的原因：首先，中央政府无论在融资方面，还是在救灾资源（包括救灾者、救援物资等）的储备和筹措上，都远远强于地方政府，这使得在灾害发生后，中央政府比地方政府能更迅速地筹措和配置救灾资源；其次，在某些情况下，本文所研究的“区域性巨灾”对地方政府所在区域的人力和物质财产打击是巨大的，甚至有可能导致地方政府陷入瘫痪，一旦如此，地方政府便不可能第一时间展开有效的救援工作，从另一个方面讲，即使地方政府在灾害发生后立即筹备救灾物资并运送到灾区，这些救灾物资与整个救灾过程的巨大需求相比，也是可以忽略的；再次，对于地方政府而言，在不可抗拒的巨灾发生后，其一般会进入一种“消极等待”状态，因为在地方政府看来，中央政府对于这类巨灾的救援工作应担负更大的责任。

本研究将灾民的“自救”行为视为整个救灾成功与否的关键因素之一，这是因为在实际的救灾过程中，不论中央政府和地方政府如何努力筹措救灾资源，尤其是直接进行救灾工作的人力资源，对于灾害的巨大需求而言都是远远不足的，而此时灾民的自救便可发挥重要的作用。灾民不仅可以提供庞大的人力，而且熟悉环境，以及信息的获取难易程度都较政府组织的人力资源具有极大的优势，一旦这种自救的主观能动性得到充分发挥，对于整个救灾的意义是不言而喻的。但是，考虑到灾民自身的“理性人”特征，这种主观能动性并不是一直处于最高点，它会受到政府行为的影响，本文采用“努力程度”来度量这种主观能动性的大小。

（二）博弈过程

整个救灾的三方博弈过程见图1，具体分析如下：

图1 三方博弈流程图

区域性巨灾突然爆发，中央政府迅速派出专家队伍赶赴灾区，对灾情进行评估以便确定灾害等级；在灾害等级确定后，中央政府决定救灾投入的力度，用变量“Ic”表示，这里的救灾投入包括物质援助（如救灾帐篷、救灾食品等）以及精神层面的支持（包括提供灾后心理辅导，普及救灾医疗知识等）。除此之外，本模型引入惩罚变量“P”，用来度量一旦救灾失败，中央政府给地方政府的惩罚，这种惩罚可能是指对地方政府主要领导人的撤职处分或者其他行政、财政等处罚。

灾民根据所观测到的中央政府的Ic和P，确定自身的“努力程度”，即在救灾中发挥出来的自救、协助救灾等主观能动性的大小，假设这种主观能动性不为博弈的其他参与者（中央政府和地方政府）所知，并用变量e来表示。同时，定义衡量灾民因努力而付出代价的函数，即成本函数C(e)，本模型假设成本函数仅与努力程度e有关，并假设成本随努力程度增加而增加，即C'(e)＞0，且满足边际成本递增的性质（成本函数为凹函数），即C''(e)＞0。

同样，地方政府观察中央政府的Ic和P，决定投入力度Il，这里的Il同样包括救灾资金和救援物资等[8]。

本模型假设此博弈过程只有一个阶段，且最终救灾结果只能处于“成功”或者“失败”两种状态，并假设救灾成功概率为 α(Ic)β(Il)γ(e)，其中α(Ic),β(Il),γ(e)分别由中央政府投入Ic，地方政府投入Il以及灾民的努力程度e决定的三个概率函数。从救灾成功概率的定义形式可以看出，中央政府投入、地方政府投入以及灾民自身努力三个要素缺一不可，只要有一项投入为零，必然导致整个救灾过程的失败。

关于 α(Ic)，本模型假设其满足几条性质：

（1）0 ≤ α(Ic)≤ 1，即概率在[0,1]区间内；

（2）α' (Ic) ＞ 0，即随着投入的增加，由投入决定的成功概率逐渐增大；

（3）α' '(Ic) ＜ 0，即随着投入的，成功概率表现出边际递减的性质。

一旦救灾成功，本模型假设中央政府、地方政府和灾民均获得各自的收益，分别记为否则，三者的收益均为0。在本模型中，我们不考虑的具体值大小，而仅关心实现这种收益的可能性，即概率大小。从下面的分析过程可以看出，这种处理能够使对三者行为的分析更为简便和有效。

在博弈过程中，我们假设博弈参与人（中央政府、地方政府和灾民）具有共同知识，即对整个博弈的规则和过程，以及不同决策下各自的赢得值具有相同的认知。除此之外，本模型还假设此博弈过程是信息不完全的，这表现在灾民的成本函数C(e)（也可认为是自身的努力程度e）只为其个人所知，中央政府和地方政府不能观测到。

（三）参与者决策

中央政府的期望收益（期望赢得）用变量Uc表示，且Uc的计算过程如下：

表1 中央政府期望收益的概率分布

Uc计算公式如下：

采用同样的方法可以计算出地方政府和灾民的期望收益Ul和Uv，

本模型假设 Uc≥ 0,Ul≥ 0,Uv≥ 0,，即期望收益（这里的期望收益不仅仅指物质利益，还包括声誉、社会认可度等非物质利益）非负，否则博弈各方将选择退出此博弈过程；同时，期望收益非负性的假设和传统经济学中“理性人”的假设相一致，即如果参与者不能获得某一收益，参与者将不会参与博弈过程。

各博弈参与方的期望收益汇总,如表2所示。

表2 博弈各方期望收益（赢得）汇总

二、均衡分析

这一部分重点分析博弈过程中均衡状态如何形成。一般来说，应急救灾博弈中的中央政府可以认为是一个“斯塔克尔贝格领导者”（Stackelberg Leader）。所谓“斯塔克尔贝格领导者”，是指那些掌握博弈中其他参与者反应函数，且自身行为会对其他参与者造成影响，并且基于对这种影响的考虑而做出使其效用最大化行为的主导型参与者。此博弈过程中的中央政府基于地方政府和灾民的利己动机而选择 Ic,P的值，并假设中央政府利用“逆向归纳法”做出决策。“逆向归纳法”又被称为“逆推法”，是求解动态博弈均衡的一种比较经典的方法。所谓“动态博弈”是指博弈参与人的行动存在着先后次序，并且后行动的参与人能够观察到前面的行动，而“逆向归纳法”则是从动态博弈的最后一步往回推，以求解动态博弈的均衡结果。

尽管博弈中的Il和e两个变量不是同时做出决策的，但可以把地方政府和灾民的决策行为看作是无次序的，即可以认为两者同时做出决策。之所以可以这样处理，是因为不论对中央政府，还是地方政府来讲，灾民的努力水平变量e是不可观测的，而中央政府一旦做出决策，其Ic和P的值则可以被地方政府和灾民观测到。

为了研究此博弈如何达到均衡状态，对地方政府期望收益函数关于投入变量Il，灾民收益函数对努力水平变量e分别求一阶导数并令其为0，具体如下：

对地方政府的期望收益函数对其投入变量Il求一阶偏导数，

对灾民的期望收益函数对其努力水平变量求一阶偏导数，

中央政府期望效用函数对其投入变量Ic求一阶偏导数，

中央政府期望效用函数对其惩罚变量P求一阶偏导数，

下面证明在此模型的假设下，博弈过程的均衡状态总是存在的。

定理1：此博弈模型存在均衡解。

证明：考虑地方政府如何决定Il以及灾民如何决定e。

对地方政府的期望收益函数Ul关于其投入变量Il求二阶偏导数，

从博弈均衡状态的求解过程可以看出，只要地方政府和灾民之间的子博弈均衡存在，则整个博弈过程存在均衡解。由式（5）和式（6）可以看出，地方政府和灾民的期望收益函数具有凹形，根据“纳什均衡点存在理论”可知，此子博弈存在均衡状态，故整个三方博弈过程存在均衡解。

三、道德风险

考虑到地方政府和灾民在做出决策时存在“签约后机会主义”行为（这里所谓的“签约”是指地方政府对灾民承担救灾责任，灾民有义务在救灾过程中进行配合并实施自救，这里可以认为是约定俗称的一种协议，当然，现实中不会真正签署此类协议），这种行为会导致救灾过程中的“道德风险”问题，即地方政府和灾民都认为对方应该承担更大的责任，表现为地方政府的投入比其应该的投入要少，灾民会比起应该的努力水平低，总之，双方均不会“全力以赴”来进行救灾工作，进而造成救灾的无效率。

下面证明存在此种博弈的救灾工作确实是无效率的。

证明：

四、结论

首先，现阶段博弈论理论研究大部分集中在两个参与者之间，很少涉及三个参与者之间的博弈关系分析，而本研究尝试将两方博弈推广到三方，构建了应急救灾过程中中央政府、地方政府和灾民三方的博弈模型，在利用“后向归纳法”求解模型均衡解的基础上，对博弈的均衡点进行研究。

其次，本研究证明了应急救灾过程中的可能存在的道德风险问题，指出由于地方政府和灾民之间的相互不信任造成的应急救灾效率的损失，即双方都存在机会主义行为，都不会主动地增加各自的投入或努力水平，即便这能够使得博弈各方的效率都得到提升。为了减轻道德风险造成的效率损失，可以考虑改变中央政府对地方政府的威胁力度（即调整变量P）或者提高信息的透明程度以及信息在各方之间传递的准确度和效率。

然后，本研究还有许多亟待解决的问题，比如本模型假设应急救灾过程是单阶段的，但现实中，这是一个多阶段博弈过程，需要引入更复杂的数学工具进行建模以及求解；除此之外，本模型忽略了地方政府和中央政府在救灾投入上的讨价还价过程，而这恰恰是理论和实践研究所关注的重点，因此，将讨价还价模型引入三方博弈过程将是下一阶段的重要工作之一。

[1] 陈安, 陈宁，倪慧荟. 现代应急管理理论与方法[M].科学出版社，2009:20-25.

[2] 陈安，马建华，李季梅，亓菁晶. 现代应急管理应用与实践[M]. 科学出版社，2010: 35-39.

[3] 姚杰，计雷，池宏. 突发事件应急管理中的动态博弈分析[J]. 管理评论， 2005,17(3): 46-50.

[4] 赵淑红. 应急管理中的动态博弈模型及应用[D]. 开封：河南大学，2007: 29-37.

[5] 徐兵. 基于博弈理论的我国公共危机管理中若干问题研究[D]. 上海：同济大学，2008:6-37.

[6] 田廓，曾鸣，王晶晶等.于精练贝叶斯均衡的电网动态应急管理[J]. 电力，2009,37(1): 103-106.

[7] 向红艳，张卓. 高速公路交通事故紧急救援的预案生成模型[J]. 大连交通大学学报，2009,30(3):9-11.

[8] ELITZUR R,GAVIOUS A. Contracting, signaling, and moral hazard:a model of entrepreneurs, ‘angels,’ and venture capitalists[J]. Journal of Business Venturing, 2003,18(6):713-718.

编辑何婧

Interpret the Jumping Events of Foxconn from Sociological Perspective

ZHANG Hao-yu CHEN An
(Institute of Policy and Management, Chinese Academy of Sciences Beijing 100049)

Based on the characteristics of large-scale emergency disasters relief, this paper presents a tripartite game model to research the behaviors of the central government, the local government and victims. The study characterizes the optimal state of equilibrium among the players and provides insights into the related institutional arrangement. Next, the study analyses the moral hazard problems of the local government and victims.It shows that the outcome of the game is not efficient and some suggestions are given to enhance the efficiency.Finally, it analyses the merits and shortcomings of the model and presents some concrete proposals for improvement.

tripartite game model, Nash equilibrium, emergency disaster relief, emergency management, moral hazard

D523

1008-8105(2011)03-0024-05

2011 - 05 - 04

张昊宇（1986-）男，中国科学院科技政策与管理科学研究所硕士研究生；陈安（1970-）中国科学院科技政策与管理科学研究所研究员. .

应急救灾三方博弈模型研究

引 言

一、三方博弈模型

二、均衡分析

三、道德风险

四、结 论

引言

四、结论