基于系统动力学的邻避设施PPP项目三方演化博弈分析

2019-12-17 06:06:14刘亚群王洪强

运筹与管理 2019年10期

程敏，刘亚群，王洪强

(上海大学管理学院，上海 200444)

0 引言

PPP(Public-Private Partnership)是一种公共部门与私人部门合作来提供公共产品或服务的模式[1]。该模式因能缓解政府财政压力，提高公共产品供给效率而被逐渐广泛应用于基础设施项目。其中，不少邻避设施(如污水处理厂、垃圾焚烧场等)采用PPP模式进行建设运营。邻避设施指具有污染威胁但又是区域发展所必需的公共设施，这类项目产生的社会效益由社会公众共享，但负外部效应却由设施附近的居民承担，因此常会遭到其反对而产生“邻避效应”[2]。由于这类项目运营期长，涉及政府、企业和公众多方主体的利益，现实中常出现诸如政府监管不力、企业运营不当、公众强烈反对等导致项目面临高风险甚至失败的情况(如长春汇津污水处理项目、天津双港垃圾焚烧项目、兰州威立雅水务项目等)，合理处理好各方利益、设计科学的运行机制是邻避设施PPP项目健康可持续运行的关键。

公共部门和私人部门是PPP项目中的两个关键利益主体，不少学者基于公私合作的视角从风险分担、利益分配、绩效评价等方面研究了PPP项目的运行机制。例如，风险分担方面，Ameyaw等[3]采用实证数据和模糊理论建立了有效控制原则下的PPP风险分担模型；汪勇杰等[4]构建公私部门的效用函数，采用演化博弈讨论了长短期合作时公私部门的风险分担比例；利益分配方面，Viegas[5]研究了交通运输PPP项目的利益分担问题；胡丽等[6]建立了基于Shapley修正的PPP项目利益分配模型，以协调各方利益；绩效评价方面，郑传斌等[7]以付费类型和关系态度为调节变量研究了PPP关键成功因素对绩效的影响。以上这些研究一般仅关注公共部门和私人部门两个利益主体，并未考虑公众参与。对于邻避设施PPP项目而言，由于公众的反应往往是决定项目成败的关键因素，因此，有必要建立考虑公共部门、私人部门、公众三方利益需求的运行机制。

PPP项目中，由于各方利益需求不同，利益相关者之间存在相互间的博弈。博弈论适合研究多主体行为，目前有不少学者用博弈论研究PPP中的问题。例如，杜杨和丰景春[8]、吴孝灵等[9]都基于Stackelberg博弈模型研究了PPP项目的补偿机制；王颖林等[10]通过建立政府部门与投资方之间的激励—努力博弈模型分析了投资方的投机行为；李林等[11]采用讨价还价博弈模型研究了PPP项目风险分配问题。相关研究主要局限于公私两方主体间的静态博弈，很少有对三方参与主体互动演化行为的研究。同时，现有的研究一般假设博弈参与方为完全理性，但现实中却很难达到这种完全理性，因此，有待采取更为科学合理的方法研究PPP项目中的参与方行为。

在实际的邻避设施PPP项目中，项目成功由公共部门、私人部门、公众三方共同决定，各利益主体通过相互模仿的学习行为形成博弈关系。不同于经典博弈论的完全理性假设，演化博弈理论以有限理性为基础构建主体交互的动态系统，以此描述参与主体的行为演化过程。因此，演化博弈方法更适用于分析邻避设施PPP项目中的多主体行为。然而，演化博弈中的演化稳定策略只能描述系统的局部动态均衡，无法反映主体博弈行为与宏观涌现之间的交互过程。

系统动力学(System Dynamics，SD)作为一种研究复杂系统中信息反馈行为的有效仿真方法，可以对系统未来的行为进行动态仿真，关注系统的动态变化与因果影响，在非完全信息情况下求解复杂问题，得到系统未来发展的趋势和方向。因此，本文将演化博弈与SD结合起来研究邻避设施PPP项目中的多主体行为。首先，运用演化博弈论中的“复制动态”思想分析研究政府、企业和公众三者之间的博弈关系，然后，采用系统动力学模拟仿真以期揭示多主体构建协作机制、形成稳定策略的行为选择。

1 博弈模型构建

1.1 问题描述和基本假设

演化博弈理论将参与博弈的主体设定为一个“种群”，并假定其为有限理性，群体行为达到均衡需要参与主体间的相互学习、模仿，通过研究群体成员策略比例的变化趋势和稳定性，分析预测群体行为的长期趋势并解释各种普遍性社会现象。近年来，演化博弈被广泛应用于社会经济生活中的制度变迁和人类行为，其核心是演化稳定策略和复制动态。演化稳定策略是群体抵抗变异策略入侵时的一种稳定状态，当某一群体的当前策略能完全不受其他任何小群体的变异策略干扰时，其就达到了演化稳定状态；复制动态则是描述博弈方策略调整动态机制的模型。

在邻避设施PPP项目中，政府将部分责任转移给企业并监管企业行为，考虑到监管成本等原因，政府会选择积极监管，也可能会选择消极监管，因此政府的行为策略空间为(积极监管，消极监管)；大多数邻避设施属于先天经济性弱的项目，基于自身利益的考虑，企业会有积极努力的内在动机，也会有采取机会主义行为的主观动机，因此企业的行为策略空间为(积极努力，机会主义)；邻避设施提供的服务结果与民众生活质量密切相关，公众可能会为保护自身权益而对企业进行监督，也可能因为监督成本太大等原因不参与监督，因此公众的行为策略空间为(参与监督，不参与监督)。三方主体均符合有限理性人假设，在博弈中通过不断获取其他主体的信息逐渐改变自己的策略，系统在交互过程中发生变化，最终达到某一稳定状态，这与演化博弈的特征相符，因此，可基于演化博弈理论对邻避设施PPP项目中三方行为进行分析。

1.2 确定模型参数

对公众而言，参与监督的成本为Cp，来自政府的奖励为Rp，企业采取机会主义行为所引发的社会利益损害为Fp。

政府选择积极监管策略的比例是x，选择消极监管策略的比例是1-x；企业选择积极努力策略的比例是y，选择机会主义策略的比例是1-y；公众选择参与监督策略的比例是z，选择不参与监督策略的比例是1-z，且x,y,z∈[0,1]。相关参数及设定如表1所示。

表1 主要参数设定及含义

1.3 构建收益矩阵

根据上述分析和假设，邻避设施PPP项目各主体在不同的策略组合下的收益支付如表2所示。

表2 政府、企业和公众演化博弈支付矩阵

2 三方主体演化博弈行为均衡分析

2.1 博弈三方的期望收益和平均收益

UA1=yz(Rg-Cg-Rp-Re-K)+

y(1-z)(Rg-Cg-Re-K)+(1-y)

z(Rg-Cg-Rp-Re+Fe)+

(1-y)(1-z)(Rg-Cg-Re+Fe)

(1)

(2)

(3)

UB1=zx(Re-Ce)+z(1-x)(Re-Ce)+(1-z)

x(Re-Ce)+(1-z)(1-x)(Re-Ce)

(4)

(5)

(6)

UC1=xy(Rp-Cp)+(1-x)y(-Cp)+x(1-y)

(Rp-Cp-Fp)+(1-x)(1-y)(-Cp-Fp)

(7)

UC2=x(1-y)(-Fp)+(1-x)(1-y)(-Fp)

(8)

(9)

2.2 三方主体的复制动态方程和演化稳定性分析

1) 基于复制动态方程原理，根据式(1)和(2)可构造政府采取积极监管策略的复制动态方程为:

=x(1-x){[yz(Rg-Cg-Rp-Re-K)+y(1-z)(Rg-Cg-Re-K)+(1-y)

z(Rg-Cg-Rp-Re+Fe)+(1-y)(1-z)(Rg-Cg-Re+Fe)]-

(10)

根据演化博弈的性质，当F在稳定点的导数为负时，该均衡点所示策略为演化过程中主体的稳定策略，对(10)式求导得:

F(x)′=(1-2x){z[y(Fe-Fg)+Fg-Fe-Rp]-

(11)

2)根据(4)和(5)可构造企业采取积极努力策略的复制动态方程为:

=y(1-y){[zx(Re-Ce)+z(1-x)(Re-Ce)+

(1-z)x(Re-Ce)+(1-z)(1-x)(Re-Ce)]-

(12)

对(12)式求导得:

F(y)′=(1-2y){x[-z(Fe+K)+Fe+K]+

(13)

3)根据式(7)和(8)可构造公众采取参与监督策略的复制动态方程为:

=z(1-z){[xy(Rp-Cp)+(1-x)y(-Cp)+

x(1-y)(Rp-Cp-Fp)+(1-x)(1-y)(-Cp-Fp)]-

[x(1-y)(-Fp)+(1-x)(1-y)(-Fp)]}

=z(1-z)(xRp-Cp)

(14)

对(14)式求导得:

F(z)′=(1-2z)(xRp-Cp)

(15)

注:x是政府选择积极监管策略的比例;y是企业选择积极努力策略的比例;z是公众选择参与监督策略的比例图1 三方主体动态趋势相位图

2.3 三方演化博弈系统的均衡分析

在分别讨论了政府、企业、公众三方博弈行为决策的复制动态过程之后对整个演化博弈系统进行均衡分析，由公式(10)、(12)、(14)构成的复制动态方程组的值域为[0,1]×[0,1]×[0,1]。

(16)

当X=0时，即可求得政府、企业、公众三方主体的演化稳定策略。其中，存在8个特殊的均衡解，分别为(0,0,0)、(0,0,1)、(0,1,0)、(0,1,1)、(1,0,0)、(1,0,1)、(1,1,0)、(1,1,1)，这8个点为该演化博弈的纯策略纳什均衡解，即当主体选择某一策略时，只要没有出现改选其他策略的突变体，则这一主体的选择会稳定在该策略，由这8个点围成的区域Ω={(x,y,z)|0

除上述8个纯策略纳什均衡解之外，演化博弈在区域Ω内还存在一个混合策略纳什均衡解E=(x0,y0,z0)，E满足式(17)，使得X≡0，E点意味着系统处于稳定状态，即参与主体的策略选择比例不会随时间而变化。

(17)

由式(17)可解得：

(18)

(x0,y0,z0)的取值都在0到1的范围之内，当E点的取值不在区域Ω时，应当舍弃点E。显然，在这一演化博弈系统模型中，政府奖励、公众参与监督的成本、政府收益、政府检查费用、企业违规惩罚等变量直接影响三方博弈主体的行为策略选择。

Friedman[12]提出通过分析系统的雅可比矩阵来判断局部均衡点的稳定性，当det(J)>0、tr(J)<0同时成立时，均衡点会逐渐趋近系统的局部稳定状态，即可通过det(J)和tr(J)的符号来判断政府、企业和公众采取的策略是否为演化稳定策略。分别求解(10)、(12)、(14)关于x，y和z的偏导数得到雅克比矩阵:

(19)

tr(J)=(1-2x)w(y,z)+(1-2y)t(x,z)+(1-2z)g(x,y)

(20)

由式(20)分析演化博弈均衡点的局部稳定性，结果如表3所示：

表3 均衡点的局部稳定性分析

由上述分析可知，虽然演化博弈分析给出了系统在一定条件下的稳定状态，但由于涉及的参数较多，且det(J)和tr(J)的符号取决于这些参数值的大小，在现有的已知条件下仅仅运用数学求导的方法并不能确定每个纳什均衡解的稳定性，也就无法确定使该演化博弈模型达到稳定状态的均衡点。因此，本文进一步采用系统动力学进行分析，研究各种不确定性因素对博弈演化过程的影响，为制定相关政策提供依据。

3 系统动力学模型的建立与仿真分析

3.1 系统动力学模型建立

根据上文分析，采用Vensim PLE软件建立邻避设施PPP项目政府、企业、公众演化博弈的系统动力学模型，如图2所示。

图2 政府、企业、公众演化博弈系统的SD仿真模型

SD模型由不同的存变量要素构成。该系统模型中，x,y,z是3个存量，分别为政府积极监管变化率、企业积极努力变化率、公众参与监督变化率这3个速率变量对时间的积分；UA1、UA2、UB1、UB2、UC1、UC2为6个中间变量；12个外部变量为系统边界以外的变化因素。

3.2 初始仿真分析

由于政府、企业、公众三个参与主体的策略选择均为0和1两种，这就构成了8种策略组合：(0,0,0)、(0,0,1)、(0,1,0)、(0,1,1)、(1,0,0)、(1,0,1)、(1,1,0)、(1,1,1)。当三方主体的初始状态均为纯策略时，系统处于均衡状态，此时任何一方主体都不愿主动改变现有策略，这8种策略组合都将成为系统的均衡状态。但这种状态并不稳定，只要系统中有一方或多方主体有微小改变，系统就会失去均衡状态。以(0,0,1)这一策略组合为例，其演化结果如图3(a)所示。由图3(a)可知，虽然政府选择积极监管策略和企业选择积极努力策略的初始概率都非常低(均为0.01)，但是在博弈中，只要参与主体发现系统中存在更高收益的策略选择，就会调整原有策略，这样通过主体间不断地相互学习、模仿，系统最终能够达到新的均衡状态[13]。

通过对8种纯策略组合的仿真可以看出：

(1)无论政府策略是从0到0.01还是1到0.99开始发生微小突变，其策略选择最终都会在1处达到均衡状态，说明在邻避设施PPP项目中政府积极监管是最优选择，政府有责任积极监管代替其履行公共服务职能的企业。

(2)在政府积极监管的情况下，如果企业采取机会主义策略，公众不论是从0还是从1开始突变，其最终策略都是1，即(1,0,0)和(1,0,1)两种策略组合的演化结果都是(1,0,1)，如图3(b)所示；如果企业积极努力，则公众不论是从0还是从1开始突变，其最终策略也都是1，即(1,1,0)和(1,1,1)两种策略组合的演化结果都是(1,1,1)，如图3(c)所示。

通过分析可知，通过博弈三方“突变—调整策略—均衡”的演化博弈过程，系统最终会达到(1,1,1)的均衡状态。

图3 x、y与z不同取值时的演化博弈图

3.3 外部变量对策略影响的仿真分析

由表2可知，各参数的取值决定各策略组合是否为使系统达到稳定状态的均衡点，这些参数即为仿真系统中的外部变量。下面以策略组合(0,0,1)为例探讨各外部变量对策略选择的影响。

(1)政府策略选择的影响因素

图4 外部变量对政府策略选择的影响

(2)企业策略选择的影响因素

图5 外部变量对企业策略选择的影响

(3)公众策略选择的影响因素

经仿真分析结果可知，政府对参与监督的公众的奖励Rp、公众参与监督的成本Cp这两个外部变量对公众策略的选择有明显的影响，如图6所示。由图6(a)和(b)可知，政府对参与监督的公众的奖励Rp越大，公众越倾向选择积极监管策略，说明公众的策略选择受政府影响，政府对公众行为也有着引导作用。由图6(c)可知，当政府对公众的奖励Rp与公众参与监督的成本Cp的差值大于零时，公众选择参与监督，差值越大，公众达到参与监督稳定状态的速度越快。当差值等于零时，公众虽然有参与监督的突变意愿，但由于“搭便车”的现象使得公众即使遭受公共利益损害也不会主动参与监督。因此，为促使公众参与监督，政府不仅要提供奖励，奖励的金额还必须足以覆盖其参与监督的成本。

图6 外部变量对公众策略选择的影响

3.4 基于模型仿真结果的对策建议

根据上述模型仿真分析结果，对邻避设施PPP项目三方主体行为提出如下建议：

(1)发挥政府主导作用，构建多主体的协调机制

经仿真发现，政府、企业和公众对外部变量取值的变化都比较敏感，其策略选择由多个变量共同影响，项目顺利进行需要多方主体的共同参与。其中，公众和企业的策略选择较大程度上受政府不同策略时的参数取值影响，即政府对其策略选择具有引导作用，因此，政府方是三方博弈行为选择的主导者。在这些外生变量中，基于生产能力正常运营可实现的收益Re和社会利益损害值Fp不会直接影响企业和公众的策略选择，即企业并不会因为项目收益越大态度越积极，公众由于存在“搭便车”的情况，也不会因为社会利益损害值大就主动参与监督。为引导企业和公众积极参与监管，政府需要发挥主导作用，兼顾多主体的利益诉求构建协调机制。

(2)重视公众参与监督，构建社会监督保障体系

对于邻避设施PPP项目，公众的监督将影响政府和企业的策略选择。仿真结果表明，政府对公众的奖励Rp与公众参与监督的成本Cp的差值大于零时，即当公众监督能得到一定承诺和保障时才会选择积极监督。因此，政府要构建社会监督保障体系，完善公众参与监督机制，包括通过完善激励制度，鼓励和支持公众对企业行为进行监督；通过互联网、专线电话等方式，方便公众参与监督，降低公众监督成本；通过构建PPP项目沟通平台、建立公开透明的项目信息发布渠道等，以利于社会监督和激励企业控制成本、提高服务水平，保障政府和公众利益。

(3)设计合理的惩罚方案，构建激励相容的支付机制

仿真结果表明，适当提高企业违规时的惩罚Fe可以促使企业积极努力。因此，政府要合理界定不良服务及相应扣款细则，设计适当的惩罚方案和金额。除此以外，政府也要构建激励相容的支付机制引导企业积极努力，把项目支付机制与绩效考核紧密联系，根据产出和绩效进行付费等。

4 结论

本文在有限理性的前提下，通过构建邻避设施PPP项目中政府、企业和公众三方演化博弈模型，对三方互动行为及稳定状态进行了分析，并在此基础上建立系统动力学模型进行仿真，分析不同因素对三方行为的动态影响。结果表明，三方主体的策略选择由多个外部变量因素共同作用，系统能够达到(政府积极监管、企业积极努力、公众参与监督)的均衡状态，政府对企业和公众行为起着引导作用，政府既要通过设立合理的惩罚方案来减少企业机会主义行为，也要鼓励公众参与监督。将演化博弈论和系统动力学方法相结合研究邻避设施PPP项目中的主体行为是一种新的尝试，然而现实状况往往比现有的研究假设复杂。因此，结合实际进一步深化模型，更贴切地仿真和描述PPP项目中的博弈行为是未来研究的方向。