雾霾治理中的协作机制研究:基于演化博弈分析

2020-10-24 02:53:06廖梦灵

运筹与管理 2020年5期

高明，廖梦灵

(福州大学经济与管理学院，福建福州 350116)

0 引言

据《中国统计年鉴(2002～2017)》数据显示，2001年中国治理工业污染废气投资额为65.8亿元，2013年上升至640.9亿元，2016年为561.6亿元，相对于2013年而言投资额有所下降，但却是2001年投资额的8.5倍。不过与治理投入形成鲜明对比的是，2013年中国气象局统计发现该年度中国25个省份，100多个大中型城市受到雾霾污染的威胁，全国平均雾霾日达29.9天，创52年来之最[1]。近年来，地方政府加大雾霾治理执行力度，污染情况有所改善，但效果并不显著。从国家统计局、环境保护部等部委编印的《中国环境统计年鉴2017》和生态环境部发布的《2017年中国生态环境状况公报》可知，2017年中国338个地级及以上城市中，空气质量不达标城市占总数的70.7%，平均雾霾日仍有27.5天。雾霾的形成原因复杂、波及范围广阔，而且大气环境属于公共物品，具有非排他性和非竞争性[2]，这使得在雾霾治理过程中容易产生“公共地悲剧”、“囚徒困境”等问题，探究如何打破雾霾治理僵局是当前面临的巨大挑战。

通过文献分析可知，目前较多学者从环境规制的角度探讨雾霾污染的治理对策。比如，Oliva[3]对比分析不同时期墨西哥汽车污染气体排放情况后，提出可以通过环境规制间接影响官员腐败成本的方式改善空气污染。Cole等[4]以英国制造业为例研究工业活动、环境规制和空气污染之间的复杂关系，结果表明无论是正式的还是非正式的环境规制都能有效降低工业废气污染。刘晨跃等[5]运用中介效应方法研究中国30个主要城市2003～2014年面板数据，发现环境规制能有效促进产业结构升级和能源消耗结构优化。王书斌等[6]分析了不同环境规制工具对企业投资意向和雾霾脱钩效应的影响，研究表明适当的提高环境管制力度和监管强度可以促进企业结构转型，实现绿色经济发展。王波等[7]将雾霾污染和现代环境责任理论结合，对当前环境规制政策进行了创新性研究并提出了完善建议。

也有学者从雾霾污染的跨域性和溢出性等特点出发，研究雾霾污染府际协同治理。比如，Kelly等[8]通过分析雾霾治理困境发现府际协同治理是必要的，并在此基础上提出了建议。Gunningham[9]认为可以采取协同组织模式或者府际协议模式解决雾霾污染的跨域治理问题。Schleicher等[10]和Wang等[11]分别探讨了府际协同治理措施对北京奥运会与APEC会议期间空气质量的影响，研究表明联合治理可以有效改善雾霾污染。蔡岚[12]认为建立横向政府和纵向政府之间的良好合作关系，有利于控制区域性的空气污染。李根生等[13]研究了财政约束和区域雾霾污染的关系，发现无约束下区域间污染溢出会导致雾霾污染加重，而府际协同治理能解决这一问题。白俊红等[14]和Sigman[15]发现环境分权制度可以改善本区域的雾霾污染，但会加重周边地区的污染状况，“联防联控”是减轻污染跨域和溢出危害的重要举措。

与此同时，还有部分学者基于演化博弈论研究多元主体联动治理机制，探讨雾霾治理过程中使多方主体达成合作并长期保持稳定关系的条件。比如，Ma等[16]运用演化博弈理论分析参与主体在政府监督和非政府监督下的行为，阐述了政府参与雾霾治理的重要性。Guo[17]从合作利益的角度出发，探讨了各利益主体在雾霾治理行动中的演化趋势和稳定策略。高明等[18]通过建立中央政府和地方政府间的演化博弈模型，研究影响大气污染合作治理联盟形成的因素。王欢明等[19]在此基础上引入企业主体，通过对比分析找出满足雾霾治理行动中利益相关者需求的协作机制。徐莹等[20]研究了雾霾背景下政府和交通企业的演化轨迹，Li等[21]认为无公众参与的政府-企业治理模式不能使系统达到最优状态，结果表明公众参与程度确实会显著影响治理效果[22～24]。

总的来说，国内外学者在雾霾治理方面取得了丰富的研究成果，也为本文提供了重要的理论基础，但仍有其局限性：一方面，现有研究侧重于从环境规制、企业结构转型和府际协同治理等角度探讨雾霾治理对策，缺乏对治理主体的行为选择及其动力机制研究；另一方面，在基于演化博弈论的雾霾治理研究中，主要考虑的是政府和企业之间的博弈关系，忽略了公众这一重要参与主体，即使部分研究涉及到公众，也是通过两两博弈对主体策略进行演化分析，无法实时观测条件变化对三方策略的影响，但现实中环境治理(包括雾霾治理)行为是三方治理主体共同作用过程。鉴于此，本文运用演化博弈基本理论，在有限理性的假设前提下，构建三方动态博弈模型，分析雾霾治理过程中地方政府、污染企业和公众的动态特性，从而揭示各方形成协作机制的条件，为改善雾霾污染提供政策建议。

1 雾霾治理中的三方博弈模型构建

1.1 基本假设

(1) 地方政府与公众之间的博弈

地区经济增长率是地方官员晋升机制中的重要考核标准之一，在此背景下，地方官员会采取“骑跷跷板”的方式有选择的对污染企业进行治理，以推动本地区经济的增长，从而获得快速升迁的机会[25,26]。随着社会的发展和公众对生活环境质量的重视，人们开始关注雾霾污染所带来的严重后果，不再盲目推崇先经济后环保的理念。以牺牲环境为代价的经济增长，虽然可以帮助地方官员获得晋升捷径，但会对公众身体健康产生威胁，降低幸福指数，引发公众的不满意感。且随着中国政治制度不断完善，公众的想法和意见越来越受到重视[27]，公众可以选择信访、举报、听证等方式表达诉求。

(2) 地方政府与污染企业之间的博弈

在追求经济增长速度的时期，地方政府和污染企业之间的矛盾并不深。不过近年来，空气质量严重下降，地方政府受到中央政府和公众的双重压力，不得不重新考虑和污染企业之间的利益关系。原毅军等[28]认为，地方政府对污染企业监察力度的改变会对雾霾污染的治理效果产生重要影响。一方面，若地方政府对污染企业进行严格治理，则需投入大量的时间和治理成本，但也会带来地方政府形象提升等潜在收益，同时污染企业的经营利润会减少，在此情况下污染企业会根据地方政府对直接排污的处罚力度调整自己的策略；另一方面，若地方政府对污染企业不进行严格治理，则可以让污染企业获得更大收益，但会对自身形象产生负面影响，且加重雾霾污染。

(3) 污染企业与公众之间的博弈

在雾霾治理中，污染企业和公众都站在自身利益最大化的角度来考虑问题。污染企业在政府进行严格治理且罚款成本较高时，倾向于采取净化排污方式，这可能会减少企业利润，但可以缓解雾霾污染状况，此时污染企业和公众形成一种良好的互惠关系；不过污染企业在政府不进行严格治理或者进行严格治理但罚款成本较低时，更喜欢选择直接排污方式，从而使自己利润最大化。此时公众会综合考量监督成本和良好生存环境带来的潜在收益，通过举报、上访等方式来约束污染企业的行为。

根据上述分析，地方政府综合考虑区域环境效益和污染带来的负面影响，其行为策略可以选择严格治理和不严格治理；污染企业综合考虑自身经济效益以及地方政府的惩罚力度，其行为策略可以选择净化排污和直接排污；公众综合考虑举报污染企业所获得的收益和监督污染企业排污所带来的成本，其行为策略可以选择监督和不监督。为了更好的建立地方政府、污染企业和公众三方博弈模型，本文基于实际情况，设立如下假设：

假设1在博弈初始阶段，地方政府选择“严格治理”和“不严格治理”策略的概率分别为x、1-x；污染企业选择“净化排污”和“直接排污”策略的概率分别为y、1-y；公众选择“监督”和“不监督”策略的概率分别为z、1-z。其中0≤x≤1、0≤y≤1、0≤z≤1。

假设2从地方政府的角度分析，选择严格治理策略付出的成本为C1，此刻若污染企业进行净化排污的同时公众选择监督策略使得当地雾霾污染得到改善，会给地方政府带来潜在的社会收益U1；相反，只要污染企业或公众任一主体选择不合作方式，都会加重雾霾污染，此时因上级政府惩罚和公信力下降带来的负收益为P1。

假设3从污染企业的角度分析，在正常情况下其收益为R。当污染企业选择净化排污策略时，因购买净化设备和环保材料所产生的成本为C2，同时若地方政府选择严格治理策略，污染企业因采取净化排污方式可获得地方政府奖励W1；当污染企业选择直接排污策略时，可能会获得额外收益，但由此造成的雾霾污染严重化给污染企业和公众带来的潜在损失为P2、P3，不过若此时地方政府进行严格治理或公众采取监督策略，污染企业会受到政府罚款G。

假设4从公众的角度来看，当公众选择监督策略时，举报污染企业所产生的成本为C3，获得的地方政府奖励为W2，同时若地方政府进行严格治理或污染企业选择净化排污所形成的良好生活环境带来的长远收益为U2。

1.2 支付函数构建

根据以上假设和参数设定，可以得到八种不同策略组合下地方政府、污染企业和公众的支付矩阵,如表1所示。

表1 三方博弈的支付矩阵

2 演化博弈分析

2.1 博弈主体的复制动态方程

通过对以上分析可知，地方政府选择“严格治理”和“不严格治理”策略的期望收益及群体平均收益分别为:

U11=yz(-C1+U1-W1-W2)+y(1-z)(-C1-P1-W1)+

z(1-y)(-C1-P1-W2+G)+(1-y)(1-z)(-C1-P1+G)

U12=y(1-z)(-P1)+z(1-y)(-P1+G)+

(1-y)(1-z)(-P1)

根据Malthusian模型，构建地方政府选择“严格治理”策略时的复制动态方程：

F(x)=x(1-x)(U11-U12)

=x(1-x)[y(-W1-G)+

z(-W2-G)+yz(G+U1)+G-C1]

(1)

同理，污染企业选择“净化排污”和“直接排污”策略的期望收益及群体平均收益分别为：

U21=xz(R-C2+W1)+x(1-z)(R-C2+W1)+

(1-x)z(R-C2)+(1-x)(1-z)(R-C2)

U22=xz(R+B-P2-G)+x(1-z)(R+B-P2-G)+

(1-x)z(R+B-P2-G)+(1-x)(1-z)(R+B-P2)

根据Malthusian方程，构建污染企业选择“净化排污”策略时的复制动态方程：

H(y)=y(1-y)(U21-U22)

=y(1-y)[x(W1+G)+zG-xzG-C2-B+P2]

(2)

同理，公众选择“监督”和“不监督”策略的期望收益及群体平均收益分别为：

U31=xy(-C3+W2+U2)+x(1-y)(-C3+W2-P3+U2)+

(1-x)y(-C3+U2)+(1-x)(1-y)(-C3-P3)

U32=x(1-y)(-P3)+(1-x)(1-y)(-P3)

根据Malthusian方程，构建公众选择“监督”策略时的复制动态方程：

E(z)=z(1-z)(U31-U32)

=z(1-z)[x(W2+U2)+yU2-xyU2-C3]

(3)

2.2 博弈三方主体策略的演化稳定性分析

由(1)～(3)式，可得地方政府、污染企业和公众三方主体的动力系统：

(4)

为了求得系统平衡点，根据方程(4)，令：

(5)

对(5)式求解，可以得到8个特殊均衡点(0,0,0)、(0,0,1)、(0,1,0)、(0,1,1)、(1,0,0)、(1,0,1)、(1,1,0)、(1,1,1)。

李雅普诺夫稳定性理论认为通过建立方程的Jacobi矩阵，分析该矩阵在各均衡点处的特征值，可判断系统的渐进稳定性。方程(4)的雅克比矩阵J为:

将8个特殊均衡点分别代入Jacobi矩阵中，由此可得对应Jacobi矩阵的特征值，表2所示为各均衡点对应的特征值。

表2 各均衡点的特征值

由表2分析可得：(0,0,1)只能是不稳定点，因为λ3=C3>0恒成立；(1,0,1)也只能是不稳定点，因为λ1=W2+C1>0恒成立；(1,1,0)也是不稳定点，因为λ1=W1+C1>0恒成立。在满足表3稳定性条件的情况下，(0,0,0)、(0,1,0)、(0,1,1)、(1,0,0)、(1,1,1)可能是ESS。

表3 均衡点稳定性条件

3 数值实验与仿真

3.1 不同条件下的情景分析

根据博弈模型稳定性分析可知，雾霾治理行动中地方政府、污染企业和公众在不同稳定性条件下的策略选择是有差别的。为了更直观地研究所构建博弈模型，本文运用matlab对上述5种稳定性条件下策略组合的演化过程进行数值仿真。

情景1地方政府、污染企业和公众采取(不严格治理、直接排污、不监督)策略演化

将参数取值为W1=2，W2=1,C1=6,U1=8,U2=5,G=4,B=4,P2=2,C3=3,U2=2。地方政府、污染企业和公众策略初始值设定为x(0)=0.5,y(0)=0.5,z(0)=0.5。仿真结果如图1所示。

图1 博弈主体在稳定性条件①下的演化轨迹

从图1可知，在参数取值满足稳定性条件①-C1+G<0、-C2-B+P2<0且-C3<0，即地方政府严格治理成本大于污染企业直接排污的罚款金额、污染企业净化排污成本大于污染企业直接排污的额外收益与潜在损失之差、公众监督成本大于零时，三方博弈主体会倾向于采取(不严格治理、直接排污、不监督)策略，此时(0,0,0)是ESS。这说明只要地方政府严格治理成本过高或者污染企业直接排污的罚款金额过低，地方政府在治理行动中无利可图便会选择不严格治理策略。而地方政府放松治理又会减小污染企业排污的外在威胁和压力，选择直接排污策略能让污染企业获得更大利益。在地方政府和污染企业都进行消极治理的情况下，公众在治理行动中付出的成本大于收益，只能选择不监督策略。在这种情况下三方博弈主体皆采取消极治理态度，系统进入最糟糕状态，雾霾污染变得更加严重。

情景2地方政府、污染企业和公众采取(严格治理、直接排污、不监督)策略演化

将参数取值为W1=2,W2=1,C1=6,U1=8,C2=5,G=7,B=4,P2=2,C3=3,U2=2，相较于情景1，仅提高了污染企业直接排污罚款金额G的值。地方政府、污染企业和公众策略初始值设定为x(0)=0.5,y(0)=0.5,z(0)=0.5。仿真结果如图2所示。

图2 博弈主体在稳定性条件②下的演化轨迹

从图2可知，在参数取值满足稳定性条件②C1-G<0,W1+G-C2-B+P2<0且U2+W2-C3<0，即污染企业直接排污的罚款金额大于地方政府严格治理成本，污染企业直接排污的额外收益、潜在损失与直接排污罚款之差大于污染企业净化排污奖励与成本之差，且公众监督成本大于公众监督带来的长远收益与政府给公众监督的奖励之和时，均衡点(1,0,0)是ESS。直接排污罚款于地方政府而言是严格治理行为下的收益，罚款金额的增加使地方政府在治理行动中受益，在利益最大化目标的驱使下自然会选择严格治理策略。虽然直接排污罚款对污染企业策略选择也会产生一定影响，但相对于直接排污收益和净化排污成本，罚款金额还不足以迫使污染企业选择净化排污策略。

情景3地方政府、污染企业和公众采取(不严格治理、净化排污、不监督)策略演化

将参数取值为W1=2,W2=1,C1=6,U1=8,C2=5,G=4,B=4,P2=10,C3=3,U2=2,相较于情景1，加大了直接排污给污染企业带来的潜在损失P2的值。地方政府、污染企业和公众策略初始值设定为x(0)=0.5,y(0)=0,5,z(0)=0.5。仿真结果如图3所示。

图3 博弈主体在稳定性条件③下的演化轨迹

从图3可知，在满足稳定性条件③-W1-C1<0、C2+B-P2<0且U2-C3<0，即地方政府对污染企业净化排污的奖励与严格治理成本之和大于零、直接排污给污染企业带来的潜在损失大于污染企业净化排污成本与直接排污的额外收益之和、公众监督成本大于公众监督带来的长远收益时，均衡点(0,1,0)是ESS。这说明增加污染企业直接排污的潜在损失是迫使污染企业选择净化排污方式的重要举措，这种损失可能是违法排污导致公司形象损坏和市场认可度降低等。但相对于地方政府和公众而言，污染企业直接排污的潜在损失不会对他们造成太大影响，所以依然保持消极治理态度。

情景4地方政府、污染企业和公众采取(不严格治理、净化排污、监督)策略演化

将参数取值为W1=2,W2=1,C1=6,U1=8,C2=5,G=4,B=4,P2=10,C3=3,U2=3，相较于情景3，提高了公众监督带来的长远利益U2的值，减小了公众监督成本C3的值。地方政府、污染企业和公众策略初始值设定为x(0)=0.5,y(0)=0.5,z(0)=0.5。仿真结果如图4所示。

图4 博弈主体在稳定性条件④下的演化轨迹

从图4可知，在参数取值满足稳定性条件④-W1-W2-C1+U1<0、-G+C2+B-P2<0且C3-U2<0，即地方政府给其他主体的治理奖励与严格治理成本之和大于严格治理的潜在收益、污染企业直接排污的潜在损失与直接排污罚款之和大于净化排污成本与直接排污的额外收益之和、公众监督的长远收益大于监督成本时，均衡点(0,1,1)是ESS。这说明公众在作出策略选择时会综合考量自身收益和参与成本，提高收益、减少成本能有效推动公众参与雾霾治理。

情景5地方政府、污染企业和公众采取(严格治理、净化排污、监督)策略演化

将参数取值为W1=2,W2=1,C1=6,U1=10,C2=5,G=4,B=4,P2=10,C3=3,U2=3，相较于情景4，提高了地方政府严格治理时的潜在收益U1的值。地方政府、污染企业和公众策略初始值设定为x(0)=0.5,y(0)=0,5,z(0)=0.5。仿真结果如图5所示。

从图5可知，在参数取值满足稳定性条件⑤W1+C1+W2-U1<0、-W1-G+C2+B-P2<0且C3-U2-W2<0，即地方政府严格治理的潜在收益大于给其他主体的治理奖励与严格治理成本之和，污染企业净化排污奖励与成本之差大于污染企业直接排污的额外收益、潜在损失与直接排污罚款之差，且公众监督带来的长远收益与地方政府给公众监督的奖励之和大于公众监督成本时，均衡点(1,1,1)是ESS。这说明在污染企业和公众都倾向于积极参与雾霾治理时，只要提高地方政府在雾霾治理中获得的潜在收益，如公共形象和公信力的提升等，便可以使系统进入良性循环阶段。

图5 博弈主体在稳定性条件⑤下的演化轨迹

3.2 群体策略初值变化对演化结果的影响

由复制动态方程分析可知，一方博弈主体的演化均衡状态会受到其他主体决策比例的影响。考虑到上述情景分析中三方博弈主体策略初值设定的单一性，本文通过调整初始值对群体策略演化结果进行检验，以消除初值选取对结果可信度的影响，增强结果的说服力。

首先研究参数取值满足稳定性条件⑤时，三方博弈主体策略初值变化对演化结果的影响，如图6至图11所示，此时参数取值同情景5。

图6、图7考察了三方博弈主体策略初值变化对地方政府群体策略演化路径的影响。从图中可知，地方政府群体选择严格治理策略比例越大，系统演化至x→1的时间就越短、速度越快，此外该群体演化速度还会受污染企业和公众策略初值变化的影响。说明在满足各方利益诉求的前提下，x、y、z初值设定的差异虽然会对地方政府群体策略演化路径产生一定影响，但不会改变该群体的最终策略选择。

图6 x初值变化对地方政府群体策略演化的影响

图7 y、z初值变化对地方政府群体策略演化的影响

图8 y初值变化对污染企业群体策略演化的影响

图9 x、z初值变化对污染企业群体策略演化的影响

图8、图9考察了三方博弈主体策略初值变化对污染企业群体策略演化路径的影响。如图所示，y值会随着时间的变化先减小后增加，这可能是因为刚开始地方政府对直接排污行为不够重视，污染企业对此抱有侥幸心理，希望通过直接排污策略获得更大利益。后来随着时间推移，地方政府加大监管力度，公众参与意识逐渐加强，迫使越来越多污染企业采取净化排污策略并最终演化至均衡状态。

图10、图11考察了三方博弈主体策略初值变化对公众群体策略演化路径的影响。如图所示，虽然三方博弈主体策略初值变化时公众群体策略演化速度也不尽相同，但未改变z→1的演化结果。公众在雾霾污染中一直扮演着受害者的角色，雾霾污染日益严重对公众的生产生活影响也越来越大，因此公众对于雾霾治理的态度也会更加积极。

图10 z初值变化对公众群体策略演化的影响

图11 x、y初值变化对公众群体策略演化的影响

综上所述，在参数取值满足稳定性条件⑤时，地方政府、污染企业和公众的策略初值变化会影响主体演化速度，但不会改变博弈主体的最终策略选择，此时均衡点(1,1,1)是ESS。

同理，参照上述方法考察其他四种稳定性条件下策略初值变化对演化结果的影响，发现演化稳定策略不会因初值选取的变化而变化，也就说情景分析中的结果是可信的。鉴于篇幅所限，另外四种情况未在文中进行详细阐述。

4 结论及建议

在雾霾治理过程中，如何处理地方政府、污染企业和公众的合作关系，是建立协作机制的关键所在。本文通过对博弈模型进行数值实验和仿真分析，得出以下结论：

(1)地方政府、污染企业和公众在不同稳定性条件下的策略选择均不同。当系统处于三方博弈主体都不治理的情景下，可通过增加直接排污罚款金额与政府严格治理潜在收益、提高污染企业直接排污潜在损失、降低公众参与成本与提高长远收益等方式分别推动地方政府、污染企业和公众采取积极治理策略，使系统向x→1,y→1,z→1的理想状态演化。

(2)在参数取值确定的情况下，地方政府、污染企业和公众任一博弈主体的策略演化速度会受到自身策略选择比例及另外两主体策略选择比例的影响，但无论x、y、z取值如何变化，都不会改变博弈群体的最终策略决策。

根据上述研究结论，为了促进雾霾治理协作机制的形成，提出如下建议：

(1)积极构建地方政府为主导，污染企业为主体和公众参与的三元主体联动治理模式，降低地方政府严格治理成本、提高严格治理收益。一方面，地方政府要积极发挥带头作用，充分利用内部资源和信息，动员专家学者，为雾霾治理提出专业意见；另一方面，通过公共媒体积极宣传全民参与雾霾治理的必要性，提高公众环保意识，合理利用公众的隐性监督功能，提高雾霾治理效率。

(2)加大对污染企业采取直接排污方式的打压力度，降低污染企业直接排污的可能性。考虑到地方政府罚款是推动污染企业采用净化排污技术的主要约束力，因此地方政府可以通过行政管制的方式来约束污染企业。同时增加对净化排污企业的奖励，向污染企业表明政府对雾霾治理的决心。

(3)制定相应的激励政策，鼓励企业和公众积极参与雾霾治理。一是对企业进行激励。在贯彻执行“污染者付费原则”的前提下，根据地方财政能力对污染企业的产业转型和设备更新等进行激励，如减免税收制度、公共资金补助等。企业在激励制度的引导下，会更加重视环境和经济的平衡，有利于社会的长远发展。二是对公众个人和环保组织进行激励。地方政府可以根据公众对雾霾治理的贡献值，给予适当的奖励，提高他们的参与收益，降低参与成本。

本文探讨了影响雾霾治理协作机制形成的条件，分析了不同情景下博弈主体的策略选择，并根据实验结果，为政策的制定和改善提供了建议。但是在实际的雾霾治理过程中，影响三方博弈主体演化至理想状态的条件更加复杂，所以在后续的研究工作中，应该将更多的参数考虑到博弈模型中。