郑江丽,杨 川,3,张 康,王 森,黑 亮
(1.水利部珠江河口治理与保护重点实验室,广东 广州 510611; 2.珠江水利科学研究院,广东 广州 510611; 3.河海大学水利水电学院,江苏 南京 210098)
由于不同区域所处的地理位置不同,往往造成区域间自然环境的差异,这种差异使得各区域在经济发展方面呈现出不同的特点。流域作为一个完整的自然单元,各要素间紧密相连、不可分割,上下游由于自然条件的差别,使得两者存在较大的经济差异[1],如何统筹兼顾上下游经济发展与环境保护,实现全流域的可持续发展,是摆在上下游面前的一道难题。
流域系统不仅具有整体性,还具有地域分异性,同时面临着上下游不同利益群体之间的利益冲突,传统环境经济学的理论和方法在解决流域问题时遇到了障碍[2]。生态补偿是以保护和可持续利用生态系统服务为目的,以经济手段为主调节相关者利益关系的制度安排[3]。流域上下游的生态补偿是在流域形成合理的利益分工条件下,上游地区用水权益让渡后的利益均衡。因此,相关学者结合博弈理论,为我国流域生态补偿制度的顺利实施提供研究基础,实现以生态补偿为纽带促进流域上下游统筹保护和协同发展的目的。马骏等[4]以微分博弈理论为基础构建多种生态补偿模型,对流域内实施协同生态补偿活动以及中央政府制定补贴政策提供了科学依据。刘慧芳等[5]运用完全信息动态博弈、演化博弈理论对东江流域上下游利益相关方的博弈结果与得失进行研究,表明中央财政的支持和监督管理以及政治考评的收益决定了江西和广东两省政府对东江治理的意愿和力度。徐大伟等[6]运用演化博弈的方法,分析流域生态补偿的特点和结果,表明流域生态补偿需要中央政府的适度干预。曲富国等[7]研究认为通过地方政府间有约束力的协议及中央纵向财政转移支付相结合的模式可实现生态补偿的最大效用。刘加伶等[8]基于强互惠主体理论,运用演化博弈方法分析了中央政府、当地政府、地方企业三者之间在长江经济带水资源生态开发利用时的利益诉求以及补偿行为的动态演化过程。
关于流域生态补偿,前人已取得丰富的研究成果,亦表明政府的干预是生态补偿政策实施的主要触发点之一。事实上,生态补偿还具有经济效应和公众参与效应,针对上述两方面效应,本文通过系统研究上下游进行环境保护和生态补偿时的特征,定义影响博弈双方行为选择的具体变量,以此建立上下游的环境保护与生态补偿成本收益的博弈模型,并解析相关变量对上下游实施正向措施的影响,以期为流域的生态补偿提供参考。
上下游是环境保护与生态补偿的主体双方,各个博弈主体都需要承担相应的责任,博弈双方是否保护环境、实施生态补偿,是在特定的条件下存在的。基于此,本文以博弈论为理论依据,以“谁受益谁补偿”为原则[9-10],构建上下游环境保护与生态补偿的演化博弈模型。本文结合上下游区域之间的不完全信息动态博弈过程给出以下4个假设:
假设1:博弈双方有实施和不实施相应策略的选择方式。其中,上游区域作为博弈参与者,其策略空间为{保护,不保护};下游区域的策略空间为{补偿,不补偿}。
假设2:博弈双方的决策实施后,能获得足够的收益,且不会损害自身的利益。
假设3:上游区域有保护环境和不保护环境的策略。若上游区域实施保护环境的策略,限制相关产业的发展,为下游经济发达区提供优质的水资源,助力下游的经济发展;若上游区域为追求经济发展,选择不保护环境,使下游区域经济发展受到约束。
假设4:在生态补偿方面,下游区域可以选择实施或不实施该项策略。若下游区域实施生态补偿,是建立在上游区域进行环境保护策略下进行;若上游区域进行环境保护,而下游区域未实施生态补偿,则下游区域会因为社会舆论压力,在经济方面遭受损失。
上下游区域作为共同面临环境保护和生态补偿策略选择行为的博弈双方,定义影响博弈双方行为选择的具体变量包括:上游经济初始收益ES;下游经济初始收益EX;上游保护环境,延缓经济发展时的经济减少系数α;上游保护环境,下游经济发展的获益系数β;上游实施保护环境措施且下游实施补偿措施时,下游给予上游的经济补偿值B;上游保护环境而下游不实施补偿措施时,下游受到舆论压力,在经济方面遭受的损失系数ω;当上下游实施正向措施(上游保护环境,下游进行补偿)时,由于环境的改善,上下游获得的环境收益值EH;当上下游实施负向措施(上游不保护环境,下游不进行补偿)时,上下游的经济惩罚系数ε。根据上述假设和变量,构建上下游区域博弈的收益信息如表1所示。
表1 上下游区域间的收益信息
假设上游区域实施环境保护的概率为px(0≤px≤1),则不实施环境保护的概率为1-px;设下游区域实施生态补偿的概率为py(0≤py≤1),则不实施生态补偿的概率为1-py。根据博弈演化理论,设上下游实施正向策略概率px和py的初始值是一定的。由进化博弈模型,可得下列赋值动态方程:
a.对于上游区域,采取环境保护的期望收益S0、不采取环境保护的期望收益S1和上游区域平均期望收益S2分别为
S0=py(ES-αES+B+EH)+(1-py)(ES-αES)
(1)
S1=pyES+(1-py)(ES-εES)
(2)
S2=px[py(ES-αES+B+EH)+(1-py)(ES-
αES)]+(1-px)[pyES+(1-py)(ES-εES)]
(3)
可得上游区域实施环境保护策略的赋值动态方程为
f(px)=px(1-px)[(B+EH-εES)py+ES(ε-α)]
(4)
b.对于下游区域,采取生态补偿的期望收益S3、不采取生态补偿的期望收益S4和下游区域平均期望收益S5分别为
S3=px(EX+βEX-B+EH)+(1-px)EX
(5)
S4=px(EX+βEX-ωEX)+(1-x)(EX-εEX)
(6)
S5=py[px(EX+βEX-B+EH)+(1-px)EX]+
(1-py)[px(EX+βEX-ωEX)+
(1-px)(EX-εEX)]
(7)
则下游区域实施生态补偿策略的赋值动态方程为
f(py)=py(1-py){[EX(ω-ε)-B+EH]px+εEX}
(8)
将上下游的复制动态方程联立构成方程组,得到上下游区域在生态补偿策略方面的博弈演化模型:
(9)
分别对f(px)和f(py)求偏导,得到博弈演化模型的雅可比矩阵:
(10)
根据雅克比矩阵得到矩阵的行列式detJ和矩阵的迹trJ分别为
detJ=(1-2px)[(B+EH-εES)py+ES(ε-α)]·
(1-2py){[EX(ω-ε)-B+EH]px+εEX}-px(1-px)·
(B+EH-εES)py(1-py)[EX(ω-ε)-B+EH]
(11)
tr(J)=(1-2px)[(B+EH-εES)py+ES(ε-α)]+
(1-2py){[EX(ω-ε)-B+EH]px+εEX}
(12)
博弈系统在平面内的5个局部均衡点分别为(0,0)、(0,1)、(1,0)、(1,1)和(x*,y*)。由上述5个均衡点得到矩阵行列式detJ和迹trJ的表达式,如表2所示。
表2 均衡点对应的矩阵行列式和迹的表达式
根据Friedman[11]提出的方法,行列式detJ>0和矩阵的迹trJ<0时,则该局部平衡点即为上游区域和下游区域实施相应策略的进化稳定策略[11]。对于(x*,y*),trJ恒等于0,不符合trJ<0的条件,因此不予讨论。依次分析各个局部均衡点对应的雅克比矩阵的行列式及其迹,以此得出各个局部平衡点的稳定性:①若均衡点(0,0)为演化稳定策略,需要满足条件ε<α,且εEX<0;由于εEX一定大于零,因此均衡点(0,0)不可能成为演化稳定策略,即上游区域和下游区域不会同时实行否定策略,即上游不进行环境保护,下游不实施生态补偿策略。②若αES-B-EH>0,则均衡点(0,1)为演化稳定策略。③若α<ε且B-EH-ωEX>0,则均衡点(1,0)为演化稳定策略。④若αES-B-EH<0且ωEX-B+EH>0,则均衡点(1,1)为演化稳定策略。
前述分析结果显示,当αES-B-EH>0时,上游实施的策略为环境保护策略,导致延缓经济发展,由于经济受损较大且获得的补偿较小,此时上游将不实施环境保护策略,均衡演化点为(0,1);当α<ε且B-EH-ωEX>0时,;因上游保护环境,下游需要给与的补偿较大,因此下游区域将不实施生态补偿措施,此时的均衡演化点为(1,0)。由于上下游区域均实施正向策略为最优策略,本文将重点解析均衡点(1,1)为演化稳定策略时的情形。
分析前述8项参数在满足αES-B-EH<0和B-EH-ωEX<0的条件时进行演化的过程。为了更好地分析上下游之间的策略选择变化,本文通过对各参数赋值的方式进行模拟仿真。
a.各参数取值为:ES=150,EX=300,α=0.3,β=0.2,B=100,ω=0.3,ε=0.4,EH=50,对该假定数值进行模拟,分析上游区域实施保护策略的比例x与下游区域实施补偿策略的比例y之间的相互关系,以及两者随时间的变化情况,结果见图1。
(a) 博弈双方演化策略
(b) 上游区域不同时间的演化策略
(c) 下游区域不同时间的演化策略图1 均衡演化点为(1,1)的模拟演算结果
图1表明,当输入的数据满足αES-B-EH<0且B-EH-ωEX<0时,上下游区域在该条件下进行博弈,最终的博弈结果为:上游区域实施环境保护策略,下游区域对上游区域进行生态补偿。
进一步解析相关变量对上下游实施正向措施的影响。根据均衡演化点为(1,1)的条件,影响均衡演化点(1,1)的博弈演化过程的参数有ES、B、EH、EX、ω和α,本文进一步分析ES、EH、B和EX对均衡演化点(1,1)的影响。
b.当上游经济初始收益减少时,即ES由150调整为50,其他参数不变(EX=300,α=0.3,β=0.2,B=100,ω=0.3,ε=0.4,EH=50)时,对该假定数值进行模拟,双方的博弈过程如图2所示。
(a) 博弈双方演化策略
(b) 上游区域不同时间的演化策略
(c) 下游区域不同时间的演化策略图2 上游区域初始经济状况较低时的模拟演算结果
图2表明,上游区域经济状况的初始水平对上游区域是否实施环境保护策略具有一定的影响。图2(b)中上游区域实施补偿策略时收敛到x=1的时间较长,即上游经济初始状况较差时进行环境保护意愿与上游经济初始状况较好时进行环境保护的意愿相比呈现减小的趋势,原因是相对于上游区域初始经济条件较好的情形,上游区域初始经济收益较低时对环境的影响、污染情况更小,进行环境保护的效果难以体现,使得初始经济条件偏差的上游区域进行环境保护的意愿度弱于初始经济条件较好的上游区域。图2(c)显示,上游区域的初始经济状况的改变,对于下游区域实施补偿措施的影响不大。
在图2演化结果基础上,将环境收益值EH由初始的50增大到200,其他参数分别为:ES=50,EX=300,α=0.3,β=0.2,B=100,ω=0.3,ε=0.4,对该假定数值进行模拟,所得的上下游间博弈结果和图2相比差异不大,即环境收益的改变对上下游实施正向措施的影响不大,本文未将结果列出。
c.进一步分析下游区域补偿上游区域对上下游实施正向措施的影响,此时的假定数值为:B=270,ES=50,EX=300,α=0.3,β=0.2,ω=0.3,ε=0.4,EH=200,分析经济补偿对上下游区域采取正向措施意愿度的影响,结果如图3所示。
(a) 博弈双方演化策略
(b) 上游区域不同时间的演化策略
(c) 下游区域不同时间的演化策略图3 下游区域对上游区域补偿值改变时的模拟演算结果
图3表明,整体而言,补偿值的改变对上游采取环境保护措施的意愿度影响不大;对下游采取生态补偿的正向措施有一定的影响。具体表现为:图3(c)中下游区域实施补偿策略时收敛到y=1的时间较长。由于假定的数值仍旧满足条件αES-B-EH<0且B-EH-ωEX<0,因此上下游依旧实施正向措施,即上游采取环境保护措施,下游进行生态补偿。
d.进一步分析下游经济初始收益对上下游实施正向措施的影响。将相关参数的数值设置为:EX=500,ES=50,α=0.3,β=0.2,B=270,ω=0.3,ε=0.4,EH=200,分析此时的上下游博弈演化过程,结果如图4所示。
(a) 博弈双方演化策略
(b) 上游区域不同时间的演化策略
(c) 下游区域不同时间的演化策略图4 改变下游区域的经济初始收益时的模拟演算结果
由于在图1~3的上下游博弈演化过程中,EX均为300,此时下游初始经济条件好,上下游的博弈过程显示如下:上游采取环境保护措施意愿几乎没有影响,而对下游采取生态补偿的意愿度有显著影响,表现为图4(c)中下游区域实施补偿策略时收敛到y=1的时间急剧缩短,说明下游经济条件越好,越希望获取优质的水源资源,因此下游区域采取补偿措施的意愿度迅速增加。
a.若上游区域实施的环境保护策略导致延缓经济发展,由此带来上游区域经济减少量大于获得的生态补偿,此时上游将不实施环境保护策略;若下游需要给予的补偿值较大,综合效益不高,下游区域将不实施生态补偿的措施;上游区域实施环境保护策略且下游区域采取生态补偿措施,需要建立在一定的条件基础上。
b.环境收益值的变化对上下游采取正向措施意愿度的影响较小;上游经济初始状况越差,上游区域倾向于进行环境保护的意愿度越低;下游对上游的补偿越大,下游区域采取补偿措施的意愿度越低;下游区域初始经济状况越好,下游区域采取补偿措施的意愿度越高。
c.在制定上下游生态保护策略和生态补偿机制时,应当充分考虑当地初始经济状况,制定适当的政策和制度,积极调动上游生态保护积极性,保证上游经济收入不低于保护前的利益获得;对于下游需要付出的生态补偿,应兼顾自身环境保护和经济发展,使得下游经济在一定条件限制下充分发展,对上游进行生态补偿。由此统筹协调环境保护和经济发展,使得环境和经济综合效益最大化。对上下游利益相关体进行生态补偿博弈研究时,必须考虑各利益体的自身发展状况,当生态补偿或环境保护损失的利益超过利益体承受边界时,往往无法取得理想的协调效果。