动态奖惩措施下政府与电子产品回收企业的演化博弈分析

2022-09-19 01:46:58郎玲玲余明阳

东华大学学报(自然科学版) 2022年4期

郎玲玲，刘峥,，徐琪，余明阳

(1.上海工程技术大学管理学院，上海 201620；2.上海交通大学安泰经济与管理学院，上海 200240；3.东华大学旭日工商管理学院，上海 200051)

在消费升级、科技发展的时代背景下，各种电子产品的更换周期也在变短,因此产生大量的电子废旧产品，我国的电子产品到达了报废的高峰期，并且呈现不断增长的趋势。面对非正规渠道回收的巨大利润诱惑，现阶段大多数的废旧电子产品都流入了非正规渠道，而对废旧电子产品不恰当的处理会导致电子产品中危险物质的泄漏，不仅影响人类健康、污染环境，还阻碍了可持续发展目标的实现。因此，不管是从节约资源层面还是在保护环境层面出发，废旧电子产品的正确回收都是十分必要的[1]。那么，政府奖惩措施下电子产品回收企业的渠道选择问题则成为建立正规渠道回收模型探讨的热点。

从废旧电子产品回收角度进行研究：林思良等[2]基于政企之间的微分博弈模型，研究政府和企业在回收废旧电子产品过程中的合作模式问题；吕君等[3]从国家回收体系的角度出发，研究不同回收费用以及多渠道协同下的废旧电子产品的回收问题；王文宾等[4]通过构建正规渠道与非正规渠道的电子回收商之间的价格模型研究政府补贴对回收商决策的影响；原逸超等[5]利用演化博弈模型探讨政府补贴对企业构建逆向物流回收废弃电子产品的影响；Hezron[6]基于镓元素需求增长的背景，研究从报废品中回收利用镓的可行性。

从演化博弈分析角度进行研究：Xue等[7]构建由政府、企业以及消费者构成的演化博弈系统，研究各主体的策略选择对循环经济的影响；Werner等[8]以合理的博弈形式为基础，对第一、第二价格公平划分的演化博弈进行分析，证明演化稳定猜想的正确性；郭军华等[9]基于碳交易政策建立演化博弈模型，考虑异质性消费者对制造商减排决策的影响；严培胜等[10]构建预算部门与财政单位的演化博弈模型，对激励以及惩罚下主体的策略选择行为进行研究；卢安文等[11]对政府和信息服务企业的演化博弈过程进行研究，分析影响政企双方策略选择的参数；潘凡峰等[12]将演化博弈应用于煤化工企业的转型策略选择，为企业的创新模式提供依据。

从系统动力学角度进行研究：马海群等[13]以新冠疫情为背景，使用系统动力学方法研究政府公开数据和安全之间的关系；曹武军等[14]利用系统动力学模型研究政府不同措施对电商产业的策略影响情况；杨光明等[15]建立由三峡上游政府、下游政府以及中央人民政府组成的演化博弈模型，基于案例研究政府动态变化下三者的利益需求和补偿机制；薛朝改等[16]利用系统动力学模型，从政府、公众以及资本的角度寻找三方合作水平提高的方法；Zhu等[17]建立了政府、餐厅以及垃圾处理厂之间的博弈模型，基于系统动力学研究三者之间的策略选择问题。

综上所述，关于电子产品回收企业的供应链微分博弈研究、企业与政府之间的演化博弈研究、基于系统动力学模型的政府动态变化研究以及演化博弈下的MATLAB软件仿真研究较为普遍，而较少将演化博弈和系统动力学结合起来研究。本文基于政府采取的动态奖惩措施，构建了政府和电子产品回收企业之间的演化博弈模型，研究政府和电子产品回收企业的渠道选择问题，这对电子产品回收企业的渠道选择具有实践意义。

1 问题描述与分析

通过建立政府与电子产品回收企业的演化博弈模型，研究政府和电子产品回收企业的渠道选择问题。假设博弈双方是有限理性的，政府存在检查和不检查两种选择，检查是指对电子产品回收企业的不正规渠道回收行为进行惩罚以及对电子产品回收企业的正规渠道回收行为进行补贴和支持。检查的目的：一方面为了降低环境污染；另一方面为了给采取正规渠道回收的企业营造更好的市场环境。电子产品回收企业有正规渠道回收和不正规渠道回收两种选择。企业通过正规渠道回收，能够获得国内低碳项目的资金支持，还有利于减少环境污染，但成本较高且利润较低；企业通过不正规渠道回收，可以获得较高的利润，但会对环境造成损害。

在政府和电子产品回收企业博弈时，假设政府采取检查的概率为x(0≤x≤1)，采取不检查的概率为1-x。电子产品回收企业选择正规渠道回收产品的概率为y(0≤y≤1)，选择不正规渠道回收产品的概率为1-y。当电子产品回收企业选择正规渠道策略时，会产生回收成本A，得到的收入为B，因此而得到的国内低碳项目的资金支持为R。当电子产品回收企业选择不正规渠道策略时，会产生回收成本A1，得到的收入为B1。电子产品回收企业回收的产品具有再次利用价值时，AB-A。当政府采取检查措施时，会产生检查成本M，在检查后会给予通过正规渠道回收产品的企业补贴W，给予通过不正规渠道回收产品的企业惩罚P。当政府采取“不检查”策略时，虽然不会产生检查成本，但是电子产品回收企业通过不正规渠道回收产品时会产生环境治理成本Ce。政府与电子产品回收企业的博弈获益矩阵如表1所示。

表1 政府与企业的博弈获益矩阵Table 1 Game benefit matrix between government and enterprise

2 演化博弈模型构建与稳定性分析

2.1 演化博弈模型的建立

uY=(-M-W)y+(-M+P-Ce)(1-y)

(1)

uN=-(1-y)Ce

(2)

x(P-M)+(y-1)Ce

(3)

因此，可以得到政府的复制动态方程为

x(x-1)(M-P+yP+yW)

(4)

vY=(B-A+R+W)x+(B-A+R)(1-x)

(5)

vN=(B1-A1-P)x+(B1-A1)(1-x)

(6)

(A1-A+B-B1+R)y-xP+B1-A1

(7)

因此，可以得到电子产品回收企业的复制动态方程为

(A-A1-B+B1-R-xP-xW)

(8)

2.2 演化稳定策略分析

2.2.1 政府静态措施下的演化稳定性分析

根据第2.1节政府和电子回收企业的复制动态方程，可以得到政府和电子产品回收企业在混合策略下的复制动态方程组为

(9)

为了分析各均衡点的稳定性，使用Friedman提出的方法，通过雅克比矩阵局部的稳定性得到演化系统均衡点的稳定性，则得到雅克比矩阵如式(10)所示。

(10)

将这5个均衡点代入雅可比矩阵式(10)中，当局部均衡点存在det(J)>0(J的行列式大于0)和tr(J)<0(J的迹小于0)时，系统处于稳定状态，据此对5个均衡点进行稳定性分析，各局部均衡点的稳定性分析如表2所示。

表2 各局部均衡点的稳定性分析Table 2 Stability analysis of local equilibrium points

由表2发现，O1(0,0)、O2(0,1)、O3(1,0)、O4(1,1)属于鞍点，O5(x0,y0)属于中心点，但不是渐进稳定的，因此系统不存在演化稳定策略。

2.2.2 政府动态惩罚措施下的演化稳定性分析

政府通常通过提高惩罚来约束电子产品回收企业的非正规渠道选择行为。为了降低不正规渠道回收电子产品带来的碳排放污染，假设政府对企业的惩罚与企业选择不正规渠道回收产品的概率成正比，即当电子产品回收企业选择不正规渠道操作时，政府的惩罚由P变成了h(y)=(1-y)m，并且m>A>0，其中m代表惩罚最高力度，政府采取检查的概率变为x*，电子回收企业选择正规渠道操作的概率变为y*。

证明：在政府采取动态惩罚措施的情况下，政府和企业的收益矩阵相应地发生改变，改变后得到的复制动态方程组为

(11)

(12)

推论1：政府动态惩罚措施下，政府最大惩罚力度m、政府对企业正规渠道回收电子产品的补贴W和政府的检查成本M会同时影响电子产品回收企业选择正规渠道的概率x*以及政府选择检查的概率y*的大小。

通过对x*和y*求导可知，随着惩罚力度m的增大，x*呈下降趋势，y*呈上升趋势，这说明政府检查的可能性减小，而电子产品回收企业采取正规渠道回收的可能性增加。而当政府对企业正规渠道回收电子产品的补贴W以及政府的检查成本M减小时，x*和y*都呈现增加趋势，也就是说政府检查和电子产品回收企业选择正规渠道的概率同时升高。

2.2.3 政府动态补贴措施下的演化稳定性分析

除了采取惩罚措施外，政府也会选择通过补贴的方式来提高电子产品回收企业采用正规渠道回收废旧产品的积极性。若政府对电子产品回收企业进行补贴，在政策实施初期，有较少的企业选择正规渠道回收产品，政府为了减少碳排放污染，会加大激励给予更多的补贴。但是随着市场上越来越多的企业选择正规渠道，政府的减排目标已经完成或者超额完成时，政府的补贴就会降低，因此，政府的补贴与企业选择正规渠道回收电子产品的概率成反比。当电子产品回收企业选择正规渠道时，政府的惩罚由W变成了f(y)=(1-y)n，同时0

证明：在政府采取动态补贴措施的情况下，政府和企业的收益矩阵相应地发生改变，改变后得到的复制动态方程组如式(13)所示。

(13)

(14)

推论2：政府动态补贴下，最大补贴力度n、政府对企业非正规渠道回收电子产品的惩罚P和政府的检查成本M会同时影响电子产品回收企业选择正规渠道的概率xs以及政府选择检查的概率ys。

通过对xs和ys求导可知，当政府的补贴力度n以及政府的检查成本M减小时，xs与ys都呈上升趋势，意味着政府检查的概率和电子产品回收企业采取正规渠道回收的概率升高。而当政府对企业非正规渠道回收电子产品的惩罚P增大时，政府检查概率降低而电子产品回收企业选择正规渠道的概率升高。

3 算例与仿真分析

3.1 政府静态措施下的博弈仿真分析

图1 初始值不同下电子产品回收企业通过正规渠道回收产品概率的演化过程Fig.1 Evolution process of the probability of electronic product recycling enterprises recycling products through formal channels with different initial values

图2 政府与电子产品回收企业混合策略的演化过程Fig.2 The evolution process of mixed strategy between government and electronic product recycling enterprises

根据图1可知，实线和虚线分别代表初始值为0.10和0.90时电子产品回收企业选择正规渠道回收废旧电子产品的概率的演化过程。通过对实线和虚线两条线的对比可以发现,不论初始值取何值，电子产品回收企业选择正规渠道回收产品的概率都不是稳定的，一直处于波动状态。但是初始值不同，电子产品回收企业选择正规渠道回收产品概率y的波动幅度是不一样的，y=0.90比y=0.10时概率的波动幅度更大。另外，y的波动幅度也会随着时间和博弈次数的增加而增大。根据图2可知，在政府静态措施下，政府与电子产品回收企业之间确实不存在稳定均衡点，验证了定理1中的结论。整个系统的演化形成了闭环曲线，呈现周期性变化，也说明了政府对电子产品回收企业正规渠道策略的引导是一个长期反复的工作。

3.2 政府动态惩罚措施下的博弈仿真分析

依据第2.2.2节的演化博弈模型以及系统动力学模型，利用VenismPLE软件对政府动态惩罚措施下政府与电子产品回收企业混合策略的概率进行仿真。此时，政府的惩罚由P变成了h(y)=(1-y)m。由于第3.1节已经证明政府静态措施下并不存在稳定的均衡点，为了明确政府和电子产品回收企业在政府的动态惩罚措施下是否存在均衡点，将政府选择检查以及电子产品回收企业选择正规渠道回收的初始概率也设置为0.50，得到政府动态惩罚措施下政府和电子产品回收企业混合策略的演化过程，如图3所示。

图3 动态惩罚措施下政府与电子产品回收企业混合策略的演化过程Fig.3 Evolution process of mixed strategy between government and electronic product recycling enterprises under dynamic punishment measures

3.3 政府动态补贴措施下的博弈仿真分析

依据2.2.3节的演化博弈模型以及系统动力学模型，利用VenismPLE软件对政府动态补贴措施下政府与电子产品回收企业混合策略的概率进行仿真。此时，政府的补贴由W变成了f(y)=(1-y)n。同样，由于第3.1节已经证明政府静态措施下并不存在稳定的均衡点，为了研究政府和电子产品回收企业在政府的动态补贴措施下是否存在均衡点，将政府选择检查以及电子产品回收企业选择正规渠道回收的初始概率都设置为0.50，得到政府和电子产品回收企业混合策略的演化过程，如图4所示。

图4 动态补贴措施下政府与电子产品回收企业混合策略的演化过程Fig.4 Evolution process of mixed strategy between government and electronic product recycling enterprises under dynamic subsidy measures

3.4 政府惩罚以及补贴力度的仿真分析

将政府选择检查和电子产品回收企业选择正规渠道回收产品的初始概率都设定为0.50。依据第2.2.2和2.2.3节演化博弈过程中的条件m>A>0以及0

图5 不同惩罚及补贴力度下政企双方概率的演化过程Fig.5 Evolutionary process of probability between government and enterprise under different punishment and subsidy force

由图5可知：政府高惩罚和低惩罚力度下，政府和企业双方概率基本呈现相似的波动趋势。政府高惩罚力度下，政府和企业双方的概率可以在更短的时间内达到均衡点，政府的检查概率降低而电子产品回收企业选择正规渠道回收的概率提高，属于政府想要达到的理想状况。同样的，不同补贴力度下的政府检查和企业选择正规渠道的概率也基本呈现相似的波动趋势，但是在低补贴力度下，电子产品回收企业选择正规渠道的概率升高，政府检查概率也会增加，这属于政府可以接受的状况。政府可以通过在一定范围内加大惩罚或减小补贴，推动电子产品回收企业选择正规渠道回收废旧产品的行为，达到低碳的目标。

4 结语

本文构建了政府和电子产品回收企业之间的演化博弈模型，从系统动力学角度研究政府和电子产品回收企业的渠道选择问题。通过稳定性分析，研究政府静态措施、动态惩罚措施以及动态补贴措施下动态均衡点的稳定性。同时通过改变政府惩罚和补贴力度，观察政府检查概率和电子产品回收企业的渠道选择概率情况。研究表明：在政府采取动态措施时，系统存在稳定的均衡点；在高惩罚力度下，政府的检查概率降低而电子产品回收企业的正规渠道选择概率提高，属于政府想要达到的理想状况；在低补贴情况下，电子产品回收企业选择正规渠道的概率升高，但政府检查概率也得到提升，属于政府可以接受的状况。因此，政府可以通过在一定范围内加大惩罚或减小补贴，推动电子产品选择企业的正规渠道选择行为，达到低碳的目标。但是还未探讨如何控制奖惩力度，使得政府能够达到最优的动态策略效果，未来将对此做进一步深入研究。