余福茂,杨灵曦
(杭州电子科技大学 管理学院,浙江 杭州 310018)
随机惩罚下电子废弃物回收主体间的演化博弈
余福茂,杨灵曦
(杭州电子科技大学 管理学院,浙江 杭州 310018)
本文从博弈的视角出发,对政府的奖惩机制下非正规回收群体与正规回收企业间合作行为的演变途径进行了研究,研究结果表明,该系统的演化方向与博弈的支付矩阵以及博弈发生时的初始状态是密不可分的,其中政府的补贴和随机惩罚、双方选择合作所获得的超额收益,合作成本以及合作风险损失是影响博弈双方合作策略选择的关键变量。最后以此为基础,提出了促使非正规回收商与正规回收企业达成良好合作关系的政策建议。
电子废弃物;非正规回收;演化博弈;随机惩罚
目前,我国电子废弃物的数量持续增长,其中绝大部分流入了非正规回收渠道,造成严重的资源浪费和环境污染。因此,越来越多的学者针对电子废弃物回收管理的问题展开研究,并取得了一定的成果。从电子废弃物的回收渠道选择方面,Huang等运用市场竞争机制,建立并比较了零售商和第三方回收商的双渠道回收闭环供应链模型,得出双渠道回收比单渠道回收更有利的结论[1]。Choi证明了不同的渠道领导者会对逆向供应链效率产生不同的影响[2]。Dwivedy等考察了不同生产者责任延伸制下的回收政策在印度的适用性,并通过建立经济模型分别对这几种回收政策下的盈利能力做出了评估[3]。李晓静等针对链与链存在竞争的情况,分析了回收渠道选择对闭环供应链各成员的影响[4]。梁喜等对比分析了三种不同混合回收模式下闭环供应链中各主体的决策和收益[5]。Giovanni基于两阶段CLSC博弈模型,分析了制造商对于回收渠道的选择问题[6]。
从政府奖惩机制对电子废弃物的回收作用研究方面,Atasu分析比较了政府对制造商设置回收目标和实行财政惩罚这两种策略的差异[7]。Aksen等研究了政府的环境政策对回收的影响,并运用双层规划模型确定了最优回收补贴[8]。张汉江等通过构建政府、制造商和再制造商、回收商的三阶段Stackelberg主从博弈模型,得出政府的最优补贴率决策[9]。余福茂等探讨了政府激励下我国现行四种回收处理模式的决策模型及最优参数[10]。Wang等研究发现加大政府的奖惩力度可以有效促进电子废弃物的回收再制造[11]。孙浩等建立了制造商回收模式下的多期闭环供应链网络均衡模型,研究表明政府实施补贴机制可以改善闭环供应链网络的绩效[12]。
以上研究为电子废弃物的妥善回收和管理做出了重要贡献,但仍存在一些局限性:①关于回收渠道的研究,仅有少部分文献涉及到不同回收渠道之间存在竞争的情形,尤其对于正规和非正规回收渠道的竞争分析,还缺少详细的讨论。②在探讨政府的奖惩机制时,大多数学者都假定政府收取的惩罚费用为固定金额,但在现实情况中,非正规回收商是否受到惩罚措施具有一定的随机性,其中惩罚系数与是否被政府发现和对环境的污染程度有关。鉴于此,本文在考虑政府的奖惩机制即补贴和随机惩罚的前提下,对非正规回收群体和正规回收企业之间的合作竞争策略进行了演化分析,旨在促进非正规回收群体和正规回收企业达成合作共赢的局面,从而使电子废弃物流向正规回收渠道得到规范化处理。
假设1:在该演化博弈系统中,一方是非正规回收群体,另一方是正规回收企业。二者的策略空间均为(合作,不合作)。由于有限理性的存在,双方会不断进行学习和模仿,通过观察对方的合作策略进行自身策略的调整和优化。
假设2:非正规回收群体由n个非正规回收商组成,假定n个非正规回收商相互独立,且每个非正规回收商回收时所采取的策略相一致。
假设3:假设πA与πB表示单个非正规回收商和正规回收企业均采取不合作策略时,即参与双方独立经营时的基本收益。当双方合作成功时将会获得超额收益,表示为ΔK。θ为非正规回收群体参与共同回收处理时的收益系数,0<θ<1,因此非正规回收群体在合作过程中的超额收益为θΔK,正规回收企业的超额利益为(1-θ)ΔK。参与双方的协同合作过程需要投入一定的成本,非正规回收群体和正规回收企业的合作成本分别可表示为nCA和CB。除此之外,博弈方可能会遭受由于对方违约所造成的信任风险,进而导致一定程度的收益损失,可用SA和SB表示。R表示正规回收企业或非正规回收群体采取合作策略时,政府给予的奖励金额。P表示当政府一旦发现非正规回收商不愿意与正规回收企业共同进行回收处理时,对单个非正规回收商收取的惩罚费用。而单个非正规回收商坚持独立经营时被政府发现并采取惩罚措施的系数为ε,其中随机变量ε满足伯努利分布,即p(ε=0)=1-β,p(ε=1)=β。
在以上假设的基础上,得出非正规回收群体和正规回收企业合作博弈的收益矩阵,如表1所示。
表1 非正规回收群体和正规回收企业博弈的收益矩阵
在博弈的初始阶段,假设非正规回收群体选择合作策略的概率为X,选择不合作策略的概率为1-X;正规回收企业选择合作策略的概率为Y,选择不合作策略的概率为1-Y。
则电子废弃物非正规回收群体选择合作策略的期望收益为:
EGY=Y[n(πA-CA)+θΔK+R]+(1-Y)[n(πA-CA)-SA+R] =Y(θΔK+SA)+n(πA-CA)-SA+R
电子废弃物非正规回收群体选择不合作策略的期望收益为:
EGN=E(QGN)=Y(nπA-E(P)E(ε))+(1-Y)(nπA-E(P)E(ε))=nπA-βnP
电子废弃物非正规回收群体采取混合策略的平均期望收益为:
电子废弃物正规回收企业选择合作策略的期望收益为:
ERY=X[πB-CB+(1-θ)ΔK+R]+(1-X)(πB-CB-SB+R) =X[(1-θ)ΔK+SB]+πB-CB-SB+R
电子废弃物正规回收企业选择不合作策略的期望收益为:
ERN=XπB+(1-X)πB=πB
电子废弃物正规回收企业采取混合策略的平均期望收益为:
依据演化博弈的原理,可以构建政府补贴和随机惩罚下电子废弃物非正规回收群体和正规回收企业选择合作策略时的系统复制动态方程:
(一)非正规回收群体的演化稳定策略
(3)
1.当Y=Y0时,等式F(X)=0恒成立,意味着在此区间内,所有的X取值点均处于稳定状态。
2.当Y≠Y0时,可以分成以下三种情况进行讨论:
(1)外墙与底板的连接:紧靠土体一侧的钢筋应伸到底板底,再水平锚固与顶板钢筋搭接,搭接位置一般在反弯点处(L0/4+Lad)(L0为该跨底板净距离);内侧钢筋应伸到底板后向外墙方向锚固。
1)当SA+nCA-R-βnp>θΔK+SA时,X=0是演化稳定策略,即随着时间的推移,有限理性的非正规回收群体会选择不与正规回收企业达成合作关系,依然坚持原有的回收方式,且非正规回收群体的策略选择与正规回收企业互不相关。
2)当βnP+R 3)当SA+nCA<βnP+R时,X=1为演化稳定策略,有限理性的非正规回收群体会选择与正规回收企业合作,共同通过正规回收渠道对电子废弃物进行回收处理。 (二)正规回收企业的演化稳定策略 (4) 1.当X=X0时,等式F(Y)=0恒成立,即所有Y点均处于稳定状态。 2.当X≠X0时,可分成三种情况讨论: 1)当CB+SB-R>(1-θ)ΔK+SB时,Y=0是稳定策略,即有限理性的正规回收企业经过长期演化后不会倾向采取合作策略。 2)当R 3)当CB+SB (三)混合策略的演化稳定性分析 其中,为了简化流程,记U1=θΔK+SA,U2=(1-θ)ΔK+SB,V1=SA+nCA-R-βnp,V2=CB+SB-R。因此0 将各个局部稳定点分别代入该雅克比矩阵,得到其行列式Det和迹Tr的值。根据雅克比矩阵特征值的性质可得到,当Det>0且Tr>0时,为不稳定点;当Tr=0时,为中心点;当Det>0且Tr≤0时,为稳定点。由此推断各个局部均衡点的性质分别如表2所示。 表2 局部平衡点的稳定性分析 图1 系统动态演化博弈相位图 从表中可以得出,该系统复制动态方程组中有一个中心点O,两个不稳定点B(0,1)、C(1,0),两个均衡点A(0,0)、D(1,1),即当系统处于稳定状态时,正规回收企业和非正规回收群体长期演化的均衡结果可能趋于竞争关系,也可能趋于合作关系。可以用一个坐标平面图来刻画正规回收企业和非正规回收群体在回收过程中策略选择的演化路径,如图1所示。 从上图可以看到,中心点O与两个不稳定点B和C的连线BOC为两种不同演化趋势的分界线。当初始状态位于临界线的左下方ABOC区域时(面积为M),系统收敛于(不合作,不合作)的稳定策略。反之,博弈双方将选择(合作,合作)的演化稳定策略。由此可见,该演化系统中博弈双方的行为是由初始状态O的位置决定的,初始状态一旦发生变动,不仅会改变不同演化趋势的变动区域,同样也会改变双方经过长期博弈选择不同策略的几率。 根据上述分析可以发现,博弈双方是否合作与以下几个决策变量相关:政府补贴R和随机惩罚P、双方选择合作所获得的超额收益ΔK、合作成本(nCA,CB)以及合作风险损失(SA,SB)。 (一)超额收益ΔK的影响 (二)合作成本CA、CB的影响 图2 超额收益ΔK的影响 图3 合作成本CA、CB的影响 (三)合作风险损失SA、SB的影响 图4 合作风险损失SA、SB的影响 (四)政府补贴R的影响 图5 政府补贴R的影响 (五)随机惩罚P的影响 对中心点O的坐标表达式进行数值模拟,可以发现,其它参数不变时,若政府对非正规回收商采取的随机惩罚金额P增加,其所对应的中心点O的坐标值将随之增大,此时点O越会向A(0,0)靠近,即非正规回收群体和正规回收企业经过长期不断博弈后最终都会选择采取合作策略。反之,P越小,则点O越会远离A(0,0),此时非正规回收群体与正规回收企业更倾向于竞争关系。 (一)结论 1.非正规回收群体与正规回收企业选择合作策略的概率与合作的超额收益和政府补贴及随机惩罚呈正相关,与合作成本和合作风险损失呈负相关。 (二)政策建议 1.要想实现非正规回收群体和正规回收企业之间的长期合作和共赢,关键在合作双方能够保证创造良好的超额收益。因此,在实践中,就要求合作双方尽可能提高资源的互补程度,实现信息、技术、产品等各方面的协同效应,进而最大程度地创造超额收益,以保证双方合作伙伴关系的良好形成。 2.合作成本与系统合作共赢的演化路径呈反比,为了使博弈双方的合作关系更牢靠,可采取如下措施:一是要求合作双方提高自主创新水平,最大限度地降低合作过程中的技术成本;二是提高合作双方的信息获取与整合能力,以实现减少信息搜寻成本的目的,进而全方位提高双方的合作效率。 3.由于非正规回收群体和正规回收企业之间的信任水平越高,采取合作的一方面临违约的几率越小,双方更容易形成稳健的合作关系。因此合作双方需要加强沟通与协调,共建良好的合作氛围。同时构建企业间的信誉评价体系和合作风险监督系统,为双方的合作提供保障。 4.为了让非正规回收商与正规回收企业达成持久的合作关系,政府一方面应重点打击小商贩、非法拆解户等非正规回收商,科学制定随机惩罚额度;另一方面要激励正规合法的回收机构,给予相应的经济补贴。与此同时政府应完善和落实废旧电子产品回收的相关法律法规,严格制定我国电子废弃物的报废标准。 (三)研究局限及展望 回顾全文,本文的研究还有很多局限和不足。例如:在回收策略选择方面只考虑了合作策略;进行数值分析时参考的是模拟的数值,与现实存在偏差;仅仅探讨了影响双方合作的关键要素,没有落实到采取合作的具体措施。 关于电子废弃物回收渠道管理下一步的研究方向可以集中在:(1)研究回收处理企业之间的竞争时,综合考虑多种回收经营策略,如采取技术创新、扩大回收规模,提高人民回收意识等。(2)结合真实数据进行数值分析,使之贴近实际。(3)对回收商合作过程中涉及到的契约设计、利益分配、政府的最优奖惩机制等问题展开深入探究。 [1] Huang M, Song M, Lee L H, et al. Analysis for strategy of closed-loop supply chain with dual recycling channel[J]. International Journal of Production Economics, 2013,144(2):510-520. [2] Choi T M, Li Y, Xu L. Channel leadership, performance and coordination in closed loop supply chains[J]. International Journal of Production Economics, 2013,146(1):371-380. [3] Dwivedy M, Suchde P, Mittal R K. Modeling and assessment of e-waste take-back strategies in India[J]. Resources Conservation & Recycling, 2015(96):11-18. [4] 李晓静,艾兴政,唐小我.竞争性供应链下再制造产品的回收渠道研究[J].管理工程学报,2016,30(3):90-98. [5] 梁喜,马春梅.不同混合回收模式下闭环供应链决策研究[J].工业工程与管理,2015,20(4):54-60. [6] Giovanni P D, Zaccour G. A two-period game of a closed-loop supply chain[J]. European Journal of Operational Research, 2014(1):22-40. [7] Atasu A, Öznur Özdemir, Wassenhove L N V. Stakeholder Perspectives on E-Waste Take-Back Legislation[J]. Production & Operations Management, 2013,22(2):382-396. [8] Aksen D, Aras N, Karaarslan A G. Design and analysis of government subsidized collection systems for incentive-dependent returns[J]. International Journal of Production Economics, 2009,119(2):308-327. [9] 张汉江,余华英,李聪颖.闭环供应链上的回收激励契约设计与政府补贴再制造政策的优化[J].中国管理科学,2016,24(8):71-78. [10] 余福茂,钟永光,沈祖志.考虑政府引导激励的电子废弃物回收处理决策模型研究[J].中国管理科学,2014,22(5):131-137. [11] Wang W, Zhang Y, Zhang K, et al. Reward-penalty mechanism for closed-loop supply chains under responsibility-sharing and different power structures[J]. International Journal of Production Economics, 2015(170):178-190. [12] 孙浩,张桂涛,钟永光,等.政府补贴下制造商回收的多期闭环供应链网络均衡[J].中国管理科学,2015,23(1): 56-64. EvolutionaryGamebetweenIrregularRecyclingGroupsandRegularRecyclingEnterprisesofElectronicWasteunderRandomPunishment YU Fu-mao, YANG ling-xi (SchoolofManagement,HangzhouDianziUniversity,HangzhouZhejiang310018,China) This paper studies the evolution of the cooperative behavior between the irregular recycling group and the regular recycling enterprise from the perspective of the game under the government incentive mechanism. The results show that the evolution direction of the system, the payment matrix of the game and the initial state of the game are all inseparable, among which the government allowance and its random punishment, the excess earnings obtained by the way of cooperation chosen by the two parties, the cooperation costs and the cooperative risk loss are the key variables affecting the choice of the game strategy of cooperation between the two. Finally, it put forward some policy suggestions for promoting the irregular recycling group and the regular recycling enterprises to achieve a good cooperative relationship. electronic waste; irregular recycling; evolutionary game; random punishment X708 :B :1001-9146(2017)04-0008-07 2017-04-24 国家自然科学基金(71373064) 余福茂(1975-),男,山西应县人,教授,博士,资源环境政策与管理、物流与供应链管理. 10.13954/j.cnki.hduss.2017.04.002四、博弈模型的数值模拟
五、结束语