政府有限管制下考虑再制品延保服务的三方演化博弈分析

2022-11-09 09:54朱晓东郭亚捷

工业工程 2022年5期

朱晓东，丁莲，郭亚捷

(南京信息工程大学管理工程学院，江苏南京，210044)

我国政府对发展绿色低碳循环经济给予特别关注，努力探索了一种新的闭环供应链运营策略——再制品延保策略[1]。推行再制品延保策略，一方面将提高消费者对再制品的接受度，推动再制品市场的发展；另一方面将获得产品的绿色溢出效应，缓解环境恶化和资源短缺等问题[2]。消费者的风险规避偏好是推行延保策略的引擎，延保策略可以满足消费者风险规避的行为偏好。在购买再制造产品时，消费者有无风险规避偏好决定了其是否购买延保服务。延保策略在实施过程中需要支付一定的成本，而延保服务能否得到消费者青睐也未可知，从而造成利润目标实现的不确定性，最终影响再制品延保策略的推行。

越来越多的学者对延保服务展开研究，大多集中于正向供应链延保服务的定价和渠道选择两个方面。但斌等[3]研究捆绑销售和单独销售策略下的延保服务定价模型。Bian等[4]研究传统延保策略和新型延保策略对收益的影响，并制定最佳的定价策略。Zhang等[5]对比不同的延保渠道对供应链定价和收益的影响。张永芬等[6]研究产品故障率对延保渠道选择的影响。同时，供应链主体的行为差异，如公平偏好[7]、情绪效用[8]、销售努力水平[9]等也会对延保供应链的运转产生重要影响。政府管制是推进发展绿色低碳循环经济的重要助力。李春发等[10]研究政府管制下信息披露对企业绿色创新的影响。Zhao等[11]认为政府设置合理的碳税可以推动企业向低碳生产演化。Shan等[12]研究政府管制对推行生产者责任延伸制的影响。

综上所述，现有研究多集中于正向供应链延保策略的定价等外部条件上，本文考虑消费者的风险规避偏好对推行再制品延保策略的拉动作用，基于利益相关者视角探讨推进再制品延保服务的稳定性与持续性问题。

1 问题描述与模型构建

演化博弈将博弈理论和动态演化理论相结合，各主体通过不断的试错、模仿和学习寻求最佳的演化策略。显然，再制品延保产业的发展是一个动态长期的过程，系统中的每个参与者都会因为个体收益的变化不断调整策略。因此，本文运用演化博弈分析再制品延保产业在发展过程中的稳定策略是合理的。

1.1 问题描述

再制品延保策略的演化博弈主体包括消费者、再制品制造商和政府，博弈主体间的逻辑关系如图1所示。消费者根据其对风险规避的行为偏好决定是否购买延保服务。再制品制造商通过利益均衡的方式决定是否为再制造产品提供延保服务。政府根据不同监管限度的效益决定选择积极管制或者消极管制的监管模式。

图1 三方演化博弈主体间的逻辑关系图Figure 1 Logical relation diagram among the subjects of the tripartite evolutionary game

本文对模型中涉及的参数如表1所示。

表1 符号与意义Table 1 Parameter symbols and meanings

1.2 演化模型构建

基于以上三者之间的动态博弈关系，本文提出以下假设。

1) 消费者、再制品制造商和政府都是有限理性的。三者能够适应动态环境的变化，在进化博弈的过程中不断调整和优化策略。

2) 消费者对是否购买延保服务有两种策略，即有风险规避偏好选择购买延保服务，概率为x，无风险规避偏好选择不购买延保服务，概率为1 -x。再制品制造商对是否提供延保服务有两种策略，即提供延保服务，概率为y，不提供延保服务，概率为1 -y。政府部门对延保服务的推行有两种管制策略，即积极管制，概率为z，消极管制，概率为1-z。其中，0 ≤x，y，z≤1。

3) 如果消费者具有风险规避偏好并且再制品制造商提供延保服务，消费者会获得使用效益V1和低碳偏好效益θe1，否则消费者只能获得原有的使用效益V2(V1＞V2) 和购买再制品的低碳偏好效益 θe2(e1＞e2)，同时还需要承担产品故障率带来的损失 αL1。消费者具有风险规避偏好，再制品制造商却不提供延保服务会导致消费者产生缺失效益 Δv。

4) 提供延保服务的再制品制造商不管产品是否可以销售出去，都需要支付房租、设备等固定成本Λ。当制造商提供延保服务且消费者具有风险规避偏好时，再制品制造商需承担由于产品故障率带来的损失 αL2(L1＞L2)。此时，再制品制造商将在获得原有收益π1的基础之上，获得收益P-αL2-Λ。当消费者未购买延保服务时，再制品制造商将获得通过发展维修业带来的收益 απ2。当零售商具有风险规避偏好，再制品制造商却不提供延保服务时，再制品制造商将产生收益缺失 Δπ。

5) 政府积极管制将产生监管成本c1。此时，政府对消费者主要采取激励措施，当消费者购买延保服务时，给予补贴R1。政府根据再制品制造商是否提供延保服务采取奖惩措施，当再制品制造商提供延保服务时提供奖赏R2，否则增收碳税T。政府的积极管制会在民众中获得良好的声望收益π3。当政府消极管制时将产生监管成本c2(c1＞c2)。此时，政府无法准确获得企业和消费者的策略选择信息，政府不采取奖惩措施。延保策略未顺利推行，政府后期需额外支付环境治理成本c3。

根据以上假设，博弈三方经过多次博弈，收益矩阵如表2所示。

表2 收益矩阵Table 2 Payoff matrix

2 演化稳定策略求解

2.1 期望收益函数构建

消费者具有风险规避偏好的期望收益UC1、消费者无风险规避偏好的期望收益UC2以及消费者的平均期望收益UC分别为

再制品制造商提供延保服务的期望收益UM1、再制品制造商不提供延保服务的期望收益UM2以及再制品制造商平均期望收益UM分别为

政府积极管制的期望收益UG1、政府消极管制的期望收益UG2以及政府平均期望收益UG分别为

2.2 相关复制动态方程

2.3 稳定性分析

均衡点的渐近稳定性可以通过分析复制动态方程系统的雅可比矩阵的特征值来评估，均衡点渐近稳定的充要条件是雅可比矩阵的所有特征值都为负。三方动态博弈的雅可比矩阵为

表3 雅可比矩阵特征值Table 3 Eigenvalues of Jacobian matrix

由于篇幅限制，本文不对每个均衡点进行稳定性分析。基于生命周期理论[13]，本文将再制品延保产业的生命周期分为3个阶段：初始阶段、中期阶段和成熟阶段。

在行业发展初期，消费者和再制品制造商对新型产业采取观望策略，政府面临社会舆论和环境恶化双重压力，采取积极管制的策略，对应E(0,0,1)。随着政府管制措施的奏效和发展，行业将进入中期阶段，三方在市场中积极推行延保策略以获得较高的收益，该阶段对应E(1,1,1)。当行业发展到一定规模，形成比较完整的延保体系，政府不需要干预市场，行业进入成熟阶段。这时政府采取消极管制策略，再制品制造商和消费者会成为市场的主体，该阶段对应E(1,1,0)。由于本文的研究目标是通过延保策略促进可持续发展，因此选择与上述3个行业发展阶段相对应的3种稳定策略进行分析。

1) 产业发展初期。从表4可以看出，要达到稳定点E(0,0,1)，需要满足条件2)下的两个不等式条件。从 Λ ＞R2+T可以看出，当再制品制造商提供延保服务花费的固定成本大于政府的奖励金额和增收税金总额时，再制品制造商不提供延保服务。从c1-c2＜T+π3可以看出，当政府积极管制获得的税收和民众声望收益之和大于积极管制与消极管制的成本差额时，政府选择积极管制。

表4 均衡点的稳定性条件Table 4 Conditions of stability at equilibrium points

2) 产业发展中期。再制品延保服务产业已经初具规模，对应稳定点E(1,1,1)。从表4可以看出，达到稳定点需要满足条件5)下的3个不等式。从P-R1＜αL1+(V1-V2)+θ(e1-e2)可以看出，消费者购买延保服务的价格与获得的奖金之差小于维修成本、延保服务增加的使用效益以及绿色低碳效益的总和时，消费者具有风险规避偏好并购买延保服务。从Λ+α(L2+π2)＜P+R2+T+Δπ可以看出，当再制品制造商提供延保服务时的经营收益、政府对制造商的奖惩金额以及不提供延保产生的收益缺失之和大于固定成本、维修成本以及对维修业的冲击之和时，再制品制造商提供延保服务。从c1-c2+R1+R2＜π3可以看出，当积极管制带来的民众声望大于相对于消极管制增加的成本和支出的奖金之和时，政府选择积极管制。

3) 产业发展成熟期。延保服务市场可以基于市场规则健康发展，因此政府慢慢退出市场，达到稳定点E(1,1,0)。从表4可以看出，达到稳定点需要满足条件4) 下的3个不等式。从P-αL1＜(V1-V2)+θ(e1-e2)可以看出，消费者购买延保服务的支出与维修成本之差小于延保服务增加的使用效益和绿色低碳效益之和时，消费者具有风险规避偏好并购买延保服务。从 Λ+α(L2+π2)＜P+Δπ可以看出，当再制品制造商提供延保服务时的经营收入与不提供延保服务的缺失效益之和大于制造商的固定成本、维修成本以及对维修业的冲击之和时，再制品制造商提供延保服务。从c1-c2＞π3-R1-R2可以看出，当政府积极管制带来的民众声望与财政支出之差小于积极管制增加的成本时，政府选择消极管制。

3 数值分析

为了直观描述再制品延保行业博弈三方的动态演化过程，本文运用Matlab软件进行数值仿真分析。通过对上述3种稳定演化策略进行数值分析，分别介绍行业发展初期、中期以及成熟期三方博弈主体的行为演化路径并对演化过程进行模拟验证。同时，以E(0,0,1)为代表点，对相关参数，如各主体的初始意愿、再制品故障率和政府积极管制时增收的碳税额进行灵敏度分析。部分参数取值如下。

V2=200，e1=50 ，e2=20 ， α=0.05， Δv=20 ， Δπ=50，θ=0.5，L1=1000，L2=500，P=300，π1=200，π2=200，c1=50 ，c2=10。

3.1 参数变化对行为演化的影响

3.1.1 博弈主体初始意愿对演化结果的影响

由博弈三方的复制动态方程可知，每一方博弈主体的演化路径都受其他主体初始意愿的影响。假设博弈三方的初始意愿均为0.5，研究改变另外两个主体的初始意愿对演化结果的影响，另外两个主体的初试意愿各取0.2和0.8。由图2可知，不同主体的初始意愿只改变演化速率，不改变最终的演化结果。如图2(a)所示，制造商企业推行延保服务的意愿与消费者无风险规避偏好的意愿成正比，制造商的低初始意愿比政府的低初始意愿更能推动消费者的风险规避偏好。如图2(b)所示，消费者风险规避偏好的意愿与制造商不提供延保服务的意愿成反比，消费者需求意愿相比政府的管制措施更能推动制造商提供延保服务。值得注意的是，当消费者和政府的初值意愿为(0.8,0.2)和(0.8,0.8)时，制造商提供延保的意愿急剧上升，但是，从长远角度看，再制品制造商知道提供延保不能受益，最终选择不提供延保服务。如图2(c)所示，消费者风险规避偏好的意愿与政府部门积极管制的意愿成反比，消费者的低需求意愿比制造商的低供保意愿更能推动政府积极管制。

图2 初始意愿对不同主体演化结果的影响Figure 2 The influence of initial state on the evolution results

3.1.2 产品故障率α 对演化结果的影响

研究产品故障率 α对博弈主体决策的影响，取α=0.05，0.15，0.25，0.35。如图3所示，产品故障率 α对各主体的策略选择有显著的影响。当α=0.05时，消费者和再制品制造商都倾向于不推行延保策略，而政府部门倾向于通过积极管制的措施推行延保策略。随着 α取值的增加，消费者和再制品制造商开始倾向于推行延保策略，而政府出于对社会总效益的考虑，逐渐推行消极管制策略。如图3(b)和(c)所示，当α =0.35时，再制品制造商和政府没有稳定的策略。因此再制品制造商和政府的适当结合是顺利推行再制品延保策略的必要条件。

图3 产品故障率 α对各主体演化结果的影响Figure 3 The influence of product failure rate α on the evolution results

3.1.3 碳税T对演化结果的影响

研究政府积极管制时对不供保企业增收的碳税T对博弈主体决策的影响，取T=0，20，40，60。如图4(a)所示，T的变化对消费者几乎没有影响。如图4(b)所示，面对较高的税务支出，再制品制造商向不提供延保服务策略演变的速率减缓。但是，由于较低的市场需求以及高昂的固定成本，再制品制造商最终还是会选择不提供延保服务。如图4(c)所示，当T较低时，政府倾向于消极管制策略，当T较高时，政府倾向于积极管制策略，之所以出现这个现象，是因为T占据政府财政收入的很大一部分。

图4 政府积极管制时对不提供延保服务制造商增收的碳税T 对演化结果的影响Figure 4 The influence of taxation T on the evolution results

3.2 产业发展初期到产业发展中期的路径模拟

为满足条件5) 下的3个不等式条件，部分参数设置如下。V1=400， Λ =75，R1=40 ，T=40 ，R2=40，π3=130。不考虑利益相关者的初始意愿，最终演化结果为E(1,1,1)。如图5(a)所示，模拟了从产业发展初期到产业发展中期稳定点E(0,0,1)→E(1,1,1)的演化过程。为了探究政府积极管制时对消费者和再制品制造商的奖励力度对博弈主体决策的影响，本文取R1=R2=10，20，30，40。如图5(a)所示，R1、R2影响消费者和再制品制造商的最终策略，而不影响政府的最终策略。如图5(b)所示，只有奖励金额足够大消费者才会向风险规避偏好演化，当奖励金额低于阈值范围时，奖励金额越高，消费者向无风险规避偏好演化的速率越慢。如图5(c)所示，奖励金额越高，再制品制造商越愿意提供延保服务，但是从长远角度看，若奖励金额低于特定的阈值范围，再制品制造商知道提供延保服务不能收益，则不会提供延保服务。只有奖励金额超过一定的阈值时，再制品制造商才会提供延保服务。如图5(d)所示，奖励金额的增加减缓了政府采取积极管制策略的演化速度。

图5 政府奖励金额对演化路径的影响Figure 5 The influence of government incentive amount on evolutionary path

3.3 产业发展中期到产业发展成熟期的路径模拟

在成熟阶段下，为满足条件4)下的3个不等式条件部分参数设置如下。V1= 450，Λ = 70，R1= 50，T=40，R2= 20，π3= 60。不考虑利益相关者的初始意愿，最终演化结果为E(1,1,1)。图6(a)模拟了从产业发展中期到产业发展成熟期稳定点E(1,1,1)→E(1,1,0)的演化过程。为了探究政府积极管制在民众中获得的声望对博弈主体决策的影响，本文取π3=120，90，60，30。在行业发展的成熟阶段，延保服务市场可以基于市场规则健康发展，政府的积极管制获得的声望降低。如图6(b)和(c)所示，政府积极管制产生的声望减小使消费者向风险规避偏好策略演化的速度减小。同时，政府选择从积极管制向消极管制转变。如图6(d)所示，政府获得声望的改变对再制品制造商几乎没有影响。

图6 政府声望 π3对演化过程的影响Figure 6 The influence of government prestige π3 amount on evolutionary path

4 结论

本文通过构建包括消费者、再制品制造商以及政府的演化博弈模型，分析博弈三方的长期策略调整机制。基于生命周期理论，对产业发展的3个关键阶段间的演化路径进行模拟并进行灵敏度分析，得出以下结论和政策建议。

1) 博弈主体的初始意愿只能改变演化的速度，对最终的演化结果没有影响。博弈主体关于推行延保策略的初始意愿越大，可以更快地收敛到稳定点。政府部门应根据行业发展现状采取适当的宣传措施，合理引导参与主体的积极性。

2) 产品的故障率会影响每个博弈主体的最终演化策略，故障率过高可能会导致系统失调。再制品制造商应该配合政府合理把控产品质量，提高系统有机协调性。

3) 政府应结合市场发展规律及时调整管制力度，促使再制品延保产业逐步向成熟期演化。具体表现为在产业发展初期，面对窘迫的环境现状，政府采取积极管制的策略，通过奖惩措施促进再制品延保策略的推广；在产业发展中期，环境问题快速得到改善，政府在保持积极管制的前提下需合理控制奖惩力度，确保博弈三方都能从中获利。但是，随着市场机制的完善，政府在环境改善方面具有边际递减的收益。同时，政府在民众中获得的声望降低，为保证较高的“投资回报”，政府采取消极管制策略以维持自身的最优性。此时，再制品延保服务产业进入成熟期阶段。在成熟理想的闭环供应链系统中，消费者、再制品制造商以及政府都可以享受再制品延保策略带来的福利。

本文的研究还存在局限性。针对不同的再制品和不同偏好的消费者可以提供不同的延保模式(如以旧换新、以旧换再、按比例保修等)，本文忽略了延保模式对主体选择的影响。在未来的研究中，将把延保模式的选择纳入演化博弈系统中，希望通过拓展延保模式，更好地推进再制品延保产业的发展并提高消费者的用户体验，达到促进经济社会绿色低碳循环发展目的。