基于制造商回收的双渠道闭环供应链博弈分析

2020-04-08 10:22司凤山戴道明
计算机集成制造系统 2020年3期
关键词:闭环零售商制造商

司凤山,王 晶,戴道明

(安徽财经大学 管理科学与工程学院,安徽 蚌埠 233030)

0 引言

随着绿色经济和循环经济的发展,废旧产品的回收利用已成为减少环境污染和降低制造成本的有效途径。制造商在经营双渠道销售的同时,也在积极开拓回收渠道,从而形成双渠道闭环供应链。

关于双渠道闭环供应链中第三方回收的策略问题,学者们从公平关切下的决策均衡[1]、集中和分散决策下的最优决策方案及协调机制[2-4]、歧视性回收与公平回收策略[5]、零售商和第三方回收对比分析[6]等方面分析了第三方回收对双渠道闭环供应链利润和回收率的影响,给出了供应链绩效的评价标准。

关于消费者对再制造产品的偏好和提供废旧产品的意愿问题。学者们研究了双渠道闭环供应链中Stackelberg和Bertrand博弈模式下消费者偏好对定价和协调策略的影响[7]、政府补贴对象的不同及消费者偏好的差异对最优决策的影响[8]、消费者对再制造产品的接纳程度,以及消费者对直销渠道的偏好对闭环供应链定价和利润的影响[9]、提供折扣或直接费用对消费者提供废旧产品意愿的影响[10]等问题,研究成果为政府制定补贴和免税政策及实施供应链协调提供了参考依据。

针对市场的需求不确定性和渠道权利结构差异问题,倪明等[11]在考虑需求不确定基础上,分析了3种回收模式下的最优决策解问题,并对3种回收模式进行了比较分析;李向荣等[12]研究了在市场需求变动的情况下,双渠道闭环供应链在集中决策和分散决策模式下的价格博弈策略问题,给出了最优定价策略;李明芳等[13]研究了在制造商负责回收的闭环供应链中,基于4种渠道权利结构下的最优决策问题,给出了不同结构下最优决策的比较分析结果;林杰等[14]研究了双正向和双逆向物流并存的供应链中的最优定价策略问题,分析了制造成本和渠道竞争强度对最优决策的影响,给出了不同渠道权利结构下的产品销售价格、回收价格和零售商利润的解析表达式。

针对回收比例、再制造率、再制造成本和再制造产品售价问题。Xie等[15]研究了双渠道闭环供应链中集中决策和分散决策下的契约协调问题,考虑了回收率与回收收益率之间的关系,设计了收益共享机制,给出了最优的双渠道售价、批发价和广告投资;朱晓东等[16]考虑线下回收和线上回收两种渠道之间的成本和可再制造比例,分析了竞合决策模式下的最优回收价格和利润,探究了回收竞争系数、可再制造比例等因素对最优策略的影响,并借助收益共享合同实现了供应链协调;李晓婧等[17]在考虑碳交易和碳排放的基础上,分析了双渠道闭环供应链模型的网络均衡问题,给出了再制造率、原材料转化率等决策参数的最优解以及网络均衡的条件;张成堂等[18]在考虑再制造产品售价差异和多种旧产品回收渠道的基础上,分析了最优的产品售价和回收价策略,在多渠道回收机制的基础上,利用收益共享机制实现供应链协调。

另外,学者们还对闭环供应链中的联合决策、消费补贴、专利许可、碳减排技术和风险合同等问题展开了研究。王玉燕[19]研究了存在双渠道回收机制的闭环供应链,给出了不同决策模式的最优策略解析式,并讨论了有无政府干预、是否联合决策等因素对最优策略的影响;Ma等[20]研究了政府的消费补贴对双渠道闭环供应链的影响,分析了政府资助计划前后的渠道成员策略,从消费者、闭环供应链的规模和企业的角度分析了消费补贴对最优策略的影响;郑本荣等[21]研究了双渠道闭环供应链中,考虑专利许可的博弈模型的最优定价和协调策略,讨论了集中和分散决策模式下的供应链成员利润均衡解,通过改进的收益共享合同实现对供应链的协调;张杰芳等[22]研究了二级闭环供应链中碳减排技术对最优决策的影响及协调问题,给出了最优策略的解析表达式;He[23]设计了供应风险分担合同下、供过于求风险共享合同、完整的供应风险分担合同和无风险分担合同对闭环供应链的协调作用,并分析了不同合同对产品回收价格和回收数量的影响。

综上所述,学者们从多方面、多角度对双渠道闭环供应链最优决策问题进行了研究,使用优化的方法给出了最优决策的解析表达式。但是,研究内容上同时涉及回收率和再制造成本差异的文献并不多见,研究方法略显单一。因此,本文在考虑产品回收率和再制造成本差异的基础上,对基于制造商回收的双渠道闭环供应链中的最优策略和动力学演化博弈行为进行研究。与以往文献相比,在研究内容上综合了回收率和再制造成本差异两个关键决策因素;在研究方法上,一方面构建了单周期静态博弈模型,通过优化的方法给出决策的最优解,另一方面建立了时滞动态博弈模型,借助非线性动力学理论和系统复杂性理论分析了系统的演化过程,给出了多种因素对系统稳定性和复杂性的影响,实现了对失稳系统的有效性控制。

1 问题描述与基本假设

1.1 问题描述

在双渠道闭环供应链中,产品回收率和再制造成本差异会对最优决策产生较大影响,基于制造商回收的闭环供应链结构如图1所示。其中,制造商一方面利用原材料生产新产品,单位新产品的生产成本为cn,另一方面还直接从消费者手中回收废旧产品进行再制造,废旧产品的回收率为τm,单位再制造产品的成本为cr。制造商生产的新产品和再制造产品,一是通过线上渠道进行网络销售,直销价为pm,二是以价格w批发给零售商进行线下渠道销售,零售价为pr。直销渠道和零售商渠道的产品需求量分别为qm和qr。

1.2 基本假设

为便于研究,对模型做出如下假设:

(1)研究的前提是市场中已经存在废旧产品,即产品已处于循环利用中。

(3)制造商回收的废旧产品全部用于再制造。通常情况下,再制造产品在质量上与新产品还存在差异,但是由于其具有价格优势,消费者仍然对其有一定的购买意愿。因此,新产品和再制造产品能够同时在双渠道中进行销售,形成渠道间的价格竞争。

(4)单位再制造产品的成本小于单位新产品的制造成本,即cr

(5)单位产品的生产成本c由再制造产品的单位成本cr和新产品的单位成本cn按回收率的比例构成:c=τmcr+(1-τm)cn=cn-τmΔ。

2 单周期静态博弈模型构建

直销渠道和零售商渠道的产品需求量分别为:

qm=a-β1pm+γ1pr,

(1)

qr=a-β2pr+γ2pm。

(2)

其中:a>0为新产品和再制造产品的最大潜在需求量;β1,β2>0为需求量对自身价格的敏感系数;γ1,γ2>0为需求量对交叉价格的敏感系数。为了简化运算,参照文献[25],此处假定β1=β2=β,γ1=γ2=γ。由于渠道的需求量对自身价格的依赖程度高于竞争渠道的价格,故而β>γ。

2.1 集中决策情形

集中决策下的供应链系统利润为:

πc(pm.c,pr.c,τm.c)=(pm.c-cn+τm.cΔ)qm.c+

(3)

式中:πc为集中决策下的系统利润,下标c表示集中决策。

(4)

(5)

(6)

证明经计算,πc(pm.c,pr.c,τm.c)关于pm.c、pr.c和τm.c的Hessian矩阵为

因为一阶主子式Det(H11)<0,二阶主子式Det(H12)=4(β2-γ2)>0,当η>(β-γ)Δ2时,三阶主子式Det(H13)<0,此时Hessian矩阵H1是负定的,所以πc(pm.c,pr.c,τm.c)是关于pm.c、pr.c和τm.c的严格凹函数,即πc(pm.c,pr.c,τm.c)存在最大值。

命题1得证。

此时,集中决策下供应链的最优系统利润为

(7)

证明

命题2得证。

2.2 分散决策情形

在分散决策下,制造商和零售商以各自利润最大化为决策目标。考虑到制造商和零售商在博弈过程中所处的地位,此处研究制造商为主导的Stackelberg博弈。其中:制造商是领导者,优先决定直销价pm.s、批发价ws和回收率τm.s;零售商是跟随者,在制造商决策的基础上再决定零售价pr.s。此时,制造商和零售商的利润分别为:

πm.s(pm.s,ws,τm.s)=(pm.s-cn+τm.sΔ)qm.s+

(8)

πr.s(pr.s)=(pr.s-ws)qr.s。

(9)

其中:πm.s和πr.s分别为制造商利润和零售商利润;下标s表示Stackelberg博弈。

(10)

根据式(1)、式(2)、式(8)、式(10)可得πm.s(pm.s,ws,τm.s)关于pm.s、ws和τm.s的Hessian矩阵为

(11)

(12)

(13)

由式(10)~式(12)可得最优零售价为

(14)

命题3得证。

此时,制造商和零售商的最优利润分别为:

(15)

(16)

证明证明过程与命题2类似。

3 静态模型数值仿真

为了更好地验证命题2和命题4结论的正确性,参数取值如下:a=1.2,β=0.6,γ=0.5,cn=0.6,w=0.8,η=0.5。

(1)在命题2中,条件cn=0.6

(2)在命题4中,条件cn=0.6

4 双时滞动态博弈模型构建

由于市场信息的不对称性和延迟性,制造商和零售商很难在及时掌握全面信息的基础上进行决策。通常它们会根据自己的边际利润同时决策,且在博弈过程中处于平等地位。制造商和零售商的利润分别为:

πm(pm,pr)=(pm-cn+τmΔ)qm+

(17)

πr(pm,pr)=(pr-w)qr。

(18)

制造商和零售商的边际利润分别为:

2βpm+γpr+(γ-β)Δτm;

(19)

边际利润直接影响制造商和零售商的决策策略。若边际利润为正,制造商和零售商则会提高相应的价格;若边际利润为负,则它们会降低相应的价格。直销价pm和零售价pr的动态博弈过程为[26]:

2βpm+γpr+(γ-β)Δτm);

(20)

其中km≥0和kr≥0分别为直销价格和零售价格的调整速度。

因为当前价格信息获取困难,所以制造商和零售商仅分别参照t-τ1时刻和t-τ2时刻的历史价格进行决策,τ1,τ2为时滞参数且τ1>0,τ2>0。为了简化运算,假定τ1=τ2=τ,即制造商和零售商参照相同历史时期的价格实施决策。此时最终的动态价格博弈模型为:

(γ-β)Δτm+a+wγ+(β-γ)cn);

(21)

5 Hopf分岔的存在性和局部渐近稳定性

(22)

模型(22)的特征方程为:

λ2+A1λe-λτ+A0e-2λτ=0。

(23)

(1)当τ=0时,式(23)简化为:

λ2+A1λ+A0=0。

(24)

(2)当τ>0时,式(23)两边同乘以eλτ,可得:

λ2eλτ+A0e-λτ+A1λ=0。

(25)

令λ=iω(ω>0)是式(25)的一个正根,从而可得:

(26)

若条件(H2):A0-ω2≠0成立,则有:

(27)

于是得:

(28)

令s=ω2,则有

令τ0=min{τ(j)|j=0,1,2,…}=min{τ(0)},则为

(29)

因此,当τ=τ0时,式(25)有一对纯虚根±iω0。

对式(25)两边求λ关于τ的导数,可得:

从而有

(30)

如果条件(H4):G1G3+G2G4≠0成立,则模型(21)满足Hopf分岔的横截性条件。至此,根据Hopf分岔的存在性条件,可以得出如下结论[28-29]:

6 动态模型仿真及分析

为验证定理1的正确性并讨论参数对系统稳定性和复杂性的影响,取参数km=0.5,kr=0.5,Δ=0.2,τm=0.6,其他参数取值与第3章相同。此时,模型(21)可重写为:

pr(t-τ)+1.648);

pr(t-τ)+1.68)。

(31)

6.1 时滞参数对系统稳定性的影响

经计算,A1=2.973,A0=1.822。根据劳斯判据可知条件(H1)满足,即当τ=0时,系统(31)是稳定的(在仿真部分,“模型”统称为“系统”)。

进一步计算可得:ω0=2.018 0,τ0=0.778 4,G1G3+G2G4=7.091 3≠0,平衡点为E(2.368,2.587)。根据定理1可得,当τ=0.778 4时系统产生Hopf分岔,如图4所示。系统在分岔临界点τ0两侧的状态截然相反,如图5和图6所示。

显然,从图4~图6可以看出,系统随τ的增大逐渐由稳定状态转变为不稳定状态,分岔临界点为τ0。如果系统进入不稳定状态会导致价格的剧烈波动,此时不利于制造商和零售商决策。因此,制造商和零售商不要参照距今太久的历史价格来决策未来的产品价格,否则由此得到的产品价格难以保持相对稳定。

6.2 价格调整速度和时滞参数对系统稳定性和复杂性的影响

制造商和零售商为了获取各自最大的利润,会不断加快价格的调整速度。但是过快的价格调整速度会使价格系统失去稳定。以制造商为例,当τ=0.5<τ0时价格调整速度km对系统稳定性的影响如图7所示。

图7显示,当km∈[0,0.05)时,直销价pm和零售价pr伴随着km的增大而明显上涨;当km∈[0.05,0.95]时,pm稳定于平衡值2.368,pr稳定于平衡值2.587。但当km>0.95时系统失去稳定,价格呈现无规则的波动。因此,价格调整速度应保持在一个合理的范围内,不可盲目提高。

以直销价pm为例,价格调整速度km和时滞参数τ对系统稳定性和复杂性的影响分别如图8~图10所示。

由图8可以看出,当km增加时,pm先迅速增大,而后趋于相对稳定,稳定域为图9中的浅蓝色部分。但是当km和τ都较大时,pm呈现剧烈波动,不稳定域为图9中右上角部分。当τ=0.5时,pm随km的变化趋势如图7所示。另外,系统的不稳定将会带来复杂性的增加,使系统变得难以把控和理解。图10中的熵图则显著地展现了系统复杂性变化的趋势。当熵值为零时,表明系统是稳定的;当熵值大于零时,则表示系统已经失去稳定,并且熵值越大意味着系统越复杂。比较图8~图10明显发现,系统的无规则波动引起了其复杂性的增加,它们所对应的不稳定域是相同的。因此,(km,τ)的取值应处在合理的区域内,否则不稳定且复杂的价格博弈系统不利于制造商和零售商的决策和获利。

6.3 再制造成本差异和回收率对价格决策的影响

再制造成本差异Δ和回收率τm对直销价pm和零售价pr的影响分别如图11和图12所示。

由图11和图12可以看出,随着再制造成本差异Δ和回收率τm的增加,直销价pm和零售价pr均呈下降趋势。根据成本公式c=cn-τmΔ,当cn不变时,提高Δ或τm就意味着降低了生产成本,因此售价也会相应降低。这与第3章的静态模型仿真结果相同。

7 稳定性控制

根据6.1节分析可知,当τ=1>τ0=0.778 4时系统不稳定,此时对应的吸引子如图13所示。显然,价格经过长期博弈后失去稳定而进入混沌状态。为避免这种状态,一是可以调节时滞参数τ使其小于临界值τ0,二是可以对失稳的系统增加控制项,使其重返稳定状态。

此处采用变量反馈控制法对失稳系统进行控制,系统(31)增加控制项之后变为:

pr(t-τ)+1.648)-μpm;

pr(t-τ)+1.68)-μpr。

(32)

其中μ为控制参数,调节μ的值可以实现系统的稳定性控制。系统(32)关于μ的分岔图如图14所示。

从图14可以看出,系统分岔临界值为μ0=0.195。当μ<μ0时系统不稳定,当μ>μ0时系统稳定。为了更清楚地观察μ0两侧的系统状态,取μ=0.15<μ0和μ=0.25>μ0,它们所对应的系统状态如图15和图16所示。

图15和图16显示,当μ<μ0时系统没有得到控制,但是当μ>μ0时,系统得到了有效控制,此时价格经过博弈后会趋于平衡点。因此,变量反馈控制法是可行的,通过调节控制参数即可实现失稳系统的有效性控制。这也说明,对于不稳定的经济市场,通过增加政府干预等外部调节机制,可以加快其重返稳定的速度,确保经济健康、稳定地发展。

8 结束语

针对发展循环经济中的双渠道闭环供应链运营问题,本文在考虑制造商回收、废旧产品回收率和再制造成本差异的基础上,首先分别构建了单周期的静态博弈模型和带双时滞的动态博弈模型;其次,分析了静态博弈模型在集中决策和分散决策下的最优策略问题,给出了最优直销价、最优批发价、最优回收率、最优零售价和最优利润的解析表达式,探究了再制造成本差异对最优策略的影响;再次,研究了动态博弈模型的Hopf分岔和局部渐近稳定性问题,给出了分岔临界时滞参数的解析表达式,探讨了时滞参数、回收率、再制造成本差异和价格调整速度对动态博弈模型稳定性和复杂性的影响;最后,针对失稳系统对价格决策带来的不利影响,运用变量反馈控制法对其进行了有效控制。研究表明,当满足一定条件时,静态博弈模型存在最优策略,且最优直销价、最优零售价、最优批发价均是关于再制造成本差异的减函数,而最优回收率和最优利润则是关于再制造成本差异的增函数。研究还发现,动态博弈模型中的时滞参数和价格调整速度不宜过大,否则会导致系统失去稳定,从而增加系统的复杂性。本文从静态和动态两个方面加深对博弈模型的认识,取得的研究结论可以为制造商和零售商的科学决策提供帮助。

为了鼓励制造商积极参与废旧产品的回收利用,可以考虑设计成本分担合同切实减轻制造商回收废旧产品的负担,这种协调机制的运用是下一步研究的内容和方向。

猜你喜欢
闭环零售商制造商
一位制造商一架军机(欧亚篇)
一位制造商一架军机(美国篇)
基于安全闭环的“两客一危”动态监管平台
完形填空两篇
一种新型烟气含氧量闭环动态自适应控制系统的研制和应用
基于四元数卷积神经网络的移动机器人闭环检测
受挫的汽车制造商在通向全新未来的十字路口止步不前
国产品牌,零售商这样说……
零售商都在做自有品牌化妆品,如何才能脱颖而出?
高通24亿美元收购芯片制造商CSR