张 侃,刘宝平,黄 栋
(海军工程大学 装备经济管理系,湖北 武汉 430033)
非合作博弈视角下稳定军事逆向物流体系构建策略研究
张 侃,刘宝平,黄 栋
(海军工程大学 装备经济管理系,湖北 武汉 430033)
基于非合作博弈理论,提出了构建军事逆向物流体系的静态完全信息博弈模型,研究了不同均衡条件下军事逆向物流相关利益主体双方的行为,给出了形成稳定军事逆向物流体系的基本条件,总结了军企双方构建军事逆向物流的主要策略。
非合作博弈;军事逆向物流体系;博弈模型构建;稳定性分析
当前,部队装备建设进程不断加快,装备更新换代十分迅速,装备在使用与保障过程中消耗的各种物资器材种类繁多、数量巨大,每年为维持装备正常使用而投入的各项费用非常高昂,因装备退役报废、故障修理、消耗处置、库存积压等而淘汰的装备物资资源更是十分惊人。因此,如何正确、高效处置巨大数量的部队退役报废装备具有非常重要的理论研究价值和非常显著的现实价值。在此背景下,军事逆向物流应运而生。它与传统的正向装备物流共同构成循环经济体系,可以使各种装备物资资源在体系中得到持续而合理的利用,不产生或者只产生很少的废弃物,同时减少装备物流活动对环境的影响,从而实现以最少的资源消耗获得最大的军事、经济和社会效益的目的。因此,积极研究并推动军事装备物资逆向流动,构建高效的军事逆向物流系统,对于减轻装备保障压力,提升部队战斗力,节约资源,改善环境,保守军事秘密,促进全社会的可持续发展都具有重要意义。
1992年,随着Stock提出“逆向物流”的概念后,关于逆向物流的研究在欧美发达国家蓬勃兴起。学术界通常认为,逆向物流是指通过将回收物资从消费点沿供应链反方向流动,经过退货、不合格品退回、维修与再制造、物料替代、物资循环利用、废弃物回收等处理环节,使这些物资重新获得价值或得到正确处理的全流程。
随着研究不断深入,国外学术界关于逆向物流的研究多以定量分析和模型构建为主,揭示逆向物流深层运作机理,提高逆向物流经济效益,具有较强的针对性。Joseph Sarkis等[1](2013)认为逆向物流比正向物流面临更多的不确定性因素,为提高逆向物流在实际运作过程中的适应性和灵活性,应当构建一个基于战略功能分解的多维度逆向物流灵活性指标评估体系,该体系可用于第三方逆向物流灵活性评价;Hamed Soleimani等[2](2014)构建了一个两阶段随机变量风险规划模型,该模型能够依据风险假定值来优化逆向物流网络设计和规划,提高了逆向物流网络对随机风险的承受能力;A.Niknejad等[3](2014)提出了基于不同回收量的整体逆向物流网络最优路线算法,该模型针对两种不同的回收量进行讨论,考虑了逆向物流需求和回收数量的模糊不确定性,研究了五种主要因素变化下的网络的敏感性分析,取得了满意的效果;Michael Mutingi[4](2014)利用系统动力学模型来定量分析逆向物流对于绿色供应链管理的影响作用,并找出逆向物流中对于绿色供应链绩效水平影响程度最大的因素,对逆向物流进行阶段性改进。
国内开展逆向物流时间较短,由于缺乏推进逆向物流的相关政策支持和管制措施,逆向物流的生态效益、环境效益和社会效益还未真正体现出来。国内学术界对于逆向物流的研究多数仍处于理论探索阶段,多为定性分析和概念描述,重在通过机制设计、行为规范和制度政策引导等来论证逆向物流与中国国情结合的可行性。付玮琼[5](2011)构建了委托代理模型,来研究政府在废旧家电逆向物流当中的激励强度和角色职能;赵秀荣等[6](2013)从回收、检验、处理、再加工等各环节分析了逆向物流的战略价值和战略地位,提出稳步推进逆向物流工作开展的实施方案,包括物流信息化、运输路径优化、供应链集成化等具体建议;李化[7](2013)构建了AHP逆向物流评价指标体系,呼吁政府重视并加强逆向物流绩效评估工作;郑芳等[8](2014)提出基于科学物流管理的第三方逆向物流方式,分析第三方逆向物流在降低企业成本和提高企业效益方面的突出优势;党辉等[9](2014)基于循环经济理念出发,提出了一种逆向物流管理运作模型,认为健全逆向物流法规制度,提高逆向物流技术研发和政府政策倾斜是促进逆向物流健康发展的三大要素。
当前,学术界关于逆向物流研究的焦点主要集中在地方大型国有企业上,对于军事逆向物流研究不足。由于我国的军事逆向物流并未真正实施,因而军事逆向物流研究的焦点问题在于如何有针对性地构建合理的军事逆向物流体系[10-12],特别是作为军事逆向物流的利益相关者,军方和厂方(以下“厂方”均指逆向物流企业)在该体系中扮演的角色和采取的行为策略。由于军方和厂方在军事逆向物流的实施过程中具有不同的利益诉求,因此非合作博弈理论不失为研究军事逆向物流体系构建下的利益相关者行为策略的一种有效方法。
博弈论[13](Game Theory),又称对策论,是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题,分为合作博弈(Cooperative Game)与非合作博弈(Non-Cooperative)两种基本类别。在非合作博弈研究领域,Nash于1950年提出了著名的“纳什均衡”理论,奠定了非合作博弈的理论基石。非合作博弈作为现代经济学的主流博弈论的主要内容,在现代经济理论体系中占据重要地位,构成了现代经济学的重要组成部分。本文研究的军方与厂方的博弈也指非合作博弈。
非合作博弈当中一个非常重要的概念叫做“均衡”,对于不同类型、不同主体、不同条件下的非合作博弈问题形成了特定的均衡概念。在非合作博弈中,以下几种均衡概念是比较常用的。
(1)占优均衡。当某一参与者独立进行策略选择时,其所选择策略与其他参与者不具有相关性,而即不考虑其他参与者如何进行策略选择,该参与者最优策略具有选择唯一性。在博弈G=[N,{Si},{Pi}]中,若每一个参与者i都存在一个策略Si,i∈N,使得占优于Si{}中任何策略,那么策略组合称为G的占优策略均衡,简称占优均衡。
(2)纯策略纳什均衡。在n个参与者标准式博弈中G={S1,...,Sn;u1,...,un}中,若对于每一个参与者i,是针对其他n-1个参与者所选策略的最佳策略,使得对于Si中所有的si都成立,则称策略组合为标准式博弈G的一个“纯策略纳什均衡”。
(3)混合策略纳什均衡。在标准式博弈G={S1,...,Sn;u1,...,un}中,参与者的策略空间为Si={si1,si2,...,sik},参与者i以概率分布 pi=(pi1,pi2,…pik)来实现k个策略的随机选择,此时形成的“策略”称为混合策略,有 0≤pij≤1,j=1,2,…,k,且pij=1。当纯策略 sij等价于混合策略pij=(0,…,0,1,0,…,0),意味着选择纯策略pij的概率为1,选择其他纯策略的概率为0。
(4)精炼子博弈纳什均衡。精炼子博弈纳什均衡属于动态博弈中均衡策略。对于完全信息动态博弈而言,精炼子博弈纳什均衡成立,应当满足两个基本条件:①参与者的某一个策略组合在整个动态博弈中构成纳什均衡;②参与者的某一个策略组合在它的所有子博弈中构成纳什均衡。
在军事逆向物流体系构建博弈模型中,参与军事逆向物流活动的主体由提供各类回收物资的军事部队(简称“军方”)和承担具体回收技术工作的企业(简称“厂方”)二者构成,军方与厂方通过博弈使得双方在一个合理的均衡条件下,共同实施逆向物流。
4.1 模型假设
假设1:博弈的参与者为军方和厂方,在博弈过程中军方与厂方都具有有限理性或过程理性,厂方追求自身经济利益的最大化,在作决策时会依据自身情况进行收益与成本的比较;军方作为理性人,追求军事装备物资价值的二次挖掘,实现军事效益最大化。军方同样会计算逆向物流中获得的二次军事经济效益与支出成本的大小,追求以最小的成本获取最大的效益。
假设2:在该博弈当中,军方代表国家利益,具有更多的话语权,属于主导的一方。军方可以在短期内使用强制手段(如监督)迫使厂方实施逆向物流,具有权威性和约束性。
假设3:厂方与军方均有两种策略。其中,厂方可选择“构建”或“不构建”两种基本策略,军方可选择“监督”或“不监督”两种基本策略。军方和厂方在进行博弈时并不清楚对方的策略选择,而双方对对方的策略和收益是完全清楚的,该博弈属于完全信息静态博弈。
假设4:在军方的监督下,厂方构建逆向物流体系,军方会给予相应的激励,而对于不构建逆向物流体系的厂方则给予相应的惩罚;厂方构建逆向物流体系,会提升其品牌形象,不构建逆向物流则会使其声誉受到损失。
4.2 博弈模型分析
军方和厂方在不同策略选择下的收益矩阵见表1。
表1 军方、厂方收益矩阵表
其中:
C1—军方的监督成本;
C2—厂方构建逆向物流体系的成本;
C3—厂方不构建逆向物流而造成的军方装备物资经济损失;
C4—军方监督下厂方不构建逆向物流而造成的声誉等无形价值损失;
S1—厂方构建逆向物流体系后获取的资源二次利用收益;
S2—厂方构建逆向物流体系后带来的品牌等无形价值增长;
S3—厂方未构建逆向物流系统前的收益;
E—厂方构建逆向物流体系时军方可获得的二次军事经济效益;
F—军方监督下对不构建逆向物流的厂方收缴的罚金。
(1)纯策略纳什均衡。当S3-C2+S1+S2<S3-C4-F时,厂方不构建逆向物流体系的收益大于其构建时的收益,此时显然有S3-C2+S1+S2<S3-C4-F<S3,所以厂方的占优策略是“不构建”。考察军方行动,可以分为两种情况:
若-C1-C3+F>-C3,即C1<F时,此时可得到第①种纯策略纳什均衡(监督,不构建);若-C1-C3+F<-C3,即C1>F时,此时有第②种纯策略纳什均衡(不监督,不构建)。这种情况下,就算厂方被查出没有构建逆向物流体系,但由于采取“不构建”策略时的收益和被监督受到的惩罚后的总和仍然大于构建后获得的收益,因此,无论军方监督是否,厂方的最优选择均是“不构建”。
同样,当S3-C2+S1+S2>S3-C4-F时,又分两种情况:
若 S3-C2+S1+S2足够大,有 S3-C2+S1+S2>S3,此时S1+S2>C2,厂方因构建逆向物流体系获利,其占优策略为“构建”,此时由于E-C1>E,军方必然选择策略“不监督”,此时有第③种纯策略纳什均衡(不监督,构建);若S3-C2+S1+S2<S3,此时 S1+S2<C2,考察军方行为,当-C1-C3+F<-C3,即C1>F时,军方的占有策略是“不监督”,此时有第④种纯策略纳什均衡(不监督,不构建)。
由收益矩阵知,军方的期望收益函数为:
厂方的期望收益函数为:
根据军事逆向物流构建博弈模型的均衡条件,其帕累托最优化均衡结果应当是军方不监督而厂方能够主动建立逆向物流体系。但是厂方作为理性的经济人,是否构建军事逆向物流体系并不是其所关注的重点,厂方只追求自身利益是否能够达到最大化。因此,若要求能够顺利建立起逆向物流体系,则需要军方和厂方通过一定的行为准则来调节各自的活动,从而使得该方案能够为双方所接受。
5.1 基本结论
(1)依据第①种、第②种纯策略纳什均衡结果,如果S3-C2+S1+S2<S3-C4-F时厂方具有占优策略为“不构建”,此时厂方不会主动构建逆向物流体系。只有当军方采取一定的 措 施 使 得 S3-C2+S1+S2>S3-C4-F , 即C4+F+S1+S2-C2>0时,此时厂方因不构建逆向物流而遭受的损失(军方罚金、厂方名誉损失)和构建逆向物流将获得的预期收益(有形收益、无形收益)之和大于厂方构建逆向物流体系的成本,厂方才有可能花费精力和时间去构建逆向物流。为满足这一条件,博弈双方的行为准则要求:军方应当加大对厂方不构建逆向物流的罚金F,增强公众的环保意识、节约意识,强调逆向物流重要性(此举能够提高C4);厂方则应当尽量降低开展逆向物流工作时各环节成本,如优化逆向物流方案设计、加强选址论证和逆向物流专业人员培训等,力求降低成本C2,同时提高综合收益S1+S2。
(2)依据第③种、第④种纯策略纳什均衡结果,如果S3-C2+S1+S2>S3,厂方具有占优策略“构建”。因此,只要能够保证厂方在逆向物流中能够获取一定收益,厂方作为理性经济人,必然会主动要求构建逆向物流体系。此时,军方无需“监督”,这也是最优化、最理想的一种博弈均衡结果。但是由于实际逆向物流水平达不到要求,特别是在构建初期,厂方很难通过短期经营而获利。此时必然要求军方采取“监督”措施强制厂方构建逆向物流体系,由于军方监督存在监督成本,因此若要维持军方长期有效的“监督”,则必须满足-C1-C3+F>-C3,即F>C1,要求军方进行监督的成本小于罚金的收益。博弈双方的行为准则要求:军方应当通过加大对厂方惩罚力度来促进自身愿意去进行监督,厂方应该采取措施降低成本,提高收益来确保逆向物流有利可图。
(4)由第(3)条结论,可知罚金F其实是一把双刃剑,F值过高或过低都会对博弈结果产生不利影响。换个思考角度,假设厂方主动构建逆向物流体系时军方能够给予适当奖励K,此时显然 α*>α**,因此,可以通过调控奖励大小来增加厂方构建逆向物流体系的积极性,说明奖励比惩罚更有效。
5.2 基于动态重复博弈的稳定性条件
当军方、厂方按照一定的博弈规则构建起军事逆向物流体系后,需要进一步考虑的问题是:军事逆向物流体系是否是一个能够长期地、周而复始运行下去的稳定体系,即如何保证其运行稳定性的问题。从博弈的角度来看,军方、厂方作为博弈的局中人,此时在进行博弈时,双方考虑的问题将是自身如何从逆向物流运行过程中获取长期、持续的收益,博弈过程将是连续的、长期的、反复的。
为保证逆向物流体系的稳定运行,军方与厂方在这一阶段形成了新的博弈,该博弈过程具有不断重复的特点,且双方在每一轮博弈中均能够获取上一轮博弈的完全信息,从而决定本轮博弈策略的选择,因此属于完全信息动态重复博弈讨论的情形。军方的策略变为“补贴”和“不补贴”两种,厂方的策略对应为“努力”和“不努力”两种,“努力”时和“不努力”时分别对应两种回收量Q1和Q2,显然Q1>Q2。考察重复博弈中第t轮子博弈,该子博弈收益矩阵见表2:
M1—军方给予厂方的每单位回收物资补贴额;
M2—厂方处理单位回收物资能够为军方带来的经济效益;
N1—厂方向军方购买单位回收物资的价格;
N2—厂方处理单位回收物资获取的收益;
λ—厂方获取单位回收物资的努力成本。
需要注意λ并不是一成不变的,λ为与时间t相关的变量,记为λ(t)。
若单独讨论第 t轮子博弈,必然有(M2+N1-M1)Q1<(M2+N1)Q1或(M2+N1-M1)Q2<(M2+N1)Q2,因此无论厂方采取何种策略,军方的占优策略一定为“不补贴”。若t较小,结合5.1中第(2)条结论,此时厂方处于逆向物流构建初期,盈利能力较弱,有 N2-N1-λ<0,从而(N2-N1-λ)(Q1-Q2)>0,厂方没有采取“努力”策略的主观要求,该博弈的一个子博弈精炼纳什均衡为(不努力,不补贴)。
显然,该博弈结果并不理想,说明无法构建一个稳定的逆向物流体系。然而,对于动态重复博弈而言,军方、厂方所考虑的是博弈的长期利益,此时双方的策略将发生变化,从而形成新的博弈均衡。军方为获取长期利益,不会计较在博弈初期的利益损失,而采取相应的“补贴”策略,当M1+N2-N1-λ>0时,厂方的最优策略将变为“努力”。
随着每一轮博弈的重复进行,厂方从事逆向物流工作的技术水平不断提高,盈利能力不断增强。在第t*轮子博弈时,厂方获取单位回收物资的努力成本λ将不断下降至λ∗,有λ(t*)=λ*,对应的回收量Q1则提升为Q∗。当满足条件
军方将在t*+1轮子博弈时改变策略为“不补贴”,此时厂方策略仍为“努力”,形成稳定的子博弈精炼纳什均衡(努力,不补贴)。
在逆向物流体系构建博弈当中,军方、厂方作为利益相关的局中人,应当具备相应的权利,并履行相应的责任。军方具有要求厂方必须构建逆向物流的行为主导权,厂方则具有开展逆向物流具体构建工作的经营运作权。
军方应采取的策略有:制定合理的奖励制度,采用必要的激励手段,运用经济杠杆调动厂方从事逆向物流工作的积极性;对于拒不构建逆向物流体系的厂方采取必要的惩罚措施,如处以罚金或其他政策性惩罚;积极向厂方人员和社会公众宣传节约和环保的理念,加深对逆向物流工作重要性的认识;在逆向物流体系构建初期,军方应采取积极补贴的方式,扶持厂方逆向物流工作的开展。
厂方应采取的策略有:转变思想观念,提高节能环保意识,加快推进逆向物流工作开展;通过降低回收成本和提高回收效益两个途径来着手构建逆向物流体系;注重对外宣传,提升品牌形象,重视和挖掘开展逆向物流工作带来的潜在无形经济效益;在逆向物流体系构建后,应加快技术创新,提升科学管理水平,提高逆向物流工作的市场获利能力,尽快摆脱对军方的补贴依赖,形成稳定、良好的独立自主运行机制。
军事逆向物流研究是近年来军队物资经济研究的一个热点问题,具有非常可观的发展前景。军事逆向物流活动能够有效提高军事资源统筹利用效益,二次优化资源配置,改善生态环境,减少浪费,提升部队战斗力水平和装备综合保障可靠性。开展军事逆向物流的关键则需要理顺军厂双方的利益分歧,通过采取合理措施加以引导,促进军事逆向物流发展形成合力。非合作博弈理论的基本假设与军厂双方的利益诉求相契合,通过探讨军厂双方的行为策略,为构建稳定的军事逆向物流体系提供了较为充分的指导依据。
[1]Joseph Sarkis,Chunguang Bai.Flexibility in reverse logistics:a framework and evaluation approach[J].Journal of Cleaner Production,2013, (47):306-318.
[2]Hamed Soleimani,Kannan Govindan.Reverse logistics network design and planning utilizing conditional value at risk[J].European Journal of Operational Research,2014,237(2):487-497.
[3]A Niknejad,D Petrovic.Optimization of integrated reverse logistics networks with different product recovery routes[J].European Journal of Operational Research,2014,238(1):143-154.
[4]Michael Mutingi.The impact of reverse logistics in green supply chain management:a system dynamics analysis[J].International Journal of Industrial and Systems Engineering,2014,2(17):186-201.
[5]付玮琼.家电逆向物流的委托代理政府激励机制研究[J].物流技术, 2011,30(6):54-56.
[6]赵秀荣,安娜,王婧.逆向物流的价值内涵及其实施方案研究[J].物流技术,2013,32(3):148-150.
[7]李化.基于AHP的逆向物流评价指标排序[J].经济研究导刊,2013, (24):56-57.
[8]郑芳,李敉.基于逆向物流的第三方物流管理分析[J].物流科技,2014, (1):125-126.
[9]党辉,蒋洪平.循环经济导向下逆向物流管理问题研究[J].物流技术, 2014,(5):70-71,137.
[10]冯海川,于淼,李伟.军事逆向物流的战略价值[J].军队采购与物流, 2009,(1):67-68.
[11]王宇,连华,王远军.加强我军军事逆向物流管理的思考[J].后勤科技装备,2006,(3):9-11.
[12]张义桂,黎明.军事逆向物流运行机制浅析[J].军队采购与物流, 2011,(3):64-66.
[13]张维迎.博弈论与信息经济学[M].上海:上海三联出版社,1996.
Study on Establishment of Stable Reverse Military Logistics System:A Non-cooperative Game Perspective
Zhang Kan,Liu Baoping,Huang Dong
(Department of Equipment Economy&Management,Navy University of Engineering,Wuhan 430033,China)
In this paper,based on the non-cooperative game theory,we proposed the static complete information game model for the establishment of the reverse military logistics system where we studied the behaviors of the two stakeholders in the reverse logistics system under different equilibrium conditions,arrived at the basic condition to stabilize the system,and at the end,summarized the major strategies for the establishment of the reverse military logistics system by military and corporate parties.
non-cooperative game;reverse military logistics system;game model establishment;stability analysis
E234;F224.32;F252
A
1005-152X(2015)10-0259-05
2015-06-18
全军物资经济研究中心科研计划项目(DALS2014-TH-023)
张侃(1985-),男,博士生,海军工程大学装备经济管理系讲师,研究方向:国防经济。
10.3969/j.issn.1005-152X.2015.10.069