成品粮应急代储企业竞合机制研究

2014-09-22 19:09翁心刚胡会琴

商业研究 2014年8期

翁心刚+胡会琴

摘要：本文将进化博弈理论与博弈链思想相结合，通过建立进化博弈链模型来研究代储企业的进化规律，并利用Matlab进行了数值仿真。由于财政补贴、投机收益、政府罚款和举报奖励等因素的取值不同，代储企业合作者比例有三种均衡状态，在不考虑政府监管的情况下，三种进化过程中的平均收益与合作者比例变化趋势相反，这些结论为地方政府构建合理有效的代储企业竞合机制提供了决策依据。

关键词：进化博弈链；成品粮应急代储企业；竞合机制

中图分类号：F123；F32文献标识码：A

收稿日期：2014-05-08

作者简介：翁心刚（1961-），男，北京人，北京物资学院物流学院教授，研究生导师，经济学博士，研究方向：物流与供应链管理；胡会琴（1983-），女，河南开封人，中国农业大学经济管理学院博士研究生，研究方向：物流系统优化与供应链管理、应急物流。

基金项目：中央高校基本科研业务费专项资金“成品粮应急代储系统协调机制研究”，项目编号：2013yj011。

2003年的非典疫情引起我国政府对非常规突发事件应急管理的高度重视，尤其是2008年四川汶川地震以来，成品粮应急储备作为应急管理体系中时效性最强的生命物资保障，在突发事件的应对中发挥了不可替代的作用。参照我国多省市《成品粮油应急储备管理办法》的规定，成品粮应急储备品种包括大米和小麦粉，成品粮应急储备大多采取市场化储备，即由生产加工企业或流通企业代理地方政府进行承储，称之为成品粮应急代储企业（简称为“代储企业”）。按照合同要求，代储企业必须按照政府的要求进行储备，主要包括收购、储存、轮换、调配等方面。代储企业在规模、发展潜力、信誉、服务和管理能力、业务范围等方面存在一定的差异，代储企业之间属于“零和博弈”的竞争；同时，代储企业也存在一定的道德风险，如以次充好、上报虚假采购价格、骗取储备补贴、故意抬高价格等。因此，对代储企业之间竞合机制的研究，对于成品粮应急代储系统保障成品粮的应急供应具有重大理论和现实意义。

一、成品粮应急代储企业进化博弈链模型构建

（一）进化博弈链理论的应用

进化博弈理论又称为演化博弈论（Weibull J W，1995；Samuelson L，1997；谢织予，2008），是研究有限理性博弈的理论（Smith J M.，1982；Axelrod R.，1984；Hofbauer J、Sigmund K，1998）。20世纪60年代，在研究解释生态现象时产生了演化博弈论（Lewontin，1961），为研究合作行为提供了有力的理论工具。进化博弈具有均衡选择作用，一些经济学家对有限群体的均衡问题进行了研究，包括有限规模群体演化定性（Schaffer，1988）、有限数目多群体均衡（Garay、Varga，1998）、多参与人多策略演化博弈均衡的性质研究（Feldman，2009；Altenberg，2010；Traulsen A、Gokhale C S.，2012），以及博弈联盟的效率（Isa E. Hafalir，2007）和形成的价值（Grabisch M、Funaki Y，2012），进化博弈的动态均衡与优化行为的选择（Y f. Zhang et al，2012）。

进化博弈和博弈链思想相结合的进化博弈链理论与分析方法，试图从全新的视角揭示组织系统的复杂博弈关系及其演化规律。该理论基于系统思维方式，在抽象出复杂组织系统客观存在的组链式博弈关系的基础上，将宏观系统分析与微观博弈分析相结合，综合考虑行为互动性、因素互动性及时间变量对系统均衡和协同演化的影响，运用系统科学方法分析组织系统内外部的作用机制，描述构成博弈链的单个博弈局势之间的相互关联特征及其作用关系，从而揭示组织系统整体模化规律的理论与方法（侯光明，2006）。

博弈链理论已被应用在社会科学的诸多领域，如通过构建企业集群的进化博弈链模型，揭示了企业集群演进的内在机理和动态过程，为探寻企业集群演进的本质规律提供了新的思路和方法（胡明礼等，2006）；在产学研领域，运用进化博弈链模型和动态决策方程，较好地揭示了产学研合作中的“囚徒困境”和演化规律（陈洪转，2012）。进化博弈链理论及其分析方法对研究组织内各主体间关系的演化过程提供了新的研究视角，本文将学习和借鉴已有的研究成果，运用进化博弈链模型对有限群体成品粮代储企业的竞合演化过程进行研究，对地方政府建立科学的代储企业协调机制提供依据。

（二）模型假设

结合我国成品粮应急代储系统的特点，本文对成品粮应急代储企业之间的进化博弈链模型作如下假设：（1）参与方的利益冲突为有限零和博弈，且损益矩阵为对称型。（2）在代储企业博弈过程中不考虑政府监管。（3）以成品粮应急代储的整个过程为研究对象，不以采购、保管、轮换、调用等某一业务环节为研究对象。（4）参与人（即代储企业）是“有限理性”经济人，其决策为使其利益最大化的最优选择，且为参与方的共同知识。（5）参与人有两种策略选择：策略1（合作）和策略2（不合作），合作策略指代储企业按照地方政府的要求开展各项承储活动，不合作策略指代储企业不完全按照地方政府的要求操作，存在不作为或有投机行为现象。

（三）博弈损益矩阵

进化博弈通过参与者的进化速度和方向等指标，反映进化的程度和发展的阶段情况。结合成品粮应急代储企业的特点，本文以代储企业采取合作策略的参与者在不同进化阶段的比例变化来刻画进化阶段的发展，并研究模型的进化稳定策略解，为建立科学的代储企业竞合机制提供决策依据。由于各参与方在不同的进化阶段有不同的策略选择，相应的收益也有所不同。地方政府与代储企业通过签订合同建立承储关系，地方政府根据代储企业的代储量给予一定的财政补贴R；代储企业除了要受到法律制度和管理规范的管制外，政府通过一定的激励措施鼓励代储企业互相监督。endprint

假设代储企业不合作时的投机收益为T，一旦被地方政府发现即要受到相应的处罚F，并没收投机收益，代储企业在采购、轮换、配送等过程中所消耗的全部成本为C。代储企业中只要有一家企业采取合作策略，就会向地方政府举报不合作代储企业，并且举报的代储企业可以受到奖励J，以此加强监管力度、拓展激励措施。但若所有代储企业均不合作就会形成合谋，相互之间的监管机制失灵。因此，代储企业之间博弈的损益矩阵如表1所示。通过研究代储企业合作者比例的进化博弈过程，探索如何通过合理设置政府补贴R和罚款F等，使成品粮代储系统进化之政府期望的稳定状态，借助多种途径实现代储企业之间的协调，提高成品粮应急代储系统的应急反应能力和处置能力。

（四）成品粮应急代储企业的进化博弈链模型

在成品粮应急代储过程中，由于代储企业是有限理性，采取策略1和策略2的博弈个体都对当前阶段的博弈局面作出反应（不一定是最优反应）。参与个体通过相互学习和模仿优势策略作出进一步的策略选择，如此不断进化。成品粮应急代储企业的进化博弈链模型可用箭线图描述（如图1），用圆圈表示参与者可选择的博弈策略，以箭线（箭尾表示参与方所采取的原策略，箭头表示该参与方在下一阶段将要采取的新策略）配以参与方在各策略之间相互转移的比例p和采取各策略时的收益u，表示各策略在不同阶段之间的进化博弈情况。

图1中的两个椭圆分别表示代储企业在博弈过程中的两个可选策略：合作策略和不合作策略。四个箭线分别表示参与方在t到t+1时刻，各参与方在上述两个策略之间的转移情况，或继续采用原博弈策略，或改用相对的博弈策略，主要取决于各策略带来的收益情况。若箭线为自环形（即箭头与箭尾指向同一策略），表示t和t+1时刻所采取的博弈策略相同；若箭线为非自环形，则表示t和t+1时刻所采取的博弈策略不相同。箭线上的pt11和ut11表示t时刻仍然采取合作策略的参与方的比例和期望收益，pt22和ut22分别表示仍然采取不合作策略参与者的比例和期望收益，pt+112和ut+112表示t时刻采取合作策略而在t+1时刻采取不合作策略的参与方的比例和期望收益，pt+121和ut+121 则表示t时刻采取不合作策略而在t+1时刻采取合作策略的参与方的比例及其期望收益。

进化博弈主要是通过研究博弈的动态演化过程来描述合作行为达成的路径和过程，但学习和模仿是一个试错过程，不断改进以提高个体的适应性。在成品粮应急代储企业博弈过程中，选择不同策略参与方比例的动态变化速度取决于其模仿和学习的速度，而该比例的变化方向取决于不同的策略给参与方带来的收益差别。在博弈过程中存在从众心理，影响着观察和模仿的难易程度，可用选择某一策略参与者比例来表示。另外，学习与模仿的成功程度也会影响下一阶段参与方策略的选择，可用参与者模仿和学习某一策略的收益超过平均收益的幅度来表示，这将直接影响到不同策略的差异对比以及对模仿策略的激励效果。因此，在t+1时刻转用其他策略的参与者的比例，与所转向策略的给踢数量及该转向策略的期望收益比平均收益高出的幅度成正比，则t+1时刻各个体的状态表示如下：

表示t时刻采用原策略个体的期望收益与群体平均收益的差值占其收益之和的比例，该比值越大说明选择该策略的期望收益越大，在下一阶段该策略的吸引力就越大。

根据代储企业之间策略选择相互转移关系，在t+1时刻代储企业进化过程的各项参数表达式

此模型可根据博弈主体在t+1时刻的收益，推导出t+2、t+3等时刻的策略选择及其收益情况。代储企业随着合作阶段的进展不断调整策略，以提高自身的适应性，直到满足各理性主体所追求的群体共赢，最终稳定在进化博弈的均衡点。

二、复制动态与进化稳定策略的仿真

随着时间的推移，在代储企业群体中选择合作策略和不合作策略的个体比例达到均衡，即进化稳定状态。当博弈群体达到进化稳定状态时，博弈纯策略在父代和子代个体中传递，采用各策略的动态变化速度为零，即dxdt=x（ut11-）=0时可得到博弈均衡点。

（1）状态一：当R+F-C>0且T-J>0时，0

由上述算例仿真可知不论x的初始值取值情况如何，经过一定时期的演化，代储企业选择合作策略的比例和群体平均期望收益都将稳定在一个均衡点。当初始值不同时，其演化路径具有较大差异。当初始值取值x=001时，随着演化代数的增加，代储企业合作比例p11的增长率先快后慢，一直保持增长趋势，最终稳定在均衡点；代储企业的平均期望收益却是先快后慢的下降趋势，最终稳定在均衡点。随着演化代数的增加，当初始值取值x=099时，代储企业合作比例p11先是迅速降低到拐点，然后缓慢上升到均衡点；代储企业的平均期望收益则是先降低到拐点，再快速上升到另一个拐点，然后再先快后慢地下降到均衡点。

对状态二进行仿真，x初始值可在区间[0，1] 之间，取初始值x=001，T=8，R=5，F=4，J=3，C=10，分别对代储企业合作比例p11和平均期望收益的进化过程进行仿真。在满足0>R+F-C>J-T且T-J>0的条件下，代储企业最终将全部选择合作策略，但其进化过程速率却是先快后慢（如图8）；同时，代储企业群体平均期望收益以先快后慢的速率下降（如图9）。因此，此状态若无一定管理策略的维持，将很快转向新的进化过程。

对状态三进行仿真，可在区间[0，1]内取x的初始值，此处取x = 099，T=5，R=8，F=4，C=3，J=8，分别对代储企业合作比例p11和平均期望收益的进化过程进行仿真。由仿真结果可知当符合条件：R+F-C>J-T>0，且T-J<0时，代储企业选择合作策略的比例逐步稳定在0，即全部代储企业均不采取合作策略（如图11）。由于投机收益的不断增加，群体的平均期望收益呈总体上升趋势（如图12）。这对于政府来说是非常危险的，一旦突发事件发生，成品粮应急代储系统毫无应对能力可言。因此，地方政府要通过调整相关参数改变代储企业的进化路径和方向。

三、成品粮应急代储企业进化过程分析

由代储企业损益矩阵可知在不考虑政府监管的情况下，代储企业的纳什均衡解为（不合作，不合作）策略组合。因此，在对代储企业的博弈进化过程中产生了随着进化代数的增加，代储企业的平均收益变化趋势与其合作比例的变化趋势相反的情景。下面在不考虑政府监管的假设前提下，分析上述三种进化均衡状态。

（1）当进化博弈均衡点介于0和1之间时，代储企业采取混合策略。一方面不考虑政府不监管，另一方面缺乏健全的竞争机制和激励机制，代储企业的最佳策略选择为不合作。因此，随着不合作代储企业比例的增加其群体平均期望收益逐渐增加，这符合R+F-C>0且T-J>0的情况。

（2）随着进化代数的增加，由图8和图9可知代储企业合作比例以“慢-快-慢”的变化速率进化，最终稳定在均衡点1，同时其平均收益以相似的变化速率向着越来越小的方向进化。状态二必须满足条件：0>R+F-C>J-T，且T-J>0，在投机收益大于政府举报收益的同时，政府补贴和罚款的净收益要小于成本。因此，经济人属性的代储企业便会逐步转向不合作策略，且仿真中的净收益要小于储备成本，其收益随着合作比例的增加而逐渐减小为负值，这与0>R+F-C>J-T且T-J>0的情况相符。所以，政府科学而合理的激励机制和实时的监管机制对激发代储企业积极性具有重要作用。

（3）在进化均衡点是0时，代储企业选择合作策略的比例先是快速减小后缓慢减小到0，同时其平均期望收益却以相反的趋势增加。由于代储企业的最佳策略选择为不合作，且当所有的代储企业均不合作时相互之间便形成串谋，且监督机制失灵，平均收益达到最大值，这与R+F-C>J-T>0且T-J<0的情况相符合。因此，在对代储企业的管理中必须有严厉的惩罚机制和健全的法律法规约束机制，以规避企业不合作行为的发生；同时需要通过多样化的激励机制和公平的利益均衡机制，为代储企业的合作提供根本动力。

四、结论

本文以成品粮应急代储的整个过程为研究对象，建立了成品粮应急代储企业合作策略者比例的进化博弈链模型，讨论了进化博弈的稳定均衡状态，并根据进化规律对代储企业的行为进行有效管理、建立科学的竞合机制，以最大限度地调动代储企业的积极性。

（1）通过讨论成品粮应急代储企业进化博弈链模型及均衡问题，本文运用Matlab进行了仿真分析，较好地解释了代储企业在博弈过程中根据不同策略的收益状况，不断调整策略选择，最后达到均衡状态。

（2）由于不考虑政府监管，在不同的均衡状态下均出现了代储企业合作者比例进化趋势与群体平均期望收益进化趋势相反的现象，并对其产生原因进行了分析。

在R+F-C>0且T-J>0时，代储企业的策略选择处于混合状态。代储企业的不合作收益要大于其合作收益，导致随着合作者比例的增加（或减少），其平均期望收益却减少（或增加）的现象。随着物价水平的提高，代储企业的仓储成本逐渐升高，即当0>R+F-C>J-T且T-J>0时，虽然一段时间内代储企业可以通过企业责任等来约束自己的行为，使系统进化为所有的代储企业均采取合作策略的理想状态。但是，如果政府不及时调整补贴额度和对投机代储企业的惩罚力度，此状态便会开始新的进化。代储企业保障自身的正常运营会通过各种渠道要弥补政府补贴差额的损失，直到代储企业的投机收益逐渐大于政府举报收益及其成本之和，即当R+F-C>J-T>0且T-J<0时，平均收益稳步上升，代储企业便会奋不顾身的转向不合作策略。

（3）在进化过程中，代储企业不同的策略选择，以及影响代储企业收益因素的变化会影响进化的方向和均衡状态，一直反映在代储企业合作者的比例和群体平均收益的变化。地方政府要根据代储企业的进化规律，利用激励机制和利益均衡机制来正确引导其行为，使其逐步转向政府期望的均衡状态，并利用各种有效手段维持。因此，地方政府可采取以下管理措施：一是根据地区经济的发展适当调整财政补贴水平，保证代储企业正常的市场收益；二是加强政府监管，适当调整惩罚力度，减少代储企业的投机行为；三是建立多样化和有吸引力的激励机制，强化代储企业之间的相互监督。

参考文献：

[1]Feldman，M.W. Sam Karlin and multi-locus population genetics[J].Theor. Popul. Biol，2009，75：233-235.

[2]Altenberg L. Proof of the Feldman-Karlin conjecture on the maximum number of equilibria in an evolutionary system[J].Theor. Popul. Biol，2010，77（4）：263-269.

[3]Traulsen A， Gokhale C S. On equilibrium properties of evolutionary multi-player games with random payoff matrices[J].Theoretical population biology， 2012， 81（4）： 264-272.

[4]Hafalir I E. Efficiency in coalition games with externalities[J].Games and Economic Behavior， 2007， 61（2）： 242-258.

[5]Grabisch M， Funaki Y. A coalition formation value for games in partition function form[J].European Journal of Operational Research， 2012， 221（1）：175-185.endprint

[6]Yanfang Zhang，Shue Mei，Weijun Zhong. Equilibrium selection under evolutionary game dynamics with optimizing behavior[J].Commun Nonlinear Sci Numer Simulat，2012，17：3719-3726.

[7]侯光明.组织系统科学概论论[M].北京：科学出版社，2006.

[8]胡明礼，刘思峰，方志耕.企业集群演进的进化博弈链模型研究[J].科技进步与对策，2006，23（11）：34-37.

[9]陈洪转.基于链结构模型的区域产学研合作均衡研究[J].软科学，2012，26（2）：6-9.

[10]余志刚，金成晓.我国粮食宏观调控的系统构建——基于公平效率协调统一视角的分析框架[J].哈尔滨商业大学学报：社会科学版，2012（5）：117-122.

A Study on Competitive-Cooperative Mechanism of Emergency Refined Grain

Agent Reserves Enterprises

WENG Xin-gang1， HU Hui-qin2

（1.School of Logistics， Beijing Wuzi University， Beijing 101149， China；2.College

of Economics & Management， China Agricultural University， Beijing 100083， China）

Abstract：Combining evolutionary game theory and game chain theory， the paper studies the evolutionary laws of agent reserves enterprises by establishing evolutionary game chain model， and uses Matlab to do the numerical simulation. Due to the factors such as financial subsidies， speculative gains， the government fines and incentive being different values， there are three kinds of equilibrium about agent reserves enterprises collaborators ratio. The average income has the opposite trends with collaborators proportion in three evolution processes without considering the government regulation. This provides a decision making basis for local government to build a rational and effective competitive-cooperative mechanism.

Key words：evolutionary game chain； emergency refined grain agent reserves enterprises； competitive-cooperative mechanism

（责任编辑：关立新）endprint

[6]Yanfang Zhang，Shue Mei，Weijun Zhong. Equilibrium selection under evolutionary game dynamics with optimizing behavior[J].Commun Nonlinear Sci Numer Simulat，2012，17：3719-3726.

[7]侯光明.组织系统科学概论论[M].北京：科学出版社，2006.

[8]胡明礼，刘思峰，方志耕.企业集群演进的进化博弈链模型研究[J].科技进步与对策，2006，23（11）：34-37.

[9]陈洪转.基于链结构模型的区域产学研合作均衡研究[J].软科学，2012，26（2）：6-9.

[10]余志刚，金成晓.我国粮食宏观调控的系统构建——基于公平效率协调统一视角的分析框架[J].哈尔滨商业大学学报：社会科学版，2012（5）：117-122.

A Study on Competitive-Cooperative Mechanism of Emergency Refined Grain

Agent Reserves Enterprises

WENG Xin-gang1， HU Hui-qin2

（1.School of Logistics， Beijing Wuzi University， Beijing 101149， China；2.College

of Economics & Management， China Agricultural University， Beijing 100083， China）

Key words：evolutionary game chain； emergency refined grain agent reserves enterprises； competitive-cooperative mechanism

（责任编辑：关立新）endprint

[6]Yanfang Zhang，Shue Mei，Weijun Zhong. Equilibrium selection under evolutionary game dynamics with optimizing behavior[J].Commun Nonlinear Sci Numer Simulat，2012，17：3719-3726.

[7]侯光明.组织系统科学概论论[M].北京：科学出版社，2006.

[8]胡明礼，刘思峰，方志耕.企业集群演进的进化博弈链模型研究[J].科技进步与对策，2006，23（11）：34-37.

[9]陈洪转.基于链结构模型的区域产学研合作均衡研究[J].软科学，2012，26（2）：6-9.

[10]余志刚，金成晓.我国粮食宏观调控的系统构建——基于公平效率协调统一视角的分析框架[J].哈尔滨商业大学学报：社会科学版，2012（5）：117-122.

A Study on Competitive-Cooperative Mechanism of Emergency Refined Grain

Agent Reserves Enterprises

WENG Xin-gang1， HU Hui-qin2

（1.School of Logistics， Beijing Wuzi University， Beijing 101149， China；2.College

of Economics & Management， China Agricultural University， Beijing 100083， China）

Key words：evolutionary game chain； emergency refined grain agent reserves enterprises； competitive-cooperative mechanism

（责任编辑：关立新）endprint

商业研究2014年8期

商业研究的其它文章: 金融资源配置状况对居民消费率的影响; 基于生态制度创新的矿产资源密集型区域可持续发展模式研究; 我国现代产业新体系构建的误区及其规避; 关于A股市场IPO浪潮下的抑价问题; 银行间同业拆借风险传染测量及仿真研究; 基于M—VAR模型的税收结构与R&D投入研究