粮食主产区动态补偿机制的演化博弈分析

2014-11-28 08:18:14焦晋鹏

江西社会科学 2014年11期

■焦晋鹏

粮食安全是关系国民经济发展和全面建成小康社会的重大问题，粮食主产区的发展是维护国家粮食安全，促进区域协调发展，带动农民增收致富的重要保障。但是，由于粮食生产具有明显的正外部性，粮食主销区和全体社会成员从中获益但并未支付相应成本，粮食主产区和农民因粮食生产损失了一部分发展权益但并未获得有效补偿，在一定程度上弱化了农户种粮的积极性和粮食主产区的均衡发展。随着国家城镇化建设进程的逐步推进，大量的农村劳动力转移到非农产业或进城务工，使得粮食的刚性需求结构发生较大变化，主销区粮食需求量逐渐增加。同时，受自然环境改变、城镇化建设征地、耕地过度利用等因素的影响，适宜种粮的农地正在逐渐流失。随着国内CPI 指数，与农业生产直接相关的农药、化肥、种子、农机具等物品价格大幅上涨，农民种粮的积极性严重受挫。因此，建立合理有效的粮食主产区动态补偿机制已成为当前保障国家粮食安全、促进农村与城市和谐发展的重点。国家在取消农业税的基础上，针对粮食主产区先后出台了一系列的粮食补偿政策，取得了较好的效果，但随着经济发展环境的不断变化，传统的粮食主产区补偿机制发挥的作用逐渐受到限制，建立更为完善的粮食补偿机制势在必行。

因此，本文尝试运用演化博弈理论分别分析粮食主产区在传统的粮食补偿机制及动态补偿机制两种不同的补偿机制下，粮食主产区的地方政府与种粮农户之间的演化稳定策略，试图揭示粮食主产区补偿机制改进的演化规律及其演化稳定策略，在此基础上研究粮食主产区的动态粮食补偿机制。

一、演化博弈模型的指标设定和前提假设

(一)指标设定

设定C1表示粮食主产区地方政府在传统补偿机制下对农户进行补偿时支付的补偿成本;C2表示粮食主产区地方政府采用动态补偿机制下对农户进行补偿时支付的补偿成本(C2＞C1);N1表示在传统补偿机制下农户决定种粮而获得的总收益;N2表示农户放弃种粮而去务工所获得的收益;D 表示粮食主产区地方政府采用动态补偿机制后给予种粮农户的增加补偿;R 表示粮食主产区政府采用动态补偿机制时获取的来自粮食主销区的利益补偿;S 表示粮食主产区地方政府改进补偿机制带动农户种粮积极性，提高粮食产量对保障国家粮食安全所产生的社会正效益，是中央对于粮食主产区地方政府的奖励性财政补贴;P 表示农户因种粮收益未达到期望而选择务工造成粮食增量下降，影响国家粮食安全所产生的社会负效益，是中央对于粮食主产区地方政府改进粮食补偿机制实施无效后的利益补偿削减，属于政策性惩罚。

(二)研究假设

第一，假设粮食主产区粮食补偿行为中存在两类行为主体:粮食主产区地方政府与农户，构成博弈方组合I=｛1，2｝，其中参与人1 为政府，参与人2 为农户，两类行为主体都是完全理性的，即均以自己期望效用最大化为前提做出决策。

第二，假设在粮食主产区粮食补偿行为活动中的两类主体都存在两种行为策略，即粮食主产区地方政府的策略集为G1=｛改进，不改进｝，改进是指粮食主产区地方政府为促进粮食产业的发展采取动态补偿机制，从而获取中央财政及粮食主销区的利益补偿，提高粮食补偿的水平，使种粮农户获得的直接补偿高于从事其他经营活动的收益，不改进则表示粮食主产区地方政府依然采用现有的补偿机制。农户的策略集为G2=｛种粮，务工｝，一般来说，在传统补偿机制下，农户会根据家庭实际状况及从事种粮以外其他经营活动的收益来选择自身的策略行为，这里用务工代表农户其他策略行为集合。

二、粮食主产区地方政府与种粮农户之间静态博弈分析

在不考虑双方行动顺序情况下，粮食主产区地方政府与农户的博弈结果矩阵如下:

图1 粮食主产区地方政府与农户完全信息静态博弈矩阵

根据博弈模型前提假设，对静态博弈条件下博弈双方收益情况进行分析。

1.当N1＞N2时，农户在考虑家庭因素和收益的相对优势的情况下，将会选择种粮，粮食主产区地方政府不改进粮食补偿机制的支付成本为C1，改进粮食补偿机制的支付成本为R+S-C2，而C2＞C1，若来自粮食主销区及中央财政的利益补偿(R+S)不能弥补改进粮食补偿机制的增加支出，则政府的最优策略为不改进;若R+S＞ C2-C1，则政府的最优策略为改进。

2.当N1+D ＜N2时，农户在考虑自身收益的情况下，会选择务工，若粮食主产区地方政府不改进补偿机制，其支付成本为C1，若采取改进粮食补偿机制的行为，则其支付成本为C2+P-R，当R-P＞ C2-C1时，政府的最优策略为改进，若R 不能弥补改进补偿机制所增加支付成本及因改进效果不佳造成的中央财政惩罚性利益补偿削减，政府最优策略为不改进。

因此，粮食主产区地方政府采取改进的粮食补偿机制获得利益补偿能否有效弥补因改进补偿机制而产生额外补偿支付是政府选择改进与否的关键因素，当R+S＜C2-C1时，粮食主产区地方政府明显会采取保守策略，农户则会根据其所获得的收益而选择自身的行为。当N1＞N2时，均衡策略为(不改进，种粮)，此时粮食补偿机制的改进对农户的影响不起决定性作用，农户的理性选择是种粮;当N1＜N2时，均衡策略是(不改进，务工)，这种情况下，粮食主产区地方政府和农户的选择对自身有利，但是从长期来看对国家粮食安全会产生不利的影响。如果R+S＞C2-C1，粮食主产区则会选择改进粮食补偿机制，若N1＞N2，或N1+D＞ N2，此时存在纯均衡策略(改进，种粮)，若改进后农户获得种粮补偿依然小于务工所获得的收益，即N1+D ＜N2，则不存在纯策略纳什均衡。

在以上研究的基础上，可以看出存在一个混合策略纳什均衡，建立2×2 双矩阵博弈模型，假设参与人1 即粮食主产区地方政府改进粮食补偿机制的概率为x(0≤x≤1)，不改进的概率为1-x;参与人2 即农户选择种粮的概率为y(0≤y≤1)，农户选择务工的概率为1-y，则此时的博弈模型可以表示为以下:

图2 混合策略下粮食主产区地方政府与农户静态博弈模型

因此，粮食主产区地方政府的期望支付成本为

对于粮食主产区地方政府来说，其支付成本相对较少，并能产生良好社会效益的条件是支付成本期望函数一阶导数等于0，即

因此，政府最优改进概率为

而粮食主产区农户的期望收益为

对于粮食主产区农户来说，其获得最大收益的条件是收益期望函数一阶导数等于0，即

因此，农户获得最大收益的概率为

粮食主产区地方政府与种粮农户的混合策略纳什均衡为(y'，x')。对于粮食主产区地方政府来说当粮食主产区农户种粮的概率y＞y'时，政府的最优选择为改进;当农户种粮的概率y=y'时，政府则以y'=(C2+P-C1-R)/(S+P)的概率改进粮食补偿机制，而当y ＜y'时，政府的最优选择是维持现状，不采用改进的粮食补偿机制。对于粮食主产区农户来说，当地方政府改进粮食补偿机制的概率x＞x'时，农户的最优选择是种粮;当x=x'时，农户则以x'=(N2-N1)/D 概率选择种粮;当x ＜x'时，农户则选择务工。可见，在静态博弈条件下，因受政府补偿成本、农户自身收益和外部利益补偿等因素的影响，均衡结果并不唯一，因此需要引入演化博弈模型进行更为深入的分析。

三、粮食主产区地方政府与种粮农户之间演化博弈分析

在静态条件下，政府和农户之间由于信息的对称性和双方的有限理性，可以通过纳什均衡 [(C2+P-C1-R)/(S+P)，(N2-N1)/D]中变量的变化不断调整自身的应对策略，但是，在粮食主产区粮食补偿的实际推行过程中，博弈双方信息是非对称的，各粮食主产区地方政府及农户的行为受诸多因素的影响，不可能实现完全的有限理性，在诸多影响因素的引导下，双方进行着不断的重复博弈，同时，在双方博弈的过程中，还会产生一定的学习强化效应，因此，静态条件下的均衡不能有效体现博弈双方的演化路径，不能充分描述现实情况下具有动态意义的粮食主产区地方政府和农户的有限理性行为，需要借助演化博弈分析的方法对该活动进行进一步的探讨。

在静态博弈分析的基础上，运用演化博弈的复制动态模型来进行分析，通过粮食主产区地方政府占优策略的实施来影响农户的选择，使其路径向既定的方向演化发展，更为准确地反映现实中粮食主产区博弈双方的决策行为。

基于静态博弈分析的前提假设，建立两总体2×2行演化博弈模型。通过对多总体演化博弈特点的分析可以发现，该演化博弈的演化稳定策略与渐进稳定状态具有等价性，且应为纯策略纳什均衡。假设粮食主产区地方政府群体中选择改进粮食利益补偿机制的比例为x(0≤x≤1)，粮食主产区农户群体中选择种粮的比例为y(0≤y≤1)。在粮食主产区地方政府与农户博弈的过程中，双方决策的适应性如果比群体的平均适应性高，则该决策会成为主导发展方向。因此，该博弈下的复制子动态方程组为:

根据演化博弈理论，上述系统演化路径与均衡可从两个角度进行分析。

1.基于粮食主产区地方政府的演化路径分析，该情况下可从两个方面进行讨论:(1)当y=(C2+P-C1-P)/(S+P)时=0，对于所有的x 概率的粮食主产区地方政府的决策选择都是稳定的，具体来说，当粮食主产区农户选择种粮决策的比例为(C2+P-C1-R)/(S+P)时，粮食主产区地方政府采取改进与不改进粮食补偿机制的决策支付给种粮农户补偿成本是相等的，两种行为策略是无差异的。(2)当y≠(C2+P-C1-R)/(S+P)时，x=0 与x=1 时，均可得到=0，因此x 取这两个值时是粮食主产区地方政府决策选择的两个稳定状态均衡点。

此时，对y 的取值情况进行分析，如果y＞(C2+PC1-R)/(S+P)，则＞0，在此情况下，粮食主产区地方政府选择改进的决策投入的成本会小于群体的平均水平，因而在x=0 的稳定状态下，若在国家发展规划的引导下，国内13 个粮食主产区的地方政府群体中若有采取改进粮食补偿机制的决策，并产生较好的经济和社会效益，则为采取相应决策的其他粮食主产区地方政府将进行效仿，相继采取改进的决策，即x=1 是复制动态下的一个演化稳定策略，也是粮食主产区地方政府的最优选择;如果y ＜(C2+P-C1-R)/(S+P)，则＜0，在此情况下，粮食主产区地方政府选择改进的决策所投入的成本大于群体的平均成本，因而在x=1 的稳定状态下，若国内13 个粮食主产区中的某一个采取改进决策的粮食主产区地方政府因投入的补偿成本过高放弃推行改进后的粮食补偿机制，并获得国家批准，那么存在相同情况的其他粮食主产区也会相继采取相同的决策，即x=0 也是复制动态下的一个演化稳定策略，但从维护国家粮食安全的角度来看，该决策行为属于保守策略，在一定程度上延缓了国家粮食安全战略的实施。

因此，y=(C2+P-C1-R)/(S+P)是x=0 和x=1两类演化策略的分界点，粮食主产区地方政府粮食补偿的成本、采用动态补偿机制时获取的来自粮食主销区的=0，对处于y 值概率的农户选择种粮与务工的决策都利益补偿、中央对于改进的奖励性财政补贴和政策性的惩罚对粮食主产区地方政府改进粮食补偿机制的决策具有一定的影响。中央和粮食主销区对于实施改进粮食补偿机制的粮食主产区地方政府的利益补偿越大，采取改进补偿机制的粮食主产区地方政府投入的补偿成本相对越低，则改进决策对于粮食主产区地方政府的导向性越大，反之，若外部的利益补偿不能弥补改进后的额外补偿支付成本，那么粮食主产区地方政府将趋向于采取保守策略，继续运行传统的补偿机制。

2.基于粮食主产区农户的演化路径分析，该情况下同样可从两个方面进行讨论:(1)当x=(N2-N1)/D 时，是稳定的。具体来说，当粮食主产区地方政府采取改进粮食补偿机制的比例为 (N2-N1)/D 时，选择种粮与务工的决策农户数量是随机的。(2)当x≠(N2-N1)/D 时，y=0 与y=1均可得到=0，因此y=0 与y=1 是农户选择的稳定状态。此时，对x 的取值进行分析，若x＞(N2-N1)/D，则·y＞0，粮食主产区农户选择种粮的收益与群体收益的平均水平相比较，会高于群体收益的平均水平，y=1 是复制动态下的一个稳定演化策略，也是在国家倡导保障粮食安全、提高粮食主产区种粮农户收益的最优策略，具体来说，当国内主要粮食主产区地方政府采取改进粮食补偿机制的比例超过 (N2-N1)/D 时，农户因看到改进后的粮食补偿机制能够带来更大的收益，逐渐趋向选择种粮的决策，并且不会因一部分农户依然选择务工而改变自身最优决策的选择。若x ＜(N2-N1)/D，则＜0，在此种情况下，粮食主产区农户选择种粮的收益与群体受益的平均水平相比较，会低于群体收益的平均水平，y=0 是复制动态下的一个稳定演化策略，具体来说，当粮食主产区地方政府采取改进的比例低于(N2-N1)/D 时，农户会因种粮收益低于务工收益，而趋向于选择务工。

所以，两类演化稳定策略y=0 与y=1 的分界点是x=(N-N1)/D，粮食主产区农户种粮的收益与务工相比越高，农户种粮的意愿越大，粮食主产区地方政府在采取改进决策所支付的补偿成本相对越低，并能更好地贯彻国家保障粮食安全的战略规划。

基于上述粮食主产区地方政府和农户复制动态方程的分析，博弈双方的演化复制动态关系演化路径图如图3 所示。

图3 粮食主产区地方政府与农户演化博弈分析路径图

从图3 可以看出，博弈双方动态演化最终趋向于哪种均衡取决于博弈初始时模型中变量的取值。如果变量初始取值落在G1和G4区域内，则通过动态演化博弈最终的稳定状态为(不改进，务工);如果变量的初始取值在G2和G3区域内，则通过演化博弈最终将稳定于(改进，种粮)的状态。显然，从保障国家粮食安全的角度来看，第二种演化方向为理想状态，即粮食主产区地方政府采取改进粮食补偿机制决策，农户则选择种粮，获得新补偿机制下的增加补偿收益，进而实现粮食主产区地方政府、种粮农户、国家三者之间策略选择的最优化，兼顾整体效益与各方利益的最大化。但是，在现实情况下，由于博弈双方信息的不对称性，粮食主产农户的行为决策可能并不以政府是否改进补偿机制实现利益补偿的增加作为关键性影响因素，农户在选择种粮与务工时具有一定的随机性，在决策时，如果农户尚未获得改进补偿机制增加的利益补偿或认为期望中的种粮收益没有务工收益高时，农户会趋向于选择务工来保障期望收益的可增长性，而粮食主产区地方政府因采用改进补偿机制未达到国家要求的状态，在下一年的粮食补偿中将受到中央的政策性惩罚，需通过增加地方财政支出弥补粮食补偿标准提高产生的增加成本，这种结果对于粮食主产区地方政府来说明显不利，因此政府将趋于放弃改进的粮食补偿机制，重新实行传统的补偿机制。

四、结论及建议

在粮食主产区粮食补偿实施的过程中，由于农户在信息的获取中处于劣势地位，其在未能直接感受种粮补偿的显性增长的情况下，会衡量种粮与其他行为决策的当时收益水平，选择获取收益高的经营方式，而在国内粮食主产区现阶段执行的补偿标准下，种粮的收益明显低于同等条件下种植经济作物或发展果蔬的收益，也低于务工的收益，这使得种粮农户群体的总体数量呈现递减的趋势，从保障国家粮食安全的角度来看，这种情况将会影响国家粮食供销和储备的长期稳定。因此，为保障国家粮食安全，实现粮食主产区粮食产量增加与种粮农户收益同步提高，国家和粮食主产区地方政府必须采取有效的措施促进改进的粮食补偿机制，即动态补偿机制的有效实施。

粮食主产区动态补偿机制与传统补偿机制相比，不仅将粮食补偿各相关主体纳入到机制中，而且进一步明确了补偿资金的构成及针对农户的补偿方式，如图4 所示:

图4 粮食主产区动态补偿机制

可见，粮食主产区动态补偿机制的有效落实和运行能够更好地促进粮食主产区经济的发展，提高种粮农户的直接收益。因此，为促进粮食主产区动态补偿机制的实施，需从五个方面进行保障。

(一)完善粮食动态补偿机制的立法

我国当前推行的粮食补偿政策缺少清晰稳定的法律保障，使得国家针对粮食主产区农户实行的粮食最低收购价，直接收入补贴等政策呈现出临时性和阶段性特征，政策效果难以保证。因此，国家应借鉴美国，法国等发达国家粮食补偿的成功经验，用法律形式将粮食主产区的粮食动态补偿政策固定下来，形成促进粮食动态补偿政策运行的长效机制。

(二)简化补贴种类

粮食主产区地方政府可根据实际情况将现有的四种补贴融合为一体，即将针对种粮农户实行的农民直接补贴、良种补贴、农机具购置补贴和农资综合补贴融为一体，建立粮食直接补偿基金。在综合考虑农户粮食产量、当期CPI 指数水平、种粮成本变动水平等因素的基础上实行动态补偿，直接针对种粮农户，补偿条目简单清晰，方便粮食产区基层组织操作，便于农户理解并做出行为反馈。

(三)提高补偿标准，明确补偿依据

为提高粮食主产区农户选择种粮行为的比例，对种粮农户的利益补偿标准应能保证农户种粮的收益不低于从事经济作物种植或务工所获取的收益，若种粮补偿低于其他经济行为的收益，农户会做出不种粮，改种经济作物或果蔬的理性选择。因此，粮食补偿的标准必须经过科学的核定，具有吸引力，补偿的依据也需做出相应的调整，实行以粮食出售量为依据的方式，由财政和粮食储备部门联合印制粮食收购统一票据，凭票据结算，补贴到人。

(四)提高对粮食主产区的财政补贴及政策支持力度

国家农业部应充分考虑国内13 个粮食主产区的具体情况，根据各粮食主产区商品粮产出数量及地区经济发展的状况分配农业项目资金，加大对粮食主产区农业板块的支持力度，鼓励实施大型商品粮基地建设、优质粮食产业工程、农业综合开发等项目，划拨专项资金用于粮食主产区中低产田改造、优良品种繁育和农技推广，对粮食总产量超过“千亿斤”的粮食主产省给予特别奖励性资金支持。

(五)完善粮食主销区对粮食主产区的反哺机制

粮食主销区对于主产区的利益补偿可通过开辟新的税赋科目，按照粮食调入数量确定补偿的标准，并将该部分利益补偿资金转入到粮食主产区直补基金池中。此外，粮食主销区可通过与主产区进行对口援建改进主产区粮食生产的基础建设水平，实现粮食调入的转移补偿，促进粮食主产区的经济发展

[1]贾贵浩.提高主产区粮食生产能力面临的问题与对策[J].宏观经济研究，2011，(3).

[2]贾贵浩.城镇化背景下粮食主产区利益动态补偿问题研究[J].宏观经济研究，2013，(12).

[3]蒋和平，吴桢培.建立粮食主销区对主产区转移支付的政策建议[J].中国发展观察，2009，(12).

[4]王冀宁，陈铭，陈庭强.中国金融市场监管行为的演化博弈研究[J].北京理工大学学报(社会科学版)，2013，(5).

[5]黄凯南.演化博弈与演化经济学[J].经济研究，2009，(2).

[6]Drew Fudenberg，Jean Tirole.博弈论，黄涛等译[M].北京：中国人民大学出版社，2010.