联合奖惩规制工具下的政企博弈

2019-04-02 07:31

福建质量管理 2019年5期

(福州大学福建福州 350108)

引言

近年来，随着社会经济的发展不断加速，暴露出越来越多的信用问题，严重阻碍了社会主义现代化发展进程。加强信用管理，构建社会信用体系的重要性日益凸显。2014年6月，国务院发布了我国第一部国家级社会信用体系建设专项规划《社会信用体系建设规划纲要(2014-2020)》，明确将商务信用纳入社会信用体系建设的四大领域之一。同年9月，商务部颁布的《关于加快推进商务诚信建设工作的实施意见》也明确提出加快推进商务诚信建设工作。由此，商务诚信被赋予了推进全社会信用体系建设的重要意义。然而，虽然有了大量的顶层设计提供制度保障，但商务诚信在建设推进过程中仍然面临着诸多困局：现有法律法规对失信生产经营行为惩罚力度不够，难以对失信企业形成有效约束[1]；失信经营的高利润和低违规成本形成鲜明对比，诱使企业采用破坏性的生产经营方式谋取暴利；政府监管部门监管资源有限，不断拓宽的监管范围使得政府监管部门难以对所有企业进行全方位的实时监控[2]。因此，对政企博弈的研究，有助于进一步明晰政企关系，为政府制定企业监管政策提供科学合理的依据。

政企博弈的本质是政府的企业政策从出台到执行过程中政府与企业的博弈行为。政府和企业的目标差异是政企博弈形成的原因，一项政策最终的实施效果在很大程度上取决于政企博弈的结果与政策目标是否吻合[3]。因此如何使博弈结果向政策目标靠拢就成了研究者们需要考虑的问题。洪璐等探讨了企业排污处理情景下的政企博弈，认为政府可以通过提高监管概率或者加大奖惩力度，从而提升政府的监管效果[4]。这也与近年来政府监管部门所采取的实际措施相吻合，事中监管和事后奖惩成了解决政企博弈问题的关键环节，也成为广大学者研究的热点问题。虽然大量研究得出了增加企业失信成本和提高监管频率可以促使企业依法守信经营的结论[5][6][7]。但一方面，单个部门的惩罚始终难以有效增加企业失信成本，不足以对机会主义失信企业形成足够的威慑。另一方面，监管资源的有限性决定了监管频率不能无限制地提高。那么，实现对有限监管资源的合理分配则成了提升监管效率的另一途径。李亘等运用多阶段进化博弈的方法，讨论了在乳制品生产的各个阶段政府监管资源的分配，认为对于多阶段的生产活动中，政府监管资源应当尽量向源头阶段偏移[8]。然而，传统规制手段下对监管资源的分配都是基于企业同质化这一前提来进行的，监管资源在企业间多是均等分配的。但现实中企业是异质的，不同企业守信经营的主观意愿是不同的，这也就意味着对监管资源分配的研究还有进一步改进的空间。其中，最主要的问题便是政府和企业之间信息不对称，且政府各部门之间的信息共享程度低。政府各监管部门不清楚不同企业的守信经营意愿大小，因此难以对监管资源进行合理分配。可见，解决信息不对称和信息孤岛问题，构建多部门协同监管体系是推进商务诚信建设进程的突破口，联合奖惩应运而生。

虽然早在2007年3月国务院办公厅出台的《关于社会信用体系建设的若干意见》便提出要建立失信行为联合惩戒机制，但是直到2016年5月国务院发布《关于建立完善守信联合激励和失信联合惩戒制度加快推进社会诚信建设的指导意见》后“联合奖惩”才真正开始进入公众视野。联合奖惩，就是在有关部门和社会组织依法依规对本领域违法违规失信行为进行处理或者给出信用分类评价，对严重守信/失信行为列入红/黑名单之后，通过信息共享，推动其他部门和社会组织依法依规采取联合激励或者联合惩戒的措施[9]。由此不难看出联合奖惩的两大作用：一方面通过信用信息共享，使得监管部门可以提前知晓企业信用状况，从而可以将监管资源向守信经营意愿低的企业倾斜，迫使其开展守信经营，提升企业群体的整体守信经营程度。另一方面，通过多个部门的联合奖励和联合惩戒，增大企业的失信成本和守信收益，扩大守信经营企业和失信经营企业的收益感知差距，从而促使更多的企业守信经营。本文也将从这两个角度，对联合奖惩视角下的政企博弈展开研究。

一、传统监管机制下的政企演化博弈

(一)参与者。博弈参与者分别是企业和政府(泛指与企业生产经营活动相关的监管部门)，博弈双方都为有限理性。

(二)行为策略及概率。企业有“守信经营”和“失信经营”两种策略。选择“守信经营”的概率为x，选择“失信经营”的概率为1-x。这里的“守信经营”是指企业严格遵照我国法律法规，积极执行相关部门颁布的行业政策。“失信经营”指企业为使自己经济收益最大化而违法、违规经营，对相关行业政策消极执行或不执行。政府也有“监管”和“不监管”两种策略。选择“监管”的概率为y，选择“不监管”的概率为“1-y”。

(三)成本收益参数设置。当企业选择守信经营时，能够获取经济收益R，但同时需要付出经营成本C1。当企业选择失信经营时，能够获取经济收益R’，需要付出经营成本C1’。

当政府选择监管时，需要付出的监管成本为C2。由于监管资源有限，存在着监管成功率Q，即以Q的概率监管到企业的守信或失信经营行为。

由于政府和企业扮演的社会角色不同，区别于企业追求经济利益最大化，政府的目标是追求社会整体收益最大化，包括经济收益和社会收益两部分。若被监管企业为守信经营，则政府的经济收益为αR，社会收益为H，此时政府给予企业奖励J，其中α为政府经济收益系数。若被监管企业为失信经营，则政府的经济收益为αR'，社会收益为H’，并对企业收取罚款F。当政府选择不监管时，只被动地获取企业“守信经营”或者“失信经营”带来的经济收益和社会收益，不产生监管成本、奖励和罚款。由此可得出博弈双方的收益矩阵如表1所示。

表1 传统监管机制下的政企博弈收益矩阵

通过演化博弈的方法求解出企业和政府的复制动态方程：

结合实际情况来看，本节只考虑0

表2 系统均衡点局部稳定性分析

由于点(x0,y0)对应的特征根λ1，λ2为一对纯虚根，故(x0,y0)为稳定的中心点，但不是渐进稳定点。系统的演化轨迹为围绕着中心点(x0,y0)的闭环曲线，政企双方表现出周期性行为，系统无法达到Nash均衡。

图1 传统监管机制下政府与企业策略演化轨迹

二、联合奖惩机制下的政企演化博弈

联合奖惩机制下的监管成功率不再是固定的，令动态监管成功率为g(x)=(1-x)Q0，其中Q0为最大监管成功率。此外，一旦政府检查到企业守信或者失信经营，联合奖惩机制还将在原来的政府奖励J和惩罚F的基础上，增加由其他部门给出的联合奖励M和联合惩戒P。由此，可得到新的政企博弈收益矩阵：

表3 联合奖惩机制下的政企博弈收益矩阵

此时的复制动态方程为：

联合奖惩机制下政府和企业的演化博弈轨迹螺旋地向内趋近于焦点，系统具有渐进稳定性，能够达到Nash均衡(如图2)

三、结论

综上，联合奖惩可以通过信用信息共享实现监管资源动态分配，将监管资源向守信意愿较低的企业倾斜，促使这部分企业开展守信经营，提升企业群体的整体守信经营程度，同时还使原来的周期性博弈行为达到均衡状态。同时，多个部门共同施加的联合奖励和联合惩戒措施，能够增大企业守信/失信的感知收益差异，有利于企业群体向守信经营转变。由此，联合奖惩对于促使企业守信经营、推进商务诚信的建设确有积极意义。

图2 联合奖惩机制下政府与企业混合策略演化过程