食品安全规制的重复博弈分析

2011-07-27 00:36:46刘任重

中国软科学 2011年9期

刘任重

(1.哈尔滨商业大学金融学院，黑龙江哈尔滨150028;2.华东政法大学法学博士后流动站，上海201620)

一、引言

近几年来，我国食品安全事件频频发生，从山西杏花村的假酒到阜阳劣质奶粉，从三鹿事件到双汇的瘦肉精，一直到现在沸沸扬扬的塑化剂事件。这些事件的发生不仅对公众的身体健康造成了巨大的伤害，更对国家的安全和社会的稳定带来了消极影响。根据制度经济学的观点，安全作为一种纯公共物品应该由政府提供［1］。因此，中国食品安全事件屡禁不止的根本原因在于政府的监管方面存在着巨大问题。本文将从规制经济学的视角紧紧围绕这一问题展开探讨，这对于分析和解决中国当前存在的食品安全问题具有一定的理论意义和现实意义。

曹婧等(2010)以危害食品安全行为的惩罚性赔偿制度为例，得出了惩罚力度与强度对违法行为具有显著影响的结论［2］。王兆华等(2004)对美国、欧盟和日本等国在食品安全立法、监管体系、管理方式以及转基因食品安全管理等方面的情况进行了分析与述评，为完善我国食品安全监管体系提供了参考和借鉴［3］。Arrow(1996)认为，食品安全管制是弥补市场失灵的必须手段，是否应进行食品安全管制以及食品安全管制政策的选择应基于成本 -收益法对管制效益评价的结果［4］。Henson和Caswell(1999)从博弈与均衡角度分析，认为食品安全管制政策的选择是国内外消费者、农场主、食品制造商、食品零售商、政府、纳税人等利益集团博弈的结果［5］。Loader和 Hobbs(1999)认为:尽管消费者非常在意食品的安全性，但保障食品安全的职责应该由政府承担［6］。分析已有的文献，多数都是从单一角度，诸如惩罚、立法、管制与被管制等各方面针对所研究的问题进行讨论的。应该说，食品安全的管制问题是一个涉及诸多博弈方，同时又受到惩罚、奖励等众多变量影响的动态博弈过程。因此，本研究采用重复博弈的方法，通过构建政府-企业、企业-企业的博弈模型，引入惩罚、奖励和社会公众满意度作为变量创建政府监管的创新模式，实现食品企业选择生产安全食品的最优博弈策略。

二、政府与企业间的静态博弈模型

首先，将政府和食品生产企业设定为博弈参与方，政府监管行为的作为和不作为，食品企业生产安全食品和非安全食品行为作为博弈双方的可选择策略，单纯考虑经济效用的情况下，可构建如表1所示的博弈支付矩阵。

表1 政府与企业间的静态博弈支付矩阵

其中，c表示政府进行监管所耗费的成本(包括检查、信息收集和处理等费用);r表示食品企业选择生产安全食品策略所获得的收益;R表示食品企业选择生产非安全食品策略所获得的短期收益;F表示食品企业从事非安全食品生产，被政府查出并予以处罚所缴纳的罚金。

现在假设政府选择监管的概率为p，则其选择不作为的概率为(1-p);食品企业选择生产安全食品的概率为q，则其选择生产非安全食品的概率为(1-q)。由此可计算政府进行监管所获效用的期望收益为:

同理，食品企业生产安全食品所获效用的期望收益为:

在长期均衡条件下，根据完全信息静态均衡博弈混合策略的求解方法可得:政府对食品企业进行监管的概率，食品企业选择生产安全食品的概率分析p和q的解同政府处罚力度F的关系，根据可以得出:政府选择监管的概率同政府的处罚力度F呈负相关关系，食品企业选择生产安全食品的概率同政府的处罚力度F呈正相关关系，这一点同现实情况相符。然而，在考察政府的期望收益函数时会发现，其代表的含义是当食品企业选择生产安全食品策略的概率q增加的时候，政府的期望收益会变小。如果将政府视作理性经济人，其出于对自身经济效用最大化的追求(F全部归其所有)，就会想方设法阻止q的增加，甚至会让q减少，也就是说政府不愿看到食品企业选择生产安全食品的策略，从而追求获得更多的F。这一结论从经济学的角度出发是有其合理性的，但是却有悖常理。在此，我们增加政府监管行为社会效益的考量指标。我们引入“公众对于政府和企业行为的满意度”对政府监管策略的社会效益进行量化，并将这一变量添加到支付矩阵中。如果公众获悉食品企业从事非安全食品的生产并且政府监管采取不作为策略的时候，则公众更可能产生“政府玩忽职守导致食品企业肆意违法”的心理，则政府蒙受了-s的公众满意度损失，新的支付矩阵如表2所示。

表2 引入公众满意度的政府与企业间的静态博弈支付矩阵

根据上述矩阵，重新求解政府和企业的期望效用函数为:

三、奖励的引入

从激励相容的角度分析，政府在对生产非安全食品的企业进行惩罚的同时，还可以在一定程度上对生产安全食品(信誉好、质量高)的企业进行一定的奖励，包括官方渠道的免费宣传，政府设立专项奖励基金奖励生产安全食品的诚信企业，针对原材粮价格上涨导致生产成本增加的补贴等等，由此所耗费的成本我们设定为w。由于企业只能通过采取检查措施才能知道哪些食品企业从事安全食品的生产，因此，奖励只能发生在政府监管、企业生产安全食品的策略选择中，则可重新构建矩阵，见表3。

表3 引入奖励的政府与企业间的静态博弈支付矩阵

根据矩阵3，再次对政府和企业的期望效用进行求解:

上述分析是在参与方进行一次博弈的基础上展开的。如果考虑到政府的奖励政策能够影响食品企业的长期行为，即生产安全食品能够为企业获得更多的奖励，从而获得更多的收益，进而政府能够在将来获得更多的税收并足以弥补政府支付奖励的情况下，那么奖励这一变量的影响是积极还是消极的呢?

四、政府与企业间的重复博弈模型

从成本角度分析，一个食品企业之所以生产非安全食品是因为能够获得更多的收益。在市场竞争中，相对于生产安全食品的企业，其原材料成本更低，生产环节所耗费的成本更少，从而在同等价格条件下，其获得的利润更多;或相同利润条件下，其价格更低，竞争力更强。所以，我们可以假设在一定区域内只存在两个(产品、规模、产能等方面)完全相同的食品企业，考察他们之间的博弈关系，见表4:

表4 两企业间的静态博弈支付矩阵

两个食品企业A和B都存在两种策略选择，即生产安全食品和非安全食品，所以此支付矩阵存在四组策略。第一组策略:两个企业都选择生产安全食品策略，其所获得的总收益均为TR。第二组策略:A生产安全食品，B生产非安全食品，其所获得的收益分别为(TR-σ，TR+σ)。在此种情况下，由于相同价格条件下，B生产非安全食品所耗费的成本更低，并且其产品同A生产的安全食品一样混迹于同一市场销售，在无有效监管条件下，其所获得的收益超过正常收益TR的部分为σ，而A因价格高于B使得收益减少，因此损失的收益为-σ。同理可得第三组策略为A生产非安全食品，B生产安全食品，其所获得的收益分别为(TR+σ，TR-σ)。第四组策略为 A、B都选择生产非安全食品策略所获得的收益为TR'。显然在同一区域内，两个企业都生产非安全食品，最终这一市场要么萎靡，民众不敢购买这种食品;要么这一市场被外来或进口食品占领，如三鹿事件之后的中国奶粉市场。所以有 TR'＜TR。因此有:TR-σ＜TR'＜TR＜TR+σ。这是一个与“囚徒困境”非常相似的结果，即A和B都担心获得TR-σ的收益而选择生产“非安全食品，非安全食品”，则此静态博弈支付矩阵的纯纳什均衡解为(TR'，TR')。

上述结论是在一次博弈条件下得出的，现在将这一支付矩阵纳入到无限期重复博弈中考察每一组解的总效用。将四组策略的总效用分别用分别表示A、B两企业始终选择生产安全食品和始终选择生产非安全食品所获得的效用表示A企业在第一期中选择生产安全食品策略，但是在第二期中由于B企业始终选择生产非安全食品策略而改变自己原来的策略，进而选择生产非安全食品策略并一直持续下去所获得的效用;恰恰相反。设折现因子为i，则A、B企业在这四组策略中所获得的总效用分别为根据前述TR-σ＜TR'＜TR＜TR+σ，显然在无限期重复博弈解中，两企业所获的效用最大，也无需政府监管，是我们最希望得到的均衡解，因此无需讨论。表示两个企业选择的策略恰恰相反，我们以为例作为一种情况讨论。对于，即使A企业在第一期中选择生产安全食品的策略，却由于B企业选择生产非安全食品而使自己的收益变少，即ΩA1-，因此，在第二期博弈中转而选择生产非安全食品策略，但是其收益和ΩB2相比，仍然少获得2σ(ΩB2-ΩA2)。因此，在这里我们可以引入前文中增加的变量——政府奖励w，如果政府给予生产安全食品企业的奖励w＞2σ，则对于食品企业A，无论B选择什么样的生产策略，A都会选择生产安全食品。那么，在这一重复博弈过程中，企业B通过观察，发现自身选择生产非安全食品策略会获得比A更少的收益，同时，如果再加上政府的严格监管，自身还要冒着被政府处罚F的罚金，其理性的收益最大化选择必然是选择生产安全食品策略。对于，因在如果存在政府给予生产安全食品企业的奖励w＞2σ，此时，无论是企业A还是B，都不必担心对方选择生产非安全食品策略而使自身的收益变小。因而，双方都会选择生产安全食品策略。所以，在引入奖励w＞2σ的情况下，第四种策略组合不会发生，也无需讨论。这样，从长期来讲，因为引入政府奖励，将使食品企业最终(无论是第一期还是后期)都会选择生产安全食品策略。这也使得前文中提到的“政府奖励越多，企业生产安全食品的概率越小”的悖论得到了解决。应该说，政府的奖励或补贴是一笔不小的开支。然而从时间维度讲，这笔开支却可以从两个方面支出，首先是针对生产非安全食品企业的罚金中支出。当罚款效应逐渐从博弈支付矩阵中发生作用的时候，即企业选择生产非安全食品策略的收益在减少的情况下改变自身的生产策略，这部分开支就可以转而从食品企业全都选择生产安全食品策略从而使自身收益和社会效益都达到最大化的情况下，从未来更多的税收中支出。

五、结论

通过构建政府与企业间的静态博弈支付矩阵，验证了罚金和公众满意度的引入，可以提高食品企业选择生产安全食品策略的概率。也有效的解释了政府过于追求经济效益最大化而忽略社会效益最大化导致食品安全事件出现在一国经济高速增长时期的现象。通过构建企业间的静态博弈支付矩阵，并将其纳入到无限期博弈中考察，通过引入奖励变量，打破了食品企业选择生产非安全食品的“囚徒困境”，验证了奖励的引入可以有效的引导食品企业选择生产安全食品的策略。正如前文分析，食品安全规制是一个涉及政府、企业、公众等多方之间进行博弈的动态过程，而其中起主导作用的应该是政府，因此，代表政府行使监管职能的食品安全监管机构应该因势利导，综合考量惩罚、奖励等措施的搭配使用，在充分考虑公众满意度的前提下，切实履行监管职能，构建科学合理的规制食品安全的监管框架和模式。

［1］张维迎.法律制度的信誉基础［J］.经济研究，2002，(1):2-3.

［2］曹婧，孙绍荣.惩罚性赔偿制度的博弈模型分析［J］.经济体制改革，2010(4):164-166.

［3］王召华，雷家骕.主要发达国家食品安全监管体系研究［J］.中国软科学，2004，(7):19-24.

［4］Arrow K.Benefits-cost Analysis in Environmental Health and Safety Regulation:A Statement of Principles［M］.Washington D.C.:The AEI Press，1996，23-27.

［5］Henson S，Caswell J.Food Safety Regulation:an Overview of ContemporaryIssues［J］.FoodPolicy，1999(24):589-603.

［6］Loader R，Hobbs E.Stragetic Responses to Food Safety Legislation［J］.Food Policy，1999(24)，685-706.