张 蓉,陈云翔
(空军工程大学 装备管理与安全工程学院,陕西 西安 710038)
作为装备采办主体,军方和武器装备承制商是一种委托代理的关系。代理方承制商对武器装备生产的实际发生成本、自身生产保障能力、技术水平、管理能力和行为偏好等方面信息的掌握远比委托方军队所掌握的要多。武器装备承制商利用军方无法直接观测其行为的信息优势和环境变量的不确定性做出有利于自身效用最大化但违背军方意愿的失信行为[1],造成武器装备采办“拖、降、涨”的严重后果。
目前,武器装备市场内的承制商数量有限,呈现不完全竞争局面,武器装备研发生产成本巨大。为了减少承制商的失信行为,促使承制商主动采取对军方有利的行为,军方往往设计激励合同提高承制商的积极性和责任心,但承制商失信行为降低的成本以及由此获得的利润有可能大于军方给予的激励利润。从长远角度看装备采办是动态重复博弈的过程,承制商的代理结果可以通过历史行为被军方观测到,军方下一阶段的博弈选择依赖承制商上一阶段的行为,双方的战略空间远远大于和复杂在于每一阶段博弈中的战略空间,从而会带来一些在单次博弈中不会出现的均衡结果。当承制商的长期收益取决于军方对其信任程度即承制商所累积的声誉时,承制商就会积极地建立好声誉以获取更多与军方合作的机会,得到长远利益,形成的声誉机制就可以在一定程度上减少承制商的失信行为。通过信用评价手段将承制商行为过程直观化、数据化,可以有效地揭示更多信息,约束和监督承制商行为,促使承制商主动提高自己的声誉以增加未来价值,达到长期治理武器装备承制商失信行为的目的。
经济学家克瑞普在“连锁店悖论”中指出,完全信息条件下的有限次重复博弈问题不会促进参与人合作行为。只有在多次连续博弈中才可以产生声誉效应,形成声誉机制并对行为人产生约束力[2]。由此可见博弈重复的次数越多,承制商建立声誉的积极性就越高。尽管装备体制改革后武器装备市场的竞争性有所提高,合作行为不止发生一次。但在采办实际过程中,武器装备的专用性使得某一承制商通过竞争手段取得合同后就处于绝对垄断的地位,与其竞争的承制商寥寥无几,同时采办时间长达几年甚至十几年,装备的替代性差,容易使委托方长期依赖于该承制商。因此军方与承制商之间博弈次数十分有限,与建立声誉相比失信行为带来的收益更大。
除了博弈的重复次数,博弈信息的完备性也是影响重复博弈均衡结果的主要因素[3]。在博弈过程中,博弈双方的信息不可能完全被揭示,信息完备性越强,承制商的失信行为就越能够及时被军方观测到。委托代理模式是造成双方博弈信息不对称的根本原因。军方出于节省资金考虑不可能付出巨额成本获取承制商信息,承制商也会最大限度地向军方隐瞒信息以保证自身收益。军方由于保密等原因也会保留一些信息不提供给承制商。因此信息完备性不足导致承制商的失信行为不能及时被军方发现,声誉机制也就不能对承制商形成制约。
重复博弈是同样结构的博弈重复多次,每次博弈称为“阶段博弈”,前一段的博弈不改变后一段博弈的结构,之前的博弈过程可以被所有参与人观测到,参与人的总支付是所有阶段博弈支付的贴现值之和或加权平均值[5]。重复博弈可使参与人权衡短期利益和长期利益并为了长远利益牺牲眼前利益,由此形成声誉效应。以法玛为代表的经济学家将动态博弈理论引入委托代理关系的研究中,论证了在多次重复代理关系情况下,竞争、声誉等隐性激励机制能够发挥激励代理人的作用。霍姆斯特姆将法玛的思想模型化,建立了声誉激励模型。
假设在单次博弈开始委托方A选择信任代理方B,B选择诚实,双方的收益分别为x1>0,x2>0。如果A信任B,B选择欺骗,则A收益为B收益为显然B的最优选择是违约,作为先行动的A在B可能违约的状态下最优选择是不信任。如果双方没有合同约束,这个结果就是唯一自我执行的博弈结果,双方不会为了集体利益而有所奉献,相反会不遗余力地追求自身利益最大化。解决这个问题的一个重要方式是重复博弈下的声誉机制。长期的委托代理关系会对人们行为选择产生影响,眼前机会主义行为带来的现时收益意味着未来交易机会的损失,最终结果在这二者之间权衡。
在单次博弈收益基础上考虑无限次博弈情况。假设A和B时间贴现因子α(0<α<1)相同。如果双方相互信任,那么他们的总贴现收益为:
如果B在第i次博弈时开始欺骗A,A终止与B的合作,那么他们的总贴现收益调整为:
通过不断博弈可以看出EA>~EA,从利益的角度讲,A选择继续交易要比终止交易更好,当A做出继续交易的选择时为了使B不欺骗A,只要让B欺骗的收益不高于不欺骗的收益,即下面等式成立:
式(5)的成立取决于博弈相关参数的取值,其中起决定性作用的是贴现因子α,除了货币形式的未来贴现率,还可以表示为继续博弈的概率或者博弈双方的耐心程度。因此,当α高于某一临界值,使得B从失信行为中得到的收益小于由此丧失的未来收益的现值时,B就有信守承诺,建立声誉的激励,合约无需第三方的验证与监督就可能自我实施。声誉的建立和维持成为避免机会主义行为、确保交易顺利进行的一种保障机制。重复博弈形成的声誉效应发挥作用的前提是完备的市场机制,假设:交易是重复进行的且竞争充分;不诚实信息可以被及时传播;对违规的严厉惩罚[6]。
在重复博弈理论中,理性参与人是指机会主义者或者非合作参与人及其行为的简化概括,非理性参与人是不同于我们熟悉的行为方式的另一类参与人的概括,是讲信誉重义气或合作类型的参与人。非理性参与人并不是不追求效用最大化,而是他具有特殊的效用函数[7]。武器装备采办的重复博弈过程基本满足以下三个条件:
条件1:从武器装备建设的长远利益考虑,军方是讲义气重信誉的非理性委托方,采取针锋相对战略,对承制商上一阶段的道德风险行为实施惩罚,使其回到正常的合作轨道,不会影响双方的继续合作。
表1显示,对照组老年患者留置针并发症的发生率为41.3%,与叶燕萍等[3]研究的结果相符。究其原因:①老年患者由于其各组织器官功能的逐渐减退,血管硬化、弹性差、脆性增大、皮肤组织松弛,常合并心脑血管疾病,存在着不同程度的血流缓慢。②老年患者因记忆力差,动作迟钝,留置期间肢体活动过度、肢体受压、下垂、置管处摩擦或按揉,相对其他年龄患者更易发生静脉炎、堵管、渗漏、意外脱管等并发症,导致留置失败。③输入一些高渗性液体对血管壁的化学刺激作用。
条件2:假设有两个以上的某型装备承制商,军方选择一个承制商签订合同,承制商是非理性的概率为i,理性的概率为1-i。理性的承制商自然选择战略,非理性的选择针锋相对战略。
条件3:博弈时承制商知道自己的行为,军方只知道承制商的行为概率。第一阶段博弈结束后根据观测结果进行第二阶段博弈,再根据第二阶段博弈结果进行第三阶段博弈,以此类推。从博弈开始到结束这段时间内的贴现因子设为α=0,即资金的价值不变。
根据以上三个条件建立承制商声誉激励模型。设承制商发生失信行为是Ud,不发生失信行为是Uh;军方对承制商的惩罚或不合作为Vp,对承制商的奖励或合作为Ve;承制商的行为产出为O(U),承制商的行为成本为C(U);军方对承制商的策略为T(V),则每一阶段装备采办给军方和承制商带来的效用分别为Ba和Bs:U的增函数,U的增函数。双方阶段博弈的支付矩阵如表1所示:
表1 阶段博弈的支付矩阵
考虑博弈进行二个阶段的情况。在第一阶段,根据军方特点,军方会选择Ve,非理性承制商选择Uh,理性承制商在第一个阶段通常不会选择Ud,否则就暴露了它是理性的本质,失去跟军方在第二阶段的合作。在第二阶段,军方根据前一阶段承制商的行为选择Ve,非理性承制商因为军方第一阶段的选择而继续选择Uh,理性承制商则考虑是最后一个博弈阶段,不会顾及当前的选择对军方在下一阶段的影响,因此它的最优选择是Ud。因此博弈结束后军方的期望效用是:
考虑博弈重复T次的情况。当博弈进行有限T次,双方为了获得下一次的收益,在T-1阶段均能取得合作。只有在最后一个阶段,理性承制商才会暴露本质选择Ud。军方和非理性承制商仍然选择合作,双方的期望效用分别为:
当T→∞时表明博弈次数足够多,参与人有足够的耐心,那么双方的期望效用可以近似为:
从上述分析可以看出承制商与军方初次合作时为了建立军方的信任,可以忍受守信带来的较低收益以便获得未来和军方长期合作,短期的低收益能够换取长期更多的收益促使不管是理性还是非理性承制商,都会选择合作。有限次数的博弈在第T阶段之前,双方选择合作的阶段数量与i无关,只与T有关,i仅仅影响双方的期望效用值并且与Ba和Bs正相关,T-1阶段之前的努力都大于单期合作时的努力程度。只有在最后博弈阶段,理性承制商才会把过去建立的声誉用尽,获取最后一次短期高收益。当T→∞时:
即在无限次的重复博弈中,双方合作与i无关。不论i多么小,只要重复次数足够多,合作局面一直存在。
在武器装备市场中,声誉机制激励承制商从长远利益考虑选择与军方合作并自觉遵守合同。所以声誉机制在装备采办过程中对承制商行为是有重要影响的。为了使声誉机制顺利实施,根据声誉效用发挥前提条件建立信用评价体制,以保证声誉机制更好地减少承制商失信行为。
由于采办项目的每个决策点都必须经过决策者审批同意后才能进入下一个阶段,因此在决策点对承制商进行信用评价,可以很好把握承制商上一阶段的努力程度,根据结果调整采办策略,增加双方的博弈次数,博弈次数越多承制商对长期利益就越重视,树立良好声誉的积极性就越大。合作局面的存在是建立在无限次博弈的基础上,但在实际采办中博弈次数不可能无限次出现,最后一次博弈就意味着合作结束。信用评价将承制商与军方合作的整个过程转化为直观数据,促使承制商认为虽然当前项目结束,但由于它面对的买方只有一个,而卖方却不止它一个。为了能获取下一次合作机会,哪怕是项目的最后阶段,也必须选择诚实,这样才有资格与其它承制商竞争,提高了承制商的竞争意识。
通过军方与承制商的不断博弈和对承制商行为的连续信用评价,军方对承制商研发生产情况了解加深,更多相关信息得到揭示,承制商选择机会主义行为就能够及时被军方发现并受到惩罚,使他为了获取短期收益而丧失长期收益。信用评价不仅可以揭示承制商过去的行为信息,还可以通过评价方法揭示承制商行为信息的规律,帮助军方预测承制商未来行为的发展动向。信用评价结果所体现出的承制商声誉等级优劣的信息在武器装备市场甚至全社会披露,为军方对承制商的监督和激励提供依据,从而增强承制商的声誉意识。
运用信用评价不仅对承制商进行短时有效的监督管理,更重要地是将承制商的行为记录在案并串联起来,成为“秋后算账”的依据,使之成为长期有效的监督管理资源,激励约束承制商按合同约定从业,循序渐进地正确引导其树立声誉意识,加强自律自觉行为,降低道德风险行为的发生。信用评价结果的公示可以让更多承制商了解彼此的信用状态,形成相互监督的局面,也促使军方在承制商发生严重道德风险时,为了给其它承制商一个公平竞争的环境就必须对承制商进行相关的惩罚。合同双方在诚实、信任的基础上充分合作,在合同履行中形成一个良好的法律环境和合作氛围,这样才会减少失信行为。
[1]魏刚,陈浩光.武器装备采办制度概论[M].北京:国防工业出版社,2008:317.
[2]张红岩.基于博弈论的集中招标采购机制研究[D].北京:北京交通大学(博士学位论文),2007.
[3]谭海涛,雍俊华,蔡永刚.基于声誉效应的装备采购道德风险防范机制分析[J].军事经济研究,2011(1):45-48.
[4]张发,赵巧霞.信用制度与合作的Multi-Agent仿真模型[J].计算机工程应用,2004(24):97-100.
[5]Robert j.Aumann.Survey of Repeated Games[J].Game Theory and Mathematical Economics,1981(4):11-42.
[6]张维迎,柯荣住.信任及其解释:来自中国的跨省调查分析[J].经济研究,2002(10):59-69.
[7]张朝孝,蒲勇健.企业内的员工激励与合作机制:博弈论方法[M].北京:华文出版社,2005:87.