杨雅斌 陈 勇
(1.佛山职业技术学院 工商管理系,广东 佛山 528137; 2.广州工商学院 物流系,广州 510850)
进入21世纪,企业之间的竞争不再是传统的一对一争夺资源之战,企业和上下游供应商的关系也不再是简单的业务往来,而是形成了一种供应链竞争与利益共享的战略合作伙伴关系。 因此,企业双方应将目光放远,做好长期合作的打算,建立一种以合作和信任为基础的战略合作伙伴关系,通过共享信息实现优势互补,增强供应链与其他供应链的竞争力。
建立供应链战略合作伙伴关系可以达成更有效的交流,降低不确定性造成的损失,减少外部因素的影响和管理成本,从而达到规模效应,实现共同目标和双赢模式。目前,企业要想从供应链中寻找效益,需要借助博弈理论,成为新时代供应链的引航者。
供应链合作伙伴关系(supply chain partnership,简称SCP)是供应链成员(供应商、制造商、分销商、零售商、客户等)之间在一定时期内共享信息、一起承担风险、一起获利的协议关系。近几年,企业考虑将自身业务与合作伙伴业务集成,不仅可缩短企业之间的距离,而且还能促进先进技术的发展。如今,大多成功企业都从原先的主从关系转向打造供应链战略合作伙伴关系。
企业供应链成员之间是否建立合作伙伴关系,涉及供应链各成员之间的博弈问题。博弈论是研究有理性的主体在做出决策时,另一方主体所采取的应对决策而获得的均衡问题[4]。基于博弈理论,某一成员的收益与自己的行为和与之交易的参与者有关。
作为理性主体,个体在合作取舍方面,一定是基于成本—收益考虑的。为便于分析,下面将基于制造商和供应商之间的战略伙伴合作关系来探讨供应链战略合作伙伴关系模型,假设双方的收益结构相同,用支付矩阵表示双方博弈组合。供应商与制造商的支付矩阵如表1所示。
表1 供应商与制造商的支付矩阵
其中:C代表合作,N代表不合作。e表示双方合作时每个企业的收益,e>0;f表示双方不合作时企业的收益,e≠f;g表示企业背叛对方时的收益,g>0;h表示双方企业都背叛对方时各自的收益,e>h且g≠h。
在理性经济人和不违背合作协议的前提下,供应链中的每个企业都以个体利益最大化为目的,这时的供应链企业合作伙伴达成的是非完全合作博弈,一般来说非合作博弈属于小概率事件。下面以供应链合作伙伴中的供应商和制造商为例,阐述纳什均衡和重复博弈的原理及运用。
1.2.1囚徒困境
(1)供应商与制造商的非合作博弈
博弈论中的“囚徒困境”模型说明,两囚犯决策的最终结果都是基于个体理性考虑,在所选择策略的基础上达到均衡,即纳什均衡(坦白,坦白),但从整体最优考虑,却是最糟糕的结局。从“囚徒困境”博弈我们可以得知一个事实:个体理性与集体理性的冲突,即个人追求最大利益的行为,通常无法使得社会利益最大化,也很难真正实现个人自身利益最大化。
透过供应链内制造商与供应商的博弈过程,可分析出供应链内企业之间的竞争性对立关系。每个企业的选择对彼此都有着影响,其可能结果如表2所示。
表2 制造商与供应商的支付矩阵
表3给出了制造商与供应商的不同选择所得到的结局。由表3中数据可知,企业如果只考虑自身利益的话,双方博弈的最优策略选择是(2,2);如果双方合作的话,那么选择策略(8,8)是最优的。由此可见,只考虑自身利益的企业将使双方都陷入“囚徒困境”。为此,双方必须达成协作,才能获得共同发展。
表3 供应商和制造商的支付矩阵
(2)供应商与制造商的合作博弈
在现实情况中,个体理性与集体理性的矛盾不可避免,为此,我们需要设定一种具有约束力的激励机制,使局中人既能满足个体理性又能实现集体理性。在上例不合作博弈的基础上,假定企业双方预先给定一个约束:如果任意一方违背约束协议的话需要付出很高的代价。我们不妨假设制裁成本分别为X1,X2,然后将决定采取一致行动——双方合作。
根据约束协议,开始交易时双方都倾向合作的策略(8,8),双方都将获得8单位的收益,总收益最大为16。但有限理性和机会主义倾向的存在,有可能使供应链节点上的企业从自身利益出发,单方面撕毁约束协议,以求获得更大的利益。
当10-X1<8且10-X2<8时,即违约成本X1,X2都大于2时,不可能使得有机会主义倾向的企业违约,这样就巩固了供应链长期战略合作伙伴的稳定性,实现了个体理性基础上的团体理性。
通过数据分析可知,一次性的博弈使得参与者只考虑短期的利益,如果违约者受到的惩罚不够大,双方很难选择合作博弈。当今,由于供应链合作意识比较淡,很多企业仍然处于对立状态而非合作关系,双方选择非合作性的博弈往往来自利益冲突。
1.2.2重复博弈
如果将上述博弈模型作为重复博弈的原博弈,则若此博弈重复进行有限次,使用逆向归纳法易得出:有限次重复博弈的均衡解与一次博弈没有什么区别;如果供应商与制造商的合作是持久的,则此博弈可认为是无限次重复博弈。下面我们以触发策略为基点,预测重复博弈的均衡。
触发策略是指在第1阶段选择合作,且在第t>1阶段,如果所有前面t-1阶段的结果都是(合作,合作),则选择合作,否则选择不合作[6]。分析过程如图1所示。
图1 触发策略
由图1可以看出,从参与人角度出发,由于博弈可以循环往复,博弈双方为了长期利益采取试探性的选择。在第一次博弈时选择合作策略以寻求对方的合作,一旦另一方为了短期利益而采取不合作行为,那么就会建立该对弈者是不可信任的理念,在下一次博弈中将采取不合作的行为,使对弈者的长期利益受损。
可见,若局中人都采取这种触发策略,那么选择(合作,合作)始终是无限重复博弈的均衡结果。由于供应链战略合作伙伴的建立是直接的、长期的,则采取这种策略对参与双方而言都是最优的,因而为纳什均衡。也就是说,如果进行多次博弈,参与者会选择长远利益从而选择不同的均衡战略,使得在一次性博弈中有可能达成合作,从而实现更好的均衡。
供应链是一个动态系统,稳定性是系统良好运作的前提。由于存在个人理性与团体理性的差异,如何使企业走出短期行为的困境,实现企业利润的帕累托最优,需将博弈理论引入供应链合作伙伴关系稳定性的研究。
在博弈论中,帕累托最优和帕累托改进是两个重要的专业术语。帕累托最优假定有限的人群和资源,如果改变现有分配状态的话,在不损害一个人的利益情况下,不会使其他人变得更好[7]。而帕累托改进(Pareto Improvement)基于帕累托最优(Pareto Optimality)基础之上,是指在不减少一方福利的同时,重组现有资源分配模式来增加另一方的福利。一般帕累托改进应用于闲置资源和失效的市场中。图2是基于两级供应链下合作博弈的帕累托改进。
图2 两级供应链的帕累托改进
对供应链进行管理之前,用无差异曲线I表示上游企业A和下游企业B的总体盈利水平。其中,R点表示实际获利水平。对供应链流程进行管理之后,上游企业A和下游企业B的总体获利水平得到提升,用无差异曲线II表示。其中,无差异曲线II的ST段为帕累托改进闭区间,该闭区间内所有的分配方案都能获得帕累托改进[7]。综上,企业A最高的获利水平由OM提高到OP,企业B最高的获利水平由ON提到到OQ[8]。
由上述的分析得出:总收益的增多,在基于帕累托改进的基础上,供应链上各节点企业也能从中收益,从而达到一个新的帕累托最优状态。个体自身利益的增加,无形中对各节点企业有更多的诱惑力和激励,使得博弈双方能够建立并维系双方合作的策略。
参考文献: