陆晓倩,王立凤
(集美大学 工商管理学院,福建 厦门 361021)
在当今的国际竞争中,一个企业的竞争地位与竞争优势不再完全取决于企业内部所拥有的能力和资源,而在相当程度上取决于与世界范围内其他公司或企业所结成的战略联盟网络的广度和深度,企业战略联盟已成为现代企业加强其国际竞争力的重要方式之一。然而,企业战略联盟作为企业合作竞争的一种组织新形态,是企业自发形成,战略联盟的组建并没有中心权威的强制作用,而且参与战略联盟的成员企业往往是利己的并且处于竞争地位。由于战略联盟内部企业间合作的发展过程类似于重复囚徒困境式的合作的进化过程,因此,本文从合作进化研究中探寻影响企业战略联盟合作关系稳定发展的因素,以提出相应的解决措施。
在重复“囚徒困境”博弈中,策略进化的稳定性是合作研究的核心问题。合作竞争的标准的博弈动态表述是“囚徒困境”(如图 1),其中,参与博弈的两个局中人在合作和背叛之间做选择。如果相互合作(MC),双方得分为 a;相互背叛(MD),双方得分为d;一方合作一方背叛,合作方(UC)得分为 b,背叛方(UD)得分为 c。并且所有收益满足条件:(1)c>ad>b;(2)a>(c+b)/2,即交替地背叛和合作的收益也没有持续合作好。
图 1 囚徒困境的收益矩阵
在非重复博弈中,背叛策略优于合作策略,表明背叛局中人在混合群体中具有更高的适应度。但在重复博弈中,由于局中人相遇的次数不止一次,因而存在很多允许合作行为出现并且不会被背叛行为所击败的可能策略,包括总是合作策略(ALLC);总是背叛策略(ALLD);“一报还一报”(Tit for Tat,TFT)策略:“一开始合作,随后按其他局中人在上一行动中的行动做出自己的行动”;“两报还一报”(Tit for 2 Tats,TF2T)策略:“一开始合作,当且仅当对手在前两次行动中连续背叛时选择背叛”等等。并且争论的焦点是 TFT策略和 ALLD策略之间稳健性问题。
基于传统的进化稳定概念和无限群体动态的观点,在有限次“重复囚徒困境”的标准进化博弈模型中,“一报还一报”策略并不能侵入总是背叛策略,因为如果无限大群体中的任何个人使用 ALLD策略,那么少量的 TFT局中人将得到较少的收益。因而,任何由 TFT引起的入侵企图将由于自然选择过程而受到淘汰。即背叛方能够抵挡住合作方的入侵,“总是背叛”策略是进化稳定的。但在无限次重复博弈(或未知结束时间的博弈)中,局中人使用直接回报的合作策略将有可能出现。并且 TFT策略和ALLD策略都将是进化稳定的,能够抵挡得住各种策略的入侵。也就是说,如果重复次数足够大,那么ALLD和 TFT能够抵制其他策略入侵的企图。
对于合作的进化过程,Axelrod和 Hamilton(1981)最早用进化博弈论方法研究了重复囚徒困境下生物系统中合作的进化,提出:(1)关于合作进化的“鲁棒性”,认为基于回报的合作策略“一报还一报”能够在多样化的环境中繁荣起来;(2)关于合作进化的“稳定性”,认为当且仅当个体之间再次相遇的概率足够大时,“一报还一报”才是进化稳定的。即当个体之间再次相遇的概率足够大时,“一报还一报”策略能够阻止一个变异策略的侵入,但“一报还一报”不是唯一能够进化稳定的策略,事实上,不管再次相遇的概率多大,“总是背叛”的策略是进化稳定的;(3)关于合作的“初始成活性”,认为在开始状态为“总是背叛”群体中,基于回报的合作可以通过两个不同的机制取得立足之地,一是变异策略之间的亲缘关系,二是变异策略以一小群的形式出现。
尽管大量关于合作进化的文献由于构造的假设与标准进化博弈模型存在着重大的不同,导致研究结果的重大差别。但上述的合作进化的博弈研究说明了,对于利己的相互处于竞争地位的个体组成的社会,合作行为会在没有中心权威的强制下产生、推广和演化。因而,合作进化的博弈分析对企业战略联盟内部合作竞争关系的研究指出了新的思路。
1.收益从根本上影响联盟合作出现和维持的预期。企业战略联盟形成背后的动力是每个参与伙伴对预期战略联盟结果的一个正的净值分配。如果相互合作的结果为获得的分配为零,即联盟的直接费用和间接的功能性困难抵消了收益,那么就不存在促使企业合作的动机。并且如果相互合作倾向于产生负的净收益,例如,合作导致了核心竞争力、核心技术的泄漏,就存在避免合作的动机。这意味着,在利己的自主性企业间合作的出现反映了通过彼此的互相依赖,共同行动的结果可以实现预期的个人收益。
2.合作伙伴偏好的改变从根本上改变联盟关系的特征。合作伙伴偏好的改变,既可以通过深思熟虑的战略调整,也可以通过外生的事件,能使博弈从某一种类型变为另一种类型,从根本上改变合作关系的特征。例如,基于名誉效应,与伙伴的合作历史以及对特定联盟的许诺,那么企业从相互合作(MC)得到的收益可能大于单方面欺骗(UD)的可能收益,那么,伙伴关系结构会从囚徒困境结构(UD>MC>MD>UC)转变为一个冲突相对更少的博弈,即猎鹿博弈(MC>UD>MD>UC)。或者伙伴们转变其战略目标,发现一个更有吸引力的联盟伙伴,或预见联盟会削弱其竞争地位。此时企业的决策者可能开始相信持续的合作比双方相互违背协定(相互背叛)具有更少优势。这种情况将导致博弈从囚徒困境博弈改变到一个称作僵局①的更加冲突的博弈(UD>MD>MC>UC)。由此可见,公司内部和外部环境的动态变化可能改变初始的收益条件并且有助于合作关系结构生存能力的提高或退化。
3.不同种类博弈的收益之间大量的差异对合作起重要的决定作用。如果战略联盟伙伴期望在未来相互合作,那么在给定种类博弈情况下,收益之间大量的差异对合作起重要的决定作用。在战略联盟中,如果违反协议(UD)获取的收益以及从持续合作(MC)获取的收益之间存在巨大差别,那么将会对战略联盟的稳定造成消极地影响。同样,如果合作双方违反合同(MD)带来的收益与相互合作(MC)带来的收益具有极大关联,这样的协议可能具有危害性,因为不管局中人 2合作与否,局中人 1仍旧能够指望得到相当大的收益。而最终,如果局中人 1背叛局中人2(UD)所获得的收益和局中人 1从局中人2的机会主义(UC)的损失之间的差距越大,合作的预期将降低。这样,收益结构,如按 UD-MC,MCMD,和 UD-UC模式获得的收益余额被预期与联盟的稳定性相关。
对于参与战略联盟的企业而言,被称作为“未来价值”的公司预期的未来利益和当前行动之间的这种联系是决定战略联盟稳定性的关键因素。在企业战略联盟中,每个企业将背叛得到的当前收益与违背协议的可能导致的未来收益的损失相比较是合作将得以维持的条件。相似地,当前行动中的合作能够与下一行动中的合作相匹配,背叛可能会遇到报复性的背叛。这样,通过鼓励互惠互利策略,重复提高了合作的预期。未来的影响越长,或者当前行动和未来结果之间的关系越紧密,将越好的促进合作的执行,因为收益的前瞻性预期抑制了对协议违背的倾向。这里的预期包括相互作用时间界限的长短,交互作用的频率以及行为的透明度大小。
1.战略联盟成员企业相互作用的时间界限必须足够长。在博弈理论中,持续相互作用的预期可被描述为一次(或单一参与)博弈,有限次重复博弈(知道时间长度的重复)和无限次重复博弈(不知时间长度的重复)。可以认为,为使合作有效,持续博弈的一个非零概率必须存在。如果存在一个确定的结束点,反映了战略联盟有限的时间界限,合作关系就可能破裂。正如 Telser(1980)讨论的“如果交易机会的顺序有一个明确可知的最近因素那么自我强化的协议并不可行。尽管终止在某种程度上迟早会发生,何时发生必须是不可预测的以维持一个自我强化的协议”。对于大多数企业间战略联盟,由于产生时没有终止时间,等同于未知长度的重复博弈。这样,伙伴间合作的程度被预期可能与时间界限的长度正相关,依次是合作关系意愿持续时期和通过意愿持续时期保持战略联盟的察觉可能性的正函数。
2.战略联盟合作伙伴之间必须频繁地发生交互作用。除了长时间界限外,另一个增大未来影响的方法是使接触更加频繁。由于战略联盟成员的关系是建立在相互信任的基础上,双方着眼于建立交易的合作关系而最终并不走向一体化。一般地说,信任是在被称为“信任周期”的循环中建立起来的,相互信任需要双方做长期艰苦的努力,信任早期的脆弱性导致战略联盟系统组织结构的脆弱,战略联盟成员企业经营决策的相互依赖进一步加大了组织结构的不稳定性。然而,在下一步的接触很快就会发生的情况下,下一步显然比通常更重要。对于战略联盟间合作的进化也是一样,促使交易频繁意味着在战略联盟结果的估价之间很少时间流逝,因此下一行动比其他所做的更加突出。当下一步的重要性增加时,相互合作的收益属于较低的折扣率,背叛的倾向降低,合作变得更容易,由于双方知道一个剥削的行动能够被下一阶段的互惠背叛所遇到(Schelling,1960)。那么,频繁的交互作用将强化互惠,扩大未来的影响,并且提高合作的稳健性。如果合作伙伴之间不存在频繁的交互作用,就不会产生以牙还牙的互惠行为。
3.合作伙伴之间的行为透明度要足够高。由于信息不对称造成的成员企业经营者决策失衡,进而不能实现预期战略联盟目标,最终导致战略联盟失败。发生信息不对称的情况有两种:一种是战略联盟建立之前,由于信息的不可观测和不可证实以及成员企业沟通不够造成的逆向选择问题,另一种是战略联盟建立之后,战略联盟各方追逐己方利益在行为选择中的不确定性造成的隐行为道德问题。
因而,行为的透明度也是增强互惠行为和使未来影响成为合作有效促进器的重要因素,这里的行为透明指的是战略联盟伙伴通过其学习另一伙伴行为的速度和可靠性。目的是战略联盟伙伴克服由于观察滞后,反应滞后以及二者兼有引起的信息不完美,包括贡献与利益隐晦不明,合作伙伴间信息分布不均以及所获利益和成本不透明。因为尽管频繁的交互作用可能有助于提高合作的稳定性,但对于任何给定的交互作用频数,主要的问题仍然是是否每一方能够实际上知道另一公司实际所做的是基于上一轮的博弈。有效的认知和控制能力——区别别人的合作和欺骗的能力并且善意地回应——构成了类似“以牙还牙”互惠策略的基础。如果由于信息不完美导致欺骗不能以及时的方式可靠地被察觉,信任开始从实际中分离并且当前行动和未来结果之间的重要连接被切断。
应该说,企业战略联盟应该是一个动态进化的过程,其中,战略联盟伙伴企业之间的学习、调整是实现联盟动态进化的关键因素之一。因此,企业战略联盟合作进化分析还必须结合战略联盟这一组织形态本身的特殊性。在构造战略联盟合作进化模型时做到两点:
由于存在诸多影响企业战略联盟进化的各种诱因和外部推动力量,不仅战略联盟成立时伙伴力量的不均衡会影响到合作的稳定,在合作过程中,合作伙伴战略地位的改变常常会影响到力量的平衡,此外,由于学习能力不同而导致的谈判实力的变迁也会影响到力量的平衡。当战略联盟中企业的力量对比发生变化,就很容易引起个体间的认知难以达成一致,从而导致合作的解体。因而必须处理好参与战略联盟伙伴的贡献(包括产品,技术,技能,信息以及管理实践等)与其利益之间关系,通过每个伙伴看待其他人下一行动时的不确定,不断评估合作伙伴实力的可能变化并且体现在战略联盟结构中。
公司内部(公司实力、资源互补性等)和外部环境(如技术、市场环境)的动态变化可能改变初始的收益条件并且有助于合作关系结构生存能力的提高或退化。由于合作伙伴在战略联盟进化的过程中始终非常关注联盟创造价值的能力以及还能获得的利益。当战略联盟所处的环境发生变化时,战略联盟成员会自主的评价环境利弊和预期目标实现的可能性,做出各种对战略联盟有益或有弊的决策。如果各方都选择了合作的态度,战略联盟的地位进一步巩固,反之,如果战略联盟一方采取不合作的态度,就有可能引起连锁反应,战略联盟面临解体风险。尤其,如果不能明确合作伙伴对于不确定的冲击的反应,战略联盟内企业面临的不确定性就会增加。不确定性会使企业不断分析合作对象的行为并预测它的意图,在信息不对称的情况下,投机、提前退出以及最终独自完成目标等最终成为企业自然的选择。因而,必须不断评估调整合作伙伴预期的变化,这包括偏好的变化、信任的变化以及信息不对称性。
不管哪种类型的战略联盟,影响企业战略联盟稳定程度的关键因素是合作伙伴从联盟中获得隐性和显性收益的大小,因而,企业战略联盟中合作的研究可借鉴重复囚徒困境中关于合作进化的博弈分析方法,同时,在构造收益矩阵时需要考虑企业在重复博弈过程中可采取的不同策略以及策略的不同组合,如基于回报的合作策略以及一些合作策略的组合。在此基础上,应该努力寻找一个战略联盟各方都能收益的平衡点,建立与战略联盟契约精神一致的战略联盟内部治理机制,导致背叛将面临较强的“套住效应”和较高的“转换成本”,制约机会主义行为。
[注 释]
① 僵局是指这样一类关系,其中通过合作没有共同利益的实现。在这样的例子中,相互欺骗的结果优于相互合作的结果(MD>MC),术语“合作”变为缺乏意义且冲突变为不可避免(例,Oye,1986:6-7).
[1] 【美】罗伯特◦艾克斯罗德著.合作的进化——对策中的制胜之道[M].吴坚忠译.上海:上海人民出版社,1996.
[2] Axelrod,Robert&William D.Ham ilton.The evolution of cooperation[J].Science 1981,(211):1390-1396.
[3] Jonathan Bendor,Piort Swistak.The Evolutionary Stability of Cooperation[J].The American Political Science Review,Jun 1997,91(2):290-307.
[4] Arvind Parkhe.Strategic alliance structuring:A game theoretic and transaction costexamination of interfirm cooperation[J].Academy of Management Journal,Aug 1993,36(4):794-829.