潘水洋++黄昊
摘要:“一带一路”战略背景下,中国企业纷纷组建企业战略联盟共同开拓国际市场,战略联盟的存在是以内部企业相互信任为基础,合理的机制设计将保证战略联盟的稳定与持久。文章采用演化博弈论对战略联盟中各个企业的行为建模,研究了联盟内部采取合作策略企业数量与采取投机策略企业数量的动态演化过程。结果表明:采用合理的惩罚机制,战略联盟中采取投机策略行为的企业数目维持将较低比例,战略联盟主要成员将会采取合作策略实现共赢,有利于维持战略联盟的稳定与持久。
关键词:一带一路;战略联盟;博弈论;多主体
一、 引言
国家级顶层战略“一带一路”通过积极发展与沿线国家的经济合作伙伴关系,共同打造政治互信、经济融合、文化包容的利益共同体、命运共同体和责任共同体。徐梁(2016)文献数据表明截止2015年底,我国企业共对“一带一路”相关的49个国家进行了直接投资,投资额同比增长18.2%。2015年,我国承接“一带一路”相关国家服务外包合同金额178.3亿美元,执行金额121.5亿美元,同比分别增长42.6%和23.45%。在“一带一路”战略引导下,国内有实力的企业面临着必须走出去进行全球化经营的挑战,如何更加安全、有效地实施跨国经营战略是每一个计划在海外进行投资的企业所必须解决的课题。科学技术发展导致社会分工越来越细,单个国内企业在竞争激烈的国际市场将面临众多挑战。为应对复杂的国际市场,国内企业通过组建战略联盟,在优势互补、利益共享的前提下共同开拓国际市场,这种战略联盟已经成为国内企业对外投资战略的一种常见模式(杨震宁,2016)。对于战略联盟的定义,李欣(2004)指出战略联盟是由两个或两个以上有着相同实力或者互补优势的企业共同组建而成。通过建立战略联盟,联盟内部企业能够形成利益共同体,达到共同开拓国际市场、共担经营风险、降低企业成本、提升竞争实力的目的。然而不论企业采用何种形式的协议组建战略联盟,企业战略联盟仍然只是一个松散型合作竞争组织,并没有一个中央集权的管理机构去控制联盟内部成员的自私逐利行为,一旦联盟内部大部份企业采取短期投机行为互相欺骗时,战略联盟将会瓦解。因此联盟内部成员相互信任是战略联盟存在的基础。
当联盟内部企业存在投机行为导致彼此不信任时,最终会导致联盟瓦解。内部企业的不信任导致联盟存在的寿命非常短暂。何静(2002)调查研究表明,联盟的寿命周期平均值为7年左右。如何设计合理的激励制度,使得联盟内部企业能够建立长久的信任关系,进而提高联盟的生存周期成为战略联盟机制设计这一领域的研究重点,有不少学者对此进行了系统的研究。范琳琳(2016)、王丹(2003)等提出对合作伙伴的信誉、风险偏好、行为进行评级,选择评级较高的企业作为合作对象;马永远(2014)、昊海滨(2004)指出联盟应当建立一套约束机制,防止欺骗和机会主义行为产生;魏光兴(2003)、江旭(2014)提出可以通过构建企业缓冲池,当约束机制无法制裁投机行为时,强制投机企业退出联盟,从企业缓冲池中选择新的企业加入,这样便降低了企业退出对联盟造成的损失成本。本文从演化博弈论的视角出发,通过对战略联盟中各个企业的行为特征进行建模,采用孙建(2004)、杨敏(2013)文献涉及的主体仿真建模软件Swarm来研究企业战略联盟内在结构的动态演化过程。研究结果表明:采用合理的惩罚机制,战略联盟中采取投机策略行为的企业数目维持将较低比例,战略联盟主要成员将会采取合作策略实现共赢,有利于维持战略联盟的稳定与持久。研究结果对如何通过合理的惩罚机制设计保持战略联盟的长久性提供了一个新的思考角度。
二、 演化博弈模型构建
战略联盟是由相互作用、相互影响的多个个体企业所组成的进化系统。在战略联盟中不存在集中控制,企业成员仅仅关注自身的利益;企业成员个体行为是有限理性的;企业成员之间、企业成员与联盟制度环境之间存在相互作用相互影响的非线性关系;为了适应环境,企业成员个体能够通过实践学习并实时调整自己的行为,使得自己的利益最大化。因此战略联盟内在结构的动态演化过程是微观个体相互作用的结果。在本部分,我们采用演化博弈论对此过程进行建模分析。
1. 战略联盟内部企业策略行为描述。假设在一个企业战略联盟中,存在4种类型成员企业,这4类企业具有如下行为特征。(1)采取TFT策略的企业。采取TFT策略的企业具有以下特征:如果该企业觀测到联盟其它企业在上一期采取合作,遵从联盟规则,则该企业在本期也采取合作,遵守联盟规则。如果该企业观测到联盟其它企业在上一期采取不合作,则该企业在本期也采取不合作,不再遵守联盟规则。(2)采取ATFT策略的企业。采取ATFT策略的企业具有以下特征:如果该企业观测到联盟其它企业在上一期采用合作,则该企业在本期采用不合作;如果联盟其它企业在上一期采用不合作,则该企业在本期采用合作。(3)采取用ALL_C策略的企业。采取ALL_C策略的企业具有以下特征:不管其它联盟成员是否合作,该企业均采用完全合作策略,始终遵从联盟规则。(4)采取用ALL_D策略的企业。采取ALL_D策略的企业具有以下特征:不管其它联盟成员是否合作,均采用完全不合作策略,始终不遵守联盟规则。
上述4个策略保存着博弈的一步记忆。由于联盟中没有集权的中央管理机构,所有的参与企业不可能都选择ALL_C策略。任何联盟规范的实施都依赖于联盟成员的自觉参与,联盟内部的每一个企业都基于自身利益以一定的概率选择这4个策略的某一个作为初始策略。
两个企业之间的博弈收益矩阵如表l所示。如果两个企业都采取合作策略(用C表示合作),则每个企业都可获得3单位的收益;如果一个企业采取合作策略,另一个企业采取不合作策略(用D表示不合作),则采取合作策略企业得到0单位收益,采取不合作策略企业得到5单位收益;如果双方都采取不合作策略,则每个企业各获得1单位收益。
2. 企业进化学习行为描述。表1只展示了两个企业相互之间的一次博弈关系,显然完全信息条件下表1的均衡是(不合作,不合作)。若对表1的博弈结构进行多次重复博弈,并且每次博弈结束后,企业通过比较自己与博弈对手的收益,动态更新策略,实现收益最大化。企业策略动态更新过程如下:初始阶段,企业i在4类策略TFT、ATFT、ALL_C、ALL_D中随机选取一个策略开始博弈。企业i与其它企业博弈结束后,该企业会从所有的博弈对手中,找出获得最高盈利的企业j。如果企业j的盈利大于企业i的盈利,那么企业i会将企业j的策略作为自己的新策略,实现策略更新。这个假设也是合理的,因为现实中的企业都是活生生的实体,它能够不断的学习和积累经验最大化自己的利益,与现实生活中的决策机制是一致的。
3. 博弈过程中的惩罚机制。模型中,联盟的信息足够完全,以至于联盟成员能够顺利监督另一个成员。这个假设是合理的。一旦某个企业采取不合作策略,则与该企业博弈时,采取合作策略的对手将会产生损失,对手马上会把不合作的企业报告给联盟。联盟既可能惩罚不合作者,也可能不采取惩罚措施(采取惩罚措施,联盟自己也会产生损失)。本模型中,惩罚采用“驱逐机制”,一旦联盟决定惩罚不合作企业,不合作企业将会被驱逐出联盟,并且在相当一段时间内联盟将不再接受该成员企业。
三、 模型仿真
为了研究企业战略联盟内在结构的动态演化过程,我们采用Swarm主体仿真建模软件对本文所描述的企业战略联盟进行仿真。建模过程如下:步骤1:定义环境,即设定企业的位置。本模型在40*40的方格上产生1 600个联盟企业成员。步骤2:博弈进行前,每个联盟成员按照一定的概率预先在设定的4种策略中随机选择一个策略。然后该企业与处于自己东南西北四个毗邻位置的企业分别进行三阶段重复博弈。步骤3:每个企业与所有的邻居企业博弈结束后,找出获得最高盈利的邻居,如果该邻居的盈利大于自己原有策略获得的收益,该企业便将邻居的策略作为自己的新策略,实现策略更新。步骤4:不断重复步骤3,直到联盟中4类策略企业数量保持稳定。
1. 不采取惩罚机制下的企业战略联盟结构演化。不采取惩罚机制条件下,无论企业是否合作,都不会受到联盟惩罚。博弈开始前,每个联盟成员按照相等的概率预先在设定的4种策略中随机选择一个策略。随着重复博弈次数的增加,采取ALL_C、ATFT、TFT策略的企业将会发现他们在博弈中收益不如采取ALL_D策略的企业收益,于是他们要动态更新自己策略,选取ALL_D策略最大化自己收益。当重复博弈进行到第4轮时,采取ALL_D策略的企业数目达到最大,紧张接着随着博弈的继续进行,采取ALL_D策略企业逐渐减少,采取TFT策略的企业逐渐增多,博弈进行到第15轮时,产生均衡,全部企业采用TFT策略,此时战略联盟瓦解,因为采取ALL_C策略的企业数为0,每个企业将根据对手的策略进行决策,如果对手合作,则企业采取合作,对手不合作,企业也采取不合作策略,战略联盟协议约束无效,联盟瓦解。以上是初始阶段采取4类策略的企业比例相等(采取每个策略的企业数目相等)时的结果,模型仿真结果如图1所示。如果改变初始阶段采取4类策略的企业比例,如选择ALL_C、TFT、ATFT、ALL_D策略的企业占比分别为30%,10%,30%,30%时,博弈最终也将在TFT策略获得均衡。但达到均衡时将花费更多的时间和进行更多次的重复博弈。这表明:即使初始阶段采用TFT策略的企业比例(10%)远低于选择其它策略的企业比例,重复博弈次数的增加也能促使TFT策略成为最终的博弈均衡策略,模型仿真结果如图2所示。
TFT策略之所以会成为最终均衡的结果,可能的原因如下:当对手采取合作时,这时采取TFT策略的人也会选择合作,这样采取TFT策略的联盟成员伪装成了合作者;当对手采取不合作时,这时采取TFT策略的人也会选择不合作,由于彼此之间均采取不合作策略,他们会保持一种默契,都不会向联盟报告对方不遵守联盟契约的行为,这样联盟被这种采取TFT策略并伪装成合作者的企业控制,联盟实际上已经瓦解。
2. 采取惩罚机制下的企业战略联盟结构演化。与上一节类似,初始时每个联盟成员按照相等的概率预先在设定的4种策略中随机选择一个策略。不同之处在于:一旦某个企业采取不合作策略,则在下一轮的博弈中不合作企业将会被驱逐出联盟。联盟对不合作企业采取终身禁入准则,联盟其他成员不会与这个企业采取任何贸易往来,这种大的惩罚力度有可能导致不合作企业破产。此后联盟会引入一个新的企业加入,以维持联盟的企业数量不变。惩罚的威慑力将导致新进入的企业采取ALL_C策略。仿真结果表明经过5轮博弈,最终达到均衡,均衡结果为采取ALL_C策略的企业数为1 590,采取TFT策略的企业数为10个,采取其他策略的企业个数为0。最终的均衡仍然存在采取TFT策略的投机者,可能的原因是由于采取了严厉的惩罚机制,采取TFT策略的联盟成员在接受其它企业监督后,意识到联盟内部存在大量采取ALL_C策略的企业成员,一旦其采取不合作策略,其投机行为被发现的概率大大增加,于是采取TFT策略的投机者伪装成了合作者,模型仿真结果如图3所示。
四、 结论与政策建议
本文通过对战略联盟中各个企业的行为进行建模,采用重復博弈理论研究在不同的惩罚机制约束下,企业战略联盟结构是如何动态演化的,为一带一路战略下我国企业战略联盟的机制设计提供了有意义的参考:(1)当不采取惩罚机制时,企业战略联盟最终会演化成采取TFT策略的投机企业控制的联盟。原因在于采取TFT策略的联盟成员伪装成了合作者;当TFT策略投机者与对手均采取不合作策略时,他们会保持一种默契,都不会向联盟报告对方不遵守联盟契约的行为,这样联盟被这种采取TFT策略并伪装成合作者的企业控制。(2)当联盟对不合作企业采取终身禁入准则,实行严厉的惩罚,使不合作企业产生破产预期时,企业战略联盟最终会演化成大部分企业采取ALL_C策略,剩下小部分企业采取TFT策略,由于不存在其他策略,大量采用ALL_C策略的企业将迫使采取TFT投机策略的小部分企业永远伪装成合作者。联盟将持续较长时间。(3)一带一路战略背景下,国内企业形成战略联盟共同开拓国际市场时,应当设计合理的惩罚机制来约束联盟内部企业短期投机行为,防止联盟名存实亡。如果惩罚过于严厉,将短期投机行为企业终生剔除联盟,也会导致联盟自身损失;如果惩罚过轻,将加大联盟瓦解的概率。一个可行的办法是构建企业缓冲池,强制短期投机行为企业退出联盟,从企业缓冲池中选择新的企业加入,这样便降低了企业退出对联盟造成的损失成本。
参考文献:
[1] 徐梁.基于中国与“一带一路”国家比较优势的动态分析[J].管理世界,2016,(2):170-173.
[2] 马永远,江旭.战略联盟伙伴间特征与联盟管理实践转移[J].管理科学,2014,(5):1-11.
[3] 杨震宁,李东红,曾丽华.跨国技术战略联盟合作、动机与联盟稳定:跨案例研究[J].经济管理,2016,(7):48-59.
[4] 李钦.战略联盟的形成及其演变[J].现代管理科学,2004,(2):62-64.
[5] 江旭,姜飞飞.企业家导向与战略联盟形成决策:联盟经验的调节效应研究[J].管理科学学报,2014,(7):22-34.
基金项目:国家社科基金重大项目“改革开放以来我国经济增长理论与实践研究”(项目号:15ZDA007)。
作者简介:潘水洋(1986-),男,汉族,湖南省岳阳市人,北京大学经济学院博士生,研究方向为计算演化博弈论与机制设计;黄昊(1985-),男,汉族,湖南省永州市人,北京大学经济学院博士生,研究方向为区域经济与产业结构。
收稿日期:2017-01-16。