基于多主体技术的纵向研发联盟仿真

2011-06-05 06:42
关键词:雪堆投机者收益

邱 钊

(海南大学 信息科学技术学院,海南 海口 570100)

全球竞争加剧迫使企业不断追求创新,产品研发活动不再局限于制造商内部,而且扩展到外部供应体系,并逐步形成纵向研发联盟.国内外诸多学者将纵向研发联盟视为日本企业“缩短产品开发时间的核心技术”[1].丰田汽车的成本优势来自于其独特的精益生产管理模式,但其之所以能做到精益生产,跟丰田公司与供应商的合作是分不开的.然而,近期频繁爆发的丰田召回事件,从“车窗门”到“爬坡门”,再到“踏板门”和“刹车门”,却使得曾被业界顶礼膜拜的日本纵向联盟体系成为丰田的质量之殇.

实证研究表明联盟的失败率高达50%以上,研发联盟的失败率更是较之犹甚[2-3],战略联盟的失败率要远高于单个公司的失败率,主要原因在于战略联盟本身就是一个高风险战略,联盟不稳定往往伴随联盟风险而生.因此,联盟风险控制在战略联盟管理研究中被认为是至关重要的.

总体而言,现有的联盟研究大多是静态研究联盟投入或产出的问题,即所谓的“内容问题”,该研究主要强调为什么选择特定的治理结构,或者如何设计联盟合作契约,从而建立激励机制或惩罚机制.迄今为止,研发联盟研究基本上还处于理论模型构建或者逻辑论证阶段,仍然缺乏针对如何有效管理协同研发“过程问题”的动态研究.

本文基于多主体的建模思路和方法,将复杂适应系统理论与博弈理论相结合,利用计算机平台对纵向研发联盟风险控制进行仿真实验,从而为国内研发联盟企业加强联盟风险控制提供理论与实践指导.

1 文献探讨

1.1 联盟风险内涵

从1990年到2002年期间,战略联盟的数量平均每年增长25%,在这种情况下,战略联盟已成为企业间合作的主要组织形式,同时战略联盟也是新创企业或研发项目通过公司风险资本的方式获取联盟企业资助的重要方式[4].

风险以及风险承担一直是社会科学研究领域中的一个重要组成部分,相对于风险承担而言,风险的概念就是所承担的最终结果的变化与差异,因此,风险通常被定义为对于风险承担者而言非常重要的产出变化.传统上,按照Knight对于风险(Risk)和不确定性(Uncertainty)的区分,不确定性是指知道未来可能发生的每一种状态,但是不能为每一种状态赋予确定的概率值;而风险是指不仅仅知道未来可能发生的每一种状态,而且知道每一种状态所对应的概率值.由于在战略领域风险经常难以确定对应概率,而且战略管理者认为风险是可以主动防范并加以控制和规避的,所以战略领域的文献中对于风险以及不确定性经常会不加以区别地使用.

Ring 和Van de Ven[5]认为,交易成本是建立治理机制防范交易不确定性所带来的危害所付出的成本.交易不确定性包括两个方面:一是机会主义行为倾向所带来的不确定性,其危害主要表现为道德风险问题、逆向选择问题以及因专用性投资带来的套牢问题;二是双方所共同面对的交易环境的不确定性,它带来了双方的协调与适应问题[5].基于这个区分逻辑,Das and Teng以及刘益、李垣[6-7]将联盟风险划分为绩效风险与关系风险两个维度[6-7].关系风险(Relational Risk)是指联盟伙伴不按照期望方式承担联盟相应义务的某些可能性与结果,其源于可能会阻碍联盟战略目标达成的所谓的关系合作问题.绩效风险(Performance Risk)是指即使联盟伙伴充分合作,但是仍然危害联盟战略目标达成的某些可能性与结果,例如虽然联盟企业具有强烈的学习欲望,但是在联盟合作过程中仍然可能会由于技术的不匹配而不能有效地学习和转化知识,或者是过于技术导向而忽视了市场导向,最终联盟合作研发的产品不为市场所接受.

1.2 联盟风险控制内涵

控制在管理中是一个非常重要的概念, 很多学者将其视为组织达到目标所进行的一系列管理与监控的过程.例如,Leifer & Mills以及Das & Teng[8-9]认为,“控制是一种调节过程,该过程在组织追求既定目标时,通过建立标准使得系统中的各要素更具有可预期性”.

在战略联盟中,控制被认为是不可或缺的,联盟中的控制可以通过管理结构、合同规定、管理安排以及其他更多的非正式机制得以实施.联盟中的控制有两种类型——控制合作伙伴和控制联盟本身.通常,这两种控制方式会以一个整体视角加以讨论.有关控制的文献大体上展示了两类基本的控制方法,一种是基于外部度量的控制和基于内部价值观的控制.第一类控制强调通过建立、运用正式的规则、流程和政策以及激励来保证组织绩效,也被称为正式控制或目标控制.第二类控制强调通过建立组织规范、价值观、组织文化和目标等内在化形式以鼓励期望行为和结果,其目的在于减少组织成员的目标和偏好分歧.因此,第二类控制也被称为社会控制、非正式控制或规范控制.

1.3 复杂适应系统理论

复杂性科学是研究系统的一般模式、结构和规律的学问,它研究各种系统的共同特征,用数学方法定量地描述其功能,寻求并确立适用于一切系统的原理、原则和数学模型,是具有逻辑和数学性质的一门新兴的科学.

复杂适应系统(complex adaptive system,简称CAS)是20世纪几代科学家不断深入研究,对复杂系统日益全面理解与认识的成果之一.它是由John H. Holland在1994年正式提出的,其基本思想是:系统中的个体元素被称为主体(Agent),主体是具有自身目的性与主动性,有活力(Active)和适应性的个体.主体可以在持续不断地与环境以及其他主体的交互作用中“学习”和“积累经验”,并且根据学到的“经验”改变自身的结构和行为方式,正是这种主动性及主体与环境的、其他主体的相互作用,不断改变着它们自身,同时也改变着环境,才是系统发展和进化的基本动因.整个系统的演变或进化,包括新层次的产生、分化和多样性的出现,新的聚合而成的、更大的主体的出现等,都是在这个基础上派生出来的.

主体系统的研究开始于20世纪50年代,中间经历了不少的挫折,直到20世纪90年代,由于电脑和通信的高速的发展,再次引发了主体技术研究的高潮,成为人工智能领域中的一个热点.由于主体系统与复杂适应系统表现形式的吻合,基于计算机技术的主体技术可以用于复杂适应系统的建模和仿真.

多主体技术与演化博弈理论结合,构成了演化网络.在该网络中,节点代表经济环境中的个体,节点间的连线代表个体间的关系或合作行为,而节点间的竞争与合作遵循博弈模型.近年来有关多主体技术平台上的演化博弈的研究蓬勃发展,物理学家Hawking说:21世纪将是复杂性科学的世纪,多主体平台上的演化博弈可作为研究复杂系统、复杂性科学一个可行的切入点,并将会在生态演化、神经网络、群体智能、认知科学、自组织涌现行为、网络化系统、经济动力学、社会心理学等研究中彰显它的作用.

表1 两主体“雪堆博弈”收益表

2 仿真模型

2.1 雪堆博弈

雪堆博弈,也称鹰鸽博弈,是著名的演化博弈经典模型.原始的雪堆博弈模型为:有两个人驾车回家,遇到暴风雪,被雪堆分别堵在了街道的两头.司机要么出来铲雪清除路障,要么待在车中.如果两个司机分别从两头铲雪(“合作”),就能都开回家并分担劳动付出.如果只有一个司机铲雪,另一个司机待在车中等对方铲完雪,他也能回家,而且还避免了劳动付出(“欺骗”).当然,如果两人都待在车中,没人铲雪,那就谁也回不了家了.设回家得到的收益为b,铲除雪堆总的劳动付出为c(一般设b>c),则其收益矩阵见表1所示.

2.2 纵向研发联盟合作博弈仿真模型

本模型参考经典的雪堆博弈模型,它的主体有两种类型—制造商和供应商,并且限定合作只发生在不同类型的主体间,即制造商和供应商之间.将“铲雪”比作“合作”,将“背叛”理解成“纯粹的欺骗,一点努力都不付出”,则可以在“雪堆博弈”模型基础上建立联盟的仿真模型.

合作所带来的收益具有共享性和溢出效应,为方便研究,双方的合作所得还是沿用雪堆博弈模型,都为b-c/2.当某一方选择合作,另一方选择背叛时,因为背叛的一方一点都不付出,其成本为零,故其收益为b,所有成本由合作的一方承担,所以合作的一方收益为b-c.如果双方都背叛,因为双方都不付出,没有任何收益,当然也没有成本,双方收益皆为零.

为更加形象贴切地描述现实世界的合作关系,本文参考“空间囚徒困境”模型[10]在纵向研发联盟仿真模型中引入网络结构来表示合作关系.即用网络G=V,E)表示主体所处的空间结构,集合V是网络G的顶点集,代表系统中的主体集合;集合E是G的边集,代表系统中主体之间存在的相互关系.主体的策略采用纯策略S={C,D},即仅为合作(C)或背叛(D).每个回合,主体都与相邻(有边相连)主体进行一次囚徒困境博弈.每个回合后,每个主体根据获取的信息不断地学习和进化.

为了更形象地展示模型的演化,根据主体的投机性将主体分成三种类型:互惠者、中性者、投机者.互惠者代表单纯采用合作策略的主体,投机者代表单纯采用背叛策略的主体,中性者代表两种策略皆有可能选择的主体.

在本模型中,联盟控制机制主要考虑正式控制,即主要通过契约规制和正式的组织安排来规避风险保证组织绩效.现实世界中,正式控制主要通过惩罚机制体现,本模型采用最严厉也是最简单的惩罚机制—“互惠者遭到背叛即终止合作”.即所有主体选择纯策略(投机者选择背叛、中性者随机选择、互惠者选择合作)进行博弈,然后互惠者根据所获取的信息判断对方的选择,如果对方选择背叛,互惠者将遭到对方的剥削,互惠者选择终止合作以惩罚对方,重新随机选择其它主体建立合作关系.

主体具有智能性和动态学习能力,在每回合博弈结束后能够学习所获取的信息,改变规则,产生适应性.在此,模拟现实世界的研发联盟运作,设计主体的适应性规则.

在每个博弈回合,每个主体和其相邻的所有主体分别进行1次博弈,并计算该主体的本回合总收益,记主体vi的收益为Pi.在现实世界的合作关系中,一般都具有路径依赖性,即不到万不得已一般不会更改合作伙伴.每个回合后,“不满意”的主体根据自己的收益决定自己的行动.“不满意”一般是指对收益不满意,但这是个相对的概念,有个比较的基准.本文采用比较严格也是最简单的方法,规定主体和所有相邻主体比较收益,如果它的收益是最差的,则该主体是“不满意”的主体,将有所动作.确定“不满意”的标准后,随后规定其动作,即主体采取何种动作来改变状态以获取更高收益.适应性动作主要是:学习最佳邻居.主体从其相邻主体集合中选出收益最高的主体,学习其策略,改变主体投机属性.

系统随着时间不断演化,直到网络中的主体全部达到“满意”状态,这意味着全部主体不再改变自身属性,这称之为达到稳定状态,系统可以结束运行.

3 仿真实验及结果分析

为降低系统建模的难度,本文采用比较成熟的复杂适应系统建模工具Repast协助建模,这样可以借助平台的优势,容易实现并发控制、主体设计、多主体交互、涌现、显示、统计等功能,可以实现对连续多主体博弈过程的仿真并可对各次博弈结果进行实时观察和结果输出.

3.1 模型参数设定

为更明显地反映联盟控制的影响,实验模拟投机者占绝大多数的投机市场初始环境下,施加联盟控制与否,市场结构截然不同的演化结果.设定参数如下:①总主体数目为200,制造商和供应商各占一半,设置投机者占比70%、中性者占比10%、互惠者占比20%;②模型环境的大小为1 200*800;③合作收益b设定为10,成本c设定为5.

3.2 实验结果

实验获得了不施加联盟控制和施加联盟控制两种不同条件下,投机市场结构演化的结果.图中的横坐标表示博弈的回合数,纵坐标表示各类型主体占全体主体的比例.

3.3 结果分析

图1显示在不施加联盟控制条件下,市场靠自身能够稍微向好的方面进化,投机者占比减少10%,其它类型的主体占比都有所提高,但幅度有限,整个市场还是充斥投机者的投机市场.

图2显示施加联盟控制后,市场向好的方面演化,互惠者占比不断上升,其它类型主体占比不断下降,最终所有主体进化成互惠者,达到理想化的合作市场.分析其中原因,互惠者虽然可能会被投机者一次性剥削(互惠者收益b-c),但因为它保持着和其它互惠者稳定的合作关系(收益为b-c/2),所以互惠者的每回合博弈次数要远远多过投机者,故其收益反而比投机者大.经过多次博弈,投机者的收益与互惠者的差距越拉越大,最终投机者沦为“不满意者”,它将学习最佳邻居,进化成互惠者.

图1 不施加联盟控制市场结构演化图 图2 施加联盟控制市场结构演化图

4 结论

本文从复杂适应系统理论的视角,通过多主体建模仿真技术,参考“雪堆博弈”模型和“空间博弈”模型,建立起纵向研发联盟网络模型并在计算机上进行演化实验.实验结果证明,施加联盟控制,能够优化市场结构,降低市场的投机氛围,促使市场向互惠的合作市场转化.

参考文献:

[1]Yassine K R C, and Donald R Falkenburg.A decision analytic framework for evaluating concurrent engineering[J]. IEEE Transactions on Engineering Management, 1999,46(2):144-157.

[2]Parkhe A. Strategic alliances structuring: a game theoretic and transaction cost examination of interfirm cooperation[J]. Academy of Management Journal, 1993, 36:794-829.

[3]Duysters G,Kok G,Vaandrager M.Crafting successful strategic technology partnerships[J].R&D Management,1999,29:343-351.

[4]Das T K, Bing-Sheng Teng. Instabilities of strategic alliances: An internal tensions perspective[J].Organization Science,2000,11:77-101.

[5]Ring Peter Smith, Andrew H, Van de Ven. Structuring cooperative relationship between organizations[J].Strategic Management Journal,1992,13:483-498.

[6]Das T K,Bing-Sheng Teng.Trust, control, and risk in strategic alliances: an integrated framework[J].Organization Studies,2001,22(2):251-283.

[7]刘益,李垣,杜旖丁.基于资源风险的战略联盟结构模式选择[J].管理工程学报,2003,6(4):34-42.

[8]Leifer Richard, Peter K Mills. An information processing approach for deciding upon control strategies and reducing control loss in emerging organizations[J].Journal of Management, 1996,22:113-137.

[9]Das T K, Bing-Sheng Teng. Between trust and control: Developing confidence in partner cooperation in alliances[J].Academy of Management Review,1998,23(3):491-512.

[10]Nowak M A,May R M.Evolutionary games and spatial chaos[J].Nature,1992,359:826-829.

猜你喜欢
雪堆投机者收益
浅析证券市场个人投机者心理
螃蟹爬上“网” 收益落进兜
奥地利一卡车穿越4米厚雪堆开辟道路
徐和谊:拒做投机者
新能源汽车:新规发布 投机者、搅局者终迎洗牌局
怎么设定你的年化收益目标
捕熊妙计
不让“投机者”有机可乘
2015年理财“6宗最”谁能给你稳稳的收益