知识团队合作的动态博弈分析

2010-09-25 10:41:44朱青梅
山东社会科学 2010年11期
关键词:纳什惩罚管理者

朱青梅 薛 珑

(河海大学商学院,江苏南京 210098;济南大学经济学院,山东济南 250022)

知识团队合作的动态博弈分析

朱青梅 薛 珑

(河海大学商学院,江苏南京 210098;济南大学经济学院,山东济南 250022)

针对知识团队的特点,利用动态博弈分析方法详细分析了知识团队成员间的合作存在的可能性问题,以及具有团队管理者的知识团队里合作存在的可能性问题,得出了在团队管理者的可置信承诺存在的前提下,具有团队管理者的知识团队在促进团队合作问题上更有优势的结论。

知识团队;静态博弈;动态博弈

知识员工在工作模式上的重要特征使团队工作成为一种常见的合作形式,即知识团队形式。知识团队作为一个动态的集体,因其成员多样性也显得与众不同,与一般的团队相比较具有一些自己独特的特点。知识团队活动是一项创造性的团队活动,只要有团队,就必然存在着团队成员之间的理念、观点、做事方法和原则等差异,这些差异和异议处理得当,团队的凝聚力就能够得到加强,反之,则影响团队的内部团结合作,从而影响团队目标的实现。

一、知识团队的特征

(一)知识团队的目标具有高模糊性和变动性

知识团队是为了满足市场的需求而产生的。然而,由于知识团队的工作成果一般是创造性的、独特的,知识团队在定义其所需要满足的需求方面最大的问题是需求是粗略的、模糊的,可能只是一个闪念,具有较强不确定性。并且,与一般团队相比,知识团队的目标具有更大的变动性。

(二)知识团队的成员具有高动态性

知识团队是一种动态团队,既有着明确的生命周期,又会不断流动和更新成员。知识员工是一种基于契约的“柔性”员工,是企业的广义人力资源:知识被企业使用,而人本身却不为企业所拥有,项目是企业使用这些人员的载体。目前,知识员工的流动比例很高,知识员工正逐步趋于“自由人”的时代,他们更忠实于自己的职业而非企业,他们的重点是工作而非在一家企业工作。在知识日益受到重视的今天,高知识可获得高薪的市场行情也引发了知识员工的高流动率。

(三)知识团队的组织生态性

知识团队有其生命周期,它随着项目任务的产生而成立,随着项目任务的完成而结束,是一种临时性的、柔性化的组织。①孙锐、石金涛:《知识工作者特征与知识团队的形成研究》,《科学技术与辩证法》2005年第12期。由于知识团队的任务是独特的,它需要团队成员带着自己独特的专业技能来参加工作。然而,正是因为技术太专,这些人只能被阶段性使用,随着工作的进展,人员的组成在知识团队生命周期内会不断变化,少数人员始终在团队成了一种特例。知识团队如同一个生态系统,一直保持着环境适应和新陈代谢的活动。

(四)知识团队的管理手段是协定和价值观

知识工作者的价值之一在于他们某一方面比其他管理者知道得多,而这导致了管理上存在“信息不对称”问题。知识员工的能力、潜力等发挥情况往往难以从工作过程或工作表现中体现出来。知识团队的管理必须充分认可员工的专业特长和员工的知识技能,靠基于各方价值观基础上的协定来管理比靠权力、权威管理更合理。

由于知识团队工作的以上特征,研究如何促进知识团队成员在实现团队目标的工作过程中的顺利合作问题就变得十分重要和有意义。

二、动态博弈分析原理

在动态博弈中,参与人的行动有先有后,后行动者的选择空间依赖于先行动者的选择。先行动者在选择自己的战略时不可能不考虑自己的选择对后行动者选择的影响,两者间存在着更强的战略相互作用。

重复博弈是一种特殊的动态博弈。重复博弈是指同样结构的博弈重复多次,其中的每次博弈称为阶段博弈。如果一个团队长时期存在,且内部人员结构稳定,则团队成员间的博弈可看作“重复博弈”。重复博弈一般具有下列三项基本特征:(1)前一阶段的博弈不改变后一阶段博弈的结构; (2)所有参与人都观测到博弈过去的历史;(3)参与人的总支付是所有阶段博弈支付的贴现值之和或加权平均值。①张维迎:《博弈论与信息经济学》,上海人民出版社2004年版。

影响重复博弈均衡结果的主要因素是博弈重复的次数和信息的完备性。重复次数的重要性来自于参与人在短期利益和长远利益之间的权衡。当博弈只进行一次时,每个参与人只关心一次性的支付;但如果博弈重复多次,参与人可能会为了长远利益而牺牲眼前利益从而选择不同的均衡战略。这是重复博弈分析给出的一个强有力的结果,它为现实中观测到的许多合作行为和社会规范提供了解释。除博弈次数外,影响均衡结果的另一个重要因素是信息的完备性。简单地说,当一个参与人的支付函数(特征)不为其他参与人所知时,该参与人可能有积极性建立一个“好”声誉以换取长远利益。

在重复博弈中,每一个阶段都开始一个子博弈。一个战略组合是子博弈精炼纳什均衡,当只当它在每个子博弈(包括原博弈)上都构成一个纳什均衡。

表1 知识团队成员博弈

三、动态博弈下知识团队合作的存在性

(一)知识团队成员间的静态博弈与动态博弈情形

首先考虑在知识团队中,团队成员间进行静态博弈的情形。假定知识团队包括甲、乙两个成员,进行一次性静态博弈。两人可选择的行动和战略均为:合作或不合作;由于团队工作的外部性,他们在一起合作工作时创造的产出为90单位,平均分配,每人分得45单位;单独工作时,每人可以创造的产出为40单位,当只有一人工作时,每人分得20单位,工作的精神成本都为30单位。则给定只有乙工作,甲不合作得到20-0=20单位,合作得到45-30=15单位,20> 15,所以甲会选择不合作;给定乙选择不合作,甲不合作得到0-0=0,合作得到20-30=10;0>-10,所以甲还会选择不合作,因此甲的最优战略并不依赖于乙的战略选择,不论乙选择什么战略,甲的最优战略是唯一的,此时称甲有“占优战略”——不合作。同样,由于对称性,乙也有不合作这一“占优战略”,即唯一的纳什均衡为(不合作,不合作),均衡结果为(0,0)。由于双方都有“占优战略”,纳什均衡是非常稳定的,但却完全没有效率,相对于合作双方状况都变差了,如表1所示。

再次考虑在知识团队中,知识团队成员间进行重复博弈的情形。设想一个知识团队中的两个成员甲和乙正在进行着博弈,支付条件与前面相同,见表1。假定,第一个时期以后,博弈重复的概率为δ,下面每个阶段也都有概率为δ的可能性再次重复。因此,该博弈潜在地无限重复,且该博弈至少重复到第k阶段的概率为δk。我们下面来证明,如果博弈重复无限次的概率足够大且参与人有足够的耐心,(合作,合作)是一个子博弈精炼纳什均衡结果。

考虑下列所谓的“冷酷战略”:(1)开始选择合作;(2)选择合作直到有一方选择了不合作,然后永远选择不合作。注意,根据这个战略,一旦一个成员在某个阶段博弈中自己选择了不合作,之后他将永远选择不合作。

首先证明冷酷战略是一个纳什均衡。假定成员甲选择上述冷酷战略,如果乙在博弈的某个阶段首先选择了不合作,他在该阶段得到20单位的支付,而不是15单位的支付,因此他的当期净得是20单位。但他的这个行为将触发甲的“永远不合作”的惩罚,因此乙随后每个阶段的支付都是0。因此,如果下列条件满足,给定甲没有选择不合作,乙将不会选择不合作:

现在假定甲首先选择了不合作。给定甲坚持冷酷战略。甲一旦不合作将永远不合作;如果乙坚持冷酷战略,他随后每阶段的支付是0,但如果他选择任何其他战略,他在任何单阶段的支付不会大于0,因此,不论δ为多少,乙有积极性坚持冷酷战略。类似地,给定甲坚持冷酷战略,即使乙自己首先选择了不合作,坚持冷酷战略(惩罚自己)也是最优的。

这样我们就证明了冷酷战略是一个纳什均衡。接下来的任务是要证明这个纳什均衡是子博弈精炼均衡。因为博弈重复无限次,从任何一个阶段开始的子博弈与这个博弈的结构相同。在冷酷战略纳什均衡下,子博弈可以划分为两类:在类型A,没有任何参与人曾经不合作;在类型B至少有一个参与人曾经不合作。我们已经证明,冷酷战略在A类型子博弈构成纳什均衡。在B类型子博弈,根据冷酷战略,参与人只是重复单阶段博弈的纳什均衡,它自然也是整个子博弈的纳什均衡。

上面的分析反映的是知识团队成员间的情况,说明只要博弈重复的次数足够多,团队成员从自身的长远利益出发也会形成互惠的意愿从而相互合作。这种合作不必是基于利他主义,而是基于互惠的共同知识,即如果有人在本期背叛,每个人可以(通过未来的不合作)来惩罚他。

(二)知识团队管理者与成员间的动态博弈情形

由于知识团队管理者的存在,除了团队成员间存在博弈关系外,还存在团队管理者与团队成员之间的博弈。

我们知道,如果团队管理者不能作出可信承诺,那么任何企图使团队成员产生高效率合作努力水平的激励方案很难成功。因此,在这里,我们假设团队管理者能作出可信承诺,并且实行鼓励合作的团队激励方案,即“共同绩效评估制”,激励制度建立在团队产出的基础上。在委托——代理框架下来分析团队合作的可能性。

模型假设:假定有一个管理者,团队由两个成员组成。管理者能收到每个成员合作程度的不完美信号。成员i的个人信号为xi,且xi可能取两个值,(xi=1)代表好信号,即表示i合作水平较高,或(xi=0)代表差信号,表示i合作水平较低。xi的概率分布不仅取决于i的合作决策,还受到共同外部冲击的影响。因此信息不完全,共同外部冲击或者是有利的或者是不利的,前者发生的概率为σ∈(0,1),此时,两个成员不管合作与否都收到好信号;不利的外部冲击发生的概率为1-σ。此时成员收到好信号的概率取决于其个人合作:如果他合作,则概率为q1,且合作的成本为e;如果他不合作,则概率为q0,这里有1>q1≥q0成立。总之,如果一个成员选择合作k∈,那么他收到好信号的概率为σ +(1-σ)qk,收到差信号的概率为(1-σ)(1-qk)。注意,一个成员的合作决策不影响其他成员收到好信号的概率。

既然管理者收到每个成员的个人信号,每个成员的工资取决于四种信号的组合。如果管理者分别收到两个成员的信号为,则用,则用表示成员i的工资,用wi≡(w11,w10,w01,w00)表示其工资向量。假定成员i和j分别选择合作水平k。在工资计划wi下,成员i的期望工资为:π(k,l;wi)≡(σ+(1-σ)qkql)+(1-σ)[qk(1-ql)+(1-qk)+(1-qk)(1-](既然成员是对称的,以后除非必要时,一般省略上标。)

如果一个成员的工资与他的同伴的信号挂钩,那么成员的支付将是相关的,相互影响的。此时,使每个成员的工资与他的同事的绩效水平挂钩是有效的工资方案。对每个成员,如果,(w11,w01)>(w10,w00),那么工资方案w显示了共同绩效评估(JPE)。如果工资方案w是JPE,因此,对于k∈,有π(k,1;w)>π(k,0;w),一个成员的努力对他的同事产生了正的外部性,知识团队具备团队生产外部性的特征。对每个成员,如果(w11,w01)<(w10,w00),那么工资方案w显示了相对绩效评估(RPE),此时,对于k,有π (k,1;w)<π(k,0;w),一个成员的努力对他的同事产生了负的外部性。很明显,支付相互依赖的性质将影响由激励机制形成的成员之间的战略相互作用的程度以及成员是否有合谋不合作的动机。

下面我们开始分析在重复博弈的环境下和共同绩效评估(JPE)的激励方案下,帕累托最优(合作,合作)能否作为子博弈精炼纳什均衡出现。另外,我们还将研究JPE在促使知识团队成员提高相互监督能力方面的作用。

为了分析成员之间的战略相互作用,我们将研究在给定工资方案(w1,w2)下的重复博弈。令在时间t=1,2,K的历史是成员直到t-1期合作决策的序列。

我们首先考虑合作的均衡成为子博弈精炼的必要条件。选定一个成员和他的工资计划w≥0。选择不合作,这个成员能确保在每个阶段至少能得到min的支付。因此,这个支付是在任何子博弈精炼均衡下可得的最劣支付的下界。所以,为了使两个团队成员都合作的结果成为一个子博弈精炼均衡,必须满足下列条件:

不等式左边表示成员在给定其他人努力情况下选择努力带来的平均贴现预期支付,右边表示成员在某阶段单方面选择偷懒并在随后得到阶段博弈均衡的最劣支付惩罚时平均贴现预期支付。由于隐含的惩罚可能不是自我实施的, (I CL)只是均衡的必要条件。

既然π(0,1;w)>π(0,0;w),条件(I CJ)比一次性博弈下的静态激励相容约束条件(I CS)π(1,1;w)-e≥π(0,1; w)更弱。这是因为,在重复博弈下,一个不合作的成员能更严厉地被惩罚。他不仅因为得到好信号的机会更少而被惩罚,而且还被其同事在随后的博弈中一直不合作的“冷酷战略”所惩罚,假定后者的行为是自我实施的。如前所述,在JPE下,一个成员的不合作行为通过降低其同事的期望支付来惩罚后者。因此,JPE可能产生在静态博弈下不能获得的“隐性激励”。但现在还不能肯定这种惩罚是自动实施的。

通过对比可知,相对绩效评估(RPE)不能产生隐性激励。考虑任何具有π(0,1;w)<π(0,0;w)的特点的RPE方案,(I CL)变成:

(I CR) π(1,1;w)-e≥(1-σ)π(0,1;w)+δ π(0,1; w)=π(0,1;w)

(I CR)与静态激励相容约束条件(I CS)相同,这意味着RPE在重复博弈下的实施成本至少与静态博弈下一样。因此,RPE不能探索成员之间的相互作用。

现在引入管理者,考虑管理者与成员之间的博弈,在委托——代理框架下加以分析。管理者应在满足成员参与约束(I C):w≥0以及激励相容约束条件(I CL)下,寻求自身利益的最大化,或等价地,最小化成员的预期效用。首先考虑如下的问题:

这里略去对引理的证明。当w′成为上述问题[L]的解时,如果它使得(合作,合作)作为团队合作均衡出现,那么它是最优的激励方案。我们可以看出事实的确如此。因为w′是一个JPE激励方案,满足π(0,1;w′)>π(0,0;w′)。因此=π(0,0;w′),当团队成员在w′下采用(不合作,不合作)的战略时,就可以达到阶段博弈均衡的最劣支付惩罚。既然( ICJ)在w′是有约束力的,下面说明在给定w′时,(不合作,不合作)的结果是自我实施的。

(1)π(1,1;w′)-e=(1-σ)π(0,1;w′)+δ π(0,0;w′)

给定π(0,1;w′)>π(0,0;w′),条件(1)暗示着如下条件:

(2)π(1,1;w′)-e<π(0,1;w′)

又因为π(k,l;w′)在(k,l)上超模的,可得:

(3)π(1,1;w′)+π(0,0;w′)-π(1,0;w′)-π(0,1; w′)=(1-σ)(q1-q0)2w′11>0

联合条件(2)和(3)可得:

(4)π(0,0;w′)>π(1,0;w′)-e

所以,(不合作,不合作)是一个阶段博弈纳什均衡。此时,阶段博弈均衡的最劣支付惩罚在w′下是自动实施的。因为w′满足[L]的约束,重复博弈中的(合作,合作)给定上述惩罚威胁下的子博弈精炼均衡。

此外,JPE工资计划w′还有在知识团队成员中防范其合谋的作用。在w′下,对成员而言,(合作,合作)相对于其它所有可能的子博弈精炼均衡能产生更高的支付。为了明确这一点,由条件(1)、(2)可得:

(5)π(1,1;w′)-e>π(0,0;w′)

也就是说,当两个成员都选择合作工作时,相对于一起不合作,他们的境况严格地改善了,即获得了帕累托改进。并且,当两人都选择合作工作时比其中有一人不合作所导致的共同的支付更高。这一点由下面的不等式可以看出:

(6)2[π(1,1;w′)-e]>π(1,1;w′)-e+π(0,0;w′)> π(1,0;w′)-e+π(0,1;w′)

在这里,第一个不等式可以由式(5)推导出来,第二个不等式可以由式(3)推导出来。JPE的特征在直觉上是很强的,在JPE下,每个成员的合作都会给他的同事带来正的外部性,并且在可实施的纳什均衡中,这些正的外部性已经实现。

因此,团队成员不能从偏离均衡来进行合谋活动中获利。这两个可观察的特点,加上上面的引理,一起可以得出如下结论:JPE工资方案w′,使得在重复博弈中,(合作,合作)作为子博弈精炼均衡而得以执行,且存在δ≤^δ,使得w′对于δ∈[δ(σ),1]是最优的。

这样,我们就证明了在存在团队管理者的知识团队里,团队成员进行重复博弈时,只要团队管理者能作出可信承诺,并且实行鼓励合作的团队激励方案,使团队成员有积极性相互监督并通过同事制裁产生“隐性激励”,①李霄、徐中和:《企业冲突管理的博弈分析》,《价值工程》2004年第1期。形成互惠的规范,那么在重复博弈的条件下,合作的帕累托最优战略组合(合作,合作)可以作为子博弈精炼均衡出现。

相对于简单的无团队管理者的知识团队的情形,由于团队管理者的存在,可以改变博弈规则,使团队长期存在,从而使团队成员间的博弈重复进行,帮助他们建立一致的稳定预期,引导他们形成合作和信任的共同信念。因此,存在团队管理者的知识团队在促进团队合作问题上更有优势。当然,前提是团队管理者的可置信承诺的存在。

(责任编辑:陆影)

F270

A

1003—4145[2010]11—0107—04

2010-09-28

朱青梅(1962-),女,河海大学商学院博士研究生,济南大学经济学院教授。

薛 珑(1977-),女,济南大学经济学院讲师。

猜你喜欢
纳什惩罚管理者
THE ROLE OF L1 IN L2 LEARNING IN CHINESE MIDDLE SCHOOLS
THE ROLE OF L1 IN L2 LEARNING IN CHINESE MIDDLE SCHOOLS
神的惩罚
小读者(2020年2期)2020-03-12 10:34:06
Jokes笑话
惩罚
趣味(语文)(2018年1期)2018-05-25 03:09:58
刘明怀:做卓有成效的管理者
中国卫生(2016年5期)2016-11-12 13:25:44
管理者当有所作为
中国卫生(2016年4期)2016-11-12 13:24:08
真正的惩罚等
管理者当有所作为
中国卫生(2014年4期)2014-12-06 05:57:02
给中青年管理者一片天地
中国卫生(2014年10期)2014-11-12 13:10:32