周 兴
(湖南文理学院 资源环境与旅游学院,湖南 常德 415000)
声誉机制对稳定高校高层次人才非物质激励的博弈分析
周 兴
(湖南文理学院 资源环境与旅游学院,湖南 常德 415000)
从博弈论的角度,利用“囚徒困境”分析高校和高层次人才的博弈行为,发现高处罚并不一定能有效抑制高校高层次人才流失(跳槽)现象。“声誉模型”研究表明,加强并硬化对高校高层次人才的非物质激励,增强教师的声誉预期收益,做好高层次人才声誉机制构建工作是稳定高校高层次人才队伍的有效方法。
博弈;“囚徒困境”;“纳什均衡”;高校高层次人才;声誉模型
随着市场经济的发展,高校高层次人才流失(跳槽)现象日益严重。这是困扰我国高等教育界的一大难题,也是高校教育改革不容回避的棘手问题,更是高校可持续发展的战略问题。本文运用博弈论理论,通过建立高校与高层次人才间的博弈模型,分析当前高校与高层次人才间的博弈行为,并引入声誉机制,以期为稳定高校高层次人才提供相应的决策依据。
“囚徒困境”博弈模型是经典的博弈模型。“囚徒困境”博弈基本模型是这样的:警察抓住了两个合伙犯罪的罪犯,但却缺乏足够的证据指证他们所犯下的罪行。如果其中至少有一人供认罪行,就能确认罪名成立。为了得到所需的口供,警察将这两名罪犯分别关押以防止他们串供或结成攻守同盟,其决策收益矩阵如表1。
表1 决策收益矩阵
显然,在这个博弈中,(不坦白,不坦白)对于两个囚徒可以实现自身利益最大的原则,然而在这个博弈中,两个博弈方对对方的可能决策完全不知晓,但又需要各自独立做出策略选择。每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对自己决策收益的影响,他会根据对方两种可能的选择分别考虑自己的最佳策略。因此,两个囚徒不知道对方会做出什么决定,(不坦白,不坦白)不是一个纳什均衡,而(坦白,坦白)是一个纳什均衡。该博弈模型中,博弈双方在决策时都以自己最大利益为目标,结果是无法实现最大利益或较大利益,甚至会出现导致对各方都不利的结局。可以看出,由于一方的决策结果将受到另一方选择的影响,所以在“囚徒困境”中不存在占优策略均衡[1]。
广义的高校高层次人才是指在高等院校人才队伍中层次较高的各类人才,包括学校的高级管理者、学术精英、优秀教师以及高层次的服务型人才等。狭义的高校高层次人才指知识层次较高、在某一学科或领域具有较深造诣、创新能力强、在学科发展及学校教学科研活动中发挥统领或骨干作用的高层次脑力劳动者。他们是高等教育发展的核心力量,其数量和质量决定着其所在院校的国内和国际竞争地位,因而也是各个高校人才引进的重点[2]。
本文采用狭义的高校高层次人才定义。高层次人才是高校提升核心竞争力的源泉,是高校发展的重要资源,千方百计吸引和稳定高层次人才也就成为高校间的一种竞争手段。而高层次人才要能发挥提升高校竞争力的功效,需要与高校较好地耦合与协同演化,在这个过程中诸多现实环境的变化,都会影响到高层次人才与高校的耦合性与协同演化的一致性,流失①便是演化过程中的一种不协同现象。在市场经济条件下,高层次人才流失(跳槽)现象越来越突出。研究这种现象,实际上就是分析高校与高层次人才之间的博弈。
高校高层次人才是否作出流失(跳槽)选择,高校对高层次人才流失(跳槽)是否决定监管,他们都将从利益最大化的角度进行思考和决策,这个思考和决策的过程是一个非合作博弈的过程。当然,高校高层次人才流动的情况是复杂及多元的。现在的现实是,越来越多的高校既是人才流出又是人才流入的处所,那么在既定的条件下(同一所高校及其高层次人才)假设高校与高层次人才各有两种策略:一是高校高层次人才选择流失(即跳槽) 和不流失(即留下来安心工作);二是高校选择不监管(高校相信高层次人才是忠诚的,并能尽最大努力做贡献) 和监管(高校认为高层次人才都有选择流失的可能,因此必须对其行为进行监管,一旦查明应予以处罚) 。
设高校高层次人才在正常情况下(即不做流失选择) 所做贡献为Y,获得的报酬为W;高校高层次人才选择流失(跳槽)获得的流失(跳槽)的额外收益为△W,由于高校高层次人才选择流失(跳槽)而对高校的贡献下降为△Y。高校为识别高层次人才是否存在流失(跳槽)行为, 需要对高层次人才行为倾向进行监察,其监察成本为C,若监察发现高层次人才选择了流失(跳槽),则给予处罚,处罚为Q;若监察发现高层次人才不选择流失(跳槽),则给予P的忠诚激励。根据利益最大化原则,得如下博弈收益战略矩阵(见表2)。
表2 博弈收益战略矩阵
现假设高校高层次人才选择流失(跳槽)策略的随机概率为x,则不选择流失(不跳槽)的随机概率为1-x;高校选择监管的随机概率为y,不监管的随机概率为1-y。且双方的决策是独立的,则各自的期望收益为:
高校高层次人才流失(跳槽)的期望收益:
f人1=x[y(W+△W-Q)+(1-y)(W+△W)]
高校高层次人才不流失(不跳槽)的期望收益:
f人2=(1-x)[y(W+P)+W(1-y))]
高校高层次人才期望收益:
f人=f人1+f人2=x(△W-yQ-yP)+W+yP)]
高校对高层次人才实施监管的期望收益:
f校1=y[x(Y-△Y-C+Q)+(1-x)(W-P-C)]
高校对高层次人才不监管的期望收益:
f校2=(1-y)[(Y-△Y)+Y(1-x)]
高校期望收益:
f校=f校1+f校人2=y(xQ+xP-P-C)+Y-x△Y)]
该博弈的纳什均衡解应满足以下条件:
(1)
(2)
可见高校高层次人才以(P+C)/(P+Q)的概率选择流失(跳槽)策略,以1-(P+C)/(P+Q)的概率选择不流失(不跳槽)策略,高校以△W/(P+Q)的概率选择监察策略,以1-△W/(P+Q)的概率选择不监察,便是该博弈惟一的混合策略纳什均衡点。
由(1)式,高校选择监管的概率y与△W成正向关系,即△W越大,高校选择监管策略的可能性也越大。而△W作为高校高层次人才选择流失(跳槽)策略的额外收益,本质上反映了一定时期内劳动力市场的供求关系。当市场上高层次人才供不应求或很容易获得额外收益的时候,高校高层次人才选择流失(跳槽)策略的可能性也随之增大,但这种增大同时受高校对高层次人才流失(跳槽)行为的约束力(P+Q)的影响。然而在(2)式中,高校高层次人才选择流失(跳槽)策略的概率x与高校对高层次人才行为监管成本具有正向关系,在其他条件不变的情况下,监管成本越高,高校高层次人才选择流失(跳槽)的可能性也越高,这表明高处罚并不一定能有效抑制高校高层次人才流失(跳槽)现象。因此,高校对高层次人才实行高监管并不是治理高层次人才流失(跳槽)的政策取向,这也就是为什么高校不断提高对高层次人才选择流失(跳槽)的处罚力度(主要是经济惩罚),而高校高层次人才选择流失(跳槽)却愈演愈烈的原因。可见,在市场经济环境下,一味从物质上激励已经不太符合高校高层次人才的流动特点,如何利用非物质激励手段寻求有效的监管策略才是长远之计。
为了有效地解决这一难题,本文引入声誉机制。声誉是反映行为人历史记录与特征的信息集, 可以作为显性激励契约的替代物, 激励和约束代理人的市场行为。在“代理人一声誉”模型中, 声誉是代理人长期业绩、行为和品德的直接表现, 也是其他社会单位与之签订合约的重要考虑因素[3]。
声誉(有的学者也称为信誉)是保证契约实施的最重要机制之一。经济学对声誉的分析有着悠久的历史。早期的古典经济学家亚当·斯密就在《关于公正、警察、税收和军队的演讲》一书中,对不同国家的商人的声誉进行过比较。他曾指出,荷兰人的声誉高于英格兰人,英格兰人的声誉又高于苏格兰人,生活在商业中心的人的声誉高于偏远地区的人。商业的业务量越大,交易频率越高,其声誉作用也就越大。
尽管早期的经济学家已经关注到声誉在经济发展中的重要影响,但迄今为止,在主流经济学中高校高层次人才声誉机制的研究并未获得应有的地位,虽说声誉问题随着博奕论在经济学中的应用受到经济学家们的关注,但是在中国的经济学研究中,尤其是在对高校与高层次人才成长博弈机制的研究中,声誉问题并未引起足够的重视。
关于声誉机制的精神激励作用,管理学家、心理学家及行为科学家早就关注并作过详尽的研究。经济学家关于声誉激励机制的正面研究,则是近二十年来随着博弈论的兴起将之应用于解析代理成本问题才开始的。
克瑞普斯(Kreps)等人提出的“声誉模型”,很好地解释了静态博弈中的“囚徒困境”难题。当只进行一次性交易时,理性的参与者往往会采取机会主义行为,通过欺诈等“非名誉’手段来追求自身利益最大化,其结果只能是“非合作博弈均衡”。但当重复多次交易时,为了获取长期利益,参与者通常需要建立自己的“声誉”,一定时期内合作博弈均衡就能够实现。
当博弈双方的行为很难、甚至无法证实,合作博弈均衡很难实施时,长期的委托代理关系就有很大的优势,长期关系可以利用“声誉效应”(reputation effects)。伦德纳(Radner,1981)和罗宾斯泰英(Rubbinstein,1979)的模型很好地解释了这种情况。但明确提出声誉问题的是法玛(Fama,1980)。法玛认为,激励问题在委托代理文献中被夸大了。在现实中,由于代理人市场对代理人的约束作用,“时间”可以解决问题。法玛与伦德纳和罗宾斯泰英的解释不同,他强调代理人市场对代理人行为的约束作用,为经理人市场价值的自动机制提出了“事后清付”(expost settling up)这一概念。他认为,在竞争的市场上,经理的市场价值取决于其过去的经营业绩,从长期来看,经理必须对自己的行为负责。因此,即使没有显性的激励合同,经理也有积极性努力工作,因为这样做可以改进自己在经理市场上的声誉,从而提高未来的收入。霍姆斯特姆(Holmstrom,1982)模型化了法玛的思想。将法玛上述思想模型化为“代理人—声誉模型”。虽然该模型是在一些特殊情况(经理人是风险中性,不存在未来收益贴现)下建立起来的,但它证明了声誉效应在一定程度上可以解决静态博弈中的“囚徒困境”难题。声誉模型告诉我们,非物质激励机制可以达到甚至超过物质激励机制的效果。
我们将“代理人—声誉模型”应用到高校稳定高层次人才的问题中,构建高校—高层次人才“声誉模型”,得出如下一次博弈收益矩阵(见表3)。
表3 一次博弈收益矩阵
从表3可以看到博弈分两个阶段。在博弈的第一阶段,高校可以选择相信高层次人才,也可以选择不相信高层次人才。如果高校不相信高层次人才,交易取消,博弈结束。如果高校相信高层次人才,则博弈进入第二阶段。在第二阶段,由高层次人才选择是否流失(跳槽)。如果高层次人才选择不流失(不跳槽),双方各得4单位收益;如果高层次人才选择流失(跳槽),则高层次人才得到8单位的收益,高校损失4单位收益。博弈如表3所示,表中每一栏第一个数字代表高层次人才的收益,表中每一栏第二个数字代表高校的收益。假定博弈只进行一次,采用逆向归纳法可找出此博弈的子博弈精炼纳什均衡,即流失(跳槽)、不信任。这也就是“囚徒困境”。上述一次博弈收益矩阵中,存在8个单位的合作剩余,但是高层次人才的机会主义行为,使得合作方式不能实现。
解决这一问题的一个重要方式就是声誉机制。如果高校和高层次人才在市场上重复相遇,只要他们预期未来收益不大打折扣,也就是双方对未来有足够的耐心即未来的贴现值较大,那么,高校终止未来所有与高层次人才交易机会的威胁将会有效地遏制高层次人才的行骗动机。假定双方有机会进行长期博弈,并且假定在每一次博弈结束前,双方都预期有可能在市场上重新相遇进行交易(每一次博弈结构相同),高校即可采用如下策略:学校对你的继续信任一旦被你滥用,学校将永远不相信你。给定高校以上战略,高层次人才将如何行动呢?如果高层次人才选择流失,他将得到本期收益8单位(仅是代表收益的符号),以后每期的收益为0,所以总贴现收益为8单位。如果高层次人才选择不流失,他得到本期收益4单位,有的概率在下期得到4单位的收益,有的概率在下下期得到4单位的收益,总的贴现收益为:
因此, 只要4(1-∂)≥8,即∂≥0.5,不欺骗就是高校高层次人才的最优选择。假定交易继续进行的概率∂≥0.5,高校高层次人才的博弈选择确实是最优的,合作关系就可以建立。所以,重复博弈促使了声誉机制的形成。声誉机制的核心是当事人为了合作的长远收益,愿意抵挡欺骗带来的一次性眼前好处的诱惑。因此,互惠互利的交易在这种声誉机制的作用下重复进行的话,“承诺”就完全可以支撑交易的顺利开展,因为它建立在当事人认定欺骗会招致严厉报复因而肯定不会发生的信念的基础之上[4]。
声誉机制的激励约束作用在于高层次人才的声誉,即过去的工作绩效是显示其人力资本的一种信号。声誉好的,人们对他的预期就好,其内部提升或被其他高校重用的几率就大。相反,声誉差的,人们对他的预期就差,其内部提升或被其他高校重用的几率就小。因此,在声誉机制激励下,高层次人才频繁流失(跳槽)将意味着断送其职业生涯、人生前程和市场价值。
进入21世纪后,我国各类高校之间的生存竞争日益激烈,其竞争的焦点之一体现在对高层次人才的争夺上,这就对高校稳定高层次人才非物质激励理论和实务提出了新的挑战。声誉机制作为一种行之有效的激励约束方式,对我国高校来说还是一种全新的模式。因此,建立适合我国国情的高校—高层次人才声誉机制,发挥声誉尤其是职业声誉对高层次人才的激励作用,对于推进我国高等教育进程,建设一只高素质的高校高层次人才队伍,从而提高我国教育的竞争力说,具有重要的现实指导意义。
注释:
①高校的人才流失不同于高校高层次人才的流动,高校间正常的人才流动是应该鼓励的,高校与企业等的正常人才流动也应该倡导。
[1]谢识予.经济博弈论(第三版)[M].上海:复旦大学出版社,2008:152.
[2]徐振鲁.高校高层次人才:概念、类型与特征[J].郑州大学学报(哲学社会科学版),2007(5):135.
[3]张维迎.博弈论与信息经济学[M].上海:上海人民出版社,2004:96.
[4]杨瑞龙,轰辉华.不完全契约理论——一个综述[J].经济研究,2006(2):160.
2010-10-11
周 兴(1982-),男,湖北武汉人,湖南文理学院资源环境与旅游学院教师,硕士,研究方向为劳动经济学和人力资源管理。
G647
A
1674-9014(2011)01-0132-04
田 皓)