王 询,曹兆文,2
(1.东北财经大学 经济学院,辽宁 大连 116025;2.西华师范大学 教育学院,四川 南充 637002)
评审作为一种重要的资源配置方式,其分配资源的数量十分庞大,作用范围也极为广泛。比如,各级各类科学基金项目评审和各级政府财政支出评审、政府采购评审、各行各业的职称评审、各种论文评审、各种投标标书的评审、企业内部许多管理评审和建设投资方案评审等等,这些评审,其结果或者直接分配给被评对象以相当数额的经济资源,或者通过授予对象以某种名誉或称号等,间接分配经济资源。此外,许多以其它名义出现的社会经济活动,其实也包含了一定的评审过程,如美国的“NRSRO”(即“国家认可的统计评级机构”)对被评对象(各种有价债券等)的信用评级,实质也是一种评审,该评审通过给被评对象分配不同的信用等级,以此影响投资者的投资行为。近年来,国内一些信用评级机构也得到了较好的发展。
当前关于评审的研究成果也较为丰富。其中,评审专家的选择方法及指标体系的研究试图通过控制评审专家的选择过程来提高评审专家队伍的质量,优化队伍结构,以达到提高评审质量的目的[1]-[4];评审项目的指派方法的研究以及评审专家评审意见的集成方法研究等则试图消除评审中各种主观误差或偏见等对评审结果的不利影响[5]。同时,此类研究也试图消除评审组织管理中的操作技术误差,进一步提高评审质量;国外关于评审专家的行为特点对评审结果的影响研究则揭示了评审的社会环境与专家评审行为的关系以及这种关系对评审结果的影响等,研究了评审活动的外在规律性,以便从中找到提高评审质量的对策[6];另有一些研究检验了评审结果的质量状况,并试图找出影响评审质量的主客观因素[7]-[9]。此外,王询的研究较早关注了评审活动参与各方作为所谓“理性人”而存在的事实这个重要问题,以经济学的方法分析了评审过程中各参与主体(未包含评审专家)根据现有体制的一些特点或漏洞,为追求自身利益的最大化而延伸出来的一些经济行为及过程等[10]。
值得注意的是,关于评审的现有研究是较少采用经济学研究方法的。那么,这是否表明后者并不具有合理性,抑或并没有多大意义呢?回答是否定的。在此,我们举两个例子加以说明。比如,为了提高评审质量,设计一些指标和规则,如专家甄选指标和专家分组规则等,对评审专家队伍的质量和结构加以控制,这当然是合理的。但是,作为理性人的评审专家,当他们面对现有的评审管理系统所规定的对评审专家进行评价和选择的指标与规则体系时,一般也会根据自身效用最大化原则进行行为选择。那么他们会有什么样的选择呢?这种选择又会对评审结果产生什么样的影响呢?传统的研究并没有回答这些问题。再一个例子,由于利益的驱动,一些被评审者可能会主动采取一些措施参与到评审过程中,从而影响评审过程和结果。在某些行业中,被评者甚至可能向评审专家行贿,比如,在各级政府财政支出评审中和建筑招投标评审中等,这种情况就时有发生。事实上,被评者向评审专家的行贿问题,在中国更具有普遍性,实践中也是许多管理与执法部门感到颇为棘手的问题之一。近年来纪检执法部门所曝出的一些大案要案,就较好地说明了这方面的情况。在此我们不禁要问,被评者行贿对评审专家的行为选择以及评审的整体质量到底会产生什么样的影响呢?这些问题,传统研究很难从微观机理上对此加以说明,其应对策略也缺乏相应的理论支撑。比如,陈媛在对专家进行分组时,虽然也承认“冲突(指一些敏感的亲疏关系——引者注)广泛地存在于评审专家和申报者之间”[5],但该文除了直接在指标体系中采取一些措施回避这类问题而外(但事实上许多时候这种情况是无可回避的),限于其研究方法和视角,不可能对这些问题进行微观机理分析和研究,而经济学研究方法却正好可以弥补这方面的不足。由此可见,对评审加以经济学视角的研究是非常必要的,它不但与传统的研究方法具有内在的一致性,而且具有重要的理论及现实意义。
基于上述分析,本文继续采用“评审的经济学分析”方法,研究评审专家面临评审管理系统的专家甄选指标相关激励以及被评者行贿时的行为选择问题。本文初步解释了评审专家行为选择的微观机理,指出了专家行为选择对评审专家队伍质量以及评审最终结果的影响,并列出了相应的政策建议。
记评审专家的总收入为y,休闲时间为l,假定专家是理性的个体,专家对自身行为结果的效用评价u可表示为关于收益y和闲暇l的冯·诺依曼—摩根斯坦效用函数,即:
u=U(y,l)
且
此效用函数的等值曲线形如图1中的U0、U*1和U*2等。
通常,评审组织者都建立了一套评审专家甄选指标。根据相关文献[1]-[4]的论述,对专家的甄选指标体系一般包括评审能力指标(比如科研项目数量与级别、发表论文数量与级别等)与评审绩效指标(比如评审项目参与数目、评审离散率和成功率等)两类。评审组织者主要依据这套甄选指标选择评审专家。一般情况下,指标得分越高,越有可能被选为更高级别的评审专家,或在评审系统中处于更高的地位,从而得到更多的评审收入(不只是通常所说的“评审费”)。比如,如果某专家是国内非常知名的学者,或者他通过历次评审积累起了较高的评审资历(评审绩效),那么他也许就有条件争取到更多高级别的评审机会,或在评审组织系统中取得更高的地位,如评审委员会主席职位等,这样,他就有可能在评审中就评审规则、过程等有更大的操纵能力[10],从而为自己挣得更多的收益,比如他如果申报基金项目,可能更容易获得批准;他自己发表学术论文,期刊杂志社更易接收;他推荐的学术人员和学术成果等,也更容易被接受;他在其它非评审性的学术工作中也可能利用其声誉或权力,获得更多的其它间接收入,等等。
根据上述分析,假定评审专家的评审收入y(包括与参加评审相关的各种形式的收入)主要取决于评审专家的评审绩效,而评审绩效则取决于评审专家评审工作的努力程度(用专家的评审工作的投入时间表示)以及评审能力(或学术水平等)等。令x为评审专家的评审绩效,w为专家的评审能力,h为其投入的时间量,评审绩效x表示为(假定不存在不确定性):
x=w·h
此外,为了对评审专家以有效激励,一种较为合理的支付策略是给予评审专家以与其工作绩效成一定比例关系的工作报酬,为方便理论讨论,设该比例因子为1,于是有:
y=x=w·h
设评审专家的可支配时间为l0,其劳动时间为h=l0-l,其它非评审收入为R(为简化分析,设非评审收入R不消耗专家的时间资源),则评审专家作为理性人的行为选择模型为:
其中,(1)式代表评审专家行动目标,即最大化自身的效用u。(2)式代表评审专家的秉赋约束线(其中的“y=x”假设评审专家的工作绩效即为其获得的收益),评审专家在决定工作投入时间量时,必须以这条直线为限,其收入与休闲时间组合点(y,l)一定位于此直线以下的部分,该直线如图1中通过R(及R')的斜线所示,图中斜率不同的两种直线,分别代表两种不同能力水平的评审专家。(3)式中U0为评审专家的保留效用,或称机会成本,(3)式说明,若评审专家从评审工作中获得的效用低于效用水平U0,则评审专家将放弃评审工作(因可从事其它工作,以相同的机会成本获得不低于U0的效用水平)。
此为一个标准的线性规划问题,它的解即为目标函数u与秉赋直线的切点U(y*,l*),如图1中的各实心圆点所示。
设有高低两种评审能力的评审专家,假定其保留效用曲线均为图1所示通过R点的曲线U0,其最佳效用水平分别为U*2和U*1,根据基本模型,显然有U*2>U*1。设组织者反评估指标体系规定了x1、x2、x3和x4四种不同水平的最低评审绩效要求,评审专家必须达到相应要求,否则将被系统从专家库中除名。
图1 评审专家行为选择
若反评估指标规定的最低评审绩效位于图1中x1位置,那么此时高水专家恰好可以获得其保留效用U0,而低水平专家无能力获得保留效用,故将放弃参与评审工作。
若反评估指标规定的最低评审绩效位于图1中x2位置,低水平专家刚好获得保留效用U0,并获得闲暇L2,恰好愿意参与评审。同时,因高水平专家的预算约束线比低水平专家的更为陡峭,故高水平专家较之于低水平专家获得更多的闲暇时间L'2(L'2>L2),获得的效用水平也高于其保留效用U0。此外,图1中x2>y*2>y*1,故所有专家投入的工作时间均大于其最大化效用时的水平,因此,评审绩效的规定迫使评审专家投入更多的评审劳动时间。此时,所有专家所获得的效用水平因投入过多工作时间而均未达到最佳效用水平U*i(i=1,2)。
若反评估指标规定的最低评审绩效位于图1中x3位置,因y*2>x3>y*1,故高水平专家将自觉增加投入工作时间,以获得更多的效用(达最佳效用水平),而低水平专家为了达到最低要求,将被迫增加投入评审工作的时间,在其投入评审的时间较其自身最大效用时为更多,故其获得的效用水平将低于其最佳水平。不过,因为低水平专家参与评审的效用水平超过了其保留效用水平U0,故仍愿意参与评审工作。
若反评估指标规定的最低评审绩效位于图1中x4位置,这时因y*2>y*1>x4,故高水平专家和低水平专家均会自觉增加投入工作时间,以获得更高的效用水平U*2或U*1。这时绩效水平规定由于太低而不起作用。
综上,x1为区别性指标,可以以此让低水平专家退出评审,x2为激励性指标,可以使评审专家提供更高的工作努力程度,x3仅对低水平专家有激励作用,高水平专家将自动提供超过绩效指标要求的更多的工作努力程度,x4因规定得太低所以对评审专家不起作用。
被评者为了增加通过评审的机率,往往主动采取措施加入到评审中来[10],其中,被评者向评审专家行贿时有发生,这也是现实中一些行业的评审管理者们遇到的颇为棘手的问题之一。
如前所述,反评估指标规定的最低评审绩效位于图1中x1位置时,在无行贿的情况下,高水平评审专家刚好获得保留效用,而低水平评审专家因其无能力获得保留效用,所以将退出评审。但是,现在由于行贿的存在,图1中,评审专家的保留效用没有改变,但其效用线及秉赋约束线均向上平移。L1与R'A(低水平专家的新约束线)及R'B(高水平专家的新约束线)的交点,均位于保留效用曲线U0的上方。这表明,无论高水平评审专家还是低水平评审专家,只要投入足够的劳动努力程度,其工作绩效达到x1的要求后,都可获得超过保留效用水平的效用。因此,最低指标x1将促使低水平评审专家增加劳动投入。此时,与无行贿时的情况不同,评审绩效x1将不能再作为甄别不同水平评审专家的指标。
当反评估指标规定的最低评审绩效位于图1中x2时,L2及L'2与R'A及R'B的交点,同样均位于保留效用曲线U0的上方,因此,高水平和低水平的评审专家均获得高于其原有保留效用水平的效用,同时,也均未达到其最大化效用水平(位于最佳效用水平左边),对闲暇的需求增加,劳动投入意愿,虽性质上与不存在行贿时的情况类似,程度却有所减弱,因而评审质量难有保证。
当评审绩效规定于图1中x3位置时,由于行贿引起评审专家对闲暇需求的增长,L3及L3'与R'A及R'B的交点均位于新的最佳效用水平点的左边,因此,无论是高水平评审专家还是低水平评审专家,只要达到了反评估指标的要求,他们就不再有进一步努力工作的积极性。此时,相比于不存在行贿时的情况,这里行贿降低了评审专家的劳动投入,从而降低了评审质量。
当评审绩效规定于图1中x4位置时,与x3位置类似。
我们从图1中可见,无论xi(i=1,2,3,4)处于何种水平,只要评审专家达到评审绩效的相应要求,其取得的效用均比不存在行贿更高,但是,应该明确的是,这种效用对不同水平的评审专家的作用是不一样的。为了考察行贿对不同水平评审专家劳动投入决策的影响,这里我们给出以下两个命题及其证明。
命题1 评审中行贿提高时,高水平评审专家与低水平评审专家最佳劳动投入量之间的差值不会改变。
证明:设w1<w2,因为
所以
对R求偏导数,有
而
故
命题2 评审中行贿提高时,若高水平评审专家与低水平评审专家所获得的效用水平都达到最大值,则低水平评审专家获得更多效用增量。
证明:就效用函数的最大值函数U(y*,l*)对R求偏导数,有:
设 w1<w2,因为
所以
又因为
所以
于是
证毕。
命题1和命题2说明,当评审中行贿增加且评审专家均获得各自的最大效用时,虽然高水平评审专家与低水平评审专家投入劳动量之差并没有改变,但低水平评审专家却得到更多效用增量,从心理学角度考虑,这会使高水平评审专家体验到一种不公平感,相当于相对地降低了高水平评审专家的效用水平。
总结本文的研究可见,当存在被评者行贿时,评审专家总可以从受贿中获得更高的效用,因此,若无相应的规制措施,评审专家为了获得更高的评审效用,必将接受贿赂。此外,因为行贿提高了效用,所以也使评审专家更愿意参与评审工作,评审组织者可以规定更高的绩效门槛而不失去评审专家的参与积极性。不过,所有评审专家只要达到了基本的绩效要求,进一步提供评审劳动的积极性显著降低;同时,低水平专家获得更多的效用增量,因而专家队伍面临整体素质下滑的压力。可见,行贿虽然提高了评审专家的效用,但却不利于保障评审质量,总体上是弊大于利的。
根据上述结论,我们提出以下政策建议:
第一,行贿弊大于利,故应坚决制止。
第二,在受贿人群中,因低水平专家以相同的劳动投入量之差而获得更大的效用增量,故这部分专家有更大的可能性接受贿赂,应考虑对这部分群体以更多的监督。
第三,考虑到现实中行贿受贿可能无法完全杜绝,因此规定明确的和较高的最低绩效指标水平,将有利于保证评审质量,使评审结果更趋于公平公正。
第四,如果评审过程控制较好,无行贿受贿或行贿受贿较少,那么组织者选择适当的评审绩效指标水平,就可以起到区别专家水平或激励专家投入更多评审劳动的效果。现实中不同类别的评审中,其专家甄选指标依据经验而制定不同的绩效水平规定,这与本文的研究结论是一致的。
[1]张守.建立合理的专家动态管理体系[J].中国科学基金,2000,(6):366.
[2]赵黎明,徐孝涵,张卫东.对同行评议专家的反评估分析[J]. 中国科学基金,1995,(6):62.
[3]马晓光,连燕华,沈全锋,于浩.同行评议中专家识别研究[J]. 研究与发展管理,2003,(3):70.
[4]丁雪伟,李莉.科技型中小企业技术创新基金项目评审专家信用评价体系研究[J].中国科技论坛,2009,(10):21.
[5]陈媛.科学基金项目评审与选择的决策方法研究[D].沈阳:东北大学硕士学位论文,2007.
[6]Olbrecht,M.,Bornmann,L.Panel Peer Review of Grant Applications:What do We Know from Research in Social Psychology on Judgment and Decision-Making in Groups?[J].Research Evaluation,2010,19(4):193-304.
[7]Bornmann,L.,Mutz,R.,Daniel,H.D.A Reliability-Generalization Study of Journal Peer Reviews:A Multilevel Meta-Analysis of Inter-Rater Reliability and Its Determinants[OL].PLoS ONE 5(12):e14331,doi:10,1371/journal,pone,0014331.
[8]Besselaar,P.,Leydesdorff,L.Past Performance,Peer Review and Project Selection:A Case Study in the Social and Behavioral Sciences[J].Research Evaluation,2009,18(4):273 -288.
[9]Bornmann,L.,Leydesdorff,L.,Besselaar,P.A Meta-Evaluation of Scientific Research Proposals:Different Ways of Comparing Rejected to Awarded Applications[J].Journal of Informetrics,2010,4(3):211 -220.
[10]王询.评审的经济学分析[J].财经问题研究,2009,(12).