公共项目绩效评价中“弃卒”能否“保车”

2019-01-14 02:52李雯雯

高教探索 2019年12期

李雯雯

摘要：广受全国各界关注的学科评估作为公共项目实施绩效的一种周期性评价，大量高校采取了“弃卒保车”的迎评策略，即安排本校相对弱势学科放弃参评，将其学科建设中的人力、物力资源打包到其他学科中参评或者直接通过撤销该学科的方式来力图获得以A类学科为代表的“亮眼”绩效。这种“弃卒保车”策略是否真的能提升所在高校的评估结果？本文通过对第四次学科评估中“985高校”的数据进行检验，发现学科弃评策略对“亮眼”绩效不仅没有提升，反而有显著的负效果，最终“赔了夫人又折兵”;而学科撤销策略则微弱地提高了“亮眼”绩效。针对这种情况，我们以即将到来的第五次学科评估为典型代表，对公共项目绩效评价提出建议。

关键词：公共项目;绩效评价;学科评估

一、引言

在一个社会主义大国的转型过程中，政府的宏观调控是中国奇迹的关键“源动力”，这种源动力生产作用的机制就在于政府财政支持的公共项目，比如“西部大开发”、“振兴东北”等经济振兴项目;“精准扶贫”、“退耕还林工程”等社会发展项目;“211工程”、“985工程”、“双一流建设”等教育振兴项目。各类公共项目之所以能够达到或者超出预期的效果，很大程度上緣于科学的绩效评价和监控问责，能够及时地了解公共项目实施情况，保证公共财政资金受托责任的履行。通过评价干预，保证公共项目实现人民所委托的目标。

绩效评价和监控问责作为科学的纠偏工具，在最大程度上实现了项目全过程中的“后置约束”，但尽管如此，仍有大量的“改善人类生活的项目”失败了，其失败原因各有不同，但其中一个重要的诱因就是在绩效评价和监控问责中存在着博弈问题。一般而言，一个项目如果在绩效评价中有一些“亮眼”点，上级部门往往就不再追究未做好的方面，甚至还公开鼓励那些做的好的地方。而另一部分公共项目正是在这些刻意营造的“亮眼”绩效的影响下，意图将“晕轮效应”发挥到最大，但结果却往往并不尽如人意。有些公共项目在评估过程中将“卒”抛弃也未能保住“车”，不但没能遮丑，反而“竹篮打水一场空”。在这场博弈中，无论“弃卒”能否“保车”，这种做法都便利了公共项目的承担者，但大大违背了公共财政经费设置的目标，损害了国家利益。若每一个公共项目都刻意以“一白遮百丑”的方式应付绩效评价，最终所有项目的积累便会产生系统性问题，引致国家治理的体系性失败。为此我们就需要去侦测现实中的“迎评策略”，不被“亮眼”绩效蒙蔽了双眼，找出看似华丽的结果后面的不足，为我国公共项目的整体性提升找到解决办法。

学科评估结果实际上就是公共项目实施绩效的一种周期性评价。以2017年结束的教育部第四次学科评估为例，其属于教育部学位与研究生教育发展中心对2011-2015年间各校年度教育经费使用情况的绩效评估。学科评估工作在显著促进我国高等教育事业发展的同时，其背后也隐藏着危机和隐患，即作为公共财政在学科建设上的检验评价，第四轮学科评估中存在着所谓的“迎评策略”。学科评估前各校大规模撤销已有的学科，意图通过撤销某些相对“弱势”的学科换来评估结果的优异。比如浙江大学共撤销了34个学科，北京理工大学撤销了20个学科，华中科技大学撤销了16个学科。除了主动撤销学科，各个学校还广泛采用了“拆东墙补西墙”的方式，故意系统性的不让某些学科参与评估，却将这些学科对应的资源（人员、经费、设备、实验与办公场所等等）分摊、组合到其他学科上去以人为制造“亮眼”绩效。考虑到各校的学科发展经费主要来源于公共财政经费，同时考虑到第四次学科评估是对“985工程”和“211工程”实施情况的一种评估，故而本文以第四次学科评估为研究对象，探索高校的“弃卒保车”策略是否达到了预期效果，进而探讨公共项目绩效评价中这种策略的形成原因，并对即将到来的第五次学科评估工作提出合理建议。

二、文献述评

通过搜索CNKI和SSCI的相关文献，发现国内外对于公共项目评估的研究主要聚焦在公共项目绩效评价的规范性、有效性以及局限性等方面。一部分学者意图运用科学方法对某项具体的公共项目进行测评，Zong（2019）用泰尔指数法测评了我国“985计划”对“985大学”的出版产出的积极影响[1];马辉（2007）提出了“过程—内容分解法（Process-Content Breakdown）+Delphi法”的指标体系两阶段构建方法[2];胡芳提出基于熵权法及多准则妥协解排序法（KIKOR）来综合决策者的偏好，从而进行有效的风险评估[3]。

围绕公共项目绩效评估的有效性，Liu（2018）研究发现，国内外研究均发现公共基础设施项目中基于公私合作的PPP（Public—Private Partnership）模式可以有效地提高公共项目建设和评估效率，Liu（2018）进一步的研究表明，正确选择评级指标对建设高效政府、提高公共项目绩效有积极意义[4]。

在对公共项目绩效评价管理漏洞的探究中，尚虎平（2012）认为我国公共财政资助的公共项目存在“边际效率递减”和“低效、无效与挥霍”的问题[5];Zong（2019）认为“985高校”项目的实施使得高校开始出现同质化趋势。Zhang（2019）探讨了公共服务项目中的参与式工具——基于网络的规划支持系统（PSS），反思了我国目前计算机知识水平低、互联网接入有限以及公众参与国家事务的传统欠缺[6]。

这些研究试图从评估方法的规范、评估效率的提高、评估漏洞的洞察等方面厘清我国公共项目绩效评价的图景，洞悉其中的诸多问题，是难能可贵的“苦口良药”，但是很少有研究将目光聚焦在公共项目绩效评估的迎评策略上，事实上，公共项目评估的结果势必与公共财政资金的流向、国家扶持政策的倾斜紧密相关，因此被评估对象所采用的迎评策略恰恰是影响公共项目评价准确性、公正性和客观性的关键因素，因此这是一个不能被忽视的领域。鉴于这种情况，本文力图从学科评估这种典型的公共项目绩效评价入手，探讨在评价过程中的迎评策略来弥补目前学界的这种不足，以实证的眼光打破利益的桎梏，科学地把握公共项目绩效评价的内在规律。

三、研究设计

本文的研究目標是厘清我国“弃卒保车”式公共项目绩效评价在实施过程中的实际效果、因果机制和突破路径等问题，并以此为方向对即将开展的第五次学科评估提出合理建议。鉴于我国公共项目种类繁多，我们以最近的一次学科评估为代表对其进行研究。

（一）样本框来源

公共项目作为实现公共利益、推进国家建设的基础性活动，在社会经济发展中发挥着至关重要的作用。国家的公共事务常依托公共项目展开，因此对公共项目的评估过程也是测量国家公共事务实施效度的过程。“985工程”“211工程”等高等教育领域的公共项目是我国在助力现代化发展道路上的有力探索，对我国教育事业的发展所起到的作用是相当深远的。尤其是被冠以“985”的高校，代表了我国最先迈向世界一流大学的第一梯队。第四次学科评估具有覆盖面积广、参评比例高、评估结果按“ABC分档”呈现的特点，本文中所重点分析的“亮眼”绩效都与A类学科相关，在这部分高校中，本身具备较强综合实力和学科实力的“985高校”占据了“亮眼”绩效的绝大多数，鉴于此，本文截取“985高校”作为分析的横截面。需要说明的是，得到A类评估结果的学科不只局限于“985高校”，部分“211高校”和其他高校也占据了少部分比例，这可能导致我们的研究存在一定的系统性偏误（Bias），但从我国目前对公共项目绩效评价的现状出发，相比于缺乏数据资料支撑的研究，有数据资料支撑的实证研究也符合“渐进真理”的做法。另外，本研究的这些不足，也在一定程度上是未来进一步研究的新的逻辑起点。

（二）数据搜集

本研究的目标是以学科评估为例，厘清我国在公共项目绩效评价程序中存在的“弃卒保车”问题。为了搜集到更加全面、准确的资料，本研究采取了以下方式来获得第四次学科评估的撤销数和弃评数的学科数据。

（1）学科撤销数数据查询方法

通过在线查阅官方公示材料，获得可信可靠的撤销学科的数据。比如2016年10月19日国务院学位委员会正式公布的《关于下达2016年动态调整撤销和增列的学位授权点名单的通知》，查询到共有25个省份的175所高校大幅撤销576个学位点，包括大量博士学位授权点。此外，共有25个省份的178所高校增列了366个学位点。从中摘取出“985高校”在撤销学科方面的数据，得到35所“985高校”中有22所在此次调整中进行了撤销学位点的调整，撤销总计数目达到193个，即12.5%的高校占据了此次撤销学科总数的33.5%。

（2）学科弃评数数据搜集方法

查询弃评学科数据的方法与查询撤销学科数据的方法不太一样。我们将弃评数定义为：弃评数=一级学科数-参评学科数，问题就此转化为查询各高校的一级学科数与参评学科数。首先通过在线比对查询，登陆中国学位与研究生教育信息网，以高校为单位查询到第四次学科评估的结果，与各个高校官网在学科简介、招生简章等中所列出的学科做出比对，得到各个高校在学科评估中一级学科数和参评学科数。第二，在“百度”搜索引擎中检索网络数据，与第一步所查询到的数据进行反复比对。相比而言，百度搜索的数据来源更多，可以很好地弥补单一途径比对的局限性。

（3）A类学科数数据查询方法

与上述方法雷同，我们通过中国学位与研究生教育信息网公布的结果，可以准确地查询到在第四次学科评估中各个“985高校”获得A类学科的准确信息。以北京大学为例，我们根据官网公布的结果，在理、工、农、医等7大类95个一级学科中查到北京大学共有A类学科35个。其他“985高校”我们也采取了这种简单但非常准确的方式获取A类学科数数据。

（三）技术路线

随着国家对教育的日益重视，教育经费投入也逐渐加大。2016年财政性教育经费投入首超3万亿元，比上年增长7.36%，体现了国家实施科教兴国战略的坚定信念，为教育事业发展铸就稳固的物质基础。不断增长的公共资金投入固然是高等教育事业发展的前提条件，但这些承担全面委托责任的资金需要通过公共项目的实施来达到提高教育质量的目的，需要及时的绩效评估来衡量效果并且根据评估结果来确定下一阶段的发展目标和分配下一阶段的教育经费。尽管第四次学科评估相比于前三次，已经采用了分级分档而不是分数排名的方式，旨在避免因分数和排名而引起的无序竞争，这种以提升学科水平为初衷的战略指向是非常值得称道的。有了正确的风向标，就应该将考察评估的重点放在评估过程中。众所周知，尽管没有具体的分数和令人敏感的排名，但与A相关的学科档次依然是各学科建设无可争议的领头羊，学科建设中A档次划分越多，随之而来的，各高校能够得到的财政资金的扶持力度也就越大，同时高校的名气就越大，有更多的发言权和社会影响力。一系列的利好优势使得各高校在评估的过程中采取不同的应对策略以期得到更多的“亮眼”绩效。除了全面迎评，还有高校采用策略性迎评的方式，除了根据国务院学位委员会《关于下达2016年动态调整撤销和增列的学位授权点名单的通知》来撤销和增列相关学科以外（从数据看，撤销的多，增列的少），还有采用弃评和打包参评的方式，让重点学科“集万千宠爱于一身”，尽可能汇集多的人、财、物等优势，以期在学科评估中得到好的成绩。一般来说，全面迎评的方式比较客观、真实地反映了当下高校各个学科建设的水平，通过学科评估的结果制定下一阶段的发展战略，这样我国学科建设可以进入“资金受托—学科建设—科学评估—提高绩效”的良性循环。但如果采用策略性评估，从考察国家高等教育经费的使用效果角度，则达不到相应的效果，属于系统性失误。如图1所示。

综上，本研究的技术路线依次为：大学类型选择→考评结果数据收集→数据整理→整合统计分析→统计结果呈现→弃卒保车因果机制探析→公共项目绩效评价政策建议。

四、“弃卒保车”式绩效评价统计结果

（一）统计检验方法确定

本研究意图厘清高校在学科评估中对本校学科的撤销和弃评等做法是否对学科的A类学科数目有显著的影响，并进一步探究这种影响是正向的还是负向的。按统计学上的传统做法，多元回归是确定影响因素的常用方式。但当研究的统计样本数量没有丰富到能够确定总体样本的分布情况时，往往会产生“伪回归”的问题。因此我们选择更为直观的测量相关系数的方法来汇报统计结果，用以反映变量之间相关关系的密切程度。统计学三大相关系数有皮尔森相关系数（Pearsoncorrelationcoefficient）、斯皮尔曼相关系数（Spearman Rank Correlation）和肯德尔相关系数（Kendllstau-b Rank Correlation），由于我们抽取的数据存在出现异常值的可能性（部分高校在撤销学科上的数据可能为0），同时未必符合总体正态分布的情况，总体上数据形态符合斯皮尔曼相关系数的要求。

（二）统计结果及研究结论

本研究的目标是通过斯皮尔曼相关系数法，利用高校学科弃评数、撤销数等指标分别计算出其对A类亮眼绩效的影响，在此基础上探索以学科评估为典型代表的我国公共项目绩效评价的现状和问题，对即将到来的第五次学科评估提出合理建议。

（1）统计数据整合

通过前文提到的数据搜集的方法，我们梳理了全国“985高校”学科撤销数、弃评数和A类学科数，如表1所示。

（2）按照上文所述的技术路线，我们最终确定了学科撤销数与A类学科数、学科弃评数与A类学科数之间的对应数据。虽然从绝对意义上说，39个数据属于小-N研究模式，但从统计学规律而言，超过30个要素的样本就开始呈现正态分布属性，逐渐会表现出一定的规律性，因此，我们的统计结论也具有一定的规律性。我们将统计检验结果总结为表2与表3。

表2 A类学科数与学科弃评数的斯皮尔曼相关系数

表3 A类学科数与学科撤销数的斯皮尔曼相关系数

从表2可以看出，A类学科与学科弃评数的相关系数显著为负（p=0.01），且其值竟然达到了-4.28，这显示了其“副作用”还非常大。也就是说，虽然这些高校企图通过将某些“见不得人”的学科隐藏，秘不示人，采用放弃评估的做法，以保证本校A类学科的数量，但是从统计检验结果看，并没有实现高校“弃卒保车”的愿望，两者之间呈现出显著的负相关，可以说是“赔了夫人又折兵”。

从表3可以看出，A类学科数与学科撤销数之间存在正相关关系，就是说高校在学科评估中对学科的撤销促进了A类学科数的提升，但是这种提升和促进是微弱的，在统计学意义上并不显著。

（三）原因分析

第一，在学科评估中，高校的弃评策略是指将某些相对弱势学科的资源拆分，集合到其他学科中，意图临时打造出强势学科参与评定，例如，因为电子信息工程专业中集合了很多物理学的学科知识，如果高校通过权衡发现该专业的实力不足以取得A的成绩而将该专业的师资力量、实验设备、论文发表情况等拆分到本校相对强势的物理学科中，那么该高校就以牺牲电子专业为代价，意图提高物理学专业在评估中的实力来取得“亮眼”绩效。诸如此类的迎评策略从表层逻辑上看是合理的，可以使得参评的硕士或博士一级学科“人多力量大”，增加夺A的概率，但事实上，在第四轮学科评估的关键环节——权重确定上，学位中心邀请专家近9000名（每个参评学科至少一位专家），根据权重设置原则给出建议权重，继而通过求平均得到各个学科的最终权重。也就是说，评估的最终结果是求平均值而不是做加法。但从高校角度看，被拆分的学科往往是高校目前学科评估中实力相对较弱或者还在成长中的学科，其人力、物力被拆分后划拨到别的学科中，弱势学科中的弱势资源反而拉低了平均值，造成了1+1<1的局面。

第二，除了弃评，很多高校也将撤销学科作为另外一种迎评策略。根据2016年10月国务院学位委员会发布的《关于下达2016年动态调整撤销和增列的学位授权点名单的通知》，全国高校开展了大范围的学科调整。单就撤销学科而言，无论是数量还是学科层级，范围之广、力度之大都引发了外界关注。而高校之所以有动力进行学科调整，原因之一在于学科评估中有硕士一级或博士一级、二级的都要参评，砍掉这些薄弱和老旧学科，能使数据“好看”，使绩效“亮眼”，属于迎评策略中的“有心”之举;之二是被撤销的这些学位点大多是与学校学科发展整体规划不符，或者是因为人才培养绩效偏低，比如第一志愿报考学生少、调剂生源不足、导师责任心不强、导师科研经费少、學生研究成绩（专利成果、发表论文等）弱、就业质量差等等，撤销这类学科有利于本校的未来发展规划，这类撤销对学科评估造成的影响属于“无意”之举。无论是有心还是无意，撤销学科之举都有各高校对本校学科群通盘规划的意图。自从学科点取消“终身制”后，高校在对自身学科评估的全盘布局上态度更加慎重，规划更加合理，因此对学科评估的结果起到了一部分的推动作用。

五、启示与突破之路

就我们的研究结果来看，在第四次学科评估中，“985高校”普遍采用“弃卒保车”迎评策略意图打造更为亮眼的绩效，但实证研究证明，弃评学科这种不适当的迎评策略对学科评估结果造成了显著的负效果;撤销学科虽然优化了学科整体结构，但对获取亮眼绩效也是收效甚微。作为典型的公共项目评估案例，高校学科评估中常见的迎评策略对公共项目绩效评价形成了几点启示。

启示一：以“数字指标”替换“真实绩效”，警惕评估中发生目标转换

作为典型的国家公共项目，第四次学科评估中评估指标的确立成为评估工作的重中之重，学位中心采用专家法和德尔斐法相结合的方法，遵循严格的程序确定指标权重。各高校通过学位中心提供的指标汇报本校在学科建设上取得的成就，因此各高校参评的过程也是数据不断生成、上报的过程。为了赢得更为亮眼的绩效，放弃和撤销某些学科就成为了很多高校屡试不爽的方法，原本“服务大局、服务高校、服务社会”的目标就转换为数据的比拼，甚至转换为虚假数据的比拼。激励理论认为，绩效评估中代理人（下级）迫于政绩压力和组织资源稀缺的束缚，在执行过程中容易将有限的资源聚焦于能够“彰显政绩”的面子工程而忽略了绩效考核的初衷。美国学者西奥多·H·波伊斯特认为，目标转换现象常常发生在公共项目的绩效评估工作中。一种情况是，不平衡的一套指标可能会不适当地关注一些绩效标准而导致对其他指标的损害。当管理者和雇员努力在某些并非最优的指标上表现却忽视了其他更为重要的目标时（因为考评指标不反映这些目标），就会出现目标转换现象从而导致整体绩效受到影响。在另一种情况下，绩效标准或激励没有被很好地具体化，使得某些被评估对象在指标上“看起来好看”，而并没有真正达到目标。[7]正是因为在目标转换发生之后，往往会“如愿”出现“亮眼”的绩效评估结果，公共财政资源继而发生倾斜和错位的配置，因此在公共项目评估过程中对于目标转换情形要多加防范，建设性地使用考评系统，引导被评估对象减少不必要的迎评策略，甚至是故意为之的欺骗行为。

启示二：是良性竞争还是信息失真？降低博弈中信息失真概率

在第四次学科评估过程中，A类学科成为“985高校”追求的目标，获得这些优质学科的评估结果犹如摘取了学科评估中的“荣誉之果”，获得国家更多政策上的重视和财政上的支持也是水到渠成，因此在“自愿申请、免费参评”的原则下，处于全国第一梯队的“985高校”纷纷采取了弃评或撤销学科等策略性行为来与评估者进行博弈，以期获得更为满意的绩效结果。但在这种博弈情形下，数据的失真会产生绩效损失现象。在实际操作层面，绩效损失是不可避免的，但如果人为的、大规模的数据失真则会放大绩效损失，引起测评的系统性问题和项目的整体性、系统性失败。我们将这一理论扩展到公共项目绩效评价层面，就需要在评估中尽量还原信息所表达的真实含义，避免大规模和有意为之的信息失真，降低评估者与被评估者的不良博弈行为概率。在绩效评价工作中，“亮眼”的绩效是被评估对象获得激励、公共项目负责人员（官员）获得肯定（晋升）的有力筹码，如果策略性应对可以改善公共项目的绩效，那么这种“策略”很快就会成为被评估者争相效仿的模式，甚至如果人为的弄虚作假可以显著提高“亮眼”绩效的概率而评估系统中恰好缺失了绩效评估后置的监督和制裁措施，那么弄虚作假就会成为千方百计获得“亮眼”绩效的不良策略，成为一种以信息失真为特点的伪参评模式。即使个别主体实事求是也改变不了现状的时候，组织成员就会随波逐流，心安理得地弄虚作假。[8]因此提高信息和数据的真实程度是改善这种博弈现象的关键。

启示三：看“显绩”更看“潜绩”，重视公共项目内涵式提升

2005年1月，时任浙江省委书记的习近平同志在《浙江日报》头版“之江新语”栏目以“哲欣”为笔名发表了《“潜绩”与“显绩”》一文，辩证地论述了政府工作中潜绩与显绩的关系：“‘潜与‘显是对立统一的一对矛盾。‘潜是‘显的基础，‘显是‘潜的结果。”学科评估结果中以A类学科为代表的“亮眼”绩效显然属于“985高校”偏好的显绩，但“实现高等教育内涵式发展”则要求高校不能仅仅追逐排行榜的名次和“亮眼”的一级学科数目，更要结合地方特色和高校优势，开发潜绩指标，为地方经济社会发展服务，实现高校内涵式发展。因此，我们将其推广到广义上的公共评估项目，既要评估其显绩，让优秀的显绩继续发扬光大，同时也要厘清公共项目潜绩的核心维度，构建一套针对公共项目潜绩的评估指标体系，用以衡量公共项目发展的可持续性。

这些启示可以说是我国在公共项目绩效评价中的通病，如何冲破桎梏根除痼疾，我们认为可以从以下路径来尝试突破。

路径1：树立真实的评估观。如郑方辉教授所言，公共项目绩效评价本质上是一种价值判断，是关于公共项目评估的价值观，它直接影响了政府行政行为的价值导向，直接决定了政府行政行为的利益指向。不搞清楚政府公共项目的评估取向，就很难把握在评估过程中存在的问题，进一步来说就难以避免在公共项目评估过程中的“拆东墙补西墙”、“一白遮百丑”、“弃卒保车”等弊端的泛滥。改革开放以来，我国政府绩效评估经历了从唯GDP—偏重GDP—突破唯GDP的科学发展之路，这种政府的绩效观转型事实上是非常成功的，就此而言，我们需要做的就是保持当前的趋势，走科学的绩效评估道路，同时在公共项目绩效评价的顶层设计上树立真实的评估观。所谓真实的评估观，就是在绩效评估前端树立诚信的参评原则，从源头上杜绝有策略的迎评现象。第四次学科评估中部分高校以弃评的方式将“非优势学科”放弃或者拆分、融合到优势学科中，或许可以形成更为强大的参评力，但这样一来，一方面曲解了教育部对于学科评估的初衷，另一方面对使用真实数据全面参评的高校造成不公平竞争的态势，扰乱了国内学科建设公平竞争的环境。针对这一态势，建议国内第五次学科评估设立高校学科的最低参评率，确保全面参评和公平竞争。同时改自愿参评为全面参评，拥有一级学科博士点的學科必须参评。我国进行的第四次学科评估与以往历次学科评估一样，坚持“自愿申请、免费参评”原则，各单位具有博士或硕士学位授予权的一级学科（含一级学科和二级学科授权），均可申请参评。这一原则本意在强调高校的参评自主权，但若部分高校将自愿参评的原则误解成了策略参评和优势学科参评，则曲解了国家将学科评估打造成为“中国特色、世界影响”的特色品牌的期待。只有在学科评估的前端树立真实的参评原则，对社会而言，才能展现出真实和具有参考价值的学科评估结果，对高校而言，才能将注意力真正投入到学科建设中。

路径2：让数据仅仅成为解释结果的来源之一，关注数据背后的“故事”，从根源上解决被评估对象目标转换的问题。公共项目绩效评价趋于完善的过程一定意义上就是对数据处理的有效性逐渐增强的过程。绩效评价中的目标转换之所以会发生，就是因为数据作为绩效信息的来源之外还承担了额外的“任务”。在我国第五次学科评估工作中，要正确对待高校学科建设的数据和指标，更要注重高校自身建设及学科内涵式发展，尽可能淡化以排名为导向的学科建设。毋庸置疑，“985”、“211”等这些集全国之力推动的教育项目为实现“两个一百年”奋斗目标和中华民族伟大复兴的中国梦提供了有力支撑，但同时，高校的发展和学科实力的提升并非一朝一夕之功，更非几次学科评估就可以轻易下定论，因此在解释学科评估结果时，突破数据和指标的桎梏，结合高校实际情况和背景环境，创设更为人性化的排序方式。目前评估中，部分高校为了赢得“亮眼”的绩效，将优势学科打包参评，非优势学科放弃参评，无形中形成了“优势学科建设是加法式增长而非内涵式增长”的错误逻辑，这种发展逻辑的危害在于对国内的一流高校的学科建设形成了不良导向和错误风气。事实上，对公共项目绩效评价来说，其涉及的项目广泛、种类繁多，用于评估的指标和数据应该仅仅是单纯描述性的，结果也只是项目绩效一个表层的图景描述，在解释项目评价结果时，应该本着“一把钥匙开一把锁”的原则，结合公共项目更为实际和全面的背景环境，将现阶段数据所背负的不必要的意义从绩效评价中剥离出去，这样被评估者目标转换就失去了动力。

路径3：预见和避免可能出现的评估双方博弈的问题。在西方绩效评估研究中，博弈被界定为“能从激励契约中获取最大收益同时没有实际改进绩效的行动”，或“刻意包装，甚至赤裸裸地捏造数据，旨在提高个人或组织的地位”。[9]波伊斯特认为矫正博弈现象需要定义可以平衡任何被引发的潜在副作用的附加指标，使得管理者更好地留意这种警告。公共项目绩效评价中的每一个环节都可能存在评估者与被评估者之间的博弈，提高绩效评价的公信力就是要建设性地应用考评系统，正确监控考评系统中指标的运用，让每一个环节中的双方博弈不以弄虚作假的方式展开。教育部实施的第四次学科评估本意是对高校学科发展和建设情况进行评价进而能够对人力物力进行更优质的资源分配，但众所周知，在学科评估中获得优异的成绩不但是国家对高校学科建设的认可和肯定，同时更是教育部在分配优质教育资源时的“宠儿”，这无形中就捆绑了很多利益因素。从政府的角度，优质教育资源被“捆绑”的过程也是政府有关部门被高校“俘获”的过程，被“俘获”之后的政府在进行“利益的权威性分配”时明显向“俘获者”倾斜。因此在未来第五次学科评估中需要进一步保证参评数据的完整性和有效性，在真实、科学的数据基础上尽可能地减少双方博弈产生的绩效损失，以使优质的教育资源公平地倾斜，增强我国在科教兴国战略上的硬实力。我们将这一思路扩展到我国公共项目评估领域，就是要预见和避免参评对象在公共项目绩效评价中出现的非正当博弈现象，以科学的评估观为指导，促进评估每一个环节都以公平公正公开的方式展开。

路径4：探索构建公共项目的潜绩评估指标体系。公共项目承担着我国公共财政资金的受托责任，在评估上不仅要体现出财政资金投入的直接效果即显绩，更要以公共财政资金投入的目的性为导向，评估出那些真正让群众（师生）有获得感的潜绩。尽管我国一直在强调高校内涵式发展，但排名、数据和等级等这类硬性的指标依然是高校追逐的目标，在硬性指标的压力下，科研实力强劲的综合性大学更能在竞争中拔得头筹，“小而精”的学院或者特色鲜明的行业型院校则相形见绌，这不利于我国教育领域整体潜绩的提升。因此注重高校的内涵式发展，提升我国教育整体潜绩，就要开发出更多测量潜绩的科学指标，在下一次学科评估中尝试使用。建立测量潜绩的评估指标体系不仅仅应用在高校学科评估上，在我国其他各类公共项目评估中同样有用武之地。面对我国纷繁复杂的各类公共项目评估工作，我们建议以厘清评估价值导向—构建指标池—筛选指标—实证评估为思路，进行公共项目潜绩评估指标的开发，在初步取得效果后尝试将潜绩评估指标体系以规范化、法制化的形式固定下来，在各类公共项目评估的实践中形成组织“惯例”和重视潜绩的行政文化，促进我国公共项目评估的正向发展。

六、研究不足与展望

改革开放以来，我国政府不断追求更科学的评估方式、更高效的评估机制，但由于我国公共项目绩效评价起步晚，同时在制度惯性的影响下，还存在一些问题。本文尝试性、探索性地以第四次学科评估中“985高校”的数据为源头，实证性地分析了高校“弃卒保车”的迎评方式，我们认为目前代表我国教育水平最高级别的“985高校”存在不适当的迎评策略，一方面扰乱了学科评估的真实性，另一方面“弃卒”也没能“保车”。本文在逻辑思路和实证方法上具备科学性，但同时也存在以下问题：第一，截止到2018年3月30日的教育部数据，我国共有普通高等学校2595所（含独立院校266所），我们所涉及的“985高校”虽然具备典型性，但是在实证研究角度上，数据的完备性不足。第二，第四次学科评估是我国教育部学位与研究生教育发展中心以第三方方式展开的非行政性、服务型的公共评估项目，是否能够完全代表我国公共项目绩效评价的发展趋势存在进一步讨论的空间。总的来说，本研究力图通过一定的数据资料来弥补和触及国内对学科评估、对公共项目绩效评价存在问题的不足，尽量以客观的数据资料作为工具来厘清我国公共项目绩效评价的问题，但这种探索性的研究依然留下了大量的空隙需要进一步的研究来弥补，需要更广泛的数据、更富于解释力的研究来解决前述的问题。

参考文献：

[1]Zong XH，Zhang W.Establishing world-class universities in China：deploying a quasi-experimental design to evaluate the net effects of Project 985[J].Studies In Higher Education，2019（44）：417-431.

[2]馬辉，杜亚灵，王雪青.公共项目管理绩效过程评价指标体系的构建[J].软科学，2008（7）：49-53.

[3]胡芳，刘志华，李树丞.基于熵权法和VIKOR法的公共工程项目风险评价研究[J].湖南大学学报（自然科学版），2012（4）：83-86.

[4]Liu B ，Shen JQ ，Meng ZJ ，Sun FH.A Survey on the Establishment and Application of Social Capital Partner Selection System for the New Profit PPP Project[J].Ksce Journal Of Civil Engineering，2018（22）：3726-3737.

[5]尚虎平，叶杰，赵盼盼.我国科学研究中的公共财政效率：低效与浪费——来自国家自然科学基金、社会科学基金项目产出的证据[J]，科学学研究，2012（10）：1476-1486.

[6]Zhang L，Geertman S，Hooimeijer P，Lin YL.The usefulness of a Web-based Participatory Planning Support System in Wuhan，China[J].Computers Environment and Urban Systems，2019（3），208-217.

[7]西奥多·H·波伊斯特.公共部门绩效评估[M].北京：中国人民大学出版社，2016：208.

[8]徐艳晴，周志忍.地方政府绩效评估中博弈行为的致因研究——分析框架及其初步检视[J].上海行政学院学报，2015（4）：15.

[9]徐艳晴，周志忍.公民满意度数据失真现象考察：信任赤字、博弈策略、理论意涵[J].公共行政评论，2014（6）：60.

（责任编辑刘第红）