蔡荣,夏雪轶,欧亚
(南京财经大学,江苏 南京 210003)
繁荣发展人文社会科学既是高校的社会责任,也是高校促进自身内涵发展的重要途径。2011年,教育部、财政部共同颁布了《高等学校哲学社会科学繁荣计划(2011—2020年)》,将加强哲学社会科学研究列为重点建设内容,并持续给予专项经费支持。教育部统计数据显示,2010年全国高校人文社会科学研究经费投入45.5亿元,到2018年,已经增加至113.3亿元,年均增长率12.1%,远远超过同期国民经济的增长速度。近年来,尽管高校科研项目在立项数量、资助强度上呈现逐年增加态势,但在经费使用和管理中也暴露出了不少问题,科研经费使用效率亟待提高[1]。高校不同学科的科研效率问题已成为高等教育研究领域很多学者关注的热点[2-3],人文社会科学也不例外[4-6]。如何科学地评价高校人文社会科学科研效率,优化公共资源配置、提升科研资金使用效率,已经成为当前亟待解决的重大问题。
数据包络分析(DEA)和随机前沿分析(SFA)是效率评估的两类主流方法。很多学者使用DEA对高校科研效率进行了评价,其缺陷是无法控制随机误差和异常统计对效率结果的影响[2,7-8]。SFA通过对科研投入及产出关系合理设定生产函数,能够给出技术及效率的一致估计,因而越来越受青睐[9-13]。但是,在SFA模型选择上,学者们基本都倾向于使用Battese和Coelli构建的常规效率模型,得到的效率存在低估偏误[14]。本文认为,准确评估高校科研效率既要考虑到高校间的异质性,也应区分短时效率(transient efficiency)和持久效率(persistent efficiency)。在现实中,不同高校在研究领域、治理制度、发展定位及外部环境等方面往往存有差异。按照Green的观点,考察期内高校间所有这些未随时间变化的因素统称为异质性,并且它们和效率无关[15]。然而,Kumbhakar等对此持有异议,认为有部分异质性因素也会影响效率,如各高校制定的科研管理制度、上级教育行政主管部门的干预等[16]。因此,Green模型得到的效率存在高估偏误[15]。为此,Kumbhakar等对Green模型又做了改进,能够在控制异质性的基础上区分出短时效率和持久效率,使得效率测算的精确度进一步提升[16]。
本文以江苏省48所公办本科院校为例,使用Battese和Coelli、Green和Kumbhakar等各自构建的SFA模型对高校人文社会科学科研效率进行评估和比较分析,旨在揭示不同模型间的差异及其对测算结果的影响,为今后的相关研究提供方法指导。另外,鉴于持久效率和短时效率各自蕴含着不同的政策含义,通过两者对比分析,也希望能够揭示高校科研无效率形成的潜在根源,为后续的深入研究提供方向和思路。
高校科研活动具有多投入多产出的特点,一般而言,科研投入包括研究经费支出、科研人员投入,科研产出包括课题立项、专著出版及发表论文数量[4,17-18]。为此,本文构建随机前沿距离函数:
lnDoit=α0+f(Qit,Iit)+vit
(1)
(2)
(3)
值得指出的是,以往研究在使用SFA模型评估高校科研效率时习惯于从多投入单产出关系出发构建生产函数[10,13],得到的效率值可能存在严重偏误,本文从多投入多产出关系出发构建的随机前沿距离函数尝试弥补这一不足。在效率估计上,SFA模型的步骤如下:首先,对函数f的技术参数进行估计,得到复合残差项εit=-uit+vit;接着,估计效率的条件期望值E[exp(-uit|εit)]。
针对面板数据的SFA模型在早期可以分为两大类,一类是效率随时间变化的模型,另一类是效率不随时间变化的模型。当面板数据的时间跨度较长时,效率不随时间变化的模型受到了较多质疑。Cornwell等[19]首次在面板数据中允许效率随时间变化,之后Kumbhakar[20]、Battese和Coelli[13]对这类模型发展又分别做了改进。Battese和Coelli[13]将(2)式中的uit设定为:
uit=uiG(t),G(t)=exp[γ(t-T)]
(4)
其中,ui服从在0处截断的非负半正态分布,G(t)假定效率在样本期间内只能随时间单调递减、单调递增或保持不变。很显然,如果真实的效率在样本期刊内随时间出现先增后减或先减后增的情况,使用这一方法估计效率将会由于模型误设而导致估计的不一致。并且,该模型在效率评估时也没有考虑异质性及持久效率,所有不随时间变化的因素均被归入无效率uit处理。因此,该方法得到的效率值是实际效率的下限。
为了在效率评估中控制高校异质性的影响,一些学者试图通过对样本进行相似性归类以使各组样本满足同质性[12],但分类标准如何确定存在较大争议。Green在SFA模型中首次正式纳入了异质性项,(2)式被调整为:
(5)
其中,ρi表示异质性因素。与Battese和Coelli模型相比,Green模型从无效率uit中剥离出了所有不随时间变化的因素,不仅包括与效率无关的异质性因素,也包括与效率有关的其他因素。因此,该模型得到的效率存在高估偏误,可以看成是真实效率值的上限。
为了获得更精准的效率估计值,Kumbhakar等对上述SFA模型又做了改进,(5)式被进一步调整为:
(6)
uit=ui+τit
(6.1)
其中,ui表示无效率项中不随时间变化的部分,称之为持久效率损失,τit表示无效率项中随时间变化的部分,称之为短时效率损失。因此,该模型得到的效率值介于上述两个模型之间。在对模型进行估计时,Kumbhakar等将(6)式重新表述成:
(7)
(7.1)
αi=ρi+ui-E(ui)
(7.2)
εit=vit+τit-E(τit)
(7.3)
据此,模型对效率的估计分为四步:第一步对(7)式进行参数估计,得到αi和εit预测值;第二步对(7.2)式进行随机前沿分析,得到持久效率ui;第三步对(7.3)式进行随机前沿分析,得到短时效率τit;第四步利用(6.1)式得到总效率。
上述三种SFA模型的特征差异见表1。
表1 不同模型的特征差异
江苏是我国高等教育大省,普通高校数量和在校生规模均居全国首位。近年来,江苏高等教育逐步从规模扩张、外延发展向内涵建设、质量提升转变。从高等教育大省向高等教育强省迈进,江苏高等教育的发展轨迹堪称中国高等教育的缩影。本文所使用数据全部来自教育部每年发布的《全国高校社科统计资料汇编》,选取了江苏48所公办本科院校作为实证分析的研究样本,时间跨度设定为2010—2018年。
高校科研活动是一项复杂的系统性工程。为了评估结果的有效性,参考已有研究文献[4,17],本文选择的投入指标包括科研经费投入(万元)、科研人员数量(人)。其中,科研经费投入是指当年实际支出的数量。产出指标包括三类:著作数量(本)、发表论文数量(篇)和课题立项数(项)。经统计发现,江苏省公立院校在样本期间人文社会科学研究的年均经费支出约1540万元,年均投入科研人员约530人,所产生的科研成果为:年均著作数32本、年均论文数429篇、年均课题立项434项。具体统计见表2。从中还可以发现:第一,科研经费支出、科研人员数、课题立项数在样本期间增长较快,著作数保持稳定,发表论文数有较大幅度的减少(这也印证了高校人文社会科学研究已从数量扩张向质量提升转变的轨迹);第二,投入产出指标的标准差较大,有的甚至超过了指标均值,说明江苏公立院校之间存在明显的异质性。
表2 描述性统计
表3 SFA模型检验结果
各模型得到的科研效率测算结果统计如表4所示。不考虑高校间异质性和持久效率的模型Ⅰ给出了科研效率的下限,平均水平为0.605,这与王树乔等的结论十分接近,他们利用2007—2013年江苏省29所高校面板数据分析发现,科研效率均值为0.62,整体存在较大改进空间[17]。当将样本期间内未随时间发生变化的因素全部从无效率项中剔除之后,得到的科研效率均值大幅上升,达到了0.863。不仅如此,科研效率分布的离散程度也大幅缩小。通过对模型Ⅰ、模型Ⅱ的效率测算结果进行比较,能够发现是否控制高校间异质性对分析结论具有重要影响。进一步观察表4,如果模型在控制高校间异质性的基础上进一步将样本期内未随时间变化的持久效率纳入考虑,那么得到的科研效率均值为0.645,结果介于模型Ⅰ和模型Ⅱ之间。另外,与模型Ⅱ得到的科研效率值相比,模型Ⅲ得到的科研效率值与模型Ⅰ更接近,这说明模型Ⅱ中的异质性因素与高校科研效率之间存在较大关联。模型测算结果对此也给予了证实,持久效率较低,平均水平仅为0.718,是造成科研效率整体不高的主要原因。从表4还可以发现,不同高校间的持久效率差异较大,短时效率差异较小,从而表明样本高校间的科研效率差异主要由持久效率差异所引起。
表4 科研效率测算结果统计
图1给出了科研效率的时序变化情况。可以看出,不论采用何种模型测算,科研效率在样本期内均具有较强的刚性,始终维持在初始水平附近。值得指出的是,模型Ⅰ对效率的时序变化特征给出了先验性的线性假设,可能得出错误的结论,这也是该模型饱受诟病之处之一。相比之下,模型Ⅱ、模型Ⅲ放松了这一假设,认为决策单位在不同时间的效率具有相互独立性。但是,这也可能脱离现实情况,受“干中学”效应影响,决策单位当期效率与往期效率之间往往相关。即便如此,图1中的信息也能够充分说明样本高校的科研效率并没有出现快速提升的现象。
图2进一步给出了各个模型测算的科研效率核密度分布情况。从图中可以发现:第一,模型Ⅲ得到的科研效率分布介于模型Ⅰ和模型Ⅱ之间;第二,模型Ⅲ得到的短时效率分布与模型Ⅱ得到的效率分布比较接近,因为后者在本质上测算的也是短时效率;第三,模型Ⅲ得到的持久效率分布与总效率分布较为相近,并且也与模型Ⅰ得到的效率分布接近,说明持久效率在总效率分布中起着关键作用;第四,模型Ⅲ得到的持久效率和总效率呈现“双峰”分布特征,且有着明显的左拖尾,说明样本高校科研效率存在低水平集聚现象。
接下来本文关注的问题是:不同高校的科研效率排序是否与所选择的模型有关?表5为各模型测算的科研效率Spearman秩相关系数。从中可以看出,模型Ⅰ和模型Ⅱ得到的效率相关性很低,这与前者旨在测算效率值下限、后者旨在测算效率值上限有关。类似地,短时效率和持久效率的相关性也很小。此外,模型Ⅰ和模型Ⅲ得到的效率相关系数较大,且在1%的水平显著。模型Ⅲ得到的总效率与持久效率之间的相关系数高达0.978,在1%的水平显著,再次证实持久效率分布很大程度上决定了高校科研效率分布。
表5 Spearman秩相关系数
那么,模型Ⅰ、模型Ⅱ和模型Ⅲ识别出的科研效率排名靠前(或靠后)的高校是否具有一致性呢?图3为各模型得到的科研效率分布矩阵。可以看出,三个模型识别出的科研效率排名靠前或靠后的高校均缺乏一致性。本文通过观察各模型得到的科研效率值发现,排名最靠前的高校在模型Ⅰ中依次是淮海工学院、南京大学、南京工业大学,在模型Ⅱ中依次是南京审计大学、常州大学、南通大学,在模型Ⅲ中依次为南京大学、南京农业大学、常州大学。因此,图3中的信息也进一步说明模型选择对于高校科研效率评估的重要性。
SFA方法在评估国内外各类机构的效率问题上被大量应用,近年来有越来越多的学者开始用来分析高校科研效率问题。但是,学者们使用SFA方法评估高校科研效率时,主要选择了假设条件较严格的Battese和Coelli模型,其它一些假设条件更加灵活的SFA模型却极少得到运用。针对这一现状,本文使用2010—2018年江苏48所公立本科院校样本,使用三种SFA模型对各高校人文社会科学科研效率进行了测算和比较。这三种SFA模型分别由Battese和Coelli、Green、Kumbhakar等提出,主要差异在于是否考虑决策单位间的异质性和是否考虑具有非时变特征的持久效率。通过比较发现,在使用Battese和Coelli模型时,由于错误地将高校间不可观测的异质性因素视为无效率,效率测算结果存在低估偏误;而在使用Green模型时,又会错误地将高校间所有不可观测的非时变因素视为与效率无关的异质性因素,从而造成效率测算结果存在高估偏误。相比之下,Kumbhakar等模型在控制了异质性的同时还区分了短时效率和持久效率,测算的效率值介于上述两者之间,产生偏误的风险大大降低。分析结果表明:江苏高校人文社会科学科研效率不高,平均水平为0.645,存在较大的提升空间;江苏高校人文社会科学科研效率在总体上没有表现出改善的迹象,呈现较强的刚性特征;另外,与短时效率相比,持久效率较低,说明后者是江苏高校人文社会科学研究整体效率不高的主要原因。
参考上述研究结论,本文主要得到如下两点启示:
第一,谨慎选择恰当的SFA模型评估高校科研效率。与DEA方法相比,SFA方法的劣势在于面临模型误设风险,故采用更灵活的假设是应用SFA方法的发展方向。在众多SFA方法中,尽管Battese和Coelli模型在很多领域得到了广泛运用,但正如边文龙和王向楠所指出的,该模型的假设条件过于严格,很容易因模型误设导致估计的不一致,在实证研究中应谨慎选择使用[21]。Green模型在理论上较以往有了较大改进,但在具体估计时可能面临“维度诅咒”的难题,并且在样本N较大、T较短的情况下,得到的效率值也会存在较大偏误。从某种程度上讲,Kumbhakar等模型规避了上述模型的不足之处,不仅使得测算的效率值更准确,而且通过对效率项的分解能够揭示更具针对性的效率提升方向。因此,建议在今后的研究中使用该模型估计效率。
第二,提升高校人文社会科学科研效率需要加强顶层设计。本文分析结果显示,江苏高校人文社会科学研究的持久效率较低,平均水平不足0.72,且不同高校之间的差异较为明显。这就意味着,从提升科研效率出发,必须加强顶层制度设计,从而切实改善持久效率水平。那么,应该从何处入手加强顶层制度设计呢?本文认为,有两方面的因素会影响高校科研持久效率。一类因素不受高校自身控制,主要是由高等教育行政主管部门决定;另一类因素受学校自身控制,主要是各高校自主制定的科研管理制度。对于前者,各级教育行政主管部门应该深化改革人文社会科学研究项目评审、人才评价及机构评估等各类制度,给出科研评价可操作细化规范,营造良好的科研环境。对于后者,各高校应努力改善科研环境和氛围,健全优化科研管理体制机制,加强科研团队建设和人才培养,切实提升科研人员实力。