陈小锋,毛羽,苏延森
(1.华中科技大学公共管理学院,湖北武汉 430074;2.安徽大学计算机科学与技术学院,安徽合肥 230601)
·中部崛起与湖北发展·省情调研
高校政府投入科研项目绩效评价指标间关系研究
——以湖北省高校为例
陈小锋1,毛羽1,苏延森2
(1.华中科技大学公共管理学院,湖北武汉 430074;2.安徽大学计算机科学与技术学院,安徽合肥 230601)
科研项目绩效评价指标间存在复杂的相互作用关系。当前,国家正在进行科技体制改革,各高校也正积极调整适应新的科技管理体制。在日常科研管理过程中,政府对高校科研项目所投入经费越高,那么高校所产生的科研论文数量越多,被SCI等收录的文章也越多。上述现象说明在政府投入科研项目的相关指标间可能存在复杂的联系。研究指标间的相互关系有助于分析高校的科研实力、科研投入、科研产出水平等方面的变化趋势,为高校科研管理人员合理决策,提高管理水平提供参考。
科研项目;评价指标;指标间关系;湖北省高等院校
目前,科研相关的绩效评价的研究很多。笔者认为,研究一类主要集中在如何构建合理指标体系。例如杨莲芬等构建的浙江省高校科研项目绩效评价指标体系,[1](p33-35)李筱林等构建的高校科技投入的绩效评价体系,[2](p199-202)谢福泉等构建的财政科技投入绩效评估体系等。[3](p25-27)另一类主要是采用不同的方法进行绩效评价。例如陆根书等运用DEA方法对教育部直属高校的科研效率进行了评价,[4](p75-79)孙海华等综合运用群组层次分析法和TOPSIS法提出了一种提升科研绩效的方法,[5](p5-8)杨莲芬等运用AHP层次分析法和熵权法对浙江省高校科研项目绩效评价指标进行赋权等。[1]但对指标间的相互关系的研究比较少。科研工作是一个复杂的系统工作,科研项目绩效评价指标不会相互独立存在的,我们有必要研究相关绩效评价指标间的相互关系。
建立指标间关系的方法大多基于典型相关分析、相关性度量方法等。[6](p1-10)典型相关分析是先将多变量转化为几个典型变量,再通过其间的典型相关系数来描述变量间关系的统计学方法。其要求,两组变量均是连续变量,数据为多元正态分布。相关性度量方法则不要求变量数据的连续性及分布特征。常见的相关性度量方法包括:皮尔逊相关性系数、斯皮尔曼相关性系数和互信息值。[7](p257-259)皮尔逊相关性系数用于测量两变量之间的线性相关,斯皮尔曼相关性系数表示的是两个变量之间的等级相关(单调相关)。然而变量间的相关除单调相关、线性相关外还有其他形式,例如非单调相关等。利用互信息计算两变量之间的相关性是建立在信息熵的基础上,从平均意义上来表征两变量间的总体信息测度。相对于皮尔逊相关性与斯皮尔曼相关性,互信息能全面表达两变量间的相关性。
(一)指标间的互信息。
“熵”是信息理论中核心的概念。[8](p77-84)熵的原始含义是对于物理系统紊乱程度的一种测度。将与看作两个随机变量,它们的对应向量分别为X与Y。
其中,p(xi)表示x取值xi为的概率,xi∈X′,X′表示x所有可能的取值的集合。
其中,(X′,Y′)表示(x,y)所有可能取值的集合。
在此基础上给出互信息定义,采用以下基本形式:
当x与y相互独立时,I(X,Y)=0;反之,I(X,Y)>0。因此,从统计学意义上讲,互信息表达的是两随机变量间的相互依赖的程度。
指标间的相关性分析的目的是挖掘相关性较强的指标序对。基于互信息相关性的理论,计算指标间的相关性系数。主要分为以下三步:
设第t指标在各高校的指标值所组成的向量为Xt,那么
其中,t∈{1,...,m},xt,i表示t第指标在第i高校中的指标值。
(1)利用式(2.3)计算任意两个指标间的互信息相关性:
其中t1∈{1,...,m},t2∈{1,...,m},t1≠t2。
由此得到任意两个指标间的互信息相关性矩阵Mm×m:
(2)本文采用线性函数转化法,将得到的互信息相关性矩阵进行归一化。所得的归一化后的矩阵为:
(3)本文假定归一化后的互信息值超过最大值的60%时,认为指标间存在较为明显的相关性。因此,本文设定互信息相关性阈值为0.6。挖掘互信息归一化矩阵M′m×m中,互信息值超过互信息阈值的指标序对。
(二)复杂网络模型。
复杂网络模型是由节点和连接节点的边来组成。[9](31-36)其中节点表示真实系统中的研究对象,边表示对象间的关系。真实系统所表现出的网络形式不胜枚举。例如,互联网网络、蛋白质相互作用网络、基因间相互作用网络等。[10](p75-78)建立由真实系统转化而来的复杂网络模型的重点在于明确作为复杂网络中节点的研究对象,以及对象间的联系。复杂网络模型系统具有其特殊的网络结构性质。通常,采用网络分析方法来进行网络分析。例如,节点度及其他网络拓扑结构指标的分析等。
1.复杂指标网络的构建。
绩效评价指标间关系的分析是本研究中的重要一环。绩效评价指标体系中所包含的绩效评价指标有多种,并且指标与指标间可能存在某种直接或者间接联系。利用相关性较大的指标间的联系将构成绩效评价指的复杂网络模型。
基于指标间的相关性的大小,设定阈值得到具有较强相关性的指标。我们以指标为节点。如果两个指标间的相关性高于阈值,那么这两个节点间存在一条边。按照上述方式建立指标网络模型。
2.复杂指标网络的分析。
网络拓扑结构指标有利于帮助分析网络的拓扑结构。无向网络中节点的度,即为与该点关联的节点的数目。节点的度可以反映节点的重要性。[11](p426-429)具有较大度的节点在复杂指标网络中的地位较为重要。例如指标相关网络中度较大的节点node1对网络较多的节点之间的相关性较大,说明与节点node1相关的多个节点中只要有一个节点(不妨设为node2)所对应的指标值发生改变,那么节点所对应的指标很可能发生改变。
由于我们比较关注科技项目的产出水平,因此有必要研究与科技产出指标具有紧密联系的其他指标。高校的科技投入指标反映政府科技部门对高校的科研项目的资助力度。因此,挖掘对科技投入指标影响较大的指标有助于辅助政府科技部门开展对各高校的科研项目的投入力度的决策分析。指标网络模型可以帮助我们寻找对科技产出指标以及科技投入指标影响较大的指标。
表1 湖北省高校政府投入科研项目绩效评价指标体系
本文根据2013年初对湖北省18所高校的调研数据进行分析。根据调研数据的实际情况,笔者在其他文章中已构建了包括科研基础、科研投入和科研产出为一级指标的包括59个三级指标的绩效评价体系(表1)。[12](p117-121)
依照指标间的互信息相关性的计算步骤,我们计算59个三级指标间的互信息相关性的过程如下。
首先,数据的整理。因指标的量纲不同,为了便于计算,本文将59个三级指标的数据进行最大值归一化,得到指标数据矩阵Data18×59(Data为18×59维的矩阵)。
其次,计算指标序对间的互信息相关性。为了便于互信息计算,将区间[0,1]等分为20个小区间,分别判断指标数据矩阵Data18×59中的每个元素所处的小区间的编号。将元素所处的小区间的编号代替该元素值,最终将指标数据矩阵Data18×59离散化。离散化后的结果使得数据矩阵中的每个元素为1到20之间的任意自然数。利用I(Xt1,Xt2)=H(Xt1)+H(Xt2)-
H(Xt1,Xt2)公式计算任意两个指标间的互信息相关性,其中Xt1与Xt2分别表示指标t1与t2的数据。我们不计同一指标间的相关性,发现指标间相关性的最大值为1.91(注:该值为指标“硕士学位授权一级学科数目”与指标“硕士点数目”之间的相关性),平均值为0.87。
再次,采用最大值归一化法处理指标间的相关性,使得任意两个指标间的相关性最大为1。指标间相关性值的分布见图1。由图1可见,指标间互信息值的分布呈单峰状,在0.5附近达到最高,说明互信息值大多集中在0.5附近。互信息值大于0.7的指标序对的个数为226,互信息值大于0.75的指标序对的个数为128,互信息值大于0.8的指标序对的个数为88。
图1 互信息相关性值的分布
假定归一化后的互信息值超过最大值的60%时,认为指标间存在较为明显的相关性。设定互信息相关性阈值为0.75,挖掘互信息值超过互信息相关性阈值的指标序对。我们得到具有较高互信息相关性的128个指标序对。例如,“教授数目”分别与“讲师数目”、“经费数目”的相关性都较为显著,“教授数目”与“讲师数目”从属于“科技基础”指标,“经费数目”从属于“科研投入”指标,可见从属于不同一级指标的两个三级指标间的互信息值也可能较大。
湖北省高校政府投入科研项目绩效评价指标间存在复杂的相互作用关系,以上指标及指标间的关系将构成湖北省高校政府投入科研项目绩效评价指标网络。
(一)指标网络模型。
1.指标网络模型的构建。
我们将59个三级指标作为网络的节点,并将指标间的互信息相关关系作为网络中对应指标的节点之间的边,从而建立指标的互信息相关网络模型模型。设定互信息相关性阈值为0.75,128个指标序对的互信息相关性高于0.75(即互信息相关关系为128个)。本文所构建的指标的互信息网络模型见图2。
图2 指标的互信息网络模型
图2中,红色节点表示科技基础所涉及的三级指标,绿色节点表示科技投入所涉及的三级指标,蓝色节点表示科技产出所涉及的三级指标。图中非孤立节点编号与指标的对应关系如下:教授数目(C2),副教授数目(C3),讲师数目(C4),硕士学位授权一级学科数目(D3),硕士点数目(D5),湖北省重点实验室数目(E7),湖北省工程研究中心数目(E8),博士后流动站数目(D1),国家级科研团队数目(D13),国家自然科学基金委员会资助项目数目(G1),湖北省科技厅资助经费数目(H4),省级一等奖数目(J4_1),省级二等奖数目(J4_2),省级三等奖数目(J4_3),发表中文专著数目(K2),被EI检索的论文数目(K5),培养的硕士生的数目(M3)。
由图2可见,网络中128条边分布于17个节点之间,网络中的大部分节点为孤立节点(即无与该节点关联的边)。该现象说明,59个指标中只有少部分指标之间存在相关关系,而大部分指标间无显著的关联关系。我们推断无显著的关联关系的指标的数据即便有大的改动,也不会对其他数据产生太大的影响。
2.指标网络模型的可靠性。
保持各指标数据向量中元素不变,随机调换指标向量中元素的位置。随机生成各指标数据随机向量。再利用互信息方法,计算各指标数据随机向量间的相关性。随机指标数据间的相关性分布见图3。
由图3可见,随机互信息值大部分分布于0.2,随机互信息值大于0.75的个数为0。该结果可以验证所得指标间关系存在的可靠性。从而进一步可以说明由这些可靠的指标间的关系所得的指标网络模型的可靠性。
图3 随机互信息相关性值的分布
(二)指标网络模型中的重要节点。
由1.2节的分析可知,网络的拓扑结构指标(例如节点的度)可以帮助发现网络中的重要节点。本节计算网络中每个节点的度,并分别将节点按照节点度的降序进行排列。指标的相关网络为无向网络。无向网络中节点的度数为与该节点相连的边的数目。例如,网络中编号为“C3”的节点分别于编号为“C4”及“J4_1”的节点存在一条边。因此,编号为“C3”的节点的度为2。同理,我们计算出相关网络中17个非孤立节点的度数,并将节点度数降序排列。相关网络中节点的度数及相应的指标编号详见表2。
表2 相关网络中节点的度数
表2中节点编号与指标的对应关系如下:教授数目(C2)、副教授数目(C3)、讲师数目(C4)、硕士学位授权一级学科数目(D3)、硕士点数目(D5)、湖北省重点实验室数目(E7)、湖北省工程研究中心数目(E8)、博士后流动站数目(D1)、国家级特色团队数目(D10)、国家自然科学基金委员会资助项目数目(G1)、湖北省科技厅资助经费数目(H4)、省级一等奖数目(J4_1)、省级二等奖数目(J4_2)、省级三等奖数目(J4_3)、发表中文专著数目(K2)、被EI检索的论文数目(K5)、培养的硕士生的数目(M3)等。
值得注意的是,在判断节点是否为重要节点时,由于节点的重要与否是一个相对的概念,节点重要性可根据个人主观评判标准来定义节点是否重要。没有一个专门的评判标准来评价所定义的节点的重要性。本研究中,我们选取了节点的度数为5。指标相关网络中的重要节点分别为:讲师数目(C4)、教授数目(C2)、硕士学位授权一级学科数目(D3)、硕士点数目(D5)、省级一等奖数目(J4_1)、省级二等奖数目(J4_2)、省级三等奖数目(J4_3)、发表中文专著数目(K2)、国家级科研团队数目(D13)、湖北省重点实验室数目(E7)、湖北省科技厅资助经费数目(H4)、湖北省工程研究中心数目(E8)。
(三)网络模型分析。
我们发现,12个重要节点中的教授数目、讲师数目、硕士学位授权一级学科数目)、硕士点数目、国家级科研团队数目、湖北省重点实验室数目、省级一等奖数目、省级二等奖数目、省级三等奖数目、发表中文专著数目等十个指标与多个指标有较强的相关性,尤其是该十个指标中的每一个与其他指标几乎都有边相连。说明以上十个指标数据具有较强的变化一致性。其中四个指标为科研产出三级指标,六个指标为科研基础指标,说明科研基础对科研产出水平存在重要影响。
在科研基础的6个指标中和人才相关的是教授数目和讲师数目和国家级科研团队数目,说明教授和讲师是高校科研的主体力量,国家级团队在一定程度上作为人才集聚在高校的科研中起着重要的作用。学科相关的是硕士学位授权一级学科数目、硕士点数目,和科研平台相关的为湖北省重点实验室数目,这与湖北高校硕士学科点和湖北省重点实验室的分布较广有关,同时也说明学科和科研平台的重要性。
科研产出中重要指标为省级一等奖数目、省级二等奖数目、省级三等奖数目、发表中文专著数目,与调研对象为湖北省高校有关。但同时也说明我们在过去的科研管理中对科研产出比较重视成果奖励。对其他方面,特别是科研成果的社会化服务方面重视不够。
同时,通过分析科研投入指标,我们发现科技厅资助经费数目(H4)与教授数目(C2)、讲师数目(C4)、省硕士学位授权一级学科数目(D3),硕士点
数目(D5)省级一等奖数目(J4_1),省级二等奖数目(J4_2)和发表中文专著数目(K2);这说明科技基础和科研产出中高水平成果对科研投入有较大的影响。
1.加强科技基础建设,提升科技产出水平。高校应转变观念理念,从人才、学科、基地等方面综合提升学校科技基础水平,通过提升科研基础水平来整体拉动学校科研产出质量。人才是科研项目完成的主体,学科代表高校在某个研究方向的研究实力,基地是科学研究的依托条件,团队是针对特定方向的科学研究的队伍建设。学校的科技基础实力的高低在某种程度上极大影响了科研项目的完成质量和产出的水平。我们要注重科研基础的建设质量。通过高水平人才引进与培养、先进科研平台建设、优势领先学科发展、优秀科研团队的建设来促进科研基础水平的质量。通过科研基础水平的提升,争取更多的科研项目,促进优秀的科研成果的产生。
2.积极重视科研成果服务经济社会发展。各高校在重视科研的学术成果的同时,积极推进科研成果的转化,强调科技服务于国家需求和社会、经济发展。在重视科研长出的学术水平的同时,进一步注重科研产出的经济效益、环境效益和社会效益。
3.做好教授、讲师的科研主体队伍建设,提高科研产出的水平。教授、讲师等作为高校的科研主体,是高校科研产出的主要力量。目前各高校主要聚焦于高水平拔尖人才,给予全方位的优惠政策,在获得部分优秀高水平成果的同时,对学校科研产出水平的整体提升影响较小,投入产出比也并不一定经济。各高校应在积极支持优秀高水平人才的同时积极改善广大科研人员条件,发挥教授、讲师等科研主体队伍积极性,使得科研产出既有亮点,又在水平上得到整体提升。同时,积极适应国家新科技体制,高校科研人员应在国家的基础研究、技术攻关、成果转化、产品研发的技术链条中合理定位,高校应根据科研人员不同作用,进行相应的人事考核和支撑条件建设的改革。
本文利用互信息度量绩效评价指标间相关性的方法,将其运用于湖北省参研高校政府投入科研项目绩效评价指标。从理论上分析了高校政府投入科研项目绩效评价指标间的关系,通过实例证明了科研基础对科研产出具有更重要的影响。为高校科研管理部门工作者提供参考。
目前,各管理部门对科研过程管理越来越重视,本研究的调研数据中缺乏科研过程数据,调研高校主要为湖北省高校,科研产出的数据主要为学术相关数据,缺乏社会效益等方面的数据。还应进一步扩大数据调研范围,尤其是应加强针对科研过程和科研产出中社会效应的数据调研,同时拓宽高校的范围,使得分析结论更具指导性。
[1]杨莲芬,唐韵.浙江省高校科研项目绩效评价指标体系研究[J].统计科学与实践,2011,(3).
[2]李筱林,肖田野,卢进.高校科技投入绩效评价模式研究[J].科技管理研究,2008,28,(6).
[3]谢福泉,任浩,张军果.财政科技投入产出绩效评价体系的构建-科技项目后评价视角[J].中国科技论坛,2006,(6).
[4]陆根书,刘蕾,孙静春,顾丽娜.教育部直属高校科研效率评价研究[J].西安交通大学学报, 2005,25,(2).
[5]孙海华,戚涝,李千目.一种新的基于TOPDIS的科研绩效提升方法[J].科技进步与对策,2008,25,(6).
[6]杨珺晖.中国经济结构性变革与经济效率的典型相关分析[J].经济问题探索,2015,(1).
[7]何绍荣,梁金明,何志勇.基于互信息和关系积理论的特征选择方法[J].计算机工程,2010,36,(13).
[8]邢修三.物理熵,信息熵及其演化方程[J].中国科学:A辑,2004,31,(1).
[9]周涛,柏文洁,汪秉宏,刘之景,严钢.复杂网络研究概述[J].物理,2005,34,(1).
[10]朱恒民,苏新宁,张相斌.互联网舆情演化的动态网络模型研究[J].情报理论与实践,2010,(10).
[11]陈静,孙林夫.复杂网络中节点重要度评估[J].西南交通大学学报,2009,44,(3).
[12]陈小锋,毛羽,苏延森.政府投入类高校科研项目绩效评价指标体系的构建及应用[J].科技进步与对策,2015,33,(5).
责任编辑 周刚
G472.5
A
1003-8477(2016)11-0059-06
陈小锋(1977—),男,华中科技大学博士研究生;毛羽(1956—),男,博士,华中科技大学副教授;苏延森(1985—),女,博士,安徽大学讲师。