孙竹梅 汪志兵 韩文民 潘雪莲
关键词:合作对象差异;聚合测度指标;科研合作能力;科研产出;合作贡献
随着科学研究的不断深入,个人、机构和国家间的科研合作均呈现日益增长的态势[1],全球规模的科研合作网络已基本形成,合作发表科研论文和形成研究的知识产权成为科研合作最主要的表现形式[2]。与此同时,学界对科研合作的研究也不断深入,研究发现,合著论文被期刊录用的概率要高于独著论文[3-4],合作的频次和规模对科研产出的数量和质量都存在积极影响[5-6],从而使得科研合作逐渐成为提升科研产出的一条重要途径,科研合作能力也被视为反映科研产出的重要指标之一。然而,科研合作能力与科研产出间是否存在完全一致的对应关系,高的科研合作能力指标值就一定意味着高的科研产出吗?针对这一问题,本文将对科研合作能力指标是否能用于测度科研产出,以及如何用于科研产出的测度展开探讨。
1文献回顾
目前,关于科研合作能力的测度指标大致可以分为两类:一类是基于科学计量学视角的;一类是基于复杂网络视角的[7]。前者包括合作度、合著率、合作系数和合作能力指数等[8-11],这些指标分别从合作的强度、深度和稳定性等方面来衡量作者的科研合作能力。后者包括网络密度、聚集系数、点度中心性、紧密中心性、中介中心性等[12-16],这些指标分别从不同的角度来衡量科研合作网络的结构属性,通过结构属性来反映作者在科研合作网络中所处的地位及重要程度。同时,科研合作网络指标也是学者们进行科研合作关系预测研究的重要依据[17-20]。
在科研合作与科研产出的关系研究方面,学者们也进行了大量的探讨,但尚未取得一致的结论。有些学者的研究证实科研合作能够提高科研产出数量,如AbramoG等对意大利82所高校科学家2001—2005年发表论文的研究结果表明,科研的国际化合作程度与科研产出的数量呈正相关[21];刘俊婉发现在分子生物学与遗传学领域中,论文合著者数量的增加有利于高被引科学家论文产出数量的提高[22]。同时,科研合作也能够提高科研产出质量,如PuuskaHM等发现在印度的科研合作中,合著者数量与论文被引频次呈正相关[23];PolyakovM等对农业、资源、环境和生态经济领域的合作发文研究发现,合作能够提高研究成果的影响力,同时国际合作对研究成果影响力的提升效果比国内合作更为显著[24];杨瑞仙等的研究发现合作机构数量和论文影响力呈现出显著正相关[25]。
但是也有些学者的研究得出了不同的结论,如Gl?nzelW等发现化学领域中国际合著论文的被引水平往往低于该领域样本的平均水平[26];钟镇的研究则指出高合著规模的论文未必获得更多的被引用,独著的论文也未必不被广泛引用[27];周静梅等的研究显示在合作机构的多样性与合作绩效之间并无显著相关性[28];姚源等对2007—2018年我国高校教师的校内、国内和国际科研合作研究发现,2007年校内合作仅对理科发文总数有正影响,国际合作仅对工科发文总数有正影响,且对理科发文总数存在显著负影响,而国内合作对人文学科、社会科学、理科和工科的发文总数均有正影响,2018年除国际合作对工科发文总数仍有正影响之外,其他类型的合作对各领域的发文总数均无显著影响[29]。
为解释这些不一致现象存在的原因,学者们对科研合作与科研产出关系的临界值也进行了探索。HodderP研究發现机构合作数量与论文的产出之间呈现倒U型关系,即当合作机构数量超过一定阈值时,论文产出呈下降趋势[30];马荣康等发现作者数量与高被引论文概率呈倒U型关系,而与零被引论文概率呈正U型关系,且拐点均为3人[31];林卉发现机构合著率与论文影响力不存在相关关系,但机构的合作度与论文的影响力存在显著正向关系,而最佳的合作机构数目为5个[7]。
综上可以看出,将科研合作能力指标用于测度科研产出具有可行性,但是也存在一定的局限性,主要表现在以下两个方面:第一,在现有研究中,一旦确定目标对象后,其合作对象以及每次合作均被同一化处理,即假设这些合作对象的科研水平是相同的,且在每次合作中的贡献也是相同的。然而事实并非如此,不同合作对象的科研水平是存在差异的,与领域内高水平对象合作的科研产出水平理论上会高于与一般水平对象合作的产出[32-33],而且即使是同一合作对象,在合作对象数量不同的合作中,其贡献也会存在差异,如合作者数量较少的合作中,单个合作对象的贡献理论上会高于合作者数量多的合作[34-35]。因此,在科研合作的研究中,这种普遍存在的合作对象差异性是不应该被忽视的。第二,单个科研合作能力指标仅能反映科研合作能力的某一方面,且这一方面未必与科研产出之间存在必然的相关性,如果单独将其用于测度科研产出时难免出现偏差,因此,应考虑聚合能够反映科研合作能力不同方面的、且与科研产出存在正向关系的指标来构建科研产出的测度指标。
基于上述原因,本研究将以机构为研究个体,在常用科研合作能力指标的基础上,考虑合作机构的科研水平差异和合作贡献差异,构建差异性指标,并通过各项指标与机构科研产出指标的相关性分析,选择具有强正相关性的科研合作能力指标,进一步构建科研产出多元聚合测度指标,对不同机构的多元聚合测度指标值与实际科研产出指标值间的差异进行对比分析,探索更能刻画机构科研产出实际情况的测度指标,为科学、有效的科研产出评价工作提供借鉴和指导。
2研究设计
本研究首先从科学计量学视角和复杂网络视角选取部分常用科研合作能力指标,其次从考虑合作对象差异性的视角提出两个相关指标,同时,从衡量科研产出的数量、质量角度分别选择具有代表性的指标,进而在各科研合作能力指标与科研产出指标相关性分析的基础上,将3种不同视角的科研合作能力指标进行聚合,构建能够更加真实反映机构科研产出的多元聚合测度指标。
2.1科研合作能力指标选取
2.1.1基于科学计量学视角的机构科研合作能力指标
1)合著率(CooperationRate)。该指标反映的是机构合作密度,即目标机构通过与其他机构合作完成的发文数量与目标机构总发文数量的比值[7,36],具体计算如式(1)所示:
2)合作度(CooperationDegree)。该指标反映的是机构合作深度,即目标机构每篇发文的平均合作机构数[7,37],具体计算如式(2)所示:
2.1.2基于复杂网络视角的机构科研合作能力指标
1)网络密度(Density)。该指标反映的是合作网络中各机构之间联系的紧密程度,即目标机构所处合作网络中实际合作关系数与理论上最大合作关系数的比值[12-13],具体计算公式如式(3)所示:
2)点度中心度(DegreeCentrality)。该指标反映的是目标机构与其他机构之间的联系能力[3-4],即与目标机构合作的其他机构数量,具体计算公式如式(4)所示:
2.1.3基于差异性视角的机构合作能力指标
如前所述,不同合作机构之间的科研水平是存在差异的,且同一合作机构在每次合作中的贡献也是存在差异的,因此,本文从差异性视角提出如下两个机构合作能力指标:
1)高水平机构合作发文率(High-levelOrgani?zationCooperationPapersRate)。即目标机构与高水平机构合作的发文数量与目标机构总发文数量的比值,该指标考虑了不同合作机构的科研水平差异,认为与高水平机构合作能有效提升目标机构的科研产出水平[38-40]。具体计算公式如式(5)所示:
2)高水平机构累积贡献率(High-levelOrgani?zationCumulativeContributionRate)。即所有與目标机构合作过的高水平机构在每篇合作发文中的贡献率累积,该指标同时考虑了机构的科研水平差异及同一合作机构在不同次合作中的贡献差异,认为在机构A与高水平机构B的两次合作发文P1、P2中,如果P1中有5个合作机构,而P2中仅有2个,则机构B在P2中的贡献率是高于P1的。具体计算公式如式(6)所示:
2.2科研产出指标
合作发文作为科研产出的重要组成部分,一直以来普遍被学者们作为科研合作的典型研究对象[41-42]。同时,对合作发文这一科研产出的测度包含多个方面,如发文数量、发文质量、成果应用、获奖等[43-45]。而科研合作对发文数量与发文质量的积极影响在很多研究中均得到了证实[46-48],因此,本研究主要选择科研论文作为科研产出的代表,并主要从发文数量和发文质量两个方面选择相应的科研产出指标。
1)总发文数量。该指标主要反映机构的科研产出能力,总发文数量越大,目标机构的科研产出能力越强,记为TP。
2)机构h指数。该指标综合考虑机构的发文数量和发文质量,相较于总被引次数而言更能反映综合性的科研产出水平。一般而言,目标机构的h指数越高,该机构的科研产出影响力越大,记为h。
2.3科研产出多元聚合测度指标的构建
在各项科研合作能力指标与科研产出指标相关性分析的基础上,选择与科研产出指标具有正向强相关性的科研合作能力指标构建科研产出多元聚合测度指标,具体构建公式如式(7)所示:
3数据采集与预处理
3.1数据采集范围
根据2017年9月教育部、财政部、国家发展改革委公布的“双一流”建设学科名单,选择材料科学与工程学科的30所入选高校作为研究对象,通过WoS数据库的ScienceCitationIndexExpanded(SCI-EXPANDED)核心集对这30所高校发表的材料科学与工程学科相关论文进行采集。考虑到数据的完整性及规模,将数据采集区间限定为2016—2018年,文献类型限定为“Article”,共采集到71308篇论文。同时采集这30所高校在该学科领域的机构h指数,以此来反映各高校的科研产出水平。
3.2合作机构的规范化与筛选
由于论文中的机构名称并未采用统一的标准进行规范化标注,因此需要对论文中所涉及的机构名称进行归一化和标准化著录。遵循的主要原则有:①对于疑似拼写错误的机构,通过地址信息进行核对与修正,如“JilingUniv”经地址信息核对修正为“JilinUniv”;②对于因空格问题造成的机构名称不一致进行统一化著录,如“JilinUniv”修正为“JinlinUniv”;③对于因缩写问题造成的机构名称不一致进行统一化著录,如“CentSUniv”修正为“CentSouthUniv”;④将二级机构以其所隶属的一级机构名称进行统一著录,如“AnhuiProvKeyLabEnvironmFriendlyPolymerMat”(安徽省绿色高分子材料重点实验室)以“AnhuiUniv”(安徽大学)进行标注。
3.3高水平机构的选择
机构科研水平的高低是一个相对的概念,并无统一认可的衡量标准,但考虑到研究的可操作性,结合目前业界对ESI排名的高度关注,本研究选择以2019年3月进入ESI材料科学领域全球前1%的机构作为高水平机构,对这30所高校合作机构中的高水平机构进行筛选。
4研究结果
4.1单项指标计算
在样本数据的基础上,利用Python编程语言分别构建30所高校的机构合作网络,并对各高校所处合作网络的相关指标进行测算,具体结果如表1所示。
4.2科研产出多元聚合测度指标构建
为保证本研究所构建的多元聚合测度指标对科研产出测度的有效性,本部分首先对3个视角下的6个科研合作能力指标与科研产出的两个指标之间的相关性进行分析,并从中筛选出与科研产出指标具有高度正相关关系的科研合作能力指标,进行科研产出多元聚合测度指标的构建。
1)指标相关性分析
为进一步明确研究所选取的科研合作能力指标与科研产出指标之间的相关性,采用SPSS22.0对其相关性进行检验,结果如表2所示。
为更直观地了解机构合作能力指标与科研产出指标之间的相关性,通过SPSS22.0绘制如图1所示的散点图。
根据相关系数的绝对值可以将相关强度划分为极强相关(0.8~1.0)、强相关(0.6~0.8)、中等相关(0.4~0.6)、弱相关(0.2~0.4)和不相关(0.0~0.2)。从表2可以看出,基于科学计量学视角选取的合著率和合作度指标与机构的总发文数量之间并无显著相关性,却与机构h指数间存在中等强度的正相关关系;基于复杂网络视角选取的网络密度指标与机构的总发文数量和h指数之间均存在显著负中等相关性,而点度中心度却与机构的总发文数量和h指数之间存在强正相关性;基于差异性视角选取的高水平机构合作发文率和高水平机构累积贡献率指标均与总发文数量和机构h指数之间存在显著正向关系,其中,高水平机构合作发文率和总发文数量之间的相关性较弱。相较于科学计量学视角下的合著率和总发文数量之间无显著相关性的现象而言,差异性视角下的指标选取正是因为考虑了合作机构的科研水平差异,才使得高水平机构合作发文率与总发文数量间呈现出显著的相关性,两者并不相悖,同时也更进一步反映出机构科研水平的差异对于科研产出水平具有显著影响。
2)多元聚合测度指标的构建
结合指标间的相关系数及散点图的显示,本研究选择与总发文数量有极强线性正相关性的点度中心度、高水平机构累积贡献率这两项科研合作能力指标,构建测度科研产出数量水平的多元聚合指标AI1,选择与机构h指数有强线性正相关性的点度中心度、高水平机构合作发文率、高水平机构累积贡献率以及接近强线性正相关性的合作度这4项科研合作能力指标,构建测度科研产出质量水平的多元聚合指标AI2。考虑到各指标值的数量级差,具体的指标计算公式如式(8)和式(9)所示。
在此基础上,对30所高校的多元聚合测度指标值和科研产出指标值进行对比分析,如图2、图3所示,同时将用于聚合的各单项科研合作能力指标值也加入对比,以便更清晰、直观地反映多元聚合测度指标的优势。
从图2中可以看出,各高校科研产出数量水平的差异与聚合指标AI1值的差异状况基本相同,即随着各高校科研产出数量的变化,AI1也保持了基本相同的变化趋势,且比两单项指标更为拟合,由此可见,AI1指标能更好反映机构的科研产出数量水平。
相较于图2而言,虽然图3中各高校科研产出质量水平的差异与其各单项指标值的差异幅度略大,但本研究所构建的聚合指标AI2却与机构h指数保持了基本相同的变化趋势,比各单项指标更好地反映了机构科研产出质量水平。究其原因,尽管相关性检验中各单项指标与机构h指数都存在强相关性,但科研产出质量水平的影响因素很多,单项指标仅反映机构科研产出质量水平的某一方面,并不能对质量水平进行全面刻画,如点度中心度计算的是机构的合作对象数量,反映的是科研合作能力中的合作广度,而这一方面的合作能力强弱更多的体现在科研产出数量水平上,与科研产出质量水平并不直接挂钩,相比之下,由于综合考虑合作深度、合作能力以及高水平机构合著率和贡献率等关键要素,聚合指标AI2与实际科研h指数的差异状况更为吻合,测度表现更加优秀。
总体上,尽管各单项科研合作能力指标与总发文数量或机构h指数之间具有一定的一致性趋势,但相较于聚合前的各个单项指标而言,多元聚合测度指标AI1和AI2能够更好地反映30所高校总发文数量和机构h指数所处的水平,说明本研究所构建的两个多元聚合测度指标相较于各单项指标更能够反映机构科研产出的数量和质量水平。
5分析与讨论
1)基于科学计量学视角的合著率和合作度指标与科研产出数量水平之间无显著相关性,而与科研产出质量水平间存在中等强度的正相关关系,说明单纯地增加合作发文的比例和扩大单篇论文的合作机构数量,虽然在一定程度上能促进科研产出质量水平的提高,但并不能有效提升机构的科研产出数量水平,因此仍要通过其他方式和途径来促进科研产出数量水平的提升,如制定相应的激励和支持政策。
2)基于复杂网络视角的网络密度指标与科研产出的数量和质量水平均存在中等强度的负相关关系,即当机构处于一个紧密合作的网络中并不意味着一定会有更多的科研产出数量和更高的科研产出质量,这与BurtRS的“结构洞”理论认为低密度的网络灵活性更强,信息冗余度低的观点是一致的[49],OrtegaJL对作者合作网络的研究也发现,稀疏网络中发文的被引次数可能高于密集型和紧凑型网络[49-50]。结合机构的点度中心度来看,发现只有当机构拥有相近数量的合作对象时,合作网络的密度才可能对科研产出数量水平产生积极影响,换言之,当某一机构处在较小合作规模的网络中,由于资源限制,即使再紧密的合作也不一定会有更多和更高水平的科研产出,而如果该机构处在一个大规模的合作网络中,由于资源的多样性和丰富性,即使网络密度不高,也可能会有相对较多和较好的科研产出。
3)基于差异性视角的两个指标与科研产出指标之间均表現出显著的相关性。其中,同时考虑机构科研水平差异和每次合作差异的高水平机构累积贡献率指标,与科研产出的两个指标之间均表现出强或极强的相关性,说明合作机构的科研水平差异不仅对科研产出数量水平有影响,同时也会影响科研产出的质量水平;虽然仅考虑合作机构科研水平差异的高水平机构合作发文率与总发文数量之间仅存在显著的弱相关性,但结合未考虑合作机构科研水平差异的合著率与总发文数量之间无显著相关性的结果来看,要通过机构合作网络来研究机构的科研水平时,考虑合作机构的科研水平差异是非常必要的。因此,机构在选择合作对象时不能仅追求数量,更要考虑合作对象的质量(科研水平的高低),要尽量多与高水平机构展开科研合作,使合作真正成为促进自身科研水平不断提升的动力。
4)基于点度中心度、高水平机构累积贡献率构建的多元聚合测度指标AI1能更好地反映机构的科研产出数量水平,说明机构的科研产出数量水平与该机构合作对象数量以及高水平合作对象在合作中的贡献程度密切相关,且成正向变化关系。因此,在科研实践中机构要提高科研产出数量水平,应从扩大合作对象数量和提升高水平合作对象贡献率两个方面来考虑,既应发掘更多的合作对象来拓展合作关系,也要不断深化与高水平机构间的合作关系,努力提升高水平机构在每次合作中的贡献度。
5)基于合作度、点度中心度、高水平机构合作发文率、高水平机构累积贡献率构建的多元聚合测度指标AI2与机构h指数差异趋势更为吻合,说明在科研实践中机构要提高科研产出质量水平,应针对这4项指标进行优化,即在加强合作深度、拓展合作面的基础上,要更加注重与高水平机构开展合作,努力提升高水平机构在每次合作中的贡献度。换言之,不仅要积极参与到和高水平机构的科研合作中去,还要不断提升机构自身在这种合作中所承担工作的数量比和质量比,逐渐成为合作团队的骨干和核心。
6结论与展望
本研究基于科學计量学视角、复杂网络视角选取部分机构合作能力指标,结合本研究从差异性视角提出的两个机构合作能力指标,通过它们与科研产出指标间的相关性分析,选择与科研产出指标具有强相关性的科研合作能力指标构建科研产出多元聚合测度指标,并对30所样本机构的多元聚合测度指标值与科研产出指标值的差异进行对比分析。研究发现,并非所有的科研合作能力指标都能够反映机构的科研产出水平,而基于与科研产出有显著强相关性的科研合作能力指标所构建的多元聚合测度指标能够更真实地反映机构科研产出水平,相较于聚合前的单项指标而言,多元聚合测度指标值差异与机构的科研产出指标值差异更为吻合,说明本研究对科研产出多元聚合测度指标的构建思路是可取的,尽管各单项指标都与机构的科研产出有高度相关性,但是并不能孤立地用于衡量机构的科研产出,这也与机构科研产出受到多方面影响因素共同作用的客观事实相符。
综上所述,机构要提高自身科研产出,应加强科研合作,在合作机构的选择上既要考虑合作机构的科研水平,也要考虑合作机构的合作贡献,与高水平机构合作且高水平机构的合作贡献大,则机构的科研产出水平较高。本研究所构建的多元聚合测度指标对于评价机构的科研产出水平是有效的,对于科研评价工作具有一定的理论意义和实践价值。但仍存在可以继续深入的地方,如对机构科研水平差异仅参考了ESI排名,且未对高水平机构间科研水平的差异进行更为细致的划分,同时,在考虑每次合作的差异时仅以单篇发文的署名机构数量进行计算,未结合作者———机构网络进行更为深入的分析。