唐福涛,王瑞文
(1.天津商业大学科技处;2.天津商业大学公共管理学院,天津 300134)
信息时代的今天,科学技术发展迅猛,科研深度和广度不断扩展不仅要依靠科研工作者自身潜心研究,还需要相关领域的科研人员深化合作,将科研人员所拥有的专业知识进行融合,以实现完成任务目标,由这种关系产生的共同体就是一个科研团队。科研团队合作关系有多种表现形式,简单可归为两大类:一类是项目合作形式,比如各种横纵向项目工作分工,以完成任务为目的;另二类是成果合作署名,比如论文发表、申报专利、申报奖项等,这种形式主要体现的是对科研工作者(机构)贡献的认可。科学技术进步奖是授予在应用推广先进科学技术成果,完成重大科学技术工程、计划项目等方面作出显著贡献的个人、组织。此类奖项覆盖面最广、获奖数量、涉及行业也最多,获奖项目完成机构在奖项中的合作是最具代表性的科研合作形式。对科技进步奖获奖项目完成机构(以下简称“机构”)的合作网络特征和合作特点的分析,有助于为科研团队的组建和发展提供理论指导,有助于提高科研产出数量和质量,为政府有关决策提供依据。
国内外对科研合作都有不少研究,传统的科研合作研究对象主要是一些显性的实体团队如项目组、科研平台等,目前随着大数据的迅速发展,基于网络大数据挖掘科研团队的研究逐渐兴起,基于网络的科研团队发现方法主要有层次聚类技术、因子分析法、Givan and Newman算法、凝聚子群算法等[1]。沈耕宇等[2]以论文作者合作共现为源数据对科研团队进行了发掘;李纲等[3]对肿瘤学科领域论文合著进行了研究并挖掘其中的科研团队;张心悦等[4]以创新管理领域论文为数据源对我国科研机构的国际合作网络进行了分析;刘延海[5]则对“2011协同创新中心”合作网络的结构特征进行了分析;谭春辉等[6]对我国国家科技进步奖获奖机构进行了合作网络分析,并对其形成机理做了研究;何秀美等[7]运用社会网络分析法对科学共同体的合作网络及演化进行了研究;许敏等[8]对长三角地区校企专利合作网络结构进行了研究;张素琪等[9]则对科研项目合作网络进行了研究,并发掘隐藏在其中的科研团队;李文娟等[10]对专利合作数据进行了研究和分析;黄修杰等[11]对广东省科技奖获奖合作网络进行了研究。从上述研究进程可以看出,对科研团队合作的研究集中在论文、项目领域,对科技奖获奖项目完成机构的研究尚处于形成机理的分析阶段,而对机构合作网络特点的分析较少。本文应用社会网络分析工具对科技进步奖的机构网络合作情况进行研究,以发现科研机构合作的特点和规律。
本研究所选取的数据来自天津市科委网站科技奖公示栏目,选取了2016—2018年共3年的科技进步奖获奖成果495项(不含科技企业创新工程项目,因该项目只允许企业单独申报)。统计获奖成果的完成机构数目如表1所示,单家机构独立完成的项目共187项,2~7家机构合作完成的项目有308项,即有62%的获奖项目都是由机构合作完成的,说明了机构合作在科技奖项申报中的重要作用。因此,对科研机构合作模式的分析具有重要的现实意义。
表1 2016—2018年天津市科技进步奖获奖项目完成机构合作情况统计
机构合作网络是包含所有科研机构及项目关系的网络,机构通过项目产生关系。首先要根据获奖机构在各项目中的排名构建项目与机构向量矩阵;其次,计算项目与机构矩阵余弦相似度并做归一化处理;最后,利用项目与机构之间的相关性系数得到机构相关性矩阵,由此得到机构合作网络。其中包括以下两个关键步骤。
2.2.1 获奖项目与机构向量矩阵构建
在构建机构合作网络之前,要根据获奖项目数据集得到机构矩阵,机构在各个项目中的参与程度通过向量来表示,每个获奖项目的机构排名代表了项目与机构间的合作关系,排在前面的机构一般对项目贡献度高,以此类推,所以机构在项目中的权重值为机构排序的倒数。aij表示第i个机构在第j个项目中的权重,则aij的定义如公式(1):
假设有m个机构、n个获奖项目,可以得到获奖项目与机构之间的关系矩阵为一个m×n的矩阵A,如公式(2)所示:
2.2.2 机构相关性矩阵构建
如果根据以上矩阵使用向量夹角余弦系数法直接计算机构向量相似度的话,每个项目的机构权重平方和会偏离1,所以在进行向量相似度计算前,需要对矩阵中分量做归一化处理。归一化处理的如公式(3)所示:
式(3)中,bij为矩阵中第i个机构在第j个项目中的权值。
将归一化的机构向量再次构造出机构与项目的归一化矩阵B,如公式(4)所示:
机构合作相关度的计算,如公式(5)所示:
式(5)中:B(i,j)表示向量Bi和Bj的相似度值;bik为第i个机构在第k个获奖项目中的权值;bjk为第j个机构在第k个获奖项目中的权值,即在所有获奖项目中机构Bi和Bj之间的合作相关程度。
本文以2016—2018年天津市科技进步奖获奖项目为数据源构建机构合作网络,并用社会网络分析指标进行对比研究。
首先利用Python语言编写根据获奖项目数据集的机构署名顺序,得到项目与机构向量空间的程序,然后进一步生成机构相关性矩阵,将这个矩阵导入UCINET6.0,应用VOSviewer工具软件绘制出机构合作网络(见图1至图3)。其中:机构合作网络中的节点分别表示各个机构;节点之间有连线表示机构之间有合作;节点间连线粗细表示机构之间的合作相关程度,机构之间的合作相关度越高,其间的连线越粗。由图1至图3可以看出,2016—2018年天津市科技奖获奖项目完成机构间的合作紧密程度逐年提高,参与机构也逐年增多。
图1 2016年天津市科技进步奖获奖项目的机构合作网络
图2 2017年天津市科技进步奖获奖项目的机构合作网络
图3 2018年天津市科技进步奖获奖项目的机构合作网络
中心性是社会网络研究的重点内容之一,中心性高的节点在网络中拥有更高“权力”,在社会网络中处于重要的位置。在社会网络分析中,对于中心性的指标主要有点度中心度和中间中心度分析。
3.2.1 点度中心度分析
在机构合作网络中,点度中心度指的是与某机构有直接合作关系的机构数量,机构数量越大,机构的点度中心度越高,机构在网络中的社会地位也越高。本文运用UCINET6.0软件,将点度中心度分析应用于机构合作网络中,测试统计结果如图4所示。从图4可以看出:(1)点度中心度为0~4的机构占多数,说明多数机构与其他0~4个机构间存在合作;(2)机构间直接合作逐年增多,点度中心度不为0的机构分别为188、222、240家。
图4 2016—2018年天津市科技进步奖获奖项目完成机构的网络点度中心度
进一步对点度中心度的统计表进行分析发现:点度中心度最大的机构为天津大学,在2016—2018年度获奖项目中,天津大学分别与45、48、81家机构存在合作关系,处于网络的中心地位;南开大学、天津城建大学、天津科技大学、河北工业大学、中国铁建大桥工程局集团有限公司、国网天津市电力公司电力科学研究院等机构也处于较重要的网络位置上。
3.2.2 中间中心度分析
在机构合作网络中,中间中心度表征机构合作网络中节点对资源传送的中介效用,是网络中经过该机构的最短路径的数量,该数量越大,机构的中间中心度就高,机构对科研资源支配的权利就大。本文运用UCINET6.0软件将中间中心度分析应用于机构合作网络中发现,2016—2018年天津市科技进步奖获奖项目机构合作网络中,每年都有80%左右的机构中间中心度为0,没有起到资源传送作用。中间中心度大于0的机构按照大小顺序分布如图5所示,可以看出中间中心度为(0,0.5]的机构占多数,说明多数机构在科技进步奖获奖项目中的资源中介作用不强。
图5 2016—2018年天津市科技进步奖获奖项目完成机构的网络中间中心度
从中间中心度前10名的机构统计结果(见表2)可以发现:中心度比较高的机构均是高校,2016—2018年连续3年中间中心度最高的都是天津大学,南开大学、天津城建大学、天津工业大学的排名也比较靠前。说明近几年在天津市科技进步奖获奖项目机构合作网络中,高校处于中心地位,在获奖项目合作中起着重要的桥梁作用。
表2 天津市科技进步奖获奖项目完成机构的网络中间中心度排行
网络密度是指网络中实际存在的关系数量与所有理论上可能存在的关系数量之比,可以反映各个机构之间合作的紧密程度。网络密度的计算如公式(6)所示:
式(6)中:D为网络密度;L为网络中各个节点实际连接线的数目;N为网络中节点数;表示的是网络中可能存在的最大连线数目。所以D的范围是0~1。
本文将网络密度分析应用于机构合作网络中,在UCINET6.0中,选择Network→Cohesion→Density→(new)Density overall,测算出2016—2018年机构合作网络的密度值分别为0.010、0.011、0.012,标准差分别为0.100、0.105、0.107。虽然机构合作网络密度呈现出逐年递增态势,但该网络仍为一低密度网络,说明机构之间整体的合作不是很紧密:一方面的原因是术业专攻,例如临床医学或者中医药方面的研究,一般仅限于医院或者医科大学内部,所以这类机构与其他机构联系比较少;另一方面,受地域、成本、管理等因素的影响,机构之间研究对接的广度受局限。
中心性和网络密度侧重于对机构合作网络的整体性分析,利用社会网络分析方法也可以对机构合作网中关联紧密的机构做重点研究,凝聚子群分析法是其中的典型的分析方法,本文通过凝聚子群对机构合作网络进行分析,并对科研团队的合作模式进行研究。
本文在对机构合作网结构的分析中发现,网络中有些节点之间的联系非常紧密,而节点和节点之外的联系却很少,以至于这些节点结合成为一个个次级的小团体,形成“抱团”现象。在社会网络分析中,网络的这种特征被称为凝聚子群[12],主要体现的是机构合作的小团队特征。由此可以判断哪些机构之间联系紧密,有明确的研究领域;同时,结合获奖项目名称,也可以判断该研究领域有哪些具体方向。
合作网络凝聚子群分析的方法有很多,包括派系、n-派系、n-宗派、k-丛以及凝聚子群密度等。本文主要应用到的是典型n-派系,其中n为小团体中成员之间距离的最大值,如果一个小团体中任何两点之间的距离最大不超过n,就称该小团体为n-派系(n-cliques)[13]。本文将UCINET6.0工具中的n-cliques(n-派系)分析功能应用到合作网络中,选择最小规模为3,可得出2016—2018年天津市科技进步奖获奖项目机构合作网络中分别有52、65、78个派系,其中连续几年都在合作领域申报科技奖项目比较典型的子群如表3所示。较典型的例如天津大学、中国电力科学研究院有限公司、国网天津市电力公司等机构近几年都在智能供电领域有较多合作,获奖共8项,其中2016年联合申报的“智能配用电系统多能源高效利用技术研究及工程应用”、2017年联合申报的“有源配电网电能质量监测与高品质供电关键技术及应用”、2018年联合申报的“综合能源微网调控关键技术及应用”在近3年分别获得天津市科技进步一等奖,说明这几个机构在此领域有着深厚的合作基础和研究深度。而在石油勘测领域,中国石油天然气集团有限公司、中国海洋石油集团有限公司等相关石油单位合作获奖20项,但这些机构与其他行业很少有联合申报科技奖项目,这主要是由行业性质的特殊性决定的。由表3可以看出:存在着机构交叉的派系,尤其是综合类高校居多,因为综合类高校的学科范围广,同一高校内不同学科部门与其他机构发生联系,而一些专业比较单一的高校所属的派系就少,合作范围也比较单一。例如:天津城建大学合作单位基本都是一些建筑类企业或者设计院;天津农学院的合作单位主要是饲料、水产、畜牧等相关机构。这和这些高校本身学科研究的方向比较专一有关,符合学校实际情况。这说明通过本文采用的方法进行的派系分析,结果真实地反映了实际的科研团队合作情况。
表3 2016—2018年天津市科技进步奖获奖项目的典型凝聚子群统计
由表3可以看出2016—2018年天津市科技进步奖获奖项目机构合作网络中,校企合作的派系所占比例较大,说明在科技进步奖申报中,高校正成为主力军,校企合作成果正成为科技奖获奖的主流。学校有丰富的学术、智力资源,企业拥有实验、实践基地,两者优势互补合作,为科技奖项申报提供有利条件。对于获奖数据,本研究将合作机构按照性质分为高校、企业、科研机构3大类,其中企业既包含私营企业也包含国有企业,医院、政府下属的组织均归类到科研机构,这样机构合作分为校企合作、校研合作、研企合作以及同性质机构合作。2016—2018年度天津市科技进步奖获奖项目中各种团队合作模式所占的比例如图6所示,可以看出同性质的机构合作一直占据主要位置,但是校企合作的比例逐渐增大,说明产学研合作的优势在逐渐体现出来。比较典型的如天津中医药大学与其附属医院以及医药企业的合作,学校主要负责理论研究、实验分析,医药企业负责生产销售的环节,附属医院主要开展临床验证,形成一个完整的产业链,促进了产、学、研协同发展,这对于其他行业的产学研合作同样具有借鉴意义。2017年颁布的《天津市关于强化实施创新驱动发展战略进一步推进大众创业万众创新深入发展的实施意见》提出了打造领军企业产学研用创新联盟,深化上中下游、大中小企业合作,推进企业与高校、科研院所构建产学研联合体,将产学研合作机制延伸到企业创新创业体系,将“双创”指标引入企业技术中心评价体系,为进一步深化产学研合作、支撑传统产业转型升级指明了方向。
图6 天津市科技进步奖获奖项目完成机构合作性质分类
本文借鉴向量空间模型,根据不同的机构在科技奖获奖项目中的排名构建了项目-机构矩阵,进一步构建机构合作关系网络进行合作相关度计算,运用社会网络分析法研究机构之间的合作网络,利用凝聚子群分析法发掘存在于其中的科研团队,主要工作和获得的结果总结如下:
(1)选取2016—2018年天津市科技进步奖获奖项目,并对获奖项目完成机构合作情况进行分析,发现机构合作报奖日益增多,且呈现出多极化的趋势,跨学科、跨地域合作不断增强。并以2016—2018年源数据构建了机构合作网络。
(2)利用社会合作网络分析方法对机构合作网络进行分析。通过点度中心度分析机构的合作规模,通过中间中心度分析找出在网络中影响较大、起主要中介作用的机构,通过网络密度分析得到哪些机构与其他机构联系广泛。分析结论显示:高校在科技奖获奖项目中从合作广度、资源中介等方面都起到了关键作用,处于网络核心位置,其中天津大学表现最为突出;企业和科研机构有较强的科技创新需求,但是创新能力不强,处于网络边缘地带。
(3)利用凝聚子群分析方法发掘存在于机构合作网络中的小团体,并进一步分析发掘存在于其中的科研团队。通过对团队合作模式的分析发现,产学研结合的项目在科技进步奖获奖项目中的优势逐渐显现。这也符合天津市实施创新驱动发展战略进行产业转型、深化产学研合作的需求,相信未来产学研合作项目将进一步引领科技创新发展。
本文以科技进步奖获奖项目作为源数据,运用社会网络分析法分析获奖项目完成机构的合作特点,有助于为政府和有关部门制定宏观科研政策、优化资源配置并促进科学技术的发展变革提供参考。当然,本研究还有不少局限,后续要进一步优化处理:
(1)分析对象只是结合了近3年的天津市科技进步奖的获奖数据,今后须进一步结合国内其他省份以及国家科技奖数据进一步完善,尤其是近几年京津冀科研合作日益增多,可进一步整理分析京津冀三地科技奖的机构合作特点和模式。
(2)本文利用社会网络分析法对机构合作网络进行了分析,运用凝聚子群的n-派系算法分析挖掘科技进步奖获奖项目当中的科研团队,后续可以尝试其他算法来研究分析比较哪种算法更优。
(3)对获奖项目完成机构的合作模式分析仅限于从机构的性质得出产学研结合的项目在科技进步奖评选中占据优势,今后也要结合机构的其他属性如研究领域等方面深入分析,为科研团队组建和发展提供理论支持。