基于SNA的科研合作网络结构与特征分析

2019-09-20 01:09韬1
重庆电力高等专科学校学报 2019年2期
关键词:周涛网络分析派系

刘 韬1,王 勉

(1.重庆交通大学 《重庆交通大学学报(自然科学版)》编辑部,重庆 400074; 2.江苏科技大学(张家港校区) 商学院,江苏 张家港 215600)

1 科研合作网络研究综述

科研合作网络是描述学术领域研究者之间合作关系的复杂网络拓扑结构,具有复杂的网络特征[1]。随着复杂网络研究的不断深入,研究者开始关注科研合作网络中节点连接的复杂性、网络演化特性和网络的动力学行为等问题,试图揭示知识创造和传播的规律。目前,对科研合作网络的研究己经成为复杂网络研究,特别是复杂社会网络研究的重要子领域。

通过对科研合作网络进行分析,能够发现隐藏在网络结构背后的社会关系,并能对某一特定领域的学术研究有更为深入的分析。10多年来,伴随着复杂网络研究的兴起,对科研合作网络的研究也从定性的分析进入到了定量的网络图形拓扑分析,并取得了一系列有价值的研究成果[2-4]。文献[3]对复杂网络的结构和功能进行了系统性的阐述,并对其中的数学家、物理学家、生物学家和引文网络做了定量化分析。科研合作网络中与大多数社会关系网络相似,都具有了小世界和无标度特征。之后Barabasi和Albert为了解释这一现象,提出了无标度网络演化的BA模型,模型指出网络的增长特性和优先连接特性是形成无标度网络的关键性要素。国内,肖连杰[5]、王福生[6]、孟佳娜[7]、张秀梅[8]、李涛[9]等学者分别从物理学、数学统计分析、动力学、数据验证的角度对科研合作网络进行了研究。

笔者基于科研网络无标度特征的基础上,利用社会网络分析(social network analysis,SNA)方法对研究领域内的引文网络关系进行了分析。引文网络是引文分析的研究对象,是指被施引文献与引用文献之间因引用关系而形成的一种网络,基本上由引文和引用组成,引文包括被施引文献与引用文献。通过分析发现该领域内科研人员的分布、合作情况,以揭示科研合作网络拓扑结构,为科研管理、知识管理提供参考依据。

2 研究方法

2.1 社会网络分析

人类社会作为一个关系社会,是人们通过某种联系建立起来的关系网络[10-14]。由多个点(社会行动者)和各点之间的连线(行动者之间的关系)组成的集合,形成了一个社会网络。在社会现象分析时,不能仅凭直觉来区分社会关联性,而需要借助一定工具来研究人类之间这种错综复杂的关系。社会网络分析(SNA)提供了分析社会网络的一系列工具,能帮助深入研究人类关系网络。随着小世界网路(small-world network)和复杂性(complexity)研究的突飞猛进,社会网络与此相适应,被广泛应用在产业集群、战略联盟、组织治理、科研管理、技术创新等众多领域,为揭示网络结构、剖析网络演化提供了新的视角。社会网络分析的最大优势在于,将复杂多样的关系表示为可视化的图形或矩阵,给予个体行动社会关系意义的阐释[9-10]。

2.2 社会网络分析的主要指标

2.2.1 点度中心度

个人在社会中处于什么位置,拥有什么样的权力是社会网络研究的重点。在社会网络中,用“点度中心度”指标来量化一个点的权力,分析该点在网络中对其他点的控制力。点度中心度可分为绝对中心度和相对中心度两类。绝对中心度是与该点直接相连的点数,相对中心度则为绝对中心度的标准化形式。若一个点与许多点直接相连,则可以认为该点具有较高的点度中心度,即表明该点在网络中拥有较大的权力,对其他点有较大的控制力和影响力[15-17]。

2.2.2 中间中心度

在社会网络中,常常可以发现网络中存在这样一个点,该点处于多个点之间,为其他点之间的联系架起一座桥。若某个点处于诸多其他点连接的路径上,其他点必须通过该点才能链接,即表明该点具有控制其他点连接的能力,对网络资源具有较强的控制度,则该点中间中心度越高。

2.2.3 网络密度

在一个社会网络中,成员之间可能互相联系,关系表现比较密切,也有可能仅有少数成员互有联系,关系表现比较松散。网络密度用来衡量一个图中点与点之间关联的密切程度,是描述图的性质的重要概念。完备图指的是所有点之间都相互邻接的图,网络密度这个概念试图对线的总分布进行汇总,以便测量图在多大程度上具有这种完备性。简而言之,关系紧密的社群信息沟通较方便,而关系不紧密的社群在沟通中常常不便。

2.3 数据收集与处理

科研人员之间的合作涉及多层面、多方式,不易观察和测量。科研论文是衡量科研人员科研成果产出的主要标准之一,由于其公开发表,数据容易获取。因此,笔者选定CNKI数据库,以某一个特定关键词为例,搜索相关研究领域内的科研论文,以此作为研究对象和数据来源。

笔者通过对CNKI数据库的抽样调查,搜索关键词“无标度网络、科研”,时间为2010—2018年,共有相关记录189条,按被引频次来排序,越往后,被引频次越低。由于某一个关键词内的科研论文数量巨大,在数据的筛选时,根据“被引频次”排序,选择被引频次在10以内的论文作为最终的数据来源。“被引频次”在一定程度上可以代表作者论文水平的高低,代表着作者在该领域内的贡献和科研地位。由已有的研究可知[10],数据的分布呈现幂律分布,是一个典型的无标度网络。因此,选择“被引频次”作为数据的筛选标准具有一定的可行性和科学性。

在数据处理时,文章名为行数据,作者为列数据,不考虑作者在一篇文章中的排序先后。如果科研人员为文章作者,标准为1,否者标准为0,从而构建一个科研人员和文献关系的二模数据矩阵。经过ucinet处理之后,转为1模数据矩阵,即科研人员之间的数据矩阵,以此来分析科研人员之间的合作关系和该领域内的网络架构。

3 社会网络分析结果

3.1 派系分析

凝聚子群分析是社会网络分析的重要方法,对于了解网络结构具有重要意义。根据有不同类型的凝聚子群分析方法,可分为派系、n-派宗、K-丛等方法。

当网络中某些行动者之间的关系特别紧密,以至于形成一个次级团体时,这样的次级团体就成为凝聚子群。关于一个网络中存在多少这样的凝聚子群的分析即为派系分析。

经计算得到,当最小派系数目为4时,分为17个派系。为了分析方便,减少派系数目,把最少派系数目设置为5,此时分为7个派系。如图1和图2所示。

1: 周涛汪秉宏傅忠谦牛永伟王达曾燕周佩玲2: 周涛柏文洁汪秉宏刘之景严钢3: 周涛汪秉宏蒋品群李季王文旭4: 狄增如方锦清汪小帆郑志刚毕桥李翔5: 赵静俞鸿骆建华曹志伟李亦学6: 许田张培培姜玉梅苏蓓蓓何大韧7: 王龙伏锋陈小杰王靖李卓政谢广明楚天广

图1 派系分类

图2 派系分类中作者隶属矩阵

其网络图如图3所示。

图3 网络图

由图3可以看出,有的作者不在派系之列,有的作者分别属于几个派系。例如周涛、汪秉宏同时属于1、2、3派系,是该领域研究的活跃和领军人物,对科研的流动、知识的交流起着带动作用。

3.2 点度中心度分析

中心度是衡量网络节点在网络中的位置重要性的指标,也是社会网络分析的重要指标之一。度数中心度是一个简单的指数,节点的度数中心度分为绝对中心度和相对中心度两类。

绝对中心度是网路中与该点直接相连的点数,相对中心度为绝对中心度的标准化形式,即

中心度是根据节点连接度数衡量节点处于网络中心的位置,节点度数中心度越高,该点就越位于网络的中心。

结果显示, 周涛、汪秉宏、方锦清、王小帆等绝对度数高,是网络中的核心节点。如图4所示。

其网络图显示结果如图5所示。

3.3 点的中间中心度分析

“中间性”测量的是一个点在多大程度上位于图中其他点的“中间”。假设在一个点对X和Z之间存在n条捷径,一个点Y相对于点X和Z的中间中心度,指的是该点处于此点的捷径上的能力。

点的中间中心度指一个点通过在其他点之间相连的最短路径上占据中间人的位置,从而为网络中其他行动者充当潜在“中介”角色的程度。如果一个点位于许多其他两点之间的路径上,就可以认为该点具有高的中间中心度。中间中心度反映一个点在多大程度上控制他人的交往。如图6所示。

123中心度相对中心度占比------------------------------------3周涛19.0003.8000.0425汪秉宏17.0003.4000.03713方锦清15.0003.0000.03314汪小帆14.0002.8000.03117李翔14.0002.8000.0312狄增加12.0002.4000.02616毕桥10.0002.0000.02215郑志刚10.0002.0000.02226蒋品群7.0001.4000.01524周佩玲6.0001.2000.013112楚天广6.0001.2000.013106王龙6.0001.2000.01321牛永伟6.0001.2000.01322王达6.0001.2000.01323曾燕6.0001.2000.01331黄海军6.0001.2000.013109王靖6.0001.2000.013110李卓政6.0001.2000.013

图4 中心度和相对中心度

图5 中心度网络结构示意图

12中间中心度非中间中心度------------------------3周涛232.1672.99613方锦清231.0002.98180章忠志210.0002.7102狄增如55.0000.71017李翔26.5000.34214汪小帆26.5000.3425汪秉宏24.1670.31240钱省三2.0000.02626蒋品群0.6670.00931黄海军0.3330.00430毛保华0.3330.00428高自友0.3330.00412陈晓荣0.0000.0006刘之景0.0000.000

图6 中间中心度与非中间中心度

其网络图显示如图7所示。

经计算得到,周涛、方锦清、章忠志的中间中心度分别为232、231、210,说明他们承担着科研交流的桥梁和中介作用。狄增如、李翔、王小帆、汪秉宏、钱省三也是相对重要的科研连接。

尤其值得一提的是章忠志,在派系分析和点度中心度分析时,章忠志在图4和图6中均未出现。但是他有很高的中间中心度。说明该作者发表过少量重量级文章,虽然他只发表了少量文章,但是这些文章非常具有研究价值。经查阅作者资料可知,章忠志是复旦大学计算机科学技术学院的副教授,主要研究领域为复杂网络、随机游走、量子信息、理论计算机科学等,迄今在国际SCI期刊上发表论文30余篇,例如Physical Review E、The European Physical Journal B、Europhysics Letters等。虽然章忠志的文章几乎都发表在外文期刊上,发表在中文期刊上的非常少,但是其研究成果具有很强的代表性和前沿性,所以在复杂网络研究领域是重要主力作者。在其发表的中文文献中,仅有的联系作者就是其导师荣莉莉,此外是周涛和方锦清。可见,ucinet分析的结果显示和实际情况是符合的。

图7 点的中间中心度网络结构示意图

3.4 网络密度分析

在一个无向关系网络中,如果网络中有n个行动者,那么包含的关系总数理论上最大可能值为n(n-1)/2,如果该网络中的实际关系数目为m,那么该网络的密度就是“实际关系数/理论上的最大关系数”,即m/(n(n-1)/2)=2m/(n(n-1))。

如果是有向网络,则网络密度为:m/(n(n-1)/2)。密度越高,说明节点间联系渠道越多,沟通频繁,网络具有较高的凝聚性和活跃度。

经计算,整体网密度为0.029 0,网络中关系的标准差为0.190 4。说明本组科研作者网络密度小,网络节点之间联系少,结构松散,多数作者之间没有合作,或者合作较少。这和中心度、中间中心度的分析结果是一致的。

4 结论

数据是未来社会发展的重要资产,单独、零散的数据没有价值,数据的价值来自于数据互联所传递出来的重要信息。笔者利用SNA分析了引文网络的作者关系,通过几个简单指标,发现了科研网络中非常重要的信息,例如哪些是核心作者,哪些是后起之秀,哪些作者起到科研交流中介的作用等,其所揭示出来的科研网络信息,对于明确行业领军人物、组建科研团队、促进知识交流和扩散、科研管理等具有积极的指导意义。

猜你喜欢
周涛网络分析派系
基于ISM模型的EPC项目风险网络分析
低轨卫星互联网融合5G信息网络分析与应用
铁路有线调度通信的网络分析
“派系撕裂校园”:暨南大学驱长风潮研究(1933—1934)
《三角形全等的判定》测试题
2016年社交网络分析
民進黨派系新動向
周涛小小说欣赏
Flapping Characteristics of 2DSubmerged Turbulent Jets in Narrow Channels*