面向合著网络的社会网络分析法综述

2015-08-08 01:57刘洋李小龙
电脑知识与技术 2015年15期
关键词:社会网络分析

刘洋 李小龙

摘要:在科研研究过程中,交流与合作日趋普遍,其研究成果一般以论文等形式呈现。随着参与科研任务的研究人数越来越多,科学论文形成的合著网络规模日趋增大。综述当前合著网络的研究现状,详细介绍一些典型的研究合著网络的方法和分析结果,并分析总结了当前合著网络的研究不足

关键词:科研研究;合著网络;社会网络分析;研究不足

中图分类号:TP393 文献标识码:A 文章编号:1009-3044(2015)15-0161-02

Abstract: During the procedure of scientific research, cooperation and communication between researchers is becoming more common. The research achievements of scientific research activities generally appear in many forms, such as papers etc. As the increase of the number of staffs working at scientific research task, the scale of coauthor network formed by scientific papers is growing. We survey the state of the art coauthor network, and introduce several typical research papers in the coauthor network filed and corresponding basic viewpoints. On the basis of this, we discuss the shortage of current studies.

Key words: Scientific research; coauthor network; social network analysis; shortage of studies

1 引言

学术论文不仅为科学家提供了获取专业成就和增长知识的方法,也为研究人员提供了获取科学资源、建立科学界与工业精英之间学术交流网络的有效途径。学术论文常包含了两个或者两个以上的作者,独著论文日趋于减少,这种现象表明,随着科学技术变革速度越来越快、理、工学科日益交叉融合、新兴前沿学科不断涌现,科学合作有助于促进资源共享、思想交流、知识,提高科研产出效率。传统的数理统计方法难以适用于当前管理学的需要,将合著网络抽象为社会复杂网络,合著论文中的作者抽象成社会网络中的节点,合著关系表示成节点与节点之间的关系,利用社会复杂网络方法对其进行研究已成为当前的主要技术手段。

社会网络分析(Social Network Analysis, SNA)是20世纪70年代以来在社会学、心理学、人类学、数学、通信科学等领域逐步发展起来的一个研究分支。国内外学者已经把社会网络分析应用在很多研究领域,如竞争情报、知识管理、产业集群、学科热点、科研人员合著等方面。根据国内外已有的研究成果来看,在对科研人员合著现象的研究中,社会网络分析方法表现的非常有效 [1-8] 。

2 当前合著网络的研究现状

1994年以来,IEEE和ACM等大型数字图书馆出现以来,国内外的一些学者就开始关注和研究合著网络。其主要原因在于:对合著网络的当前状态和结构进行观察可以提供许多有价值的数据。合著网络属于一种典型的社会复杂网络,它具有其拥有的一些结构特征,如小世界特征、网络中存在内聚倾向以及无标度特征等等。因此,一些分析社会复杂网络的工具和方法同样可应用于合著网络,以深入挖掘合著网络潜藏的有用信息。这些工具和方法已成为当前研究合著网络的主要手段。

Newman M在文献[1-2]内,针对生物医疗、数学和物理等3个领域,分别对Los Alamos e-Print Archive、Medline、Stanford Public Information Retrieval System和Networked Computer Science Technical Reference Library等4个数据库中的论文构建单独的合著网络,对科研人员撰写科学论文的合作模式进行了定量的分析。在文献[1-2]中,Newman M分析了合著网络的基本结构特征,包括论文的数量、作者的数量,以及不同学科、不同时间下的合作模式的变化特点,观察到合著网络存在着以下特点:1)计算机、理论物理领域合作作者的平均数量较小,实验物理领域的合作作者平均数量非常大,不同学科不同方向之间存在着较大的差异;2)形成的最大连通子集一般包含了80-90%的作者,说明了同一学科形成的学术团体是相互连通的;3)在同一学科内,任意两个作者之间的平均距离为6,说明了合著网络符合小世界特征。

在文献[3]中,Newman M提出了计算中间中心度的快速算法,并通过中间中心性分析表明,与其它的社会复杂网络相似,中间中心度高的科研人员地位一般高于具有较小值的人。与一般网络不同的是,合著网络呈现一种小世界效应,作者之间的平均距离并不随网络节点个数的增加呈现对数级增长。在该文中,Newman M还讨论了带权值的合著网络以评估作者之间的合作强度。量化权值公式的基本思想是,合作论文数量越多,论文合著作者数越少,对应的权值越大。依据此公式,通过从事实验物理领域研究的科研人员构建的合著网络发现,基于权值的接近中心性分析比无权值的接近中心性分析更符合实际情况。主要根据是,若采用无权值的接近中心性分析,若干个最大接近中心度的节点都是从事实验物理领域研究的科研人员,这与该领域论文的平均作者数量较大有直接关系,因此难以衡量不同作者之间的合作关系强度。而采用基于权值的接近中心度分析方法,连接强度高的节点容易取得较高的值,如第5个最好的物理科学家,虽然只有3个科研合作者,但由于他们之间存在着紧密的科研合作,且这些科研人员自身与外界之间具有很强的合作关系,在该分析方法下,他所对应的接近中心度值较高,更能有效反映真实的科研合作情况。

Yoshikane等以43个顶级计算机期刊论文为例,考虑了研究者在科学研究中的两种角色,领导者角色和跟随者角色[4]。分析了合著网络中作者在不同角色中的重要程度,以及计算机理论和计算机应用领域之间在这方面的区别。结论指出,计算机应用论文对应的作者较多,计算机理论论文对应的作者较少。这与实际的观感是相符的,计算机应用常常更为复杂的实验,需要更多的研究人员共同来完成。而计算机理论一般注重理论推导,对实验的要求不高。此外,与计算机理论不同的是,在计算机应用领域,研究人员扮演的角色定位较为清晰,或领导者角色,或跟随者角色。

Yin等以交叉学科数据库COLLNET为数据源,研究交叉学科领域合著网络的特点[6]利用社会网络分析方法分析,得出如下结论:与一般的学科相比,交叉学科合著网络节点间平均距离较大,反映了交叉学科研究人员进行科研合作、信息流动率不高。此外,节点平均度较小,反映其领域研究人员之间的合作性不强等。基于以上结论,作者给出了交叉学科合作性差的原因,由于交叉学科发展时间不长,跨国界跨区域之间合作还较少,因此,随着时间的增长,该领域研究人员之间的合作必然会得到增强。

而在国内,一些学者也开始了这方面的研究,并取得了一定的研究成果。Liu X.等基于ACM、IEEE和联合的ACM和IEEE的数字图书馆内的合著网络,提出了一种带方向性的网络结构,设计了评价因子Author- Rank,对研究人员的贡献进行量化分级[10]。李凌云等针对有关“虚拟实验”方面的文章,从合著度与合著率、合著网络的中心性、凝聚子群、社群图等方面进行了分析[7]。在文献[8]中,作者根据收集整理的2004到2008年《科研管理》构建的合著网络,利用社会网络分析对整个合作网络进行了小团体分析、集聚程度分析和中心性分析。文献[9]利用社会网络分析方法,从中心性分析、凝聚子群分析以及核心和边缘结构分析三个结构,选择《情报学报》的合著者为对象,对国内情报学领域的合著网络进行了实证研究,指出了该学报的合著网络核心作者的数量和所属科研机构。

3 当前的研究工作存在的不足

从以上分析可以看出,现有基于合著网络的研究涉及到很多领域,如生物医疗、数学和物理、信息可视化、交叉学科等,从一些具有代表性期刊形成的合著网络出发,从全局范围内挖掘出当前具有影响力、较高学术贡献的研究人员和研究团队。这些研究虽然很有理论意义和实际价值,然而还存在着以下的不足:

1)学术界以往常常基于有影响力的期刊中搜索数据源,构建和形成合著网络,针对某一个具体团队成员的合著网络研究较少,也缺乏基于合著网络、分析某一二级机构下的科研团队结构的特征分析的研究成果。然而,小科研团队是从事科研活动的单元和基础,是承担国家重大的科学技术研究课题和经济社会发展中的重大理论问题和政策问题研究的核心力量,挖掘不同层次科研团队当前的状态和内部特征,有助于单位人事管理部门修正和制定相应的发展策略,以改善高校科研团队的结构,获得更多和更好的科研成果,应该对科研团队进行进一步的深入研究。

2)与国外著名机构相比,国内机构,尤其是地方性科研院所的科研实力还比较弱,在有影响力的期刊内发表的论文较少,因此,基于该样本构建的合著网络对于分析其所属学科科研团队的特征缺乏实际意义。若基于所有的期刊数据库的期刊论文作为数据源,又会导致出现一个新的问题:论文质量的度量问题。在前面的文献里面,有影响力的期刊论文质量都较好,然而,国内期刊质量参差不齐,有些期刊甚至以收取版面费作为盈利工具,不考虑论文质量,甚至缺乏基本的审稿程序。虽然以往的文献涉及到构建带权值的合著网络,但针对数据源样本质量参差不齐的情况,以往的文献还缺乏深入研究。面对这种情况,如何构建合适的合著网络,以评价研究个体在网络中的作用、重要性等,是需要解决的关键性问题。

4 总结

本文综述当前研究合著网络的代表性成果的基本思想和总体结论,重点叙述如何对关系进行量化表征、揭示关系的结构、解释社会现象的过程。在此基础上,分析和讨论当前合著网络存在的缺点和不足。

参考文献:

[1] Newman M E J. Scientific collaboration networks II:Shortest Paths, Weighted Networks and Centrality [J]. PHYSICAL REVIEW E, 2000(64): 016132.1-8.

[2] Newman M E J. Scientific collaboration NetworksI. Network Construction and Fundamental Results [J]. Physical Review E, 2000(64): 016131.1-8.

[3] Newman M E J. The structure of Scientific collaboration networks [J]. Proceedings of the National Academy of Sciences [J]. 2001,98(2): 404-409.

[4] F. Yoshikane, T. Nozawa, K. Tsuji.Comparative analysis of co-authorshipNetworks considering authorsroles in collabora tion: Differences between the Theoretical and Application Areas[J]. Scientometrics. 2006, 68(3):643-655.

[5] L. Yin, H. Kretschmer, R. A. Hanneman, Z. Liu. Connection and stratification in research collaboration: an analysis of the collnet network[J].Information Processing and Management. 2006(42):1599-1613.

[6] 李凌云,王海军,王佳.虚拟实验研究领域作者合著的社会网络分析[J].实验室研究与探索,2011,11(11):56-60.

[7] 付允, 牛文元, 汪云林, 李丁. 科学领域作者合作网络分析——以《科研管理》(2004-2008)为例[J]. 科研管理, 2009, 30(3):41-46.

[8] 李亮, 朱庆华. 社会网络分析方法在合著分析中的实证研究[J]. 情报科学,2008, 26(4):549-555.

[9] Liu X, Bollen J, Nelson M L, etc al. Co-authorship networks in the digital library research community[J]. Information Processing & Management, 2005, 41 (6): 1462-1480.

猜你喜欢
社会网络分析
突发事件网络舆情传播的实证研究
社会网络视角下的旅游规划决策研究
网络学习平台和移动学习平台协作学习效果比较研究
国内图书馆嵌入式服务研究主题分析
展会品牌利益相关者的构成及其网络结构研究
境外公益旅游研究进展与启示
新浪微博娱乐明星的社会网络分析
基于社会网络分析的我国微课研究探析
国内计算机领域科研团队结构分析
近10年我国会计学专业教育改革的综合可视化分析