张 晶,王福生,杨洪勇
(鲁东大学a.图书馆信息交流部;b.信息与电气工程学院,山东 烟台 264025)
社会合作网络中的群体涌现行为研究
张 晶a,b,王福生a,杨洪勇b
(鲁东大学a.图书馆信息交流部;b.信息与电气工程学院,山东 烟台 264025)
应用复杂网络理论,研究了社会合作关系网络,揭示社会网络的群体涌现行为。通过对科学家科研合作网络进行分析,建立了一个科研合作网络模型。在建立的合作网络模型基础上,引用实证数据,研究了期刊作者通过合作科研论文所形成的实证数据网络。研究结果表明形成的作者科研论文合作网络是具有群体涌现行为的自组织无标度网络,实证网络的统计数据呈现出复杂网络的小世界网络特性。
合作网络;群体;涌现;复杂网络
科学技术的发展,推动了世界各地的科研组织和科研机构采用全新的现代化方式进行合作研究,各种形式的科学合作日益成为科学研究中进行科技创新的主要方式。通过对科研合作形成的团队结构进行研究,来揭示科学技术研究人员的信息交流与合作共享的组织形式。研究过程中,把科研团队成员作为网络中的一个节点,如果两个科研人员共同承担过某科研项目或者共同发表过科研论文,则这两个节点之间就有一条连边,也就是说这两个研究人员之间有合作。随着时间的变化,大量科研人员之间就逐渐形成了一个结构复杂的网络[1-3]。
在科研人员合作关系网络中,可以应用网络分析方法来分析科学家之间的合作关系以及科学家之间的相互影响。对于科研合作网络节点之间连接的复杂性、科研合作网络结构的演化规律以及科研合作网络模型的动力学行为等相关问题,近年来是复杂网络研究领域关注较多的问题之一[4-8]。通过对某学科领域内的科研合作网络的演化规律进行研究,对探索科研合作的新模式、增强科学家的影响力、提高科学家的创新能力,以及促进学科领域的快速发展等问题具有很重要的推动作用。
本文通过对科研合作网络的变化规律进行分析,应用复杂网络理论,建立了一个科研合作网络结构演化模型,研究了科研合作演化网络中的群体涌现行为。应用实证数据分析,表明形成的科研合作关系网络是具有群体涌现行为的自组织网络。
研究科研合作网络,首先要建立科研合作海量数据库,然后从数据库中提取合作关系数据,最后根据数据库中的合作信息建立一个合作关系网络。本文主要研究某领域科学家之间共同发表科研论文的合作关系库,令数据库中一位作者作为网络中一个节点,如果数据库中的作者之间共同发表过一篇科研论文则合作网络中对应的节点之间就建立一条连线。在提取合作数据时分析发现:有许多科研论文的作者在选择合作作者时,不是完全随机选择的,合作者是在自己的研究团队中(或者在科研合作人员中)选择。当然也存在少数的个别作者是独立的,这种情况在网络中就相当于是孤立节点。在期刊论文统计数据库中,论文的作者数量是不确定的。
本文作者对科研论文海量数据库进行了深入细致的分析,根据分析结果提出了本文的科研合作网络结构演化模型,来描述科研合作网络中论文与作者的演化规律。
网络演化初始,首先假定数据库中已经有m0篇科研学术论文,每篇科研论文中包含的作者数量随机选定,初始假定数据库中共有n0个作者。根据网络的演化过程,每次只能增加一篇科研论文,作者合作关系网络就会发生一些变化(增加一定数量的作者),根据合作判定规则增加一些连线。由于在实际期刊论文中每篇科研论文的作者数量是有限的,因此网络演化算法中每次最多增加K个作者。科研合作网络按照预先设定的概率逐步生成作者和连线:
其中,分子si等于节点i所有边的连接度之和,称为节点的连接强度;分母为M个作者组成的局域网络中所有节点的强度之和。
3)不增加新的作者。这种情况是,新的论文作者都已经在数据库中存在了。按照规则1)选择已经存在的i个作者,构成一个全连通的子网络。
假设网络连接概率分别为p1,p2,p3,而且p1+p2+p3=1。根据复杂网络理论和网络演化算法,新网络模型中节点i的强度si的变化率为
在科研合作网络演化算法模型的3种不同情况中,假设3种不同情况具有相同的期望值:
代入式(1),简单整理可得
化简可得,节点强度的概率分布
图1 合作网络模型的分布图(log-log)Fig.1 Distribution figure(log-log)of collaboration network model
在科研合作网络的群体行为研究中,统计了《情报学报》期刊近6年间出版的所有论文,并建立了科研论文作者合作关系数据库,数据库中有期刊论文的标题以及每篇论文对应的合作者。本文中只考虑两位作者之间的合作关系(没有考虑是否有多篇合作论文),也没有考虑作者在论文中的署名顺序,在同一篇论文的合作者之间的合作关系用一个全连通的子网络来表示。
首先分析实证数据库的复杂网络特性。通过对科研合作数据库进行分析,统计了合作网络中每个节点的连接边数,也就是每个节点的邻居个数(表示这位作者有多少合作者)。实证数据统计发现(见表1)网络中有许多节点的连接度数很小(度不超过3的节点数有880个),只有很少节点的连接度数较大(节点度数大于10的只有5人)。
表1 网络节点的度分布Tab.1 Degree distribution of network nodes
根据数据库的统计结果,绘制了合作网络中的合作者数量与作者数的关系图(见图2),度分布图中科研网络的合作者数目呈现出幂律衰减规律,整个合作关系网络的度分布呈现出无标度复杂网络特性,无标度网络的幂律指数k≈-2.5。合作网络是自组织的无标度网络,与网络演化算法的理论分析一致。
通过对实证海量数据库的深入分析,科研实证网络是一个非连通的复杂网络(见表2),实证合作网络由一些没有关联的独立子网络构成。各子网络之间没有连线,但每个子网络的内部节点之间连接紧密,形成一个全连通合作子网络。
由统计表可以看出,合作网络有5个非常大的研究团队,这些团队中研究人员超过了20人。由于科研合作网络是一种自组织网络,而这种自组织网络表现出来群体涌现行为。这些群体组成的子网络中,作者形成了良好的科研合作关系,群体中发表论文较多,科研人员之间合作的机会较多,同时他们之间的相互影响较大,这种良好的合作关系能够促进新知识的传播和共享。这些自组织群体涌现对于新技术探索、新知识共享具有很大的推动作用。
合作网络中节点数目为23的子网络是一个较大的网络(见图3),该研究团队有23名合作者,其网络结构与常规的星形网络近似,该合作子网络具有较大的聚集系数,该研究团队有很强的凝聚力,构成了一个典型的小世界网络。该网络中度最大的节点度数为20,也是整个网络连接度数最大的,具有网络最大介数229。该科研人员具有很强的影响力和号召力,应该是该研究团队的带头人。
合作网络涌现出的最大的子网络(见图4)。该研究团队有27名科研人员,其中又分成了多个研究子团队。除了靠近右边的两个小团队看起来较分散外,其他3个小团队组成的子网络结合比较紧密,这3个小团队都有一个影响力较大的领导者,3个团队的领导者在网络中也是直接相连的。因此涌现出的最大的科研团队,其成员可能来自不同的研究小团队,这些科研人员之间具有知识的互补性,其团队合作精神更强,这种结构的合作网络对新知识的传播和新技术的探索具有更大的促进作用。该网络中度最大的中心节点的连接度数为10,介数为249。对科研合作数据库中的作者单位进一步研究发现,该科研团队是整个网络中人员地域分布最广的,与我们的分析一致。
图2 合作者数量与作者数的关系log-log图Fig.2 Collaboration network log-log plot for collaborators and authors
表2 合作网络节点数统计表Tab.2 Statistical table for nodes number in collaboration network
图3 节点数为23的子网络拓扑Fig.3 Sub-network structure with 23nodes
图4 节点数为27的子网络拓扑Fig.4 Sub-network structure with 27nodes
本文研究了科研合作网络的群体涌现行为。通过对科研合作关系数据库的深入分析,建立了一个基于复杂网络的合作关系网络演化模型。应用理论分析和实证数据研究了科研合作网络的演化规律,分析了科研合作网络的一些整体和局部的结构特点。研究发现,自组织合作网络符合复杂网络的幂律分布,同时表现出群体涌现行为。本文研究对于创新技术的探索、科技信息的获取、科学资源的共享等科技发展创新思想的研究具有十分重要的理论指导意义。
[1]Newman M.Scientific collaboration.I.network construction and fundamental results[J].Phys Rev E,2001,64(1):016131.
[2]Watts D,Strogatz S.Collective dynamics of“small world”networks[J].Nature,1998,393(4):440-442.
[3]Barabási A,Albert R.Emergence of scaling in random networks[J].Science,1999,286(5439):509-512.
[4]张培培,何阅,周涛,等.一个描述合作网络顶点度分布的模型[J].物理学报,2006,55(1):60-67.
Zhang Peipei,He Yue,Zhou Tao,et al.A model describing the node degree distribution of collaboration network[J].ACTA Physica Sinica,2006,55(1):60-67.
[5]徐玲,胡海波,汪小帆.一个中国科学家合作网的实证分析[J].复杂系统与复杂性科学,2009,6(1):20-28.
Xu Ling,Hu Haibo,Wang Xiaofan.An empirical analysis of Chinese scientific collaboration network[J].Complex System and Complex Science,2009,6(1):20-28.
[6]杨洪勇,张嗣瀛.作者合作复杂网络模型[J].情报科学,2008,26(5):774-778.
Yang Hongyong,Zhang Siying.A complex network model of author collaboration[J].Information Science,2008,26(5):774-778.
[7]杨洪勇,王福生.科研合作网络中的模体涌现模型[J].情报学报,2009,28(4):606-609.
Yang Hongyong,Wang Fusheng.Motif emerging model of scientific collaboration network[J].Journal of the China Society for Scientific and Technical Information,2009,28(4):606-609.
[8]李凯军,顾长贵,瞿艳青,等.一些实际双层网络之间的合作涌现[J].复杂系统与复杂性科学,2012,9(2):79-83.
Li Kaijun,Gu Changgui,Zhai Yanqing,et el.Onset of cooperation in some real world layered networks[J].Complex System and Complex Science,2012,9(2):79-83.
On Swarm Emergence Behavior of Community Collaboration Network
ZHANG Jinga,b,WANG Fu-shenga,YANG Hong-yongb
(a.Library Information exchange department;b.School of Information and Electrical Engineering,Ludong University,Yantai 264025,China)
In this paper,by applying complex network theories,the community collaboration network is studied and the swarm emergence of the community network is revealed.Based on the analysis on research collaboration network,a network model for author collaboration database is founded.By means of the network theories model,the Journal authors collaboration network is investigated by the demonstration data.It is shown by means of data analysis that the collaboration network is a self-organized network with the behavior of the swarm emergence,and the network statistics parameters have presented the complex characteristic of scale-free and smallworld.
collaboration networks;swarm;emergence;complex network
TP301.5
A
1672-3813(2013)03-0045-05
2012-12-04
国家自然科学基金(61273152);山东省自然科学基金(ZR2011FM017)
张晶(1965-),女,山东莱州人,副研究馆员,主要研究方向为网络数据分析、数字化网络等。
杨洪勇(1967-),男,山东庆云人,博士,教授,主要研究方向为复杂网络、多智能体编队、网络控制等。
book=49,ebook=310
(责任编辑 李进)