大数据背景下一类社会网统计性质的初步研究

2019-02-13 01:36傅春花徐秀莲何大韧
计算机时代 2019年1期
关键词:数值模拟

傅春花 徐秀莲 何大韧

摘  要: 在大数据背景下,文章实证地研究了一类合作竞争网络的集群系数对顶点度的依赖关系,结果显示两者的依赖关系函数c(k)形式是多样的,有指数形式、泊松形式和幂律形式。通过广义合作网络模型,在项目大小分布分别是指数分布、泊松分布和幂律分布的三种情况下,数值模拟了集群系数对顶点度的依赖关系。得到的结果与实证统计的结果相同,即c(k)有指数形式、泊松形式、幂律形式及SPL等多种形式,并得出随机选择旧节点连接的概率p越大,所得网络的集群系数对顶点度的依赖关系越远离幂律形式,越接近均匀情况即指数形式或者泊松形式。

关键词: 集群系数; 顶点度; 实证统计; 数值模拟; 随机概率

中图分类号:N93          文献标志码:A     文章编号:1006-8228(2019)01-21-04

Abstract: In the background of large data, this paper empirically studies the dependency of clustering coefficient on the degree of a vertex in a class of cooperative competition network. The results show that the dependency function c(k) of the two has various forms, such as exponential form, Poisson form and power law form. Based on the generalized cooperative network model, the dependence of cluster coefficients on vertex degree is numerically simulated in three cases: exponential distribution, Poisson distribution and power law distribution. The results are the same as those of empirical statistics, that is, c(k) has many forms, such as exponential form, Poisson form, power law form and SPL. The greater the probability P of random selection of old node connections, the farther the dependence of cluster coefficients on vertex degree of the network is from the power law form, but the closer to the uniform situation, i.e. exponential form or Poisson form.

Key words: clustering coefficient; degree of a vertex; empirical statistics; numerical simulation; probability

0 引言

復杂网络,一个引起几乎一切基础学科和应用学科注意的热门研究领域,开始于1998年。它的研究和发展以图论作为重要基础,图论的大量知识在网络研究过程中得到了广泛的应用。之后,许多物理学家把统计物理学引入到复杂网络的研究中,大家才知道,许多实际网络的一些性质:例如集群系数(clustering coefficient)、度(degree)分布、平均距离(averaged distance)等。

顶点度(degree of a vertex),用k表示,是复杂网络研究中的一个重要的统计性质。一般地,假设网络中的一个节点i有ki条边将它和其他节点相连,那么这ki个节点就是节点i的邻点。某一节点i的顶点度ki,就定义为与该节点相连接的领点的总数,即节点的度表示为该节点的邻点个数的总和。直观上看,度越大的节点意味着它在某种意义上显得越“重要”。

集群系数(clustering coefficient),用c表示,是复杂网络研究中的另一重要统计性质和概念。它表示网络中某一节点的邻点之间联系的紧密程度。例如,在你的朋友关系网络中,你的两个朋友彼此间也是朋友的可能性大小。假设网络中的一个节点i有ki条边将它和其他节点相连,显然,在这ki个节点之间最多可能有ki(ki-1)/2条边,实际存在的边数记为Ei。那么,节点i的集群系数ci定义为。与此等价的另一定义为,其中,与节点i相连的三元组是指包括节点i的三个节点,并且至少存在从节点i到其他两个节点的两条边。整个网络的集群系数c,就是网络中所有节点的集群系数的平均值。很显然,c的取值介于0到1之间。当c=0时,说明网络中所有节点均为孤立节点,即节点之间没有任何连边;c=1时,说明网络中的任意两个节点都直接相连。一般情况下,c的取值是在0到1之间的某个中间值。

Erzsébet Ravasz 和 Albert-László Barabási曾研究过复杂网络的层次结构与该网络集群系数对顶点度的依赖关系密切相关[1]。他们提出,如果集群系数对顶点度的依赖关系函数c(k)是幂函数关系,即,则表明该网络具有层次结构。反之若c(k)不满足幂函数关系,则该网络无明显的层次结构。通过实证调研,我们也发现很多实际网络的c(k)并不是很好的幂函数关系,甚至有些实际网络的集群系数与顶点度是无相关的[2-5]。

本文研究目的在于讨论复杂网络中集群系数与顶点度的依赖关系。接下来将极其简要地介绍我们所研究的一些实际系统,以及这些实际系统的网络构成,重要的是给出我们所研究的这些实际网络的集群系数对顶点度的依赖关系。之后将给出我们广义合作网络模型的数值模拟结果,并对结果进行了粗浅的分析。最后将给出本文的一些简单的结论,期望对复杂网络的研究具有一定的价值。

1 实证统计结果

统计调研了10个实际系统。表1为这10个实际网络的具体描述。图1至图10为10个实际网络的集群系数与顶点度的依赖关系。

2 模型数值模拟

2.1 广义合作网络模型

下面是我们在广义合作网络模型[8]的基础上,对模型作了一定的修改,然后通过数值模拟得到了数值结果。设初始t=0时有m0个顶点,已经联接成若干个完全图项目,它们的项目度hi0之和为h0。每步时间演化过程增加一个新顶点,然后,以一定的概率p随机连接、以其余的概率(1-p)优选连接,选取T-1个旧顶点,把这T-1个旧顶点和这个新顶点(共T个顶点)中两两之间尚未连接的边都连上,构成一个新的完全图项目。共演化得到5000个项目,5000个节点。我们对项目大小(T)分别为泊松分布、指数分布和幂律分布时的三种情况进行了数值模拟,结果将在后文详细报道。

2.2 数值结果分析

下面是我们通过数值模拟得到的数值结果,图11、图12、图13分别为项目大小(T)为泊松分布、指数分布和幂律分布时,当网络演化过程中新节点连接旧节点的选择概率p取不同值时的情况得到的数值模拟结果。

2.2.1 项目大小为泊松分布(如图11)

2.2.2 项目大小为指数分布(如图12)

2.2.3 项目大小为幂律分布(如图13)

3 结束语

本文对十个实际系统进行了实证统计调研,主要研究了这十个系统的集群系数对顶点度的依赖关系,通过我们的研究发现,这些系统的c(k)关系函数形式是多样的,有指数函数、泊松函数等,甚至还有线性函数。为了能找出这些实证结果的合理解释,我们通过广义合作网络模型进行了数值模拟。通过对模型数值模拟结果的分析比较,发现在网络演化过程中,新节点选择旧节点的随机概率p越大,按照节点的项目度优选的概率(1-p)越小,演化所得网络的c(k)关系越远离幂律分布,越接近相对均匀的分布,即我们此处所述指数分布或泊松分布,而与网络本身的项目大小分布是什么情况无关。

参考文献(References):

[1] Erzsébt Ravasz and Albert-László Barabási.Hierarchical organization in complex networks. Phys. Rev. E 67 026112,2003.

[2] Parongama Sen, Subinay Dasgupta et al. Phys. Rev. E 67036106,2003.

[3] Anjan Kumar Chandra and Subinay Dasgupta. Physica A,2005:357-436

[4] S. Battiston and M. Catanzaro. Eur. Phys. J. B 38 345(2004).

[5] Wang Ru and Cai Xu. Chin.Phys.Lett,2005.22(10):2715

[6] 劉爱芬,付春花,张增平,常慧,何大韧.中国大陆电影网络的实证统计研究[J].复杂系统与复杂性科学,2007.4(3):10-16

[7] Fu C-H, Zhang Z-P, Chang H, Tao J-R, Chen Z-H, DaiY-L, Zhang W, He D-R. A kind of collaboration-competition networks[J]. Physica A, 2008.387:1411-1420

[8] Zhang P P, Chen K, He Y, Zhou T, Su B B, Jin Y, Chang H, Zhou Y-P, Sun L-C, Wang B-H, He D-R. Model and empirical study on some collaboration networks[J]. Physica A,2006.360:599-616

猜你喜欢
数值模拟
基于AMI的双色注射成型模拟分析
锥齿轮精密冷摆辗成形在“材料成型数值模拟”课程教学中的应用
基于气象信息及风场信息的风机轮毂处风速预测
西南地区气象资料测试、预处理和加工研究报告
张家湾煤矿巷道无支护条件下位移的数值模拟
张家湾煤矿开切眼锚杆支护参数确定的数值模拟
跨音速飞行中机翼水汽凝结的数值模拟研究
双螺杆膨胀机的流场数值模拟研究
一种基于液压缓冲的减震管卡设计与性能分析
蒸汽发生器一次侧流阻数值模拟研究