张利亚 杜 川 逯鹏
【摘 要】近年来,全世界爆发了多种全球性传染病,这使得研究者们开始更多地关注病毒的传播机理和如何采取有效措施控制病毒传播,而复杂网络为研究病毒传播提供了有效工具,同时复杂网络也是复杂性系统研究的重要手段,因此复杂网络的研究具有十分重要的价值和意义。文章以實际社会网络中的病毒及传染病传播为切入点,着重介绍了复杂网络的统计特征、数学模型及复杂网络上的病毒传播知识,并对复杂网络研究的发展进行展望。
【关键词】复杂网络;病毒传播;仿真组合
【中图分类号】R511;O157.5【文献标识码】A 【文章编号】1674-0688(2020)11-0094-03
0 引言
从2003年的SARS病毒、2009年的甲型H1N1流感、2014年的埃博拉病毒,到2020年暴发的新型冠状病毒,局部的传染病会迅速演变为全球性的流行病大暴发,因此研究病毒的传播机理,进而采取有效措施控制病毒传播具有十分重要的价值和意义,而复杂网络为此提供了有效的研究工具。不仅病毒传播网络及传染病网络,人类社会的很多网络,比如社交网、语义联系网、因特网、电力网、食物链网、蛋白质作用网、大脑网络等,都可以用复杂网络进行描述和分析[1]。本文以病毒传播网络为切入点,浅析当前复杂网络的发展。
用复杂网络来描述某一复杂系统时,节点表示某一物理实体,节点间的连边代表节点间的关系或相互作用。1959年,Erdos与Rényi两位学者创建了随机图理论,被公认为为复杂网络的创始性系统研究。20世纪的后40年并没有更好的研究方法提出。直到世纪之交,研究者们打破了长期的传统图论观念,对复杂网络开始了轰轰烈烈的研究,其中两项重要发现被认为是其发展过程的里程碑:WS小世界网络和BA无标度网络。此后,复杂网络的研究得以迅猛发展[2]。
1 复杂网络理论基础
研究者们用一些统计特性来描述复杂网络,这些特性包括平均路径长度、聚类系数、度与度分布、介数及其分布、模块性、度相关性等[3]。实际的复杂网络大多数都具有小的平均路径长度、节点的度分布服从幂律分布、具有较高聚类性等。
1.1 平均路径长度
平均路径长度L(也叫特征路径长度)表征网络中所有节点对之间距离的平均值,而节点对之间距离用dij表示,指连接这两个节点的最少的边数。
网络中dij的最大值称为网络的直径,用D表示:
N为网络中节点的总数。D与L可以用作衡量网络的传输效率和鲁棒性的指标。特定的实际网络中,其平均路径长度L也存在其特定的意义。例如,在病毒传播网络中L代表病毒传播时间,交通网络中L代表站点间的距离。L是表征网络的整体特征参数。
许多实际的网络虽然规模很大,即网络节点数N很大,但其平均路径长度L却较小,这就是复杂网络的小世界特性。这是因为L与N是对数成正比,即L∝lnN。大量研究表明,实际社会中的复杂网络大多都具有小世界属性。
1.2 聚类系数
节点的聚类系数描述:假设节点i存在ki个邻居节点,而这ki邻居节点之间又互相存在实际的连边数为Ei,那么节点i的聚类系数Ci可以表示如下:
某一节点的聚类系数的含义:该节点全部邻居节点之间的实际连边数,与这些邻居节点间最大可能连边数的比值。而所有节点的聚类系数的平均值就构成了网络的聚类系数C,由定义知0 1.3 度与度分布 度与度分布是网络的一个重要参数。网络中单个节点的度可以用该点所连边数来表示,或者用该点的邻节点数来表示。网络中度大的节点通常称为关键节点。网络的度是指所有节点度的平均值,也称为网络的平均度,用〈k〉来表示。网络中节点的度分布情况常用分布函数P(k)来描述,P(k)表示随机选择的某个节点的度恰好为k的概率是多大。 有两种经典的度分布情况:一种是指数分布,即随着k的增加P(k)以指数形式衰减;另一种是幂律分布,即P(k)~k- r,r为度指数,r的值与网络的动力学特性有关。幂律分布也称为无标度分布,此时网络被叫作无标度网络。 常见的网络(比如规则网络和随机网络)度的分布区间比较小,多数节点的度分布都集中在平均度(k)的左右,这是代表了网络节点的同质性,故平均度〈k〉的值也被认为是网络的一个重要特性指标。 1.4 复杂网络模型 一个好的网络模型能够正确地表征真实网络的拓扑结构特征。对复杂网络建模是复杂网络研究的一个重要方向,其目的是揭示形成这些共有统计特性的内在机制。但是,由于真实的网络通常具有高度复杂性,那么仅用一个通用模型对所有真实网络进行建模是不科学的。研究者们对复杂网络的研究经历了从规则网络、随机网络,到小世界网络与无标度网络的发展历程,比较经典的复杂网络模型有规则网络(比如星形耦合网络、全局耦合网络及最近邻耦合网络等)、随机网络(ER随机网络)、小世界网络及无标度网络。WS小世界网络演化模型如图1所示。 2 复杂网络上的病毒传播 截至目前,针对复杂网络的研究整体上体现在两个方面:一方面是揭示网络结构演化的动力学机制,另一方面是研究网络上的动力学过程。复杂网络上动力学过程主要研究网络结构对其上的动力学过程的影响,这有助于人们理解各种真实网络的功能。复杂网络上的动力学过程很复杂,例如耦合振子的同步、病毒传播、演化博弈行为、雪崩效应等[4]。这里简要介绍复杂网络上的病毒传播。
各类病毒造成的传染病不单会危及人们的身体健康,还会给社会带来重大的经济损失,造成金融危机,演变为全人类的重大灾难。因此,对于病毒传播或者传染病的发生机制、传播机制,以及相对应的防控措施的研究是当今科学研究的重点和焦点。
病毒传播动力学是对病毒传播进行定量分析的一种理论方法。首先通过分析病毒种群的生长特征、发病机理与传播规律,以及相关的生物和社会因素创建一个合适的数学模型;然后对该数学模型的动力学特性进行定性定量分析及数据模拟,进一步揭示疾病的发生过程及传播规律;最后判断传染病的发展形势,剖析病毒传播的原因及要素,探求传染病预防及控制的最佳策略。
经典的病毒传播模型把病毒内的个体分为几类,每一类均处于一个基本状态。这些基本状态包括:S(susceptible)易感状态,也称为健康状态;I(infected)感染状态;R(removed)被移除状态。一般用不同状态之间的转化过程来定义不同的传播模型。其中,影响最大的是Pastor-Satorras与Vespignani通过平均场理论建立的SIS及SIR模型。易感状态被感染后又回到健康状态并且拥有了免疫性,这种情况称为SIR模型。如果易感人群被感染后又重新回到原来的易感状态,这种情况称为SIS模型。
复杂网络上的病毒传播和规则网络上的病毒传播有非常显著的不同。在随机网络或者规则网络中存在有限的正值传播临界值λc,当传染病的有效传播率低于λc时,感染节点总数成指数减少,到最后病毒在网络中被消灭,此时的网络处于吸收阶段(absorbing phase)。与之相反,当传染病的有效传播率大于λc时,病毒会扩散,使最终网络的感染个体总数趋于某个稳定状态,此时网络处于激活阶段(Active Phase)。
当传播网络为无标度网络时,一个节点的度越大,被感染的概率就越大。对于指数范围是2<γ≤3的无标度网络,当网络节点数N→∞时,网络的λ0→0。因为大部分无标度网络都存在2<γ≤3,所以在无标度网络中,总有λ≥λc,不管传播强度多么小,疾病总能长期存在。
研究流行病、计算机病毒、知识、谣言等各种信息在真实系统中的传播是一项非常复杂而有意义的工作,也是当前研究的热点之一。例如,针对2020年暴发的新型冠状病毒肺炎疫情,白亮等人研究了新型冠状病毒来源、传播途径,并总结了易感动物模型最新研究进展[5],李栋、白瑞瑞提出了一个关于新型冠状病毒传播仿真组合模型来有效模拟新型冠状病毒(COVID-19)的传播过程[6]。
3 复杂网络研究展望
21世纪以来,得益于计算机、互联网及各种高端科学技术的进一步发展,人们已经进入大数据时代,能够快捷地获取所需的各种信息和资源,人类的生活与科研也发生重大改变,复杂网络已成为大数据时代不可缺少的一部分。
对于复杂网络的研究还有助于人类解决当今所面临的以下重要问题[7]:①可以为网络工程的设计、防护和开发应用提供稳固的理论和技术基础,例如研究计算机网络上的病毒傳播有助于找到抑制病毒传播的有效途径。②21世纪是互联网和大数据时代,网络科学的研究具有现实和长远的军事国防意义。③复杂网络研究有助于人类早日战胜各种传染病。例如,社会网络中不同传染病的传播机制、人们采取什么控制措施能将损失降到最低。因此,对复杂网络的研究具有重大意义。
参 考 文 献
[1]刘建香.复杂网络及其在国内研究进展的综述[J].系统科学学报,2009(4):33-39.
[2]周涛,傅忠谦,牛永伟,等.复杂网络上传播动力学研究综述[J].自然科学进展,2005(5):513-518.
[3]张利亚.视觉皮层突触连接网络演化模拟研究[D].郑州:郑州大学,2016.
[4]刘永奎.复杂网络及网络上的演化博弈动力学研究[D].西安:西安电子科技大学,2010.
[5]白亮,刘宝宁,赵四海,等.新型冠状病毒来源、传播途径及易感动物模型研究进展[J].临床医学研究与实践,2020(S1):1-2,11.
[6]李栋,白瑞瑞.新型冠状病毒传播仿真组合模型[J].统计与决策,2020(5):5-10.
[7]汪秉宏,周涛.当前复杂系统研究的几个方向[J].复杂系统与复杂性科学,2008(4):25-32.