田崇峰 陈智豪 王 进 葛桂萍
(1.江苏农林职业技术学院 信息工程学院 江苏 句容:212400;2.江苏农林职业技术学院 基础部 江苏 句容:212400;3.扬州大学 信息工程学院 江苏 扬州:225127)
互联网尤其是移动互联网的快速发展,给人们提供了更多的信息来源。即时通讯软件、微型博客、SNS(Social Network Service)网站等在线社交工具构建出一个庞大的在线社交网络,例如国外的Facebook和国内的微信。在这个虚拟的社交网络里,信息传播的速度比以前更快,范围更广。在线社交网络对于加速信息与知识传播、促进情感分享发挥着积极的作用,但另一方面,也给一些负面消息(例如谣言等)的传播提供了可乘之机。在社交网络里,谣言的传播速度非常快,危害也非常广,对人们正常的生产、生活秩序造成恶劣的影响,例如“达州一孕妇因H7N9死亡”[1]。因此,研究在线社交网络环境中谣言抑制策略,有效控制谣言传播的范围,尽可能消除对社会造成的危害具有非常重要的应用价值。
在社交网络环境中,信息传播模型吸引了众多学者的研究兴趣。大部分研究工作以传染病传播模型为基础,从不同侧面加以改进使之更符合信息在虚拟社交网络的传播规律。黄宏程[2]等在SIR(Susceptible Infective Removal)的基础上,对感染者引入了衰减函数,相当于感染者在没有外力的作用下自身获得免疫成为免疫者。谭娟[3]在SIR模型上将感染事件细分为内部感染和外部感染,将免疫事件细分为传播者自身产生抗体获得免疫和易染者自身免疫。M-CSR[4]模型将网络节点划分为轻信者、传播者和理性者,在CSR(Credulous Spreader Rational)基础上引入了个人接受概率,建立移动SNS谣言传播模型。万佑红[5]等将从众效应引入到CSR模型中,揭示从众效应在谣言传播的特性。
由于谣言传播给正常社会秩序造成危害,部分研究工作及成果集中在谣言抑制策略方面。在复杂网络中目标免疫策略[6]、熟人免疫策略[7]最初应用于控制网络中病毒的传播。顾亦然等在SEIR[8]的基础上提出了重要熟人免疫[9]的谣言抑制策略,随机选择1个健康节点作为初始免疫节点,抑制策略是在模型的每轮迭代中总是选择免疫节点的1个最重要熟人节点作为免疫对象,并与目标免疫策略[6]、熟人免疫策略[7]进行对比分析。李涵曼[10]等在SIR基础上引入“推手节点”,通过该类节点来抑制信息传播,推手节点类似于目标免疫策略[6]的Hub节点。王英等提出的改进的综合免疫策略[11],在目标免疫策略与熟人免疫策略之间寻求折中,是两种免疫策略的综合应用。
从当前主要的谣言抑制策略分析,大部分策略在模型迭代的早期便开始抑制在线社交网络的节点,取得理想的抑制效果。然而在谣言传播中、后期的效果不明显,例如目标免疫策略的Hub节点,由于度很大,很可能已经成为传播节点,抑制效果不佳。对邻居节点实施免疫时,没有考虑多社区的因素。社交网络的多数节点处于1个或者多个社区中,自然会向不同的社区分享网络信息,包括辟谣信息。其次,多数抑制策略随机选择初始免疫节点并对邻居节点实施免疫,没有考虑初始免疫节点的选择对谣言抑制效果的影响。针对上述问题,本文提出了一种多社区免疫的谣言抑制策略。在真实的社交网络环境中进行仿真实验,与其他谣言抑制策略进行对比分析,并探索初始免疫节点对谣言抑制效果的影响等问题。
首先以传染病模型SEIR[8]为基础,建立在线社交网络谣言传播模型。将在线社交网络的节点分为四类,即易染节点、潜伏节点、传播节点和免疫节点。易染节点是指社交网络中未接触到谣言的用户,对谣言缺乏免疫力;潜伏节点是指网络中已经接触到谣言,但未表现出兴趣因而暂时不会向其他节点散播谣言的节点;传播节点是指对谣言表现出兴趣并向网络中其他节点散播谣言的节点;免疫节点是指对谣言已失去兴趣或者自始对谣言无兴趣的节点用户。其中传播节点和潜伏节点已经接触并授受了谣言,总称为感染节点。
将在线社交网络的四类节点所处的状态描述为健康状态S、潜伏状态E、传播状态I和免疫状态R。在线社交网络中的节点在这四种状态之间进行迁移。建立如下节点的状态迁移规则,即谣言传播规则,如图1所示。
图1 节点状态迁移规则
规则1:易染节点与传播节点接触后,以概率p1迁移从S状态迁移到E状态,成为潜伏节点。
规则2:潜伏节点以概率p2从E状态迁移到I状态,成为传播节点。
规则3:潜伏节点以概率p4从E状态迁移到R状态,成为免疫节点。
规则4:传播节点以概率p3从I状态迁移到R状态,成为免疫节点。
规则5:免疫节点以概率p5从R状态迁移到I状态,再次成为传播节点。
规则6:传播节点散播谣言信息后,按规则4发生状态迁移,但不再对外传播谣言信息。
在重要熟人免疫[9]的谣言传播模型中,传播节点传播谣言信息后以概率1迁移到免疫状态。然而在真实的社交网络中,传播节点可能在多个网络社交圈、微型博客中散播谣言信息;即使传播了谣言信息后,传播节点用户的思想意识仍保持着谣言的内容,认同谣言的观点。因此,传播节点并不是在传播谣言信息后立即迁移到免疫状态,而需要一个过程。本文模型的规则4建立在这个现实基础之上,传播节点在散播谣言信息时以一定概率迁移到免疫节点。
前已述及,多数谣言抑制策略在谣言传播模型的早期便开始工作,具有理想的抑制效果。然而,如果抑制策略开始于传播的中期或者后期,由于度较大的节点可能已经成为传播节点,从而导致抵制效果不明显,例如目标免疫策略[6]。
在重要熟人免疫[9]的谣言抑制策略中,进行每一轮谣言抑制迭代时,免疫节点总是选择一个度最大且未获得免疫的邻居节点作为下一个免疫目标。换句话说,在社交网络中免疫用户总是选择社交圈中影响力最大的那一个好友作为免疫目标,并通过这个好友的影响力来扩大抑制效果。
相关研究表明,复杂网络的社区发现与识别、社区划分评价[12-13]等问题已成为当前社交网络研究领域的重要方面。按兴趣、职业、地理位置等特征,多数用户节点总是处在1个或多个网络社区中,并与网络社区的其他节点分享网络信息。可以分析得知,重要熟人免疫[9]谣言抑制策略的用户节点社区数量全部为1个。本文提出的多社区免疫谣言抑制策略阐述如下。
果蔬运输系统网络结构主要由3部分构成,感知网络、通信网络(包括移动通信网络和互联网Internet)和网管中心,如图3所示。
(1)设G为在线社交网络,在G中选择1个用户节点Ni,作为初始免疫节点,置初值d=0,设置Sd={Ni};
(2)置d’=d+1,Sd’=Ф,对于∀Nj∈Sd,执行如下步骤;
(3)识别出节点Nj在G中的社区Cj={Cj,1,Cj,2,…,Cj,n},其中n≥1;
(4)对于∀Cj,k∈Cj(1≤k≤n),Cj,k={Nj,k,1,Nj,k,2,…,Nj,k,m},计算Nj,k,x(1≤x≤m)的度,在Cj,k集合中选择度最大且未获得免疫的节点Nj,k,t,以一定的概率pj,k对Nj,k,t实施目标免疫,置Sd’=Sd’∪{Nj,k,t};
(5)如果模型迭代完成,抵制策略结束,否则置d=d’,Sd=Sd’,转到步骤(2)继续迭代。
多社区免疫谣言抑制策略的现实基础是用户在社交网络中往往隶属于多个网络社区,例如工作圈、休闲圈等,通过多种社交工具与圈内好友交换信息。免疫用户在接触到辟谣信息后,习惯性地在多个网络社区中分享。而社区中最活跃的用户(即度最大的用户)往往比社区内其他用户更容易接触到辟谣信息,成为下一个免疫目标。
将本文提出的多社区免疫谣言抑制策略与目标免疫抑制策略[6]、重要熟人免疫抑制策略[9]进行仿真实验对比分析,并探讨初始免疫节点对谣言抵制效果的影响。实验方案及结果分析阐述如下。
选取Facebook的好友关系数据[14]构造一个在线社交网络,该网络的统计数据与重要熟人免疫抑制策略[9]的实验数据统计量见表1所示,本文实验数据的度分布见图2所示。在本文的在线社交网络中,度为0的节点有80个,最大度值为293,从聚类系数、度相关系数等统计量来看,本文数据的质量略好于文献[9]。
表1 实验数据统计量
图2 实验数据的度分布
首先对谣言传播模型进行仿真。与文献[9]相同,选取1个度为平均度的结点作为初始传播节点,图1所示的概率参数分别设置为:p1=0.35,p2=0.2,p3=0.05,p4=0.002,p5=0.05,迭代次数为100,重复仿真的次数为30次。在谣言传播模型的仿真过程中分别统计易染节点、潜伏节点、传播节点和免疫节点数量随迭代时间的变化趋势,见图3所示。
图3 谣言传播模型仿真
从图3的仿真结果来看,本文的谣言传播模型与文献[9]的仿真结果大体一致。文献[9]仿真结果表明,t=7时迎来谣言大面积的传播,本文所使用的在线社交网络在t=23左右出现大面积的谣言传播。
在线社交网络谣言抑制策略的作用应该体现在2个方面。一方面,在早期尽可能控制谣言传播的范围,另一方面,在传播中、后期尽可能消除谣言造成的危害。当前大多数谣言抑制策略更多侧重于第一方面的研究,例如重要熟人免疫抑制策略[9]和综合免疫策略[11],实施抑制策略的时机比较早。本节通过仿真实验与当前多数谣言抑制策略进行对比分析,探讨谣言传播中、后期的有效抑制策略。
一般而言,度值大的节点往往关注更多的网络社区,度值小的节点关注的社区相当少。此外,用户节点在网络社区中传递信息的概率是有区别的,关注度越大,传递信息的概率越大,并呈递减的趋势。鉴于此,设置免疫节点最多在4个网络社区分享辟谣信息,分享的概率依次为1、0.7、0.4和0.2,部分节点可能关注更多的网络社区,但在其中传递信息的概率很小,作忽略处理。在本文选取的在线社交网络中进行仿真实验,采用文献[15]所述方法识别节点所在社区,分别在t=15、t=20和t=25实施无免疫、目标免疫、熟人免疫和多社区免疫抑制策略。由图3可知,在t=23左右出现谣言传播高峰,而这三个时刻能够代表谣言传播的中、后期阶段。模型迭代次数为100次,重复实验次数为30次。统计谣言传播模型迭代过程中感染节点(传播节点与潜伏节点)的数量随时间变化的实验数据。
在谣言传播的中期(t=15)实施多种抑制策略,感染节点数量随迭代时间的变化见图4所示。从图中可以看出,目标免疫的抑制效果不是很显著,其原因是部分Hub节点已成为传播节点,达不到传播早期的免疫效果;重要熟人免疫策略略逊于目标免疫,无明显抑制效果。多社区免疫的谣言抑制效果要优于目标免疫和重要熟人免疫策略。
图4 t=15时刻的谣言抑制效果
在谣言传播的高峰期(t=20)以及后期(t=25)分别实施多种抑制策略,感染节点数量随迭代时间的变化分别见图5和图6所示。在这两个时刻,谣言已经开始大规模传播,感染节点逼近无免疫措施的峰值,三种谣言抑制策略对峰值的影响都不明显。然而,在峰值之后的谣言传播衰退期,多社区免疫的谣言抑制策略能够加速感染节点的减少,促使传播节点和潜伏节点迁移到免疫状态,成为免疫节点。这说明多社区免疫的谣言抑制策略能够更快地消除谣言早、中期传播所造成的危害,这一特点在图4所示的抑制效果中也能得以充分体现。
图5 t=20时刻的谣言抑制效果
图6 t=25时刻的谣言抑制效果
采取多社区免疫的谣言抑制策略,分别选取随机节点和初始传播节点作为初始免疫节点,重复3.2节所述t=15时刻的仿真实验,统计感染节点数量随迭代时间变化的实验数据,见图7所示。
图7 初始免疫节点对抑制效果的影响
从图7可以看出,在谣言传播中期,初始传播节点作为初始免疫节点对谣言的抑制效果比较好,感染节点的峰值要低于随机选择免疫节点;而且在谣言传播的后期,感染节点数量下降更快,说明消除谣言传播造成的危害更明显。其原因在于,采用初始传播节点作为初始免疫节点,免疫对象是感染节点的可能性更大,而随机选择免疫节点,免疫对象也可能是未感染的节点。因此,在对在线社交网络中流传的不实信息进行辟谣时,首先从谣言传播源开始更有效。
在线社交网络对于加速信息、知识的传播有着积极的作用,但流言蜚语之类不实信息的传播对社会正常秩序造成危害,需要研究相应的对策抑制谣言在网络中的传播。当前主要的谣言抑制策略主要研究谣言传播早期的抑制效果,前提条件是尽可能早地识别、证实谣言的出现,才能发挥更好的抑制效果。本文从人们对待辟谣信息的心理及行为特征出发,提出了多社区免疫的谣言抑制策略,在谣言传播的中、后期仍能取得更好的抑制效果,而且在谣言传播后期能有效降低感染节点的数量,有利于消除谣言传播后期造成的危害。此外,本文还对比研究了谣言抑制策略中初始免疫节点选择对抑制效果的影响,实验表明,从谣言传播源开始实施抑制策略能更有效地发挥抑制策略的效果。在本文的多社区免疫抑制策略中,节点的社区发现与识别是关键环节,对最终抑制效果的影响较大。针对在线社交网络谣言传播模型,改进社区识别算法是本文下一步的研究工作。