潜程浩,胡彦蓉,刘洪久,潘军可
1.浙江农林大学 信息工程学院,杭州 311300
2.浙江省林业智能监测与信息技术研究重点实验室,杭州 311300
地方性网络论坛作为一个重要的网络舆情话题传播平台,其主要目标用户拥有相同的地理位置和文化环境。这一特点使地方性论坛可以集中反映一地居民关注的热点事件以及相关观点态度。以杭州一地方性网络论坛为例,诸如“杭州新的消费券马上就要来了”“邻居遛狗给我带来的烦恼”这样的帖子遍布整个论坛。这些帖子无一不反映着普通民众关注的热点和相关态度。与此同时,这类帖子在论坛中常年处于热帖的状态。这说明论坛中带有地方性色彩的舆情话题在论坛用户中具有很强影响力。鉴于互联网的传播速度与规模,再小的舆情话题,经过发酵也有可能在网络中造成巨大的社会影响。这就导致同样带有地方性色彩的不良信息(例如谣言)也能通过地方性网络论坛给社会稳定带来危害。因此,为了对相关的舆情话题传播进行监管,防止不良信息对当地社会稳定造成危害,对地方性网络中热点舆情话题的传播机制和特点的研究便有了重要的实际意义。
当前,国内外对于舆情信息传播机制的研究很多。主流的方法是通过改进传染病动力学SIR模型建立新的舆情信息传播模型来对其进行研究。最早的传染病SIR模型由Kermack和McKendrick提出[1],该模型将传播节点分为易感者、传播者和免疫者三类。后续的研究基本上都是以此为基础进行改进进行的。目前该领域的研究主要集中在以下三个方面:
(1)根据传播的节点类型的不同,对模型的传播节点的类型和数量进行拓展。Zanette等人首先提出将复杂网络中的节点分为了无知者、传播者、移出者三种节点[2]。Xiong等人结合微博转发行为的特点,在传播模型中加入了接触者节点,提出了SCIR信息传播模型,并进行了仿真实验[3]。张永等人在SIR模型的基础上加入新的节点,建立了基于转发行为因素的SCIR模型[4]。张永等人考虑邻居节点间的互相影响,加入了一个假免疫节点,构建了SDIR模型[5]。崔金栋等人综合考虑了微博网络中话题式信息的衍生特性,建立了H-SEIR模型[6]。
(2)根据实际情况中不同的信息传播环境带来的信息传播的传播机制的不同,对模型进行改进。方劲皓等人在SCIR模型中,引入了节点的在线和离线状态,增强了模型的时效性[7]。范海波等人根据发布信息的用户的可信度差异对信息传播的影响,针对真假信息传播的不同效果,提出了新的IBU模型[8]。魏静等人在SIR模型的基础上,提出了部分无知者直接转变为免疫者以及具有衍生效应的SIR改进模型[9]。包峻波等人考虑现实中信息真伪的不确定性,在SIR模型中引入博弈论和社会加强效应,设计研究了基于非完全信息博弈的SIR模型[10]。Kawachi等人根据现实中谣言传播的特点,在谣言传播模型中,新加入了传播者转变为未知者,抵制者转变为传播者等变化规则,完善了相关的信息传播模型[11]。刘小洋等人针对社交网络中一种信息会抑制另一种信息传播的机制,运用马尔科夫链理论分析网络上不同信息之间的竞争机制和节点状态转化、信息传播演化之间的内在联系,建立了网络系统信息扩散的非线性动力学传播模型[12]。
(3)针对信息传播模型中原本恒定的传播系数进行拓展。Barros等把模糊理论与SI传染病模型相结合,将系数变为一个模糊集[13]。Zanette在小世界网络中对谣言传播的阈值进行了研究[14]。王飞雪等人在SIR模型的基础上考虑了谣言在不同节点上的传播概率,提出了社交网络中考虑节点自身影响的谣言传播模型[15]。陈紫扬等人考虑到不同影响力的节点对信息传播的影响,提出了NI-SIR模型[16]。对于网络中的节点多次接触到同一信息所造成的模型中系数的变化,也有学者对此作出了研究。Dodds等人提出多次接触同一信息后,信息传播的记忆效应会对后续的信息传播造成影响[17]。王晓萌等人通过引入信息曝光度曲线与社交网络个体影响力,提出了一种基于信息转发传播过程中记忆效应的信息传播模型[18]。Lü等人提出在社交网络中节点多次接触同一信息时,接受信息的概率不同于只接触了一次该信息时的概率,并引入了一个指数函数来反映在多次接触同一信息的过程中,概率变化的过程[19]。刘咏梅等人提出了考虑到兴趣衰减系数的基于小世界网络的微博谣言传播模型[20]。
结合以上文献可以看到,当前国内外研究的重点主要有三个方向,即模型节点的类型和数量的变化、传播系数的拓展以及对信息传播机制的改进。但是,上述文献仍具有较大的局限性:所有研究都是基于传染病动力学SIR模型进行改进,针对微博等平台的“转发”传播机制进行的。这些研究无法应用于地方性网络论坛中的舆情信息传播机制的研究。网络论坛中的舆情话题传播机制是基于对论坛帖子的“回复”行为构建的:回复量越高,帖子在论坛中的实时位置越靠前,越容易被用户看到,帖子内的信息越容易被传播。
因此,为了对地方性网络论坛中的舆情话题信息传播机制进行研究,本文基于SIR模型,改进提出了UBIR(Unknow-Browser-Infected-Removed)模型。该模型的主要特点是:第一,以用户的“回复”行为作为信息传播机制的基础。现有研究中的“转发”行为,本质上就是使某个传播节点中的舆情信息接触到更多未知节点的行为。网络论坛中没有“转发”这一行为,起到相同作用的是“回复”行为。因此,该模型以“回复”为基础,构建了新的地方性网络论坛中舆情话题信息传播机制。第二,在SIR模型基础上加入了新的浏览者节点(Browser)。与常见的SCIR、SEIR模型[3-6]相比,UBIR模型增加了新的不同状态节点之间相互转化的机制,更加符合网络论坛传播机制的特点。第三,针对地方性论坛舆情话题传播机制的特点,对模型参数进行了改进。通过参数的变化,UBIR模型成功地还原出了地方性论坛舆情话题传播机制的三个特点。第四,在模型中加入并改进了兴趣指数函数。刘咏梅等人[20]提出的兴趣指数函数描述了同一节点多次接触同一信息对该信息在节点中传播概率的影响,UBIR模型在此基础上进行改进,将网络论坛中节点的邻居节点个数与信息接触次数相结合,使该函数能够适用于本次研究。
本文为了研究热点舆情话题在地方性网络论坛中传播的机制和特点,基于SIR模型构建了UBIR模型。该模型引入了兴趣指数函数,加入了新的浏览者节点,结合了网络论坛中回复帖子增加信息传播概率的特点。UBIR模型共有四种类型的节点,即Unknow(未知者)、Browser(浏览者)、Infected(传播者)、Removed(免疫者),其示意图如图1所示。
图1 UBIR模型示意图Fig.1 UBIR model diagram
在UBIR模型中,未知者节点在接触到传播者节点后以P(m)的概率转变为浏览者节点。浏览者节点分别以α和β的概率转变为传播者节点和免疫者节点。
与传统SIR模型不同的是,在UBIR模型中,传播者节点和免疫者节点有一定的概率能够转变回浏览者节点。这一现象和论坛的特点有关:
第一,传播者节点的用户在回复完帖子后有三种选择,即离开帖子,继续回复和继续浏览帖子。这三种选择分别代表了转变为免疫者、继续作为传播者和转变回浏览者这三种情况。
第二,论坛普遍都有搜索和收藏功能。即使一篇帖子无人问津,完全“沉贴”,不再参与信息的传播,用户都可以通过搜索和收藏功能,再次接触到这一帖子。网络论坛中帖子的另一大功能便是“网络聊天室”。免疫者用户在失去对帖子的兴趣后很有可能会收到后续用户对其的回复。在这种情况下,免疫者用户往往会通过搜索或收藏再次找到帖子,参与话题的讨论。例如在百度贴吧中,就有很多用户在离开帖子转为免疫者的十几个小时后,为了回复别人,再次进入同一篇帖子转变回浏览者。在论坛中,讨论意味着传播信息。这种情况在大型论坛中是比较常见的。
UBIR模型能够适用于大多数大型的网络论坛。但是地方性网络论坛由于其主体用户和规模的特殊性,无法直接应用UBIR模型进行研究。
为了对地方性论坛热点舆情话题传播机制进行进一步研究,本文选取了“天涯论坛”这一国内主流的综合性大型网络论坛作为参照,爬取了一篇带有地方性色彩的热点舆情话题相关帖子。其数据如图2、图3所示。
图2 大型论坛回复量变化图Fig.2 Change chart of reply volume in large forums
图3 大型论坛回复量变化速率图Fig.3 Graph of rate of change of reply volume in large forums
从图中明显可得,大型论坛中回复量的增长有多次明显的长达数个小时的停滞,其增长速率在逐渐减少至归零后再次大幅增加。大型论坛中地方性舆情话题信息传播的周期较长且速度较慢。从发帖开始,在50个小时后,回复量的增长才最终归零。论坛中对帖子的回复可以等同于对信息的传播。大型论坛中回复量的增长可以在数次归零后重新再次开始增长。这种现象的主要原因就是原本的免疫者用户通过搜索和收藏功能,再次接触到相关帖子,并进行回复。
作为对比,本文在杭州19楼论坛对相同舆情话题的帖子进行了爬虫。之所以选择该论坛,是因为该论坛规模和用户群体规模适中,具有较强的杭州地方性色彩,其数据具有较强的代表性,能够有效地反映出该地民众的舆情信息。在该论坛爬取的同一热点舆情话题传播的结果如图4、图5所示。
图4 地方性论坛回复量变化图Fig.4 Change chart of reply volume in local forum
图5 地方性论坛回复量变化速率图Fig.5 Graph of rate of change of reply volume in local forums
由于地方性论坛规模相对较小,同一热点舆情话题相关的单篇帖子回复量较少。为了避免偶然性,本文选择了同一话题的两篇帖子同时进行了爬虫。从图2到图5四幅图的对比,可以发现地方性论坛中热点舆情话题的传播具有三个特点:
(1)地方性舆情传播速度快。相比大型论坛,地方性舆情话题在地方性论坛发帖后的2到3个小时就会达到回复量增长速度的巅峰。帖子回复量的快速增长,使帖子的舆情话题信息传播在发帖后的3个小时内达到巅峰。
(2)传播周期短。在发帖的三个小时内达到舆情话题信息传播的高峰后,帖子的回复速度就会逐渐下降,直到12个小时左右,帖子的回复量归零,话题信息停止传播。
(3)停止信息传播后不会“死灰复燃”。在帖子回复量增长归零,停止信息的传播后,基本不会再重新开始大规模的信息传播。
地方性论坛之所以与大型综合性论坛会有这样的区别,主要是其目标用户和论坛规模造成的。地方性论坛的用户主要是当地居民。与当地相关的舆情话题信息更容易被地方性论坛用户接受。这造成了地方性论坛传播地方性舆情话题速度快的特点。这反映到UBIR模型中的变化就是未知者节点在接触到传播节点后,转变为浏览者节点的概率比普通论坛更高。地方性论坛较小的规模则决定了其信息传播周期短,以及停止信息传播后不会“死灰复燃”的特点。在经历发帖后的12个小时的传播后,论坛中关心相关舆情的大多数用户都已经接触舆情话题的相关信息。较少的用户也使得帖子的“聊天室”功能受到了一定的限制。例如杭州19楼论坛总注册人数在200万左右,而论坛中一篇热门帖子的阅读量就达到了23万,这说明论坛中的活跃用户其实已经基本上都接触了该篇帖子的信息。后续已经不会再有更多的用户参与到该帖子的传播中来了。这反映到UBIR模型中的变化就是,在地方性论坛的UBIR模型中,免疫者不会转变为浏览者。
本文结合UBIR模型和地方性论坛的三个特点,建立了针对地方性网络论坛的UBIR模型,其示意图如图6所示。
图6 地方性论坛的UBIR模型示意图Fig.6 UBIR model diagram of local forum
地方性网络论坛和普通论坛的信息传播机制都是建立在回复行为上的。二者的传播机制没有本质区别。现有的差别主要是由地方性论坛的规模和主要目标用户造成的。因此,地方性网络论坛的UBIR模型的主要变化有两个:第一,地方性网络论坛UBIR模型的P(m)中的λ比普通的UBIR模型要高。第二,地方性网络论坛UBIR模型中的免疫者节点不会转变为浏览者节点。
本文所涉及模型,均选取地方性网络论坛“杭州19楼论坛”作为数据来源,模型所涉及的相关假设规则如下:
(1)在网络论坛所处的社交网络中,回复即被视为传播信息。与微博,推特等社交软件不同,网络论坛的信息传播机制使模型无法利用消息的转发行为来定义话题信息是否成功传播。在网络论坛中,存在“顶帖”现象,即用户回复网络论坛中的某一篇帖子,会提高该帖子在论坛版面中的位置。这会提高其他用户接触到这一帖子信息的概率。根据这一机制,本文将论坛用户对某一篇帖子的回复行为视为对该帖子包含的舆情话题信息的传播行为。
(2)假设在该论坛所处的社交网络中包含的总节点数(用户人数)为N,该论坛用户总共分为四类:未知者U(t)、浏览者B(t)、传播者I(t)、免疫者R(t)。其中未知者为网络论坛中在t时刻没有点进相关舆情话题消息的帖子中进行浏览的用户。浏览者为接触到相关舆情话题消息后点进相关帖子进行浏览,但是既没有关闭帖子离开,也没有进行回复顶帖的用户。传播者则是浏览者中接受了相关信息并进行了回复,增加了帖子的热度,提高了帖子在论坛中的位置,进一步传播了相关信息的用户。免疫者则是最终失去了对相关信息兴趣,离开了相关帖子,从舆情话题信息的传播行为中退出的用户。
(3)假设19楼论坛所在的社交网络为小世界网络,并假设其网络的平均度为kˉ。
(4)在论坛中接触到同一篇帖子或者说同一个热点舆情话题的多个不同帖子的次数不止一次。不同的接触次数,以及帖子本身的话题的兴趣指数(吸引人的程度)都会影响到用户点进该篇帖子成为浏览者的概率。由刘咏梅等人的相关研究[18]可知,用户接受并传播某条舆情信息的概率随着该信息的出现次数的变化而变化。这种由于不同的接触次数而带来的对相关信息的兴趣的变化或者说浏览信息内容的概率的变化可以用指数函数来进行表示。有公式如下:
其中,λ是未知者点第一次接触到传播舆情话题信息的相关帖子就点进该帖子转变为浏览者的概率。地方性网络论坛中,该概率更高,λ比在普通论坛中更大。b是该舆情话题的兴趣系数,b越大,P(m)随着接触话题信息的次数的增加,减少的速度越来越快,浏览的概率越来越小。换言之,b越小,用户对该舆情话题的兴趣越高。m则是某节点用户接触到相关话题信息的次数,在本文所涉及模型中具体体现为该节点在小世界网络中邻居节点中的传播者节点数量。
(5)假设所有的未知者节点,在第一次接受到舆情话题信息后,有λ的概率对话题信息产生兴趣,进入帖子转变为浏览者节点。随着传播行为的进行,该节点的邻居节点中的传播者节点越来越多(接触到该话题信息的次数越来越多),P(m)最终趋向于0。即未知节点的用户不再转变为浏览者,一直保持为未知节点。
(6)浏览者在浏览完该帖子后,有δ的概率失去对这一话题信息的兴趣,直接离开该帖子,不对这一话题信息的传播产生作用。为了简化模型,假设离开帖子的浏览者不会再对该帖子产生兴趣,重新进入该篇帖子再次成为浏览者,转变为免疫者。地方性网络论坛中的免疫者不会再转变为浏览者和传播者。同时浏览者有α的概率选择回复帖子,对该帖子的舆情话题产生传播作用。因此本文认为回帖的用户转变为传播者。由现实情况明显可得:
(7)用户的回帖行为并不限于一次。因此在用户以概率β失去回帖的兴趣,转变为免疫者节点退出话题信息的传播过程前,都将被视为传播者并进行传播行为。在实验中,为了简化模型,设β为固定值,每进行一次传播行为,就判断一次是否退出传播。
(8)传播者节点进行一次传播行为后,有γ的概率转变回浏览者。在转变回浏览者的情况下,用户继续留在帖子中浏览舆情话题信息,直到再次回复转变为传播者或者离开帖子变为免疫者。
由以上假设可得,在t时刻,未知者节点以概率P(m)被任意一个传播节点传播,接触到信息后转变为浏览节点。因此,未知者的演化方程为:
在t时刻,论坛中的浏览者节点(Browser)在由未知节点转变过来的同时,还分别以δ和α的平均概率转变为传播者节点(Infected)和免疫者节点(Removed)。同时,还有一部分传播节点以γ的概率转变回浏览节点,由此可得浏览者的演化方程为:
传播者和免疫者节点在t时刻的演化方程如下:
由以上式(1)到式(6)综合可得到UBIR模型的演化模型如下:
其中,U(t)+B(t)+I(t)+R(t)=N。假设在信息传播初始情况下,有N0个浏览者,其余均为无知者节点。在实际情况中的意义即为,在一篇帖子刚发表的t0时刻,有N0个用户进入了帖子进行浏览。
本文根据模型假设的舆情话题信息传播机制,使用netlogo仿真软件,进行了仿真实验。实验以杭州19楼论坛中带有地方性色彩的热点舆情话题为数据来源。通过将仿真结果与实际数据进行对比,本文研究了网络论坛中舆情话题信息传播的机制并验证UBIR模型的有效性。
首先,本文在杭州19楼论坛,选取“最美司机吴斌”这一具有很强杭州地方性色彩的热点舆情话题作为主要的研究对象。为了减少单篇帖子回复量较少带来的偶然性,本文一次性选取了该舆情话题相关的5篇帖子,总数据量达到10 611条回复。爬取数据如表1所示。
表1 爬取的19楼论坛部分数据Table 1 Part of 19lou forum data
以第一层楼层的回复时间为原点t0,以回复时间的时间差为横坐标,以用户回复的楼层数和楼层数的增加速度为纵坐标。选取目标帖子发布后12个小时内的数据变化,利用MATLAB软件进行作图。结果如图7、图8所示。
图7 热点舆情话题帖子回复量随时间变化图Fig.7 Number of responses to hot public opinion topic posts changes over time
在图7和图8中,每一条曲线代表一篇有着相同话题信息的论坛帖子。图7显示的是在五篇热点舆情话题相关帖子中,用户回复量随着时间推进发生的变化。图8显示的是用户回复量变化速率。从图中可知,五篇帖子的信息传播过程符合地方性论坛传播机制的三个特点。其回复数的变化曲线都近似于对数曲线。在帖子发表后的两个小时内,回复量发生了较快增长,并在2小时至3个小时的区间内达到增速的最高峰。随后增速开始大幅下降,帖子的“热度”下降,回复量增速趋缓。最终在12个小时后,回复量增速渐渐归零,帖子失去热度,在论坛中“沉贴”了。
在上述两幅图中可以看到,第五篇帖子与其他帖子的曲线有较大差别。该帖子的回复量的变化趋势虽然与其他曲线相近,但是整个变化过程比其他曲线推迟了3个小时。该现象的原因是该篇帖子的发布时间处于凌晨3点钟。由于该时段的活跃用户数量较小,导致在3个小时后,即现实时间6点钟后,才有用户对其进行回复。这一现象说明,信息传播的开始时间对整个信息传播行为也会产生影响。本文暂不对这一影响因素进行进一步的研究。
对比图4、图5和图7、图8,两次爬取的数据虽然舆情话题不同,但是两次爬取的帖子的曲线变化趋势相同,都符合地方性论坛热点舆情话题传播的特点。这说明热点舆情话题本身的内容不会对地方性论坛传播机制的三个特点带来影响。
图8 热点舆情话题帖子回复量变化速率图Fig.8 Change rate chart of response number of hot public opinion topic posts
根据模型的基本假设,本文采用Netlogo软件进行仿真实验。
本文将实验中代表社交网络中各个节点的主体:turtles设为三个属性,分别为Removed、Browser和Infected。属性布尔值的true和false分别代表了该turtles所代表节点的属性。当三个属性全部为false的时候,当前节点是未知节点。Removed属性为true,另外两个属性为false的时候则是免疫节点。以此类推,由此来表示节点的不同状态。在netlogo中,为了方便区别节点的不同状态,赋予不同节点不同形状加以区分。为了反映出地方性网络论坛的特点,本次实验网络节点个数N为1 000,初始浏览者节点数B0为100,兴趣指数b为0.2。
实验的具体过程如下:
(1)形成实验中的社交网络。该步骤通过各个节点之间的链接,形成一个小世界网络来完成。其节点数量变化如图9所示。
图9 建立总节点数N=1 000的社交网络Fig.9 Establishing social network with total number of nodes N=1 000
(2)假设在一篇帖子发布后的t0时刻,有B0个用户点击进入了帖子进行浏览。本实验B0=100。在社交网络中增加100个浏览节点,其节点数量变化如图10所示。
图10 随机选择B0个节点转变为浏览者Fig.10 Randomly selecting B0 nodes to convert to browsers
(3)开始模型的传播过程仿真。各个节点数量变化如图11所示。从传播开始后,浏览者节点和传播者节点呈波浪状起伏变化,两者交替增加减少。未知者节点不断下降,转变为新的浏览者节点。这说明,这一条舆情话题信息在网络论坛中不断传播,没有接触过该信息的人不断减少。同时,免疫者节点不断增加,并且随着浏览者节点和传播者节点的变化,增速在不断增加。
图11 信息传播过程图Fig.11 Information dissemination process diagram
(4)如图12所示,论坛所处社交网络只剩未知者节点和免疫者节点,传播者和浏览者全部归零,话题信息的传播过程结束。在这种情况下,不会再有新的传播节点产生,话题信息的传播行为完全停止。同时,由于论坛规模较小,活跃用户相对较少,不再有新的用户通过收藏和搜索功能重新加入话题信息的传播。对应的现实情况就是,一篇帖子失去了热度,浏览过和回复过该篇帖子的用户全部离开。因此,帖子在论坛中的位置不会再被提高,并随着新的帖子的出现,慢慢地离开论坛的前排位置。新的未知节点不再有机会看到这篇帖子,接触到相关话题信息,最终“沉贴”。从图中还可以看到,在结束传播后,社交网络中的未知者节点数量仍然远远大于免疫者节点。这说明论坛中没有接触过该信息的用户任然占大多数。这一现象也符合实际中论坛活跃用户远少于总用户的事实。
图12 信息传播完成图Fig.12 Information dissemination completion diagram
(5)验证兴趣指数对舆情话题信息传播效果的影响。不同的话题带来的兴趣指数不同,由此会对信息的实际传播带来不同的影响。因此本文将初始节点数N0设为1 000,在初始时间t0,点进帖子内的浏览者节点B0为60。分别取兴趣指数为0.2和2.0,以此来仿真不同话题带来的不同的兴趣指数的影响。通过不同节点随时间的变化来验证实验结果。
(6)对比仿真结果和实际数据,通过曲线的对比,证明UBIR模型的有效性。
3.3.1 模型仿真结果分析
用户在论坛中进行回复,从浏览者转变为传播者。而传播者在结束信息传播行为后,最终都转变为免疫者。因此,在UBIR模型中,免疫者数量反映了现实中用户的回复量,可以在一定程度上等同于回复量。免疫者的数量反映舆情话题信息传播的效果。免疫者节点越多,回复量越高,传播效果越好。仿真实验中免疫者节点变化如图13所示。
图13 仿真实验的免疫者节点变化曲线图Fig.13 Graph of immunizer node change in simulation experiment
将图13所代表的仿真结果和图7所代表的实际数据进行对比,明显可得,仿真结果与实际数据发展趋势基本吻合。二者的节点数和回复量,均在开始信息传播行为后的前6个单位时间内快速增加。在第6个单位时间后,二者的增长曲线均趋于平缓,并在11至12个单位时间完全停止增长。
图14表示的是仿真实验中,免疫者节点的变化速率。从上文可知,免疫者节点的变化速率可以反映出回复量的变化速率。将图14和图8进行对比,可以看出,虽然仿真结果存在速率的部分浮动,但在整体上,二者发展趋势基本吻合。二者均在信息传播行为开始后的2到3个单位时间内达到了增速的巅峰。在之后的9个单位时间内,虽然偶有涨幅,但是增速总体是在逐渐下降的,直到最后第11至第12单位时间,增速归零。
图14 仿真实验的免疫者节点变化速率图Fig.14 Graph of rate of change of immune nodes in simulation experiment
所以,整体来看,本文所涉及地方性论坛的UBIR仿真模型较为拟合实际情况。该模型可以较好地描述现实里地方性网络论坛中热点舆情话题信息的传播过程,反映出话题信息在地方性论坛中传播的三个特点。
3.3.2 兴趣指数对舆情话题传播效果的影响
兴趣指数和舆情话题本身的内容有关,为了研究其对热点舆情话题传播的最终效果的影响,本文选取了两个不同的兴趣指数进行了对比实验。
当兴趣指数为0.2时实验结果如图15所示,当兴趣指数为2.0时实验结果如图16所示。
图15 b=0.2情况下各节点随时间变化Fig.15 Each node changing with time in the case of b=0.2
图16 b=2.0情况下各节点随时间变化Fig.16 Each node changing with time in the case of b=2.0
不同的兴趣指数代表了不同话题对于论坛用户的吸引程度。该指数越小,话题越吸引人,论坛用户回复的概率越大。可以看到,b=2.0时,最终免疫者节点的数量远远高于b=2.0的情况,而未知者节点却低于b=2.0的情况。这说明,兴趣指数越小,整个网络中参与到舆情话题信息传播的节点越多,信息传播的效果越好。通过同一论坛中不同舆情话题实际数据的对比,可以看到,19楼论坛中“最美司机”相关帖子的回复量要远高于另一个热点话题。其帖子内包含信息的传播效果也比普通信息的传播效果更加优秀。为了排除偶然性,本文分别在兴趣指数为0.2和2.0的情况下,重复进行实验,其结果如表2所示。
表2 两种兴趣指数下最终免疫者节点数Table 2 Number of final immune nodes under two interest indices
可以看到,在兴趣指数为0.2的情况下,最终免疫者节点的数量的平均值要高于2.0的情况。因此兴趣指数越小,话题越吸引人,信息传播效果越好的结论成立。
通过建模与仿真实验,可以得出结论,地方性网络论坛中的热点舆情话题的传播机制是基于“回复”这一用户行为的。因为地方性论坛在传播舆情话题上的三个特点,其传播机制与普通论坛存在一定区别。地方性网络论坛的传播速度比普通论坛更快。在某个舆情话题的论坛帖子被发表后,论坛中部分用户进入帖子由未知者转变为浏览者。随后部分浏览者选择回复帖子转变为传播者,同时还将帖子顶到论坛中更加靠前的位置。这使更多未知者用户接触到了这一帖子包含的舆情话题信息,完成了一次话题信息的传播。在失去兴趣退出帖子转变为免疫者前,传播者保持着对帖子的回复,不断“顶帖”传播该帖子的舆情信息。另一部分浏览者,在接受完帖子的舆情话题信息后失去对该信息的兴趣,直接退出了话题信息的传播,转变为免疫者。同时,传播者也有可能转变回浏览者,这对照了现实中用户停止回复但是继续浏览帖子的情况。
对比实际数据和仿真结果,明显可得,以上行为发生的高峰期在帖子发布后的2个小时至3个小时之间。因此,若是要对相关舆情信息进行管控,最佳的操作时间就在帖子发布的2个小时之内。
为了研究地方性网络论坛中热点舆情话题传播的机制和特点,本文通过普通论坛和地方性论坛数据的对比,得出了地方性论坛舆情话题信息传播机制的三个特点。本文基于SIR模型进行改进,提出了针对地方性网络论坛的UBIR模型。UBIR模型考虑并结合了现实的网络论坛中信息传播机制的特点。例如传播节点有可能会重新转变为浏览节点,浏览节点也可能直接转变为免疫节点,多次接触同一信息会对传播造成影响等。通过仿真实验,验证了UBIR模型可以较好地还原网络论坛中舆情话题传播的过程,能够成功地还原出地方性网络论坛中舆情话题信息传播的机制,对解决现实中舆情话题传播管理的问题具有参考意义。
本文也有一定的局限性。实际论坛中,虽然由于论坛本身规模较小,用户相对较少,参与舆情话题传播的用户数量仍然是一个较大的数字。由于模型本身的局限性,UBIR模型对于论坛中浏览量的增加也能增加帖子的热度,提高其在论坛中的顺位,加快信息的传播这一机制特点没有能够进行还原。在处理实际数据时发现的发帖时间对于信息传播的影响机制也没有能够通过该模型还原。因此,UBIR模型仍旧存在一定的偏差,地方性网络论坛的信息传播机制仍不完善。在未来的研究中,可以进一步优化模型,使其更加符合现实中网络论坛舆情话题传播机制的特点,为网络论坛的监控和管理提供有效的参考。