,
随着网络与通信技术的飞速发展,信息传播载体与主体多元化,传播内容多样化、广泛化、细微化,新旧媒体、各类社群间的界限消融,已进入了泛媒体时代。本文借鉴以往学者将传染病模型引入网络舆情传播研究的做法[1-4],以消息识别为基础,区分采用SIQR及SIRS模型,引入“外舆论场”“用户传染力”等概念优化免疫手段,优化控制网络舆情传播,搭建了“导”“控”相结合的网络舆情传播优化控制平台,并利用Swarm软件仿真分析,有效验证了该平台效能。
利用wiki技术,搭建了一个面向所有人,共同参与、共同编辑,以消息识别结果为基础区分调用带连续接种SIQR模型与SIRS模型的“导”“控”结合的优化控制平台。该平台由消息识别器和网络舆情控制系统2部分组成,整体框架结构如图1所示。
图1 网络舆情传播优化控制平台结构
1.1.1 消息真伪判别
以《泛媒体环境下网络舆情传播控制的优化研究》中提出的信息真伪判别指标项及其质疑指数为基础[5],以“机器遍历+人工判别”方式判别舆论传播过程中初始消息及衍生消息的真伪。
1.1.1.1 机器遍历方式
首先对消息文本预处理,以正则表达式+HTMLParser抽取信息,结合JE分词系统,获取良结构化的消息内容特征与主题。然后将良结构化的消息内容与话题数据库中的话题信息内容表及话题信息来源表以机器遍历方式检索对比,获取各指标项质疑值。若是已有话题,则依据表内字段判断该消息的内容常识性、发布偶然性、来源真实性及权威性;若是新话题,则以该消息为特定主题,从微博、知乎、网易等主要网络舆论平台进行信息抓取、处理、识别与分析,将其存入话题库对应表内,再进行上述已有话题的检索判别步骤,完成判别。
1.1.1.2 人工方式
由所有具备人工审核权限的信息审核员,结合传统媒体信息,对消息内容的来源准确性、信息内容的专业性、信息发布的利益相关性逐一判别。各指标项的所有信息审核员判定分值均低于其对应质疑指数时,才判定该指标项质疑值低于其质疑指数。
最终,综合上述7项指标的质疑值,当其均低于对应指标项的质疑指数时,该消息判别为 “真”,否则判别为“假”。
1.1.2 信息文本情感识别
本文从评价对象入手,细分信息文本为N个评价单元,每个评价单元均由评价对象、评价词、否定副词、程度副词、文本句型5个元素组成,通过累计相加各评价单元情感极值得到信息文本的最终情感值。若信息文本情感值>0,则认为信息情感倾向为“正”;若信息文本情感值<0,则认为信息情感倾向为“负”;若信息文本情感值=0,则认为信息情感倾向为“中性”。其中有如下2个关键点。
一是评价对象、评价词与评价单元的抽取。评价对象与评价词的抽取均采用“有监督&无监督”的半自动方法。首先以无监督的Apriori 算法结合CRFs 模型,抽取部分评价对象,并结合有监督的人工方式抽取的评价对象,获取评价对象集合;然后一方面以基于Apriori 算法的半监督迭代方法抽取具有明显情感倾向的频繁项为评价词,一方面以人工方式抽取本身无明显情感但结合位置与评价对象显示出明显情感倾向的频繁项为评价词,获取评价词集;最后以评价词输入CRFs 模型,结合词位置、程度词等特征,抽取评价单元。
二是单元5组的分类及情感极值赋值。对评价对象、评价词、否定副词、程度副词及句型进行分类,按类赋予对应的情感极值,并结合消息文本的语境、所指向的领域背景,以人工方式适当修正分类及赋值结果,使消息文本的情感极值更符合其实际语义[6]。
1.1.3 消息识别结果分类
根据消息真伪判别与信息文本情感识别的结果,将话题消息区分为“虚假”的消息、“真实”且“负面”的消息、“真实”且 “正面”的消息和“真实”且 “中性”的消息4类。该分类结果为网络舆情控制系统中模型的调用、免疫手段的采取提供依据,是整个网络舆情传播优化控制平台的基础部分。
根据消息识别结果,网络舆情控制系统启用2种不同模型进行舆论传播控制。对“虚假”的消息及“真实”且“负面”的消息启用带连续接种的SIQR模型,加速舆情收敛,以“控”为主;对“真实”且 “正面”的消息启用SIRS模型,帮助舆情扩散,以“导”为主;对“真实”且 “中性”的消息以监测为主。该系统中所有用户均为注册用户(区分为普通用户与管理员),其权限按其性质及等级授予,未注册访客只有最低浏览权限。
1.2.1 用户行为建模与传染力分析
以话题主题为关键词,对比话题数据库,搜寻该类话题的发布者及参与者,并与用户数据库信息进一步比对,获取系统内所有与该话题有关的用户。根据用户基本信息及其发帖、评论、转发等历史记录对其建模,将其中虚假、负面信息传播频次大于系统众数的用户定义为“恶意用户(um)”,将真实、正面信息传播频次大于系统众数的用户定义为“优质用户(uh)”,其余的均定义为“普通用户(uo)”。
该系统网络为加权无标度网络,根据平均场理论,系统传播阈值与网络拓扑结构、节点传染能力都有关系,在系统网络规模固定的情况下,节点传染力越强,舆情传播速度越快,传播范围越广[7-8]。因此,在用户建模同时,分析其传染力,对舆情传播控制方法的采用具有极其重要的意义。计算用户传染力,并统计其数据分布规律,分别将用户传染力分为对应的几个等级(表1)。
表1 用户传染力等级表
1.2.2 网络舆情传播的优化控制
在开放性网络舆情传播控制系统中,不论消息识别的分类结果如何,舆情衍化都必然经过话题创建、传播、锁定3个阶段,各类用户(包括管理员)主要以消息转发、评论、话题推送、权限调整、版本控制等方式参与话题创造与修改,通过协同编辑加速实现舆情传播的客观化和理性化。不同模型的调用、外舆论场的引进、用户类型区分与传染力分析等均为增强协同编辑效用的手段。
管理员M设置敏感词汇,进行事前用户审查,在舆论初期及时锁定恶意用户um,只开放浏览权限,使其无法参与话题转发、评价或编辑等。从外舆论场提取对应话题的正面、真实信息,以最高频次推送,加大外舆论场推进率,引导其看法,提高接种成功率。上述接种免疫手段将贯穿舆情衍化全过程。
充分重视优质用户uh。除管理员权限外,最大程度开放其权限,减少其评论、转发、创建类似新话题的时间、字数等限制,增强其正面客观话题的置顶频率,使之更好地参与协同编辑。以固定频次从外舆论场提取相关正面真实信息推送,促进其传染能力和等级的提升,便于扩散正面情绪、客观信息,增强系统自净能力。
对普通用户uo按传染力等级开放权限及调整外舆论场信息推送力度。调用SIQR模型时,等级越高,对应系统权限越低且信息推送频次越高。根据其中心性与中间中心性挑选核心用户,进一步限制其协同编辑权限,加强其信息内容的审查频次与力度。一旦发现其恶意、虚假信息传播频次超过系统众数,则视其为um予以隔离,且注重对核心用户的真实正面信息推送,提高接种成功率。调用SIRS模型时,等级越高对应系统权限越高,充分发挥其传染力,促进正面舆情扩散;而等级越低信息推送频次越高,不仅提取外舆论场信息推送,加大其推进率,且注重平台热点和优质用户推荐,增强uh的辐射影响,促进uo向uh转变。
各类用户不再局限于网络传播环境,从系统提取引发舆论的根本问题,外推至外舆论场,寻求共振与支持,促进根本问题解决并将结果反馈给舆情平台,引导舆情传播理性化、客观化,并使其自身认识到网络舆情并非脱离社会现实存在,其恰恰植根于现实土壤。群聚力用于传播 “谣言”,无助于事件解决。
管理员(M)动态监测话题传播,按时间轴顺序将传播过程分为N个时间段,计算各时间段内各节点流量Qvi(t)(即t时刻流经vi节点的瞬时数据量,为t时刻vi节点的数据流入量与流出量之差),及各节点传播速度qvi(t)(即t时刻vi节点传播话题的速度,为t时刻vi节点话题发送与接收速度之差),并依据两者大小,找到“核心节点”[9]。然后按顺序两两比较各时间段内各节点流量大小与传播速度,尤其当核心节点不再发生明显变化时,则认为该时刻后舆情传播进入稳定态,管理员即对其锁定。
该平台的Swarm仿真系统由ObserverSwarm,ModelSwarm,StartSwarm 3个层次组成。StartSwarm为最上层,用于启用程序;ObserverSwarm为中间层,用于控制并观察ModelSwarm的运行状况,并将运行结果以各类话题的数量变化趋势为指标进行展示;ModelSwarm则为主体核心层,调用了User类、PosAuction类、CombAuction类和AuctionModelSwarm类。其中User类用于生成用户传染力和用户类型,PosAuction类封装N个用户并计算获取各类用户具备不同传染力等级时对各类话题的感染力度;CombAuction类调用PosAuction类,获取网络舆情传播控制平台的初始化状态,更新运算,获取不同控制模式下单位时刻内平台各类话题的数量及其对应的各类用户数量;AuctionModelSwarm类再调用CombAuction类,模拟舆情传播全过程,持续计算,获取不同控制模式下平台各类话题的数量及其变化趋势。
本文在仿真系统中将话题区分为理性正面话题(★)、中性话题(●)和负面虚假话题(▲)3类,用户区分为管理员(M)、恶意用户(um)、优质用户(uh)和普通用户(uo)4类。各类用户传染力区分为5等,分别赋予“1、2、3、4、5”5个数值,数值越大,其传染力越强。
该平台中用户传染力数值为常数,感染其他用户及其话题内容性质的能力是固定的,不发生变化。平台运转时,各类用户随机走动,按以下规则进行感染:当um遇到话题,该话题标记为负面虚假话题(▲),并感染1个uo成为um,感染 1个uh成为uo;当uh遇到话题,即理性正面话题(★)、中性话题(●)均标记为理性正面话题(★),负面虚假话题(▲)标记为中性话题(●),只感染1个uo成为uh;当uo遇到话题,参考该话题的关联话题,以其中数量最多的话题类型予以标记,当数量相当时,将其标记为中性话题(●),不感染任何用户;当M遇到话题,该话题标记为理性正面话题(★),不感染任何用户。
对该平台进行仿真分析,发现平台运行迭代到15次时,平台中负面虚假话题486条(占73.97%),理性正面话题38条(占5.78%);而uo数量占用户总数的73.6%,uh和 um数均不超过15%。可见舆论传播初期,负面虚假话题及中性话题占绝大多数,而理性正面话题非常少;大部分用户都为普通用户,容易受到信息内容及关联用户的影响与感染。随着迭代次数增加,网络舆情不断传播发酵,当平台迭代到890余次后,各节点(尤其核心节点)流量不再明显变化,且各类话题数量也趋于平稳,即认定该网络舆情已处于传播稳定态,此时理性正面话题1 348条(占81.25%),负面虚假话题174条(占10.52%),而中性话题132条(占7.98%),而uo数量仍超过半数(占用户总数的57.1%),uh数量仅增长了5.7。
可见,当无优化模型时,网络平台需迭代较多次数,耗费较长时间才能实现舆情稳定,完成对舆情传播的控制,且理性正面话题增速缓慢,优质用户数只略微增长,普通用户仍占大多数,整体环境更有利于负面虚假话题信息的传递与发酵(图2)。
图2无优化控制的舆情传播仿真结果
该平台中用户传染力数值是变化的,其感染其他用户及其话题内容性质的能力根据平台一系列优化免疫措施发生改变。当平台运转时,各类用户随机走动,按以下规则进行感染:事先区分um,锁定、隔离,使um只能接受而无法传播其他用户话题信息,不改变任何话题性质、不感染任何用户;当uh遇到话题,传染力等级为4、5的uh将各类话题均标记为理性正面话题(★),感染1个uo成为uh、1个um成为uh;传染力等级为1、2、3的uh仅将理性正面话题(★)、中性话题(●)标记为理性正面话题(★),仍将负面虚假话题(▲)标记为中性话题(●),只感染1个uo成为uh;当uo遇到话题,传染力等级为4、5的uo将话题标记为理性正面话题(★),感染一个um成为uo;传染力等级为1、2、3的uo则参考关联话题中数量最多的类型予以标记,当数量相当时,将其标记为中性话题(●),不感染用户;当M遇到话题,该话题标记为理性正面话题(★),感染1个uo成为uh、1个um成为uh。
对该平台进行仿真分析,发现尽管在初期,平台中负面虚假话题及中性话题仍占多数,理性正面话题数量也很少:SIQR模式下,迭代到15次时,负面虚假话题占71.36%,理性正面话题占4.62%;SIRS模式下,迭代到15次时,负面虚假话题占69.73%,理性正面话题占5.97%,且普通用户为平台大多数。但随着外舆论场、用户权限等优化免疫手段的运用,SIQR模式下平台仅迭代至494次,舆情传播进入了较为稳定的收敛状态;而SIRS模式下平台迭代至643次,使舆情传播进入了大范围的地方病状态,实现了短时间内舆情传播的快速收敛与扩散,加速了舆情传播的理性化与客观化,使优化平台的“控”“导”功能均得到了较好发挥,且平台中优质用户数均得到一定程度提升,增长率超过20%,恶意用户数量也明显下降(图3、图4)。
图3 连续接种SIRQ模式下舆情传播优化控制的仿真结果
图4 SIRS模式下舆情传播优化控制的仿真结果
各类网络舆情传播控制平台多以“控”为主,忽视正面舆情传播,聚焦网络媒体,忽略外舆论场作用,视野局限于封闭单一的环境系统,缺乏开放性和动态性,且免疫手段单一、滞后,未充分考虑传播节点的传播能力与网络结构带来的影响。
本文从泛媒体环境出发,充分考虑上述问题,在文献[5]的基础上,利用wiki技术构建网络舆情传播优化控制的技术框架与平台,以消息识别为基础,灵活调用不同模型控制舆情,人人参与、共同编辑,以用户建模与传染力分析结果为依据,按不同等级开放各类权限,区分推送外舆论场信息,加大外舆论场推进作用,全程接种,优化免疫。并且利用Swarm软件进行仿真分析,发现对比一般网络舆情传播平台,该优化平台加速了舆情传播的理性化与客观化,能短时间内实现舆情传播的快速收敛与扩散,控制打击“谣言”,弘扬正能量,更贴合开放环境下舆情传播控制的现实需要,充分验证了其控制方法的有效性。但本文尚未推行该平台大规模的实践使用,对其实践效果也未有科学评价手段,这是我们进一步研究所需解决的问题与目标。