杨长春++袁敏
〔摘要〕突发事件之间存在的关联、削弱或衍生的关系,会对现发的突发事件的热度产生影响。本文根据突发事件的交互关系,建立舆情敏感信息库,对突发事件的热度进行预测,并通过实验验证和理论分析,为政府消解突发事件负面舆情提供参考。
〔关键词〕交互关系;突发事件;舆情预热度;舆论共识度
DOI:10.3969/j.issn.1008-0821.2017.03.008
〔中图分类号〕G206〔文献标识码〕A〔文章编号〕1008-0821(2017)03-0040-06
〔Abstract〕The weakened or derived relationships between the occurrence of emergencies,effect the heat of the current incident.Based on the interaction of emergencies,this paper built a public sensitive information database to predict the heat of emergencies.Through the experimental verification and theoretical analysis,the paper obtained the ideal result,which was the efficiency of the government to dissipate the negative public opinion.The results provided feasibility recommendations and methods.
〔Key words〕interaction relationship;emergencies;public opinion preheat degree;the consensus of opinion
突发事件具有紧急性、严重性、扩散性、群发性和连锁性等方面的特征[1],发生后迅速引爆网络舆论场,而因传播过程中速度迅猛但信息不对称、网络舆情主客体素质良莠不齐等原因,让不理性、负面的声音甚至谣言更容易在网络上传播,增大了突发事件类网络舆情的负面影响及治理难度。突发事件之间本身存在的衍生[2]、连锁[3]、系列化呈现[4]、舆情共振[5]等关系,而又由于抢占网络注意力的利益驱使,网络媒介在突发事件发生后主动协同过滤关联事件并加以大量传播以期望引起更大的关注量和话语权,网民对于特定突发事件存在群体记忆,使得突发事件的交互关系对突发事件类网络舆情热度产生了多重影响,将其量化并引入到热度预测的研究中,对于有效的引导舆情的正确走向,控制突发事件类舆情发展具有重要意义。
根据《第38次中国互联网络发展状况统计报告》[6]显示,截至2015年6月,我国微博客用户规模已经达到204亿,虽然随着微信、知乎以及豆瓣社区的兴起,微博舆情主引擎的地位在一定程度上被削弱,但是当突发事件爆发后,微博因为其广播性和互动性,可以更加原生态的展现社会舆论,故仍然是研究网络舆情的最佳平台。本文就以市场份额为694%的新浪微博微博为例,对突发事件在新浪微博上的应对机制进行研究。
1相关研究回顾
现有研究中,学者们对于突发事件类网络舆情热度的研究相对较多,主要从定性和定量两个角度展开。定性研究主要从监测角度,建立突发事件热度评价指标体系,研究突发事件的关系来进行热度预测。如张一文等[7]从媒体影响力,政府疏导力,事件性质和网民相互作用力建立了四级指标的突发事舆情热度评价体系。刘毅[8]将三角模糊数学对网络舆情的各个指标权重进行量化研究,在此基础上曹学艷等[9]又将政府应对等级引入到网络舆情热度评价指标中;而关于突发事件关系中,王国华等[10]对热点事件的关联的研究中就曾提出要建立关联舆情数据库来进行热度预测和舆情监控,王建伟等[11]也指出突发事件之间可能存在的连锁反应可用于应急预警和综合减灾。
定量研究主要是从基于自然语言处理和数据挖掘和基于内容的热度分析方法。如鲁明羽[12]针对中文语义的复杂性和多样性,提出模糊聚类算法来对论坛热点话题挖掘。邓爱萍[13]提出可以快速聚类的网络热点事件识别与跟踪的算法。郑魁等[14]对突发事件的网络信息分词后合并关键词,以关键词列表的形式反映事件热点。
综上,对于网络舆情危机的研究方向较多,其研究成果也为本文奠定了良好的理论基础。但是在突发事件的热度研究中,往往都是在舆情传播阶段的博主指标、博文指标、传播指标和受众指标几个方面测定舆情热度等级,在此阶段测定的热度具有一定滞后性,不利于政府快速采取行动阻止舆情进一步扩散,同时没有将突发事件的交互关系考虑其中。因此本文在此基础上建立的热度预测模型,在突发事件的爆发初期根据舆情敏感信息库对其进行衡量,得出突发事件的可能热度,为每次突发事件的舆情处理提供参考。
2突发事件热度预测模型
根据《中华人民共和国突发事件应对法》的定义,突发事件是指突然发生,造成严重社会危害,需要采取应急处置措施予以应对的自然灾害,事故灾难,公共卫生事件和社会安全事件[15]。在事件发生的早期,参照敏感信息库以及突发事件的首发信息特征对突发事件热度进行预测,得出此次舆情的可能热度,如果预测的热度值超过设置的阀值则对此次事件加大处理网络舆情的处理等级。快速开展调查行动,并即时参与调查和处理的信息公开。
21基于历史建立舆情敏感信息库
舆情预热度是基于网络资源有限且注意力是稀缺下提出的概念。在一个时间间隔内,媒体和公众对一个事件的注意力是有限的且对于每个事件所给予的注意力是不同的,而政府用来处理突发事件在网络上的传播的资源也是有限的,要提高资源的利用率,将有限的资源用于处理可能会造成最大影响的事件上来。而在突发事件爆发期,政府再介入只会导致意见的分裂但不会影响到传播过程的完整性,故造成的损失和影响仍然比较大。因此在突发事件发生的早期进行热度预测,是减少损失和有效管理的重要手段。
突发事件的传播过程往往经历萌芽、形成到爆发、高潮直至消退、消亡(残留)的完整过程,爆发期和高潮期持续时间较长,呈现出二级甚至多级传播的态势、热点频现、周而复始的循环状态。特别是突发事件具有持续性和延展性,公众在较长一段时间内都会关注,因此具有很长的潜伏期。这种潜伏体现在两个方面,一是在引起极大关注的突发事件的网络舆情消退后仍有二次爆发的可能;二是突发事件出现后并未引起网民足够的重视,但下次相似的事件发生时再次被唤起。这两种情况下,网络舆论在前期基础上传播的更加汹涌。突发事件大多涉及政府工作的方方面面,对此网民倾向于负面认知和反面判断。因此在处理突发事件的网络舆情中有必要建立舆情敏感信息库,将公共食品安全、医疗卫生、官员贪污、执法犯法等极易引起民众情绪的敏感事件收入其中,以便为现发的网络舆情提供处理经验,也利于于并对其进行监控,防止二次舆情的爆发。
对中国人民网监测中心每年发布的《网络舆论共识度研究报告》[15]中政府认同度比较低、舆论场差异较大的事件性质作为舆情敏感信息库的类别。具体如表1:
借鉴并结合文献[9]的网络舆情热度应对等级的评价指标,构建舆情敏感信息库的数据结构。根据新浪微博的2010-2015年的互联网舆情分析报告提供的事件热度值以及当年的新浪微博的讨论量,将2010-2015年有影响的突发事件录入舆情敏感信息库中,其中收集的数据分为客观数据和主观数据,客观数据是指发生时间、持续时间、微博讨论量、事件性质、热度等定性数据,客观数据过新浪提供的API接口应用python爬虫程序进行搜集。主观数据如应对等级、政府应对满意度等采用德费尔法,由10位网络舆情管理领域的专家对事件的政府处理效果打分,去掉最高分和最低分平均而得。具体结构如表2实例。
22指标构建与热度预测的计算方法
本文热度预测采取的方法是在突发事件发生后,对突发事件的具体特征以及舆情敏感信息关联事件进行分析,得出事件的可能热度的一种预测方法。指标构建从两方面考虑,一是同类型突发事件的叠加影响,如“深圳娃娃鱼”事件与“山东青岛大虾”事件属于在不同时间段内的同类型突发事件,两次事件的叠加使得民众对于不良商家和涉事政府的不作为产生了更大的反感情绪,加大了“山东青岛大虾”事件的恶劣影响。二是不同类型事件的交互影响,这种交互影响体现在两方面,一方面可能产生衍生舆情。衍生舆情是指在原始舆情的高潮结束后,因为某个衍生点产生的衍生舆情造成的另一个舆情高潮,与原始舆情交叉在一起造成更大的影响[1]。例如地震属于自然灾害类,而官员贪污属于官民关系类,若在地震事件期间爆出官员挪用救灾资金,则会产生更大的社会影响;另一方面,在一个时间间隔内,不同类型的突发事件若没有联系,则存在削弱的关系。例如自然灾害类的“庐山地震”和社会道德争议类的“复旦投毒案”事件在同一天发生,但是“复旦投毒案”热度就被“庐山地震”削弱。故在舆情敏感舆情信息库时,需要建立突发事件之间的内在联系,将孤立的突发事件有机的联合起来。因此引入度分布的概念,度分布是网络的重要统计特征,在社会网络中,度可以表示个体的影响力和重要程度[16],将每个类别的突发事件抽象为节点,则度表示突发事件的交互关系,使用数据可视化软件Gephi计算度生成突发事件关系图,如图1所示。1
其中节点为舆情敏感信息库中的不同类型的突发事件,边表示与其它类型的突发事件的关系,分为正相关和负相关,正相关表示连锁或者衍生关系,负相关表示削弱关系。绝对值越大则表示两个节点的交互影响越强。较大的节点拥有与比其它节点相比更多的联系。
为了对预热度进行量化的计算,還需要建立合理并具有实际可操作性的指标,借鉴文献[15]比较成熟的网络舆情热度的部分指标,结合突发事件的自身特征以及与其它突发事件的联系,形成指标体系,其中一级指标1个,二级指标3个,三级指标8个。热度预测的指标体系如表2所示。
221数据标准化
预热度中的计算指标包括效益型指标和成本型指标,E11、E12、E21、E22都为效益型指标,而E13、E23为成本型指标。为了使数据更易于计算,要对其进行同趋化处理,采用指标无量纲化方法,公式分别为(1)和(2)。
得到的数值在[0,1]区间内,对其进行标准化将其放大100倍,至区间[0,100],得到最终计算数据。
222末级指标含义
2221同类型事件的时间间隔E11
突发舆情的影响具有时间效应,距现发事件的时间间隔越长,对现发突发事件的影响则越小,故计算现发的突发事件距离最近一次的同性质的突发事件的时间间隔n(n的单位为月,若时间间隔不足1个月则计做n=0),同类型时间间隔权重为E11=100-n。
2222突发事件的热度E12,E21
对舆情敏感信息库中的同类型突发事件的热度加权求平均,以保证计算尽量符合最近时间间隔的实际情况,提高计算精度。2010-2015年赋予了不同的权重[07,075,08,09,1]。例如“抢盐风波”这类型的网络谣言类突发事件,因为近几年对于网络谣言的治理,此类事件已经很少能引起极大的影响,但若不加权处理就记入热度计算,则会影响计算的精度。最后为了使数据更具有可比性进行归一化处理之后可得表3所示。
2223突发事件的政府满意度E13,E23
对舆情敏感信息库中的相同类型突发事件的政府应对满意度进行与热度的类似的操作,可得表4。一般而言,政府应对满意度与突发事件的热度成反比,政府应对满意度低的突发事件再次发生只会增加网民的不满情绪,而不会削弱舆情热度。为了后来的层次分析法的计算,对政府应对满意度进行处理,先进行取反1-θij,再对取反结果进行归一化和标准化处理,公式(1),放大100倍将最终数值区间固定在[0,100],结果如表5所示。
2224与不同突发事件的关系系数E21
突发事件的网络舆情一般持续时间在10~20天左右,舆情的爆发期和高潮期集中在前5天,若在此期间发生无联系的另一起突发事件,则突发事件的热度就会被削弱;或若此突发事件是由前一突发事件衍生的、相关联的事件,则此突发事件的热度就会增强。
关系系数具体见图1所示的边标签。
将其关系系数放大100倍,使值落在[0~100]区间内。
2225突发事件主体E31
突发事件的主体是指参与或者涉及事件的人,从主体身份以及主体影响力两个方面进行考察。主体身份是指当事人或涉事人的社会身份,不同的社会身份所引起的关注以及情感态度都不一致,如大学生、婴儿、孕妇、农民工等弱势群体更容易激起民众同情,高官、城管、医生等容易激起社会道德讨论;而主体影响力是指知名度、社会地位,影响力越大的主体引起的关注也越大。若无主体则忽略不计(自然灾害无主体)。
2226损失程度E32
在突发事件初期,损失程度难以一步明朗的情况下,若属于A类则按照国家分类标准划分,见图并分别赋予权重,若不属于A类事件,则根据具体情况划分。
223AHP方法计算指标权重
层次分析法是由美国匹兹堡大学教授TLSaaty在20世纪70年代中期提出的。它的基本思想是把一个复杂的问题分解为各个组成因素,并将这些因素按支配关系分组,从而形成一个有序的递阶层次结构,层次分析法可以考虑指标之间的相对重要性,提高权重设计的科学性[15]。
依据表2建立的指标体系,构建两两比较判断矩阵B=(bij)n*n,得到各个指标的相对权重,对指标权重特征向量进行一致性检验,最后计算组合权重,得出一级指标相对于上级总体指标的权重分配值。利用同样方法可以得到二级指标相对于一级指标的权重,得到其权重如表7所示:
3实验验证
对2015年引起较大影响的事件进行“预热度”的计算,对计算结果与《2015年互联网舆情分析报告:2015年网络热点舆情》给出的实际事件热度进行比较分析,分析结果如表8所示:
可知拟合结果较好,预热度和实际热度数据显著相关。
以山东疫苗事件为例,315曝光的劣质义齿生产后,2016年3月18日山东疫苗事件的发生,迅速的引爆了舆论场,引起民众极大的恐慌情绪和对政府监管失守的极大不满。而“山东疫苗事件”之所以造成如此巨大的舆论影响,正是因为前期劣质义齿事件的铺垫,以及2013年“乙肝疫苗致人死亡事件”和2010年的“山西疫苗事件”的文章《疫苗之殇》微博上二次传播,导致民众对政府监管的不满情绪在涉及医疗安全这类敏感事件时彻底引爆。以此次事件为例带入计算可得舆情预热度EH=078125,可知已经属于较大负面舆情事故。
此种热度预测方法是在突发事件发生初期,对突发事件可能热度的预测。在此基础上将有限的网络舆情管理资源优化分配到最有可能造成较大社会影响的事件上,尽管因为突发事件之间存在的差异性和演变机理的不同,就算出来的热度并不等同于突发事件的实际热度。从实验结果上看,预测热度值对实际热度也存在普遍的高估,但是为了降低忽略任何一个可能会引起较大影响的负面事件的可能性,这种有限度的高估是可以接受的。
4结论与展望
突发事件的热度预测,对政府合理调度网络资源,监督引导舆论正确走向,提高政府公信力具有重要意义。准确性和即时性是热度预测最重要的两个因素,因此本文在分析突发事件网络舆情的特征以及之间存在的交互关系的基础上建立舆情敏感信息库来对现发的突发事件进行热度预测,相较于对突发事件发生后再进行数据挖掘等处理方法上提高了预测的速度,且具有可接受的预测精度。
另外本文将突发事件类网络舆情关系引入到舆情热度指标的研究中,丰富了已有的舆情热度的评价指标,也为政府应对突发事件类网络舆情提供参考,即重视历史突发舆情的处理结果和处理经验的价值,在舆情传播的潜伏期能识别出可能引起较大影响的突发事件并优先处理,破环其演化路径,减少由于谣言、错误舆论等对于公信力的削弱。
丰富了舆情热度计算指标,预热度的计算是基于以往突发事件的权重指标计算,但是针对负面突发舆情的多爆发点的特点,由于敏感舆情信息库不具有足够多的数据,应用机器学习算法容易出现过度拟合的特征,因此在将来的研究中基于前人关于热度等级的研究基础上,尽可能完善舆情敏感信息库,以便于采用机器学习算法进行数据的拟合。
参考文献
[1]兰月新.突发事件微博舆情扩散规律模型研究[J].情报杂志,2013,31(3):31-34.
[2]兰月新.突发事件网络衍生舆情监测模型研究[J].现代图书情报技术,2013,(3):51-57.
[3]王建伟,荣莉莉.突发事件的连锁反应网络模型研究[J].计算机应用研究,2008,25(11):3288-3291.
[4]方付建,肖林,王国华.网络舆情热点事件“系列化呈现”问题研究[J].情报杂志,2011(2):1-5.
[5]刘雪梅.对网络空间舆情共振现象研究框架的思考[J].新闻与传播研究,2011,(4):32-33.
[6]科学世界网.看点!第38次《中国互联网络发展状况统计报告》[J].科学家,2016,4(9).
[7]张一文,齐佳音,方滨兴.非常规突发事件网络舆情热度评价体系研究[J].情报科学,2011,29(9):1418-1424.
[8]刘毅.基于三角模糊数的网络舆情预警指标体系构建[J].统计与决策,2012,(2):12-15.
[9]曹学艳,张仙,刘睴,等.基于应对等级的突发事件网络舆情热度分析[J].中国管理科学,2014,22(3):83-88.
[10]王国华,邓海峰,王雅蕾.网络热点事件中的舆情关联问题研究[J].情报杂志,2012,31(7):1-5.
[11]王建伟,荣莉莉.突发事件的连锁反应网络模型研究[J].计算机应用研究,2008,(11):3288-3291.
[12]鲁明羽,姚晓娜,魏善岭.基于模糊聚类的网络论坛热点话题挖掘[J].大连海事大学学报,2008,34(4):52-59.
[13]邓爱萍.网络热点发现与跟踪算法研究[J].计算机与现代化,2009,(12):122-124.
[14]郑魁,疏学明,袁宏永.网络舆情热点信息自动发现方法[J].计算机工程,2010,36(3):4-6.
[15]祝華新.网络舆论共识度研究报告[R].北京:人民舆情检测室,2015
(本文责任编辑:马卓)