高艳子,秦江涛
(上海理工大学 管理学院,上海 200093)
据中国互联网络信息中心发布的第32次统计报告显示:截止至2013年6月,我国网民规模已达到5.91亿,较2012年增加了2656万人,互联网普及率达到44.1%,较2012年底上升了2.0个百分点。[1]互联网技术的发展,使得网络不仅成为人们获取资源和信息的平台,更成为人们进行交流和发表言论的重要工具。网络舆情就是在这种背景下产生的。网络舆情是指人们围绕各种社会事件的发生和发展变化而产生的、利用互联网传播的对各种事件的认知、态度、情感和行为倾向的集合。[2]随着网民规模的扩大和网民结构的多样化,网络舆情的规模和影响越来越大,政府也因此更加注重对网络舆情的监督和调控管理。
网络舆情既有有利的一面,也有不利的一面。一方面,网络舆情能够反映民众的想法,政府可以通过网络舆情了解到民众所关心的事件或问题,继而推进相关工作,更好地满足民众的要求。但同时,由于舆情事件的多样性,很多舆情事件的发生会对公众产生错误的引导,继而扰乱社会秩序,给国家和政府的管理工作带来困难。对网络舆情的研究为我国基于网络的信息传播研究提供了新的切入视角,也为政府更好地把握民意,积极推进管理工作提供了依据,具有很好的理论意义和实践价值。[3]
网络舆情的研究是一个多学科相结合的综合性研究,具有较高的复杂性。从网络舆情兴起至今,许多学者从多个角度和领域对其进行了分析和探讨,并取得了一些显著的成效。有些专家学者对网络舆情的定义和特点进行了概括,并总结了网络舆情的主要传播途径。[4]有些专家学者给出了互联网内容及舆情的十大核心元素,对网络舆情进行了深度分析。[5]有些专家学者提出了将内容分析法运用于网络舆情信息分析的方法,并给出了这种分析方法的优点。[6]有些专家学者通过对网络舆情设立预警等级和进行指标体系建设等对网络舆情的预警机制进行了研究。[7]有些专家学者利用复杂网络对网络舆情的传播规律进行了分析。[8]有些专家学者将Web挖掘技术应用于网络舆情的分析处理中,并建立的智能分析模型,指出通过Web挖掘能够实现网络舆情的自动采集和分析。[9]有些专家学者从网络舆情的基础理论、管控机制、外部性和分析技术与系统构建四个角度分析了我国网络舆情的研究现状,并对其以后的发展研究给予了分析。[10]
本文采用遗传算法的遗传操作基本模型构建网络舆情信息的动态传播模型。遗传算法是模拟生物的遗传操作进行的,本文将网络舆情信息的传递和演化看作生物基因的遗传过程。网络信息的传播和演化过程是持续进行的,进行遗传操作分析是将网络舆情的整个传播过程分成一个个小的阶段进行。在舆情发展之初就开始进行分析判断,随着舆情发展演化逐步进行循环分析。在网民、监管机构和舆情信息本身的共同作用下,通过一次次的迭代,构成了网络舆情的动态发展演化过程。需要注意的是,利用遗传操作对网络舆情的传播演化进行分析并不是简单基于时间串联进行的,网络舆情的传播和演化是一个并行进行的过程,即在传播的同时也有可能发生演化。因此,本文基于遗传操作的舆情分析流程,是在舆情发展过程中循环渐进进行的。基于遗传操作进行分阶段的循环渐进分析,一方面能够实时掌控舆情发展形势,避免传统方法难以找到最佳舆情控制点的缺陷;另一方面,循环渐进的分析更符合网络舆情并行的传播演化特征,更能把握舆情关注点的实时变化,舆情态势可以得到更好控制。
遗传算法是一种进化算法,它是借鉴生物进化的遗传、选择和变异等现象发展而来的。在通过编码形成初始种群后,通过遗传操作对群体中的个体按对环境的适应度进行操作处理,然后优胜劣汰循环优化,组后得到最优解。本文利用这种演化思想,描述网络舆情的传播演化过程。将网民对舆情事件或信息的评论看作通过编码形成的初始种群;对各种舆情评价的交融和舆情关注点的演化等的分析处理看作对群体按环境适应度的操作处理过程;分析时段得到的舆情关注点和舆情热度值即看作得到的最优解。舆情监控部门根据此时得到的舆情关注点和舆情热度预测舆情态势和走向、决定采取何种行动对舆情进行引导和控制,继而进行新一轮的演化循环分析。
遗传操作包括选择、交叉、变异三个遗传算子,本文利用它们来表示舆情观点的形成、舆情观点的交融和舆情关注点的动态演化分析过程(图1)。通过对舆情发展演变的循环分析,能够将舆情信息的动态传播、动态演化综合起来进行考虑,继而能够更准确、更全面的把握舆情的发展走向和规律,对舆情分析工作的展开有着很好的参考价值。
图1 基于遗传操作的网络舆情分析流程图
产生网络舆情的因素有很多,突发事件、帖子、视频、图片、微博日志等都有可能是网络舆情的起源。另外,便利的交流和信息媒介,如网络新闻网站、微博、论坛、即时通讯软件、搜索引擎等,也加速了网络舆情的形成和传播。舆情事件或舆情信息源出现以后,舆情监管机构首先对其进行分析和预测,估计其可能的热度。如能够准确预测舆情未来态势并且有能力及时调控,则在扩大舆情规模之前就能把舆情控制住,继而舆情终止。如舆情信息源是民众较敏感的话题或事件,则其传播速度会远大于舆情监管部门的调控速度,舆情规模会扩大。随后监管部门会根据舆情的发展情况给以预测、引导和调控,控制舆情态势向能调控的方向发展。随着政府部门的处理及舆情事件的解决,网络舆情最终得以平息。
遗传算法中的选择过程即通过编码得到初始种群的过程,在网络舆情传播中看作得到网民评价的过程。网民针对舆情信息源可以选择关注或不关注、选择做出何种评价内容。网络舆情在网民的选择行为中得以形成和传播。网民会针对舆情信息发表自己的观点、意见或表达自己的情绪,这些构成了各种新的舆情子信息,同时原舆情信息的更新及舆情控制部门的引导调控行为也是新一代舆情的组成部分。
网民是网络舆情的主题,他们既是舆情的创造者又是舆情信息的传播者。互联网的便利性给网民创造了能够自由发表言论的平台。每个网民都是一个独立的个体,不同网民对同一事物的认识会由于自身的文化背景、思维方式、人际关系及所处环境因素等的不同而不同。同时,网民对媒体报道的认知态度和接受能力也会影响其本身对舆情事件的看法。加之网民规模十分庞大,针对同一舆情事件自然会形成多种不同的意见和观点。这些意见和观点相互融合交叉,就形成了新的网络舆情关注点和舆情态势。
遗传算法中的交叉即两个个体随机的交换某些基因,继而产生新的基因组合的过程。本文将此过程引申为网民对舆情信息的各种意见表达的融汇过程。各个网民的舆情观点可以看作遗传操作中的个体的基因,舆情观点的融合可以看作基因的组合。舆情事件信息的传播,会得到很多网民对此事件的不同意见或观点。对其他网民的评论,不同网民因为意见或所站角度的不同又会有不同的看法,所以会针对别人的评论表达自己的赞同或反对意见,同时被评价网民也可以对别人的评价给以回复。这种网民针对舆情信息的交互过程见图2。网民评论过程的持续进行,共同构成了网络舆情。
遗传算法中的变异是指改变基因串上的某些基因以得到新的个体。本文将其引申为网络舆情传播过程中舆情关注点的改变。各种网络舆情观点进行交叉融合,会逐渐形成若干种能代表本分析阶段网民的主流观点及关注的主要问题的评论。事件的发展是动态进行的,不同分析时段网民的舆情关注点是会发生变化的,变异过程即看作对这种变化的表述和变化后的关注点的获得过程。
伴随着网民参与网络舆情事件评论热度的增加,网络舆情所形成的数据流也会大量增加。舆情信息流中所包含的信息会随着网民的参与和问题的处理而发生变化,在不同的时段网民对同一舆情事件内容的关注侧重点会有所不同,不同舆情的交融还可能会引发新的舆情热点,即网络舆情发生演化。
图2 网络舆情评论的交融过程
本文在此以2012年的钓鱼岛事件所引发的舆情事件,对网络舆情演化过程中关注点的变化过程进行分析。关于钓鱼岛的所有权问题中日之间一直存在争议,但在2012年日本要将钓鱼岛“国有化”使得矛盾激化。此消息传开后网络舆情迅速升温,舆情热点集中在对日本人、日货及中方政府对此事的态度等方面的讨论上。加上此事涉及国家领土完整和国家主权,网民的愤怒情绪更为强烈。网络舆情的迅速发展,衍生出了很多新的舆情事件,如烧砸日本车、抵制日货、反日游行、保钓行动等等。这些由舆情引发的活动中有理性的做法也有不理性的行为,因此这些衍生的活动又引发了关于是否应该抵制日货、是否应该打砸已有日货、中方政府应该如何处理这一事件、中国的外交政策等的舆情讨论。由此可以看出,随着舆情态势的不断发展,在中日矛盾的主题下,钓鱼岛问题引发了其他更多方面的中日问题,舆情关注点表现出了多元化。
网民对舆情事件参与性的加强使得舆情观点更加多样化,舆情主题走向更加多元化,如何准确分析网络舆情的走向,准确挖掘有用的舆情信息,是进行网络舆情引导和调控的关键。虽然网络舆情在不同的时段舆情关注点可能会发生变化,但同一主题不同时刻的舆情内容之间又具有关联性,所以通过舆情关注点的变化可以预测舆情发展的走向。由于网络舆情的传播具有快速性、实时性及无限性的特点,因而传统定点分析的方法难以准确把握舆情状况,分析处理效果欠佳。所以。针对网络舆情变化后的关注点的获得,本文采用舆情观点动态聚类的方法来对其进行描述(图3)。由于对网络舆情发展演化的分析是循环渐进进行的,所以对舆情关注点的聚类是动态的。这种观点聚类方法在考虑了主题相关性的同时还考虑了舆情发展的时间因素,能够同时考虑新出现的信息和历史信息,因而能够更好地反映网络舆情关注点的动态演化。
首先由于个人语言表达习惯的不同,需要对各种舆情评价进行中心观点概括,然后利用分词工具对其进行分词处理。目前最常用的分词工具有哈工大的LTP分词工具和中科院的ICTCLAS分词系统,它们通过中文分词和词性标注等处理,能够达到很好的分词效果。在分词之后提取能够代表各评论特征的特征词,通过比较不同的词之间的相似度来判断各舆情评价的侧重点,继而对其进行聚类。通过聚类可以得到分析时段网民最关心的问题或讨论最激烈的问题,即此阶段的关注点。
图3 舆情观点动态分析过程
经由以上操作得到的能代表分析时段的舆情关注点可以看做是遗传算法中经迭代得到的最优解。将网络舆情此刻的关注点结合此时网民参与热度、舆情发展的历史信息,舆情监管部门能够更好的预测网络舆情的发展走向和态势。在此基础上,舆情监管部门结合以往舆情处理经验,调整应对措施,积极应对,能够减小舆情危害,最终使舆情逐渐得以控制和平息。
以上基于遗传操作的各过程循环进行,共同构成了网络舆情的传播和演化过程。在网络舆情的产生和发展阶段,网络舆情传播迅速、舆情关注点变异的可能性较大。当在政府舆情部门调控治理下,舆情事件所引发的问题得以解决,民众热度减退,网络舆情就会逐渐平息。传统基于网络舆情传播生命周期的分析方法,将网络舆情的发展演化总体看作一个分析过程,只是指出在网络舆情的爆发期到来之前给以引导和控制。而实际由于很难确定具体何时为爆发期,亦无法确定事件的影响程度,因此很难找到合适的控制点,即便找到,也不一定能够通过一次处理就达到舆情控制的效果。利用基于遗传操作的动态循环渐进的分析方法能够实时掌握网络舆情的发展变化,继而做到对网络舆情进行实时监控和引导,能够更好地对网络舆情进行控制,减小舆情危害。
利用遗传算法的处理模式动态分析网络舆情信息的传播过程,能够更加清晰全面的了解和把握舆情的发展过程。通过网络舆情信息的动态传播及演化过程分析,发现除了舆情信息本身的爆发性和敏感性对舆情传播有大的影响外,舆情监管部门的调控和网民观点的多样化也是影响舆情发展态势和走向的关键因素。因此,加强舆情监管部门的调控能力和对网民进行规范教育也是网络舆情研究的重点。已有文献给出的政府对网络舆情的调控主要是分析提出解决办法,本文给出的建议主要是从前期预防和总结经验进行分析的。
从上述基于遗传操作的网络舆情传播演化的过程可以看出,网民评论的多样性是网络舆情发展和演化的基础。在舆情评价形成的过程中,网民的匿名性一方面可以使其根据事件发表自己真实的观点和意见,但另一方面,有些网民会把网络当做发泄情绪和不满的工具,发表一些不负责任或有诋毁性的言论。还有一些人出于一些动机会发布一些不符合事实、甚至危害国家安全的言论,即网络谣言。很多网民由于从众心理的作用,很容易受别人的影响。还有的网民在接触到舆情事件信息时不会去认真考虑、也无从得知信息的真伪,特别是在一些关乎自身利益的情况下,即便有疑问,也会选择去相信。比如日本地震后有传言说碘盐可以防辐射,造成了很多地方出现了抢盐风波,盐价疯涨。另外还有山西地震传言、“蛆橘事件”等,对人们的实际生活带来了很大的影响。因此,教育网民理性判断和发表言论是避免网络谣言传播、净化网络交流平台的关键。有关部门一方面应加大对网民的言论教育,教育网民理性发表言论。另一方面还应对网络谣言进行快速准确的辟谣、设立法律法规对恶意言论发布者进行强制制裁,努力构建一个自由而又真实的交流平台。
通过对网络舆情传播演化的循环渐进分析,可以看出舆情监管部门的引导和调控在处理网络舆情的过程中起到关键作用,因此应注重提高各舆情监管机构处理问题的能力,积累、交流舆情处理经验。虽然引起网络舆情的具体事件不同,但大致可以归纳为几个类别。人民网舆情频道按领域将网络舆情事件分为经济生活、社会民生、公共管理、司法实践、文化科教、群体事件、港台国际、地方形象和企业形象九大类。[11]对网络舆情进行治理和引导,首先要了解舆情的实质,分析舆情反映的是哪方面的社会问题,从本质上辨别舆情事件真伪。其次。由于对各类舆情事件所引发的舆情问题处理过程的大致框架相同,因此各级舆情监管部门可以对不同的网络舆情及事件进行聚类,总结各网络舆情的种类、特征、表现形式、影响幅度、治理办法等,在此基础上积极进行经验交流。在新的舆情事件发生的时候,首先判断是否有已发生的同类事件,然后根据事件本身的新特点和已有事件的处理经验相结合进行处理。通过运用经验处理能够做到对舆情事件的迅速定位,还能对舆情事件可能的发展态势进行预测,提高网络舆情的处理效率。
在舆情观点的交叉融合阶段,由于从众心理的存在,很多网民会受到其他网民评论的影响,在判断和认识上会出现随大流的现象。培养意见领袖,可以使这种倾向向能调控的方向发展。网络舆情事件的信息大部分最初是由少数人经过传播而形成网络舆情的,如果在舆情传播和形成阶段,即选择阶段,正确发挥意见领袖的领导作用,树立切合实际和正面的观点派别,将会大大减弱谣言和猜测带来的危害,减弱网络舆情的负面影响。自发形成的过激型的意见领袖会引导网民极端化的分析问题,袒护政府的意见领袖会使网民对其不信任,还可能引发对政府的不信任。因此,在意见领袖的培养方面,要注重培养能客观分析事实、保持理性思维的意见领袖。
互联网的普及和信息技术的成熟,使得网络舆情逐渐成为研究的热点。网络舆情从产生到消亡是一个动态发展变化的过程,只有对其进行实时监控和预测,才能准确把握其规律和走向,及时采取应对措施。本文通过分析发现利用遗传操作的基本模型可以很好地模拟网络舆情的动态传播和演化过程,并且通过循环渐进的分析更能实时把握网络舆情的发展变化。通过利用遗传操作的分析流程,还能找出进行引导和监控工作的关键点,对其采取应对措施,可以有效减小网络舆情的危害。
[1]中国互联网数据资讯中心.http://www.199it.com/archives/132716.html[DB/OL].
[2]曾润喜.网络舆情信息资源共享研究[J].情报杂志,2009,(8):187-191.
[3]季丹,谢耘耕.中国网络舆情研究的历史回顾与反思[J].上海交通大学学报(哲学社会科学版),2012,(4):48-56.
[4]刘毅.略论网络舆情的概念、特点、表达与传播[J].前沿论坛,2007:11-12.
[5]谢海光,陈中润.互联网内容及舆情深度分析模式[J].中国青年政治学院学报,2006,(3):95-100.
[6]刘毅.内容分析法在网络舆情信息分析中的应用[J].天津大学学报(社会科学版),2006,(4):307-310.
[7]吴绍忠,李淑华.互联网络舆情预警机制研究[J].中国人民公安大学学报(自然科学版),2008,(3):38-42.
[8]潘新.基于复杂网络的舆情传播模型研究[D].中国知网博士论文,2010.
[9]张玉峰,何超.基于 Web挖掘的网络舆情智能分析研究[J].实践研究,2011,(4):64-68.
[10]曾润喜.我国网络舆情研究与发展现状分析[J].图书馆学研究,2009:2-6.
[11]王国华,冯伟,王雅蕾.基于网络舆情分类的舆情应对研究[J].情报杂志,2013,(5):1-4.