基于舆情大数据的网民关注度转移模型研究

2018-12-08 11:17兰月新刘冰月张鹏
现代情报 2018年10期
关键词:数值仿真网络舆情大数据

兰月新 刘冰月 张鹏

〔摘 要〕[目的/意义]基于舆情大数据研究网民关注度转移模型,能够深入解读大数据环境下网络舆情事件的竞争效应,可以为网络舆情治理提供参考依據。[方法/过程]定性分析大数据环境下网络舆情事件竞争效应以及网民关注度转移机理,基于微分方程组构建网民关注度转移模型,通过研究模型特性和数值仿真,理解两个舆情事件之间网民关注度转移的定量关系以及未来趋势,并给出估计模型参数的方法。[结论/结果]经过理论建模和实证分析得出本文构建的网民关注度转移模型是可行的,尤其是可以通过舆情数据分析确定多个舆情事件的竞争结果以及网民关注度转移的关键节点,为进一步研究网民关注度转移趋势预测问题提供模型基础。

〔关键词〕大数据;网络舆情;网民关注度;转移模型;预测;数值仿真

DOI:10.3969/j.issn.1008-0821.2018.10.002

〔中图分类号〕C912.6 〔文献标识码〕A 〔文章编号〕1008-0821(2018)10-0010-06

〔Abstract〕[Purpose/Significance]This paper studied the netizens attention transfer model for big data of network public opinion,and further interpreted the competition effect of different Internet public opinion events under big data environment,and thus provided references of network public opinion management for the government.[Method/Process]Through the qualitative analysis of the competition effect of different Internet public opinion events and netizens attention transfer mechanism under big data environment,this paper constructed the netizens attention transfer model based on the theory of differential equation.By studying the characteristics of model and numerical simulation,this paper further identified the quantitative relationship and future trends of netizens attention transfer between two public opinion events,and provided the method to estimate model parameters.[Result/Conclusion]Through theoretical modeling and empirical analysis,this paper concluded the feasibility of netizens attention transfer model.Through public opinion data analysis,identifying competition results of multiple public opinion events and key nodes of netizens attention transfer could provide model foundation for the further study on the trend prediction of netizens attention transfer.

〔Key words〕big data;network public opinion;netizens attention;transfer model;prediction;numerical simulation

1 现状分析

根据第41次《中国互联网络发展状况统计报告》显示,截至2017年12月,我国手机网民规模达7.53亿,网民中使用手机上网人群的占比由2016年的96.1%提升至97.5%[1]。随着移动宽带互联网的普及,越来越多的网民通过互联网表达自身观点和诉求,在同一时间段内,往往是多个舆情事件并存,并且多个舆情事件相互影响、相互作用,形成一种“竞争”效应。如何把握网络舆情事件“竞争”实质和机理是政府面对各类网络舆情事件并发时需要解决的关键问题。

学术界对相关主题的研究主要体现为两个方面:一是网民关注度及其相关研究,如关注度的替换/叠加效应,以及体现网民关注度的舆情热度、热词、热搜等研究;二是舆情事件关联及其相关研究,如从舆情事件、舆情话题、舆情主体等不同层面探讨多事件、多话题、多主体的关联效应和演化机理。简要研究内容和代表性研究成果如表1所示。

虽然已取得了诸多研究成果,但大多是研究网络舆情传播的一般规律、针对某些网络舆情的案例分析或者多个网络舆情事件的统计规律,而对某个时段多个网络舆情事件并存时,相互作用、相互影响的程度和机理尚少有研究。基于此,本文以网民关注度转移的视角,构建数学模型,研究多个网络舆情事件并存时的竞争机理,为政府制定网络舆情治理策略提供参考依据。

2 大数据环境下网民关注网络舆情机理研究

2.1 大数据环境下网络舆情事件之间的竞争效应

随着互联网的普及,公共管理、社会矛盾、公共安全等各种类别的网络舆情事件频发,网民的意见、情绪等在网络上表达,生成大量文字、图像、音视频等格式的舆情信息,这些极具价值的信息在微博、微信、论坛等互联网平台快速传播。这些满足大数据的快速、多样、多量、价值性等特征,所以网络舆情已经形成一个大数据环境。通过整理2014-2017年人民网发布的《中国互联网舆情分析报告》,并从中提炼热点舆情数据发现:近4年,热点舆情总数为3 238,其中每年的日均热点舆情数量分别为4.21、1.37、1.65、1.64(详细数据见表2)。这仅仅是热点舆情的统计数据,而非热点舆情的数量会更多,所以平均每天都会发生规模或大或小的网络舆情。

进一步研究这些网络舆情案例发现,网民关注持续时间少则几个小时,多则数十天,甚至更长时间。有学者专门研究了100个舆情案例的网民关注度时间问题,通过统计分析得出网民关注持续时间均值为20.59天,关注持续时间的极小值为1天,极大值为149天[15]。在网民关注持续时间内,多个网络舆情事件相互影响,相互冲击,形成一种“竞争”效应(见图1),其竞争的实质内容即是网民的关注度。

2.2 网民关注网络舆情机理分析

网民关注网络舆情受诸多因素影响,包括兴趣、爱好、诉求等主观因素,也包括事件敏感程度、离奇程度等客观因素影响,这些因素直接影响网民关注网络舆情事件的持续时间。当一段时间内,有多个网络舆情事件产生时,由于网络无界性、开放性等因素,网民的主要关注点往往会发生转移,在这个过程中,形成聚集“围观”现象,进而使得被“围观”的网络舆情事件热度升温,成为热点舆情,所以热点舆情的生成过程也就是网民关注度转移、聚集的过程。所以,深入研究网民关注度转移问题,可以深层次解读热点舆情生成机理,描述网络舆情事件之间的“竞争”效应。假设一段时间内,有N个网络舆情事件产生,则网民关注点在N个事件之间相互转移,形成相对复杂的转移模式。基于此,为深入研究网民关注度转移机理,N个网络舆情事件之间的网民关注度多向转移模式可以简化为两个舆情事件的关注度单向转移模型(见图2)。更进一步,网民关注度由原始舆情I转移到新舆情II,在这个过程中,由于关注度的转出导致舆情I的信息量增长变缓,而由于关注度的转入导致舆情II的信息量增长加快,所以网民关注度转移的实质是信息量的转移,通过信息量的变化程度可以描述网民关注度的转移程度,进而从定量视角解读网络舆情事件之间的“竞争”效应。

3 面向舆情大数据的网民关注度模型研究

3.1 建模前提与假设

根据信息生命周期理论,网络舆情传播经历发生、发展、消退等阶段,这与生态科学中生物的萌芽、成长、消亡的生长机理相似,即“S型”曲线规律,故而可以用生物的生长模型来描述网络舆情信息的传播问题,通过大量网络舆情数据(信息量累计百分比数据)也可说明这一点(见图3)。基于此,本文选取Logistic模型来描述网络舆情传播过程。

4 网民关注度转移数值仿真

为进一步研究两个网络舆情事件之间的“竞争”效应,通过Matlab数值仿真方法研究网民关注度转移机理。为方便仿真研究,设定仿真参数见表3。

令舆情Ⅰ转出指标σ分别为0、0.05、0.10、0.15、0.20、0.25、0.30、0.35、0.39,调节系数m分别为0.5、1、2、5,绘制网民关注度由舆情Ⅰ转入舆情Ⅱ(简称舆情Ⅰ→舆情Ⅱ)的仿真效果图(见图5),研究不同场景的网民关注度转移规律问题。

观察仿真图像发现:随着转出指标的增加,一方面,舆情Ⅰ的信息量上限由1 000单调递减至25,舆情Ⅰ的转出度O(Ⅰ)由0单调增加至97.5%;另一方面,舆情Ⅱ的信息量上限由2 000单调增加至某个峰值后,然后再单调递减,舆情Ⅱ的转入度I(Ⅱ)变化区间分别为[0,4.01%]、[0,7.74%]、[0,14.55%]、[0,31.65%]。此外,对应不同的调节系数m,可以绘制舆情Ⅱ的信息量与转出指标的关系图(见图6)。不难发现,舆情Ⅱ的信息量在σ=r12=0.2处取得峰值,对应峰值分别为2 080.1235、2 154.7005、2 290.9944、2 632.9932,这就说明舆情Ⅰ转出指标为增长率一半时,舆情Ⅱ的竞争效果达到最优,正因为这一点,随着舆情Ⅰ信息量的转入,舆情Ⅱ的信息量曲线由单“S”型逐步变为双“S”型,在m=5时,双“S”图像尤为清晰,所以两个舆情事件的竞争关系也是导致网络舆情数据出现“震荡效应”的原因之一。

5 实证研究

5.1 数据来源

通过清博舆情监测软件(http://yuqing.gsdata.cn)分别获取雪乡宰客事件、“桑吉”爆燃事件、女子阻拦高铁事件的微博舆情统计数据,数据采集时段为2018年1月9日0点至2018年1月19日23点(详细数据见图7)。

5.2 数据分析

由于3个舆情事件均是同一时段的热点舆情,无法事先判断事件信息量的转出和转入,所以,为方便研究舆情事件之间的竞争效应,本文将3个事件中任取两个作为建模事件,故而形成六种结果。通过前文确定模型系数的方法,根据3个舆情事件的微博舆情統计数据可以确定模型的具体参数(见表4、表5)。

通过数据分析发现:当只有雪乡宰客事件和“桑吉”爆燃事件时,信息量由“桑吉”爆燃事件转移到雪乡宰客事件;只有雪乡宰客事件和女子阻拦高铁事件时,信息量由雪乡宰客事件转移到女子阻拦高铁事件;只有女子阻拦高铁事件和“桑吉”爆燃事件时,信息量由“桑吉”爆燃事件转移到女子阻拦高铁事件。所以当3个舆情事件共存时,“桑吉”爆燃事件的信息量分别转移到另外两个舆情事件中,并且转移到雪乡宰客事件的信息量要多于转移到女子阻拦高铁事件的信息量,而雪乡宰客事件信息量转移到女子阻拦高铁事件中。所以,根据本文计算结果,3个事件的竞争结果排序是女子阻拦高铁事件>雪乡宰客事件>“桑吉”爆燃事件,这也验证了通过网民关注度研究网络舆情事件竞争效应的可行性。

6 总结与展望

随着移动宽带互联网的普及,网络舆情事件频发,已呈现大数据环境,同一时段的网络舆情事件之间存在竞争关系,研究竞争程度和结果可以为网络舆情治理提供参考依据。基于此,本文通过网民关注度的视角研究网络舆情事件的竞争效应,构建了网民关注度转移模型,并通过模型分析、参数估计、数值仿真以及实证分析研究了模型特性、网民关注度转移机理等,并通过实际案例验证了模型可行性。

大数据的核心是预测,本文仅仅是建立了两个舆情事件的关注度转移模型,而限于篇幅,尚未根据本文模型预测网民关注度转移趋势以及网络舆情事件竞争结果。此外,对于多个事件并存时的转移问题,以及多个事件不同步时的转移问题有待进一步研究。

参考文献

[1]中国互联網络信息中心.第41次中国互联网络发展状况统计报告[R/OL].http://www.cnnic.net.cn/hlwfzyj/hlwxzbg/hlwtjbg/201801/t20180131_70190.htm,2018-02-06.

[2]陈安,房亚楠.多舆情事件的演化机理及其公众关注度的替换/叠加效应研究[J].广州大学学报:社会科学版,2017,16(6):24-29.

[3]刘艳红.基于关注度的网络舆情信息传播探究[J].新闻研究导刊,2017,(23):78,81.

[4]滕文杰.突发公共卫生事件网络舆情网民关注度区域分布研究[J].中国卫生事业管理,2015,32(5):393-396.

[5]林萍,解一涵,魏静.信息传播平台对网络舆情热度的影响分析[J].现代情报,2018,38(5):94-99.

[6]徐旖旎.基于微博的媒体奇观网络舆情热度趋势分析[J].情报科学,2017,35(2):92-97,125.

[7]苏国强,刘芊汝,薛信朋,等.面向舆情大数据的突发事件网络民意热度评价研究[J].内江科技,2017,38(7):74-75.

[8]曾子明,黄城莺.基于BP神经网络的突发传染病舆情热度趋势预测模型研究[J].现代情报,2018,38(5):37-44,52.

[9]杨宁.传播学视域下微博热搜榜的问题研究[J].新闻传播,2017,(12):121-122.

[10]喻国明.大数据分析下的中国社会舆情:总体态势与结构性特征——基于百度热搜词(2009-2012)的舆情模型构建[J].中国人民大学学报,2013,27(5):2-9.

[11]王长峰,庄文英,于长钺.基于改进SIR模型的群体意见竞争演化研究[J].情报杂志,2017,36(10):97-103,136.

[12]许媛,梁循.政府指导下时序耦合的企业相关双舆情分析——以“魏则西”及“雷洋”事件的耦合为例[J].中国管理科学,2016,24(S1):294-301.

[13]尹熙成,朱恒民,马静,等.微博舆情话题传播的耦合网络模型——分析话题衍生性特征与用户阅读心理[J].情报理论与实践,2015,38(11):82-86.

[14]王国华,邓海峰,王雅蕾,等.网络热点事件中的舆情关联问题研究[J].情报杂志,2012,31(7):1-5.

[15]张雪红.社会性事件网民关注规律研究[D].太原:太原科技大学,2013.

[16]姜启源,谢金星,叶俊.数学模型[M].北京:高等教育出版社,2011.

(责任编辑:马 卓)

猜你喜欢
数值仿真网络舆情大数据
多自由度本船操纵运动仿真
基于VOF方法小型赛车燃油晃动数值仿真
浅析网络舆情治理
基于社会稳定视角的网络舆情预警机制构建的思考