兰月新+夏一雪+刘冰月
〔摘 要〕 [目的/意义]研究网络舆情演化的多维度模型,从更高视角解读网络舆情传播规律,丰富和完善网络舆情传播理论。[方法/过程]定量分析网络舆情趋势预测中信息增长率的变化问题,构建以增长率和时间为自变量,信息累计数量为因变量的多维函数模型,并通过MATLAB仿真研究各个参数对网络舆情传播的影响以及网络舆情传播路径分析,然后通过“成都女司机”微博数据验证了模型的可行性,更加直观地诠释了高维模型研究网络舆情演化机理的优势。[结论/结果]经过理论建模和实证分析得出,将logistic模型拓展到高维研究网络舆情演化机理是可行的,并且多维度模型很好地解释了网络舆情数据出现多个“峰值”现象,而网络舆情统计数据的实质是高维度模型曲线在时间轴的投影。
〔关键词〕网络舆情;Logistic模型;演化机理;仿真分析;实证分析;大数据
DOI:10.3969/j.issn.1008-0821.2017.08.008
〔中图分类号〕 G206 〔文献标识码〕A 〔文章编号〕1008-0821(2017)08-0057-08
〔Abstract〕This paper studied the multidimensional model of network public opinion evolution,interpreted the law of network public opinion from a higher angle,and enriched the theory of network public opinion communication. Quantitative studied the change of information growth rate during network public opinion trends forecast,constructed a multidimensional function model that the rate of growth and time were the independent variables,and the cumulative number of information was the dependent variable. Then studied the effect of various parameters on the network public opinion dissemination and its path through MATLAB simulation,verified the feasibility of the model by analysis of the “Chengdu female driver” microblog data,and illustrated the advantages of the high dimensional model to study the mechanism of network public opinion. Through theoretical modeling and empirical analysis,it was feasible to extend the Logistic model to higher dimensional research of network public opinion evolution mechanism. The multidimensional model explained the phenomenon of appearing more “peak” in network public opinion data,and the essence of network public opinion statistics was the projection of the high dimensional model curve in the time axis.
〔Key words〕 network public opinion;logistic model;evolution mechanism;simulation analysis;empirical analysis;big data
1 現状分析
根据第39次中国互联网络发展状况统计报告(CNNIC),截至2016年12月,我国网民规模达7.31亿,互联网普及率为53.2%,其中手机网民规模达6.95亿,网民中使用手机上网的比例为95.1%[1]。随着移动宽带互联网的普及,网民可以通过手机快速、及时参与网络热点讨论,所以,每天都会发生规模或大或小的网络舆情,其中包含定量文字、图片、视频等,形成一个网络舆情大数据环境。面对海量网络舆情信息,如何精确研究网络舆情演化机理成为网络舆情精细化研究的一个重要内容。
网络舆情是极具现阶段中国政治与社会特色的研究领域。国外网络媒体在反映社情民意方面的作用不及我国,研究相对较少,他们较多的关注网民进行的网络内容创作、编辑与筛选,使网民能够与编辑、记者进行意见交流,对网络新闻制造和传播产生影响。国外网络舆情的传播演化的研究,吸引了物理学、计算机、通信网络、社会学和经济管理等学科学者的关注,显示了该领域的跨学科性和热门性[2-6]。这些研究虽然能解释网络舆论传播演化中的某些现象,但舆论主体间具有情感性、复杂性和多变性的社会关系,使这些模型的解释能力都有各自的局限,且无法描述网络舆论演化的整体态势。
国内网络舆情演化机理方面研究较多,将国内研究文献通过CiteSpace软件进行可视化可使前沿主题更加清晰,隐去关键词出现频率3以下的关键词,生成关键词共现可视化图谱,如图 1所示。观察知识图谱发现,目前国内网络舆情演化机理研究前沿主要集中在 3个部分: 一是以“自回归模型”、“指数平滑模型”、“隐马尔科夫模型”等为主的基于统计学的舆情演化机理模型[7-9](A区); 二是以“灰色理论模型”、“神经网络模型”、“支持向量机模型”、“贝叶斯网络”等为主的基于智能机器算法的舆情演化机理模型[10-12](B区); 三是以“系统动力学”、“社会网络分析”、“演化博弈”等为主的基于社会学理论仿真的舆情演化机理模型[13-15](C区) 。
虽然学术层面取得了很多研究成果,但是网络舆情演化机理仍有很多问题需要解决,例如①如何解读网络舆情统计数据的多“峰值”现象;②目前的演化机理模型大多只有一个时间变量和一个信息量变,但网络舆情传播演化受多个因素影响,所以需要考虑更多的影响要素,开展精确化研究。综合以上问题,本文在定性分析网络舆情演化机理的基础上,通过求解Logistic模型的解析解,构建多维度演化机理模型开展网络舆情演化的精细化研究,以期为网络舆情传播理论提供参考依据。
2 网络舆情演化机理问题
随着网络舆情监测软件的开发和利用,通过软件可以非常便利的采集新闻网站、微博、博客、微信、论坛等互联网平台上的网络舆情信息,为网络舆情分析提供统计数据。例如, “信息量~时间”的二维统计数据(图2)常用来描述网络舆情演化机理,通过统计数据可以直观了解网络舆情传播态势。
然而,根据网络舆情定义[16-18],网络舆情即网民通过互联网对某一网络话题进行交流的信息总和。不难发现,网络舆情定义中,信息量和值是一个随时间变化的变量,所以需要对监测软件获取的统计数据进行累加,得到累加数据,进而构造信息量和值變量研究网络舆情演化机理。
2.1 网络舆情演化基本模型
2.2 网络舆情演化动态预测问题
文献[19]研究了基于logistic模型的动态预测方法,即,首先,通过监测获取的数据应用差分回归法确定模型系数 和K,进而预测舆情未来趋势;其次,随着新数据的加入逐步修正模型系数 和K,进而实现动态预测舆情未来趋势。但在实际应用中,随着新数据的加入,模型参数 变化明显,所以参数 亦随着时间在变动。以“归真堂”舆情为例,图3是“归真堂”网络舆情网络新闻词频统计数据[20](舆情监测区间为2012.02.10-2012.03.13,关键词为归真堂)。以前10个数据为基础数据确定模型参数,然后逐个加入后面的数据,通过差分回归法确定增长率,得出增长率随时间变化的曲线(图4),图中曲线在初期变化明显,但随着数据的增多变化逐步趋于稳定。
综合以上两点,网络舆情在传播演化过程中,网络舆情信息量随着时间的变化而变化,并且随着增长率的变化而变化,所以如果将变化率作为变量来看待的话,便可以构建网络舆情信息量关于时间和增长率的多元函数关系。基于此,本文构建网络舆情演化的多维度模型,从更高视角解读网络舆情传播演化机理,以期为研究网络舆情传播理论提供参考依据。
3 基于logistic模型的网络舆情演化机理多维模型
3.1 网络舆情演化机理多维建模
在K=100,初值=1%K时,绘制模型对应三维图像示意图(图5),图中曲面均是连续光滑的,可以对其进行求导,研究对应变量的变化规律。模型在面的投影(图6)均是“S”形曲线,与网络舆情数据累加量的曲线相吻合,换句话说我们通过监测软件获取的舆情累加数据曲线只是本文构建的多维模型的一个投影。所以,本文构建的演化机理多维模型有助于从更高视角解读网络舆情演化机理,并且可以深层次挖掘数据之中的变化规律,尤其是发现增长率对网络舆情传播的影响。(注:三维曲面图中红色代表网络舆情信息量最大,黄色次之,蓝色最小)。
除此之外,本文构建的网络舆情演化多维模型中的初值是作为常数出现的,不同的初值对网络舆情的影响相对较小(图7),模型曲面会随着初值的变化被“压缩”或者“拉长”,但曲面形态基本不变。通过模型也可看出,它对网络舆情的影响包含于之中,所以下文会对开展一些研究,而不针对初值开展专门研究。
3.2 模型分析
4 仿真研究
网络舆情演化多维模型中的涉及参数包括、、,在这些参数作用下网络舆情演化呈现多维曲面结构,而网络舆情信息量曲线则是这个曲面上的一条曲线,并且随着参数的变化,这条空间曲线在曲面上的位置也在变化,也就是网络舆情传播路径在发生变化。基于此,本文先研究模型的参数仿真,然后研究网络舆情传播路径仿真与分析。
4.1 关键参数仿真
4.1.1 变上限模型仿真对比研究
通过图11发现,上限高的曲面完全覆盖上限低的曲面,直面与三个曲面相交的三条空间曲线均具有“S”曲线结构,且网络舆情传播初期增长率高,随着时间的推移,信息量在增长,而增长率在变小,在信息量趋近于饱和之时,增长率也稳定于最小值(图12),这个最小值往往就是模型拟合数据获取的定值增长率。这些图像特征说明上限值的增大极大提升了网络舆情信息的增长空间,换句话说,当网络舆情信息量突破上限值后,信息量增长速度不会变缓,而是会继续高速增长,直至接近下一个信息量上限前,增速才变缓慢。所以,在某些网络舆情信息量会出现多个小的“S”形,其对应为累加的统计数据曲线图则会出现多个“峰值”现象,虽然如此,在对网络舆情数据进行累加之后,总体趋势依然呈现“S”形,将三条曲线在轴做投影很好地印证了这一点(图13)。
以“雾霾”微博舆情数据(统计时间:2016.11.1-2016.2.16)为例,在微观层面,累加数据曲线是由多个小的“S”形曲线组成的,每产生一个小的“S”形,信息量都会突破原有上限继续增加(图14);在宏观层面,总体依然呈现“S”形,并且每一个小的“S”形对应统计数据的一个峰值,图中的累加曲线是一条二维曲线,其实质是本文构建的多维模型曲面上空间曲线的一个投影。
4.1.2 恒定、高速增长模型仿真研究
以“和颐酒店遇袭”事件微博舆情数据为仿真基础,该事件微博舆情信息的上限与初值的比为,=1.9540。具体仿真参数设定见表3,根据MATLAB绘制模型对应曲面(图15),研究模型在恒定、较高的增长率条件下的演化规律。
通过图16发现,恒定高增长率条件下网络舆情信息量短时间快速增长达到饱和状态,所以突破上限的概率明显增加,突破第一个上限后,信息量继续增加直至下一个上限,进而形成前文讨论的多“S”形状(图15和图16中虚线所示),这种现象会随着网民关注度的增加不断出现,直至关注度降低后稳定于一个高值上限,这也和前文研究相吻合;反过来,如果网络舆情信息量空间受限,即上限降低,则网络舆情则将快速饱和于一个低值上限,以此类推,网民关注持续降低会使网络舆情信息量饱和于一个较低的数值。所以当网民数量相对稳定时,这种现象较为常见,当多个网络舆情同时期产生后,关注度高的一个网络舆情信息量空间增加出现多个舆情数据峰值,而其他网络舆情信息量空间降低,网络舆情很快饱和, 本文称这种现象为信息量相对“守恒”现象。
4.2 网络舆情传播路径仿真与分析
通过前文分析,网络舆情产生初期,时间小,增长率大,信息量小;网络舆情饱和阶段时间大,增长率则很小,信息量很大。基于此,本文研究网络舆情传播不同路径对舆情传播的影响,选取三个平行于轴的直面与模型曲面相交构造路径,三个直面方程为
通过图17发现,三条路径是模型曲面与三个直面相交而成的,它代表网络舆情具体的传播路径,三条路径在面进行投影均是“S”曲线(图18)。三条路径上增长率均随着时间增长而单调递减,路径起点和终点相同,但是网络舆情信息量随着时间变化的曲线却差距很大,三条路径在面进行投影(图18)不难印证这一点:1号路径在经历5个时间单位后快速达到饱和状态,2号次之,而3号路径则在30个时间单位才达到饱和,所以1号和2号路径突破上限的概率远高于3号路径。在实际网络舆情传播过程中,由于网络舆情传播受网民关注度、意见领袖、网络水军的影响,所以舆情传播实际路径会在多个模型路径上波动,所以从微观视角观察的话,反映网络舆情传播路径是一条有很多“弯曲”的空间曲线。
结合以上内容,容易得出,网络舆情监测软件获取的舆情数据仅仅是网络舆情传播过程中信息量在时间轴上的“投影”,直接研究监测数据会损失部分关键信息,而本文构建的多维度模型将增长率作为一个维度进行建模,可以得出影响舆情传播的关键就是增长率函数,这一点更好地解释网络舆情数据的波动现象,也可以为网络舆情导控提供指导。
5 模型验证研究
5.1 数据来源
2015年5月3日下午,成都市娇子立交桥男司机狂殴女司机事件引发一场舆论风暴,新浪微博“@成都商报”首次曝光娇子立交桥下男子狂殴女司机事件,舆论迅速发酵。截至13日24时,通过网络舆情监测软件获取新浪微博发布和转发信息100万多条,相关话题#女司机惨遭男司机暴打#阅读量8312.8万,话题讨论数12.8万。以新浪微博按小时统计数据为基础绘制网络舆情传播趋势图(图19)。
5.2 数据建模
5.3 结果分析
通过图20的三维图像可以得出如下结果:
1)“成都女司机”舆情曲线完全附着在空间曲面上,监测获取的舆情数据,只是网络舆情演化信息量在时间轴的投影。正好验证了本文构建的多维模型的合理性,相对于二维的监测数据,多维模型是相对全面的描述了网络舆情传播机理。
2)将黑色曲线在面做投影,得到投影图像(图21),容易看出,增长率整体趋势随着时间增长而变小,但如果将图像放大会发现增长率在局部出现了波动,这一点正好印证了仿真研究中网络舆情信息量增长率会出现波动现象,进而导致网络舆情传播路径是一条有很多“弯曲”的空间曲线(图22)。
通过MATLAB仿真研究了模型特性,并通过“成都女司机”网络舆情数据验证了模型。通过本文的研究可以得出以下结论:
1)将logistic模型拓展到高维研究网络舆情演化机理是可行的。这一点已经通过模型仿真和实际数据进行了验证;
2)本文构建的多维度模型很好地解释了网络舆情数据出现多个“峰值”现象。多“峰值”现象的实质是网络舆情传播不断超越模型上限的过程。
3)网络舆情统计数据的实质是高维度模型曲线在时间轴的投影,并且网络舆情传播路径可以在多条增长率函数上波动,但是信息量在时间轴的投影依然是“S”形曲线。
基于以上结论可以继续开展研究,例如:本文构建的基础模型是logistic模型,除此之外,还有其他的“S”形曲线模型有待进一步尝试。
参 考 文 献
[ 1 ]中国互联网络信息中心.第39次中国互联网络发展状况统计报告[R/OL]. [2017-2-18]. http://www.cnnic.net.cn/hlwfzyj/hlwxzbg/hlwtjbg/201701/t20170122_53271.htm
[ 2 ] Rowe G,Hawkes G,Houghton J.Initial UK Public Reactionto Avian Influenza:Analysis of Opinions Posted on the BBC Website[J].Health,Risk&Society Health,Risk&Society,2012,10(4).
[ 3 ] Daley D J,Kendall D G.Epidemics and Rumours[J].Nature(S0028-8036),1965,204(9):1118.
[ 4 ] Serge Galam. Modeling Rumors:The no Plane Pentagon French Hoax Case[J]. Physica A:Statistical Mechanics and its Applications,2013,320:571-580.
[ 5 ] Zanette D H. Dynamics of Rumor Propagation on Small-world Networks[J].Phys. Rev. E (1539-3755),2012,65:041908.
[ 6 ] Moreno Y,Nekovee M,Pacheco A F.Dynamics of Rumor Spreading in Complex networks[J] . Phys.Rev.E E(S1539-3755),2014,69:066130.
[ 7 ]周耀明,李弼程.一种自适应网络舆情演化建模方法[J].数据采集与处理,2013,28(1):69-76.
[ 8 ]徐敏捷,刘冰月.基于组合预测的网络舆情数据预测模型研究[J].情报科学,2016,34(12):40-46.
[ 9 ]何建民,李雪.面向微博舆情演化分析的隐马尔科夫模型研究[J].情报科学,2016,34(4):7-13.
[ 10 ]杜智涛,谢新洲.利用灰色预测与模式识别方法构建网络舆情预测与预警模型[J].图书情报工作,2013,57(8):27-33.
[ 11 ]孙玲芳,周加波,林伟健,等.基于BP神经网络和遗传算法的网络舆情危机预警研究[J].情报杂志,2014,33(11):18-24.
[ 12 ]张一文,齐佳音等.基于贝叶斯网络的非常规危机事件预警研究[J].图书情报工作,2012,56(2):76-81.
[ 13 ]张一文.齐佳音等.网络舆情与非常规突发事件作用机制研究——基于系统动力学建模[J].情報杂志,2010,29(9):1-6.
[ 14 ]王晰巍,邢云菲,赵丹,等.基于社会网络分析的移动环境下网络舆情信息传播研究—以新浪微博“雾霾”话题为例[J].图书情报工作,2015,59(4):14-22.
[ 15 ]陈福集,黄江玲.基于演化博弈的网络舆情热点话题传播模型研究[J].情报科学,2015,33(11):74-78.
[ 16 ]曾润喜,徐晓林.网络舆情突发事件预警系统、指标与机制[J].情报杂志,2009,28(11):52 -54.
[ 17 ]王青,成颖,巢乃鹏.网络舆情监测及预警指标体系构建研究[J].图书情报工作,2011,55(4):54-57.
[ 18 ]丁菊玲,勒中坚,薛圈圈.定量网络舆情危机预警模型构建[J].图书情报工作,2011,55(10):59-63.
[ 19 ]兰月新,董希琳,苏国强.公共危机事件网络舆情预测问题研究[J].情报科学,2014,32(4):35-38.
[ 20 ]凤凰网新闻频道:归真堂事件展现网络公关攻防技巧[EB/OL].[2013-1-20].http://news.ifeng.com/gundong/detail_2012_02/29/12862548_0.shtml?_from_ralated.
(本文责任编辑:孙国雷)