混合神经网络的高校网络舆情预测模型研究*

2016-12-21 03:06李孟山

赣南师范大学学报 2016年6期

关键词：舆情粒子神经网络

武燕，黄颜，吴维，李孟山

(赣南师范大学 a.数学与计算机科学学院;b.物理与电子信息学院，江西赣州 341000)

·应用数学·

混合神经网络的高校网络舆情预测模型研究*

武燕a，黄颜a，吴维b，李孟山b

(赣南师范大学 a.数学与计算机科学学院;b.物理与电子信息学院，江西赣州 341000)

为了对高校大学生群体性事件网络舆情进行准确预测并作正确引导，提出一种基于改进粒子群算法的混合神经网络(HANN)的高校网络舆情的发展趋势预测模型.HANN首先采用自适应调整策略和混沌理论对粒子群算法进行改进得到改进粒子群算法(CSA-PSO)，再通过CSA-PSO算法训练径向基人工神经网络(RBF ANN)得到；RBF ANN的结点个数通过试探法确定.通过实例测试和与其它模型比较实验，结果表明所提出的HANN方法具有较高的预测精确，综合性能较好.

网络舆情；群体性事件；神经网络；混沌理论；自适应调整策略

1 引言

网络舆情是公众通过互联网对某些热点、焦点的社会问题产生的不同看法所发表的网络舆论.主要的实现方式包括：QQ、论坛、微信、博客、微博等网络工具.互联网作为一种新兴媒体已在社会信息传播中占有主导地位，成为公众发表舆论最常用的平台.公众通过网络工具对一些问题或焦点的舆论则在短时间内就可以形成，信息量极其大，而且网络舆论的数据特点具有不规则性和随机性.因此，对网络舆情的准确预测和干预则尤为重要[1-4].

近年来，高校校园网络的兴起，越来越多的大学生通过互联网借助新兴媒体工具关注自己校园热点和焦点并发表自己的观点和看法.高校大学生思维活跃并乐于发表自己的见解，敏感性较强，成为网络群体的重要参与力量.但是由于大学生对问题的分析能力尚未完全成熟，易受到迷惑，这给高校学生思想政治教育工作带来挑战[5-7].因此，对高校网络舆情进行准确预测并作出引导，形成具有参考价值的舆情信息，有利于高校学生思想政治教育工作顺利开展[8-9].

目前，网络舆情的分析方法主要有：一、传统方法，如调查法和基于统计规则的方法；二、智能方法，如采用人工神经网络、聚类算法、支持向量机等.由于网络舆情数据具有不规则和非线性等特点，并且其发展趋势也具有复杂性等，因此采用传统的统计方法则具有一定局限性[10-11].人工神经网络被广泛应用于解决复杂非线性问题，因此，人工神经网络成为对网络舆情进行预测的主要方法，研究者也提出一些基于神经网络的网络舆情预测模型，预测结果比传统方法具有一定优势.但是人工神经网络算法也有自身的缺陷，算法容易陷入局部最优、其训练结果的好坏依赖于初始权值的选择等.为了改进人工神经网络的性能，研究者试图将各类智能优化算法应用于网络训练，因此，将各种智能优化算法用于改进神经网络得到性能更好的混合神经网络[12-18].孙玲芳等[19]采用遗传算法对BP神经网络的初始值与阀值进行优化，构建了基于遗传算法的BP神经网络舆情预测模型；但是遗传算法的效率比其它优化算法低.

智能优化算法中PSO优化算法相对于遗传算法和模拟退火算法则更为简单，容易实现且需要优化的参数较少，是一种全局最优搜索算法，被广泛应用于优化人工神经网络.如魏德志等[20]提出一种混沌理论和改进径向基函数神经网络模型，用于网络舆情预测，预测效果较令人满意.PSO优化算法虽具有较强的全局搜索能力，但是在搜索过程中容易陷入局部最优.如果简单将两种算法结合建立模型，虽相比人工神经网络模型有所优势，但是没有从根本上解决问题.为此，本文试图将混沌理论和自适应策略用于改进PSO算法，再将改进后的PSO算法用于BP神经网络的结构优化和参数调整，使得网络能够充分训练，得到一种混合神经网络(HANN)用于高校网络舆情预测.

2 模型理论

2.1 改进粒子群算法(CSA-PSO)

粒子群算法(PSO)是受鸟群觅食行为启发得到的一种智能优化算法，被用于解决最优化问题.假设在n维搜索空间中，由m个粒子组成n维空间的潜在解，在求解迭代过程中粒子更新自己的速度和位置是通过如下公式完成.

为了改进PSO算法早熟收敛问题，加快算法的收敛速度，引入混沌理论和自适应权重调整策略优化PSO算法中的三个参数分别为：学习因子c1和c2，惯性权重因子ω，得到CSA-PSO算法.其中，惯性权重因子ω下述公式调整.

式中，权值最大值和最小值用ωmax和ωmin表示；当前迭代次数表示为iter；itermax表示为PSO算法被允许执行的最大迭代次数.n表示的含义为非线性设置指数.

在算法执行过程中，利用Lorenz方程对学习因子c1和c2进行调整，并进行优化搜索.

上式中三个控制参量a=10，r=28，b=8/3.得到学习因子c1和c2.

混沌为具有随机性的运动状态，由混沌变量来呈现混沌状态,具有随机性、遍历性和规律性特点.学习因子c1和c2利用混沌变量的这些特征来实现混沌变量的演变并进行粒子优化搜索, 使算法不仅在进入早熟收敛时，能促进算法跳出局部最优，同时在算法搜索过程中探索占优时，提高收敛速度和收敛精度.

2.2 混合神经网络(HANN)

将CSA-PSO算法用于训练神经网络，对RBF-ANN的基函数中心及扩展常数、网络权值进行优化，得到基于CSA-PSO算法和RBF ANN的混合神经网络.CSA-PSO执行过程中每个粒子的位置向量与相应的参数相对应，网络适应度函数采用网络输出误差衡量，误差越小则表示适应值越好，粒子的性能则更好.网络的权值是通过粒子位置的改变而作更新，在搜索空间内粒子进行搜索使得网络的输出误差最小.在每次搜索迭代过程中，全局最优的粒子为最小误差的粒子.

图1 优化网络结构训练结果图

本文采用三层RBF神经网络，根据“两会”作为舆情信息关键字预测问题，主要是分析按照时间序列对这个网络舆情关键字的访问量.所以网络使用一个输入结点，一个输出结点.隐含层中结点个数是通过试探法确定其个数，个数从3增加到11，其得到9个HANN模型，通过计算模型的MSE来确定隐含层结点的最佳个数，如图1所示.

从图中可以得出，选择MSE较小的网络作为最优的网络结构，据图1所示，隐含层结点数为5时网络模型最优.所以本文建立了基于CSA-PSO的3层结构为1-5-1的HANN模型.

在CSA-PSO算法用于训练神经网络的过程中，PSO算法的参数选择直接影响算法的性能.通常情况下，根据问题规模来确定算法的参数，本文中参数的确定如表1所示.

表1 CSA-PSO算法参数描述

图2 “两会”百度指数趋势图

3 预测实验

3.1 实验数据与评价

实验数据是通过百度公司开发的百度指数应用统计得到，它是以海量网民行为数据库为基础的数据分享平台，统计结果比较客观和全面.选择“两会”作为舆情信息关键字，统计出从2015年2月1日到2015年4月30日产生的90个分量的时间序列数据，建立一个包含90组数据的数据库,如图2所示.将数据库中的数据随机分成训练集、验证集和测试集三个子集.

模型采用计算平均相对误差(Average relative Deviation,ARD)、预测均方根误差(root mean square error of prediction，RMSEP)和平方相关系数(Squared Correlation Coefficient,R2)进行精度和可靠性评价，其中ARD和RMESP定义为：

其中，样本个数用N表示，网络模型预测值采用Pre(i)表示，Exp(i)为实验实际值，x是N个样本数据xi的平均值.

图3 实验值与模型预测值对比图

图4 测试集中实验值与模型预测值对比图

3.2 实验结果

使用数据库中的训练集数据用于网络训练，通过建立的HANN模型进行训练.图3为使用40组训练样本对混合网络进行训练所得到的预测值和实际值的对比图；直线表示预测值等于实际值的理想模型，蓝色星型符号和红色的圆圈符号分别表示在训练集和验证集中的预测值.

通过采用训练集和验证集对所提出的HANN进行训练，从对比结果可见， HANN达到较理想的模拟效果，预测值和实验值吻合性较好.通过训练集对HANN模型进行训练得到的训练结果可见，HANN模型已被充分训练；通过验证集对HANN模型进行训练得到的验证结果可见，预测结果都非常接近理想值，因此可知HANN模型预测能力可靠且预测精度较高.

图4绘制了测试集中的预测效果，从图可以看出，预测值分布均匀，模型的预测能力优良，具有实际参考价值.

为了进一步评估得到模型的精度和可靠性，将本文提出的算法(CSA-PSO RBF ANN)与经典的神经网络预测算法(RBF ANN)和粒子群优化算法(PSO ANN)进行比较，通过计算各算法模型的平均相对误差(Average relative Deviation,ARD)、预测均方根误差(root mean square error of prediction，RMSEP)和平方相关系数(Squared Correlation Coefficient,R2)进行精度和可靠性比较.

通过表2所得到结果可知，CSA-PSO RBF ANN 的平均相对误差和均方根误差明显小于RBF ANN和PSO ANN算法的平均相对误差,则说明预测精度更准确；在相关性上，平方相关系数表明，CSA-PSO RBF ANN模型的预测值与实验值吻合度较高.

表2 各模型统计数据表

4 结论

高校大学生群体性事件网络舆情受到多种不确定因素的影响，信息表现出无规则、随机性和复杂性等特性，是一种复杂的非线性问题，给高校思想政治教育工作者带来挑战.采用传统方法进行预测，结果不令人满意.本文构建了基于CSA-PSO RBF ANN 模型(即混合经网络模型(HANN))，通过上述实验可知模型预测能力强，易于操作.预测结果为高校教育工作者进行高校网络舆情监测和干预提供参考价值.

[1] 郑岩.高校网络舆情监测系统的目标定位、评判依据与运行保障研究[J].情报科学,2015,(6):81-85.

[2] 王海涛,张福蒸,王义,等.通过信息技术提高高校网络舆情引导能力[J].华东师范大学学报(自然科学版),2015,(S1):18-23.

[3] 任娟玲,王志泉.高校网络舆情危机的应对策略研究[J].学校党建与思想教育,2013,(21):31-33.

[4] 曾润喜,王国华,徐晓林.高校网络舆情的控制与引导[J].情报理论与实践,2009,(11):79-82.

[5] 许静,李亚平,方志耕.高校网络舆情危机演化GERT模型及其应对机制和策略[J].数学的实践与认识,2015,(5):75-82.

[6] 闾春飞,张鹏超.基于思想政治教育视角的高校网络舆情引导机制探讨[J].学校党建与思想教育,2015,(2):90-92.

[7] 杨敏.网络舆情视阈下高校网络文化安全问题研究[D].武汉:华中师范大学,2014.

[8] 王超,王磊,李楠.大数据时代高校网络舆情管理主体的能动性研究[J].管理现代化,2015,(4):100-102.

[9] 吕娟.高校大学生网络舆情的监管与疏导研究[D].上海:华东政法大学,2013.

[10] 王少鹏.基于LDA的文本聚类在高校网络舆情分析中的应用研究[D].北京:首都师范大学,2014.

[11] 阮芳.新时期高校网络舆情管理存在的问题及对策研究[D].武汉:湖北工业大学,2012.

[12] Zhao, X. C., Liu, Z. Y., Yang, X. J. A multi-swarm cooperative multistage perturbation guiding particle swarm optimizer[J].Applied Soft Computing,2014,22:77-93.

[13] Zhang, Y., Gong, D. W., Sun, X. Y., et al. Adaptive bare-bones particle swarm optimization algorithm and its convergence analysis[J].Soft Computing,2014,18(7):1337-1352.

[14] Zhai, S. J., Jiang, T. A novel particle swarm optimization trained support vector machine for automatic sense-through-foliage target recognition system[J].Knowledge-based Systems,2014,65:50-59.

[15] Wang, L., Yang, B., Chen, Y. H. Improving particle swarm optimization using multi-layer searching strategy[J].Information Sciences,2014,274:70-94.

[16] Nguyen, T. T., Li, Z. Y., Zhang, S. W., et al. A hybrid algorithm based on particle swarm and chemical reaction optimization[J].Expert Systems With Applications,2014,41(5):2134-2143.

[17] Campos, M., Krohling, R. A., Enriquez, I. Bare Bones Particle Swarm Optimization With Scale Matrix Adaptation[J].IEEE Transactions on Cybernetics,2014,44(9):1567-1578.

[18] Hu, M. Q., Wu, T., Weir, J. D. An Adaptive Particle Swarm Optimization With Multiple Adaptive Methods[J].Ieee Transactions On Evolutionary Computation,2013,17(5):705-720.

[19] 孙玲芳,周加波,林伟健,等.基于BP神经网络和遗传算法的网络舆情危机预警研究[J].情报杂志,2014,(11):18-24.

[20] 魏德志,陈福集,郑小雪.基于混沌理论和改进径向基函数神经网络的网络舆情预测方法[J].物理学报,2015,64(11):11053.

Research on College Internet Public Opinion Prediction based on Hybrid Artificial Neural Network

WU Yana, HUANG Yana, WU Weib, LI Mengshanb

(a.SchoolofMathematics&ComputerScience;b.SchoolofPhysicsandElectronicInformation,GannanNormalUniversity,Ganzhou341000,China)

In order to accurately predict and guide internet public opinion of college students group event, in this paper, a hybrid neural network (HANN) model based on improved particle swarm optimization algorithm is proposed to predict the development trend of network public opinion in universities. The Model forecasts the development trend of internet public opinion in Colleges and Universities. Firstly, the particle swarm optimization algorithm is improved by the adaptive adjustment strategy and the chaos theory, and the improved particle swarm optimization algorithm (CSA-PSO) is proposed. CSA-PSO algorithm is used to train RBF ANN, and the number of nodes in the hidden layer is determined by the heuristic method. Finally, HANN is proposed and used to predict the samples. Compared with other models, the experimental results show that the proposed HANN has a high degree of accuracy and has good performance.

internet public opinion; group event; neural network; Chaos theory; adaptive adjustment strategy

2016-06-14

10.13698/j.cnki.cn36-1346/c.2016.06.005

国家自然科学基金项目(51663001)；江西省教育厅科学技术研究项目(GJJ150983, GJJ151012)；校级教改项目(GSJG-2015)

武燕(1986-)，女，内蒙古包头人，赣南师范大学数学与计算机科学学院讲师，研究方向：数据挖掘及应用.

http://www.cnki.net/kcms/detail/36.1037.C.20161209.1500.012.html

TP183;TP393

1004-8332(2016)06-0023-04