基于层次分析的长短记忆网络(AHP-LSTM)的食品安全网络舆情预警模型

2022-01-07 03:21江志英李宇洋李佳桐贺彦林朱群雄

北京化工大学学报（自然科学版） 2021年6期

江志英李宇洋李佳桐贺彦林朱群雄*

(北京化工大学 1.信息科学与技术学院; 2.智能过程系统工程教育部研究中心，北京 100029)

引言

互联网的发展和计算机的广泛普及使得网络深入到人们的日常生活中，人们已经习惯于在网络中发表各自的观点，因此网络舆情成为反映社会问题的一个重要渠道。食品安全一直是社会普遍关注的一个问题，尤其是近几年“染色馒头”、“过期肉”、“毒豆芽”等事件的发生，引起了公众的高度关注。部分食品安全事件是在网络上曝光后才引起重视并最后得以解决，由此可见网络舆情对于食品安全问题的治理尤为重要。网络信息的高速发展为各个领域的研究带来新的机遇。近年来，已经有学者开始关注网络媒体和社交网络在预警领域的应用[1]。互联网使得研究人员能够收集数据并分析个人和团体如何在网络平台上进行交流，包括通过新闻网站和社交媒体网站上的评论区进行交流的数据[2]。由于社交媒体数据具有规模大、参与者多、传播快、数据内容丰富等特点，对社交媒体数据中信息传播的分析与建模成为研究的难点[3]。

目前，国内外对于网络事件舆情分析的研究主要分为两类：(1)基于事件影响要素的舆情预警；(2)基于情感分析的舆情预警[4]。第一类以舆情事件要素为研究对象，通过建立指标体系、融合舆情预警模型，对网络事件进行预警研究。例如，文献[5]以网络舆情事件的百度指数、头条指数等作为舆情热点指标，建立指标体系对舆情进行预警分析。第二类则以事件相关的网络言论为研究对象，分析言论的情感倾向值，从而实现舆情预警。例如，文献[6]结合舆情情感特征，利用情感分析方法实现了网络事件的舆情研判。文献[7]针对食品安全领域的事件要素以及相关新闻文本情感倾向建立了事件舆情指标体系，并结合神经网络模型进行预警分析，其核心主要包括指标体系的建立与预警模型的研究两方面内容。文献[8]指出，媒体报道的数量、消费者的关注程度、信息的争议程度以及所涉及的信息渠道等可能导致事件风险放大，因此这些事件要素成为舆情指标体系的重要指标依据。

在与食品安全相关的风险预警模型研究领域，通过神经网络建模的研究方式较为普遍。如文献[9]使用基于反向传播神经网络(back propagation neural network, BP)的食品安全预警模型对肉类食品的安全风险进行预测，可为食品安全风险预警提供技术支撑。但BP神经网络模型的初始权值为随机分配，导致运行结果不稳定、预测精度不高[10]。文献[11]结合主成分分析法(principal component analysis, PCA)和径向基函数网络算法(radial basis function network, RBF)建立农残含量预测模型，可有效预测农作物中农药残留含量的情况。但传统RBF算法收敛慢，且计算复杂度会随着网络层次和节点数的增多而迅速增加[12]。文献[13]建立了贝叶斯网络模型，对高校的食品安全状况进行风险预测，便于提前发现风险威胁，为高校食品安全的风险预警提供帮助。但贝叶斯网络依赖于概率计算，属性组合的计算复杂程度会增加，使得预测难度加大，所需时间也更长[14]。文献[15]运用支持向量机(support vector machine, SVM)和互联网技术构建了易腐食品的安全预警云体系，尝试对冷鲜鸡肉保鲜期进行预警，并通过实验验证了该模型的有效性和准确性。但SVM算法适用于少量的线性可分的数据训练，不适于大规模非线性网络文本领域的舆情预警分析[16]。与此同时，随着数据类型和复杂度的增加，模型的建立变得更加困难，传统模型已经无法满足其要求[17]。Hochreiter等[18]首次提出长短期记忆(long short-term memory, LSTM)网络，即通过维持一个记忆单元来确定哪些不重要的特征应该被遗忘，哪些重要的特征应该在学习过程中被记住，显示了学习长期依赖性的优越性能。LSTM网络作为最先进的递归神经网络之一，收敛快、预测精度高，在人工笔迹生成、语言预测、语音识别等领域的学习任务中取得了显著的效果[19-20]。基于改进LSTM构建的双向长短时记忆循环神经网络(bi-directional long short-term memory, BiLSTM)以及注意力机制的双向长短期记忆网络(attention based bi-directional long short-term memory, attention based BiLSTM)等模型均可建立较准确的预测模型[21-22]，但相对于LSTM网络，这些网络的结构较为复杂。

本文在媒体报道的数量、消费者的关注程度及网络舆情要素基础上，融合情感分析建立舆情指标体系，以LSTM神经网络为核心构建食品安全网络事件预警模型。考虑到网络事件预警缺乏期望输出，引入层次分析法(analytic hierarchy process, AHP)算法对指标数据进行融合计算，并以此作为LSTM神经网络的期望输出；利用LSTM神经网络从指标数据中学习并挖掘出事件指标数据之间的依赖关系，对食品安全事件进行预警分析，为食品安全监督和管理提供数据支撑。

1 基于层次结构的食品安全网络舆情指标体系

1.1 指标体系模型

建立合适的食品安全网络舆情指标体系是能够有效实现食品安全风险预测和预警的前提。针对舆情预警指标体系已经有许多研究成果，已有文献中提出了关于舆情指标选取的一些基本原则[4,23]，归纳起来有以下几点：1)指标应具有代表性，选取尽可能准确、对舆情确有影响的因素；2)指标应尽可能量化，客观地反映出舆情的状态，对于无法量化的指标应该进行定性分析；3)指标应该尽可能全面，以便能够全面地对舆情的趋势进行研判。

从上述基本原则可以看出，对于舆情指标体系的建立，首先需要有科学的依据，能够客观反映出舆情的状态及发展趋势；另外还应该是可操作的，比如需要能够进行定量或定性分析，过于抽象的指标是没有意义的；再则对于舆情风险的研判不能片面，这就要求指标选取时需要尽可能的全面。从结构上来看，网络舆情具有多面性，同时舆情结构的每一层面都包含许多具体的舆情要素。因此，从整体上来看，网络舆情的特征体系是一个多层次的结构，并且构建的网络舆情指标体系需真实、实时地反映舆情动态。

综上所述，结合网络舆情特征，为全面反映出舆情的状态及趋势，需要构建一个多层次、多角度的指标体系结构。文献[23]通过分层次处理，根据不同的层次选择不同的方向，再从多个方向进行指标体系的构建，依托此结构模型设计的指标体系能够很好地反映出舆情的多面性。此结构模型对本文工作提供了很大的参考价值。

1.2 指标体系构建

通过对食品安全网络的特征进行分析，在网络舆情指标体系模型的基础上，利用网络爬虫从互联网中抓取与食品安全相关的舆情数据，构建三层食品安全事件预警指标体系，具体流程如下：首先利用文本聚类技术获取事件的基本信息；再从普通网络用户的角度出发，就针对发生的食品安全事件所发表的意见言论进行文本挖掘；最后结合情感分析方法进行情感倾向判定，实现食品安全网络舆情指标体系相关指标值的采集。数据源方面，以聚类算法中聚类形成的新闻报道簇作为事件基础信息，网络言论则是通过抓取微博相关博文、评论和转发等信息构成，最终形成基于微博和新闻的网络舆情预警指标体系，其中微博相关6个指标、新闻相关4个指标。具体的指标体系结构如图1所示。针对图1的网络舆情体系，分别对各指标进行详细说明如下：

图1 基于层次结构的食品安全事件预警指标体系

1)新闻数事件相关的新闻报道数量，该数值与事件关注度正相关；

2)网站数发表或转载事件相关新闻报道的网站数量，该数值与事件关注度正相关；

3)微博数事件相关的微博数量，该数值与事件关注度正相关；

4)微博点赞数所有与事件相关微博的点赞总数，该数值与事件关注度正相关；

5)微博转发数所有与事件相关微博的转发总数，该数值与事件关注度正相关；

6)微博评论数所有与事件相关微博的评论总数，该数值与事件关注度正相关；

7)新闻正面数事件相关的新闻中，情感分析值为正值的数量，该数值与事件情感倾向正相关；

8)新闻负面数事件相关的新闻中，情感分析值为负值的数量，该数值与事件情感倾向负相关；

9)微博正面数事件相关的微博中，情感分析值为正值的数量，该数值与事件情感倾向正相关；

10)微博负面数事件相关的微博中，情感分析值为负值的数量，该数值与事件情感倾向负相关。

2 基于层次分析的长短记忆网络(AHP-LSTM)的食品安全舆情预警模型

传统的神经网络模型由于数据类型的持续增多和数据复杂性的增加，面临着建模困难、预测精度不达标等诸多问题。文献[18]提出的基于深度学习的长短期记忆网络，具有收敛快、预测精度高等特点，是目前最先进的递归神经网络之一。因此，本文基于层次结构的食品安全网络舆情指标体系，结合LSTM构建食品安全网络事件预警模型。对于神经网络而言，为了取得较好的训练效果，需要有科学有效的训练数据，包括输入数据与期望输出数据。在本文的场景下，模型的输入数据可根据舆情指标体系获取，但缺乏标准的期望输出数据。为了解决这一问题，引入文献[24]中提出的基于关联函数差分驱动的层次分析算法，用于对指标体系数据进行融合计算，并将融合计算结果作为对应输入数据的期望输出，用来构建完整的预警模型。

2.1 基于关联函数差分驱动的层次分析算法

层次分析法是一种将复杂问题划分为多个层次结构的、多目标的方法，该方法可将定性与定量相结合。AHP方法的3个阶段包括: a)识别因素和建立层次优先排序模型；b)建立问卷调查和收集数据；c)寻找每个风险因素的权重。传统的层次分析法在评价过程中有很多的不足，如当指标过多(超过9个)或数据量过大时，对指标重要程度的判断将及其复杂和困难且计算精度也会因此受到影响。此外传统的层次分析法多用专家决策法，具有很强的主观臆断性，容易给结构的准确度带来偏差[12]。为了解决上述问题，采用文献[24]中提出的基于关联函数差分驱动的AHP算法，其基本原理如下。

1)构造下侧关联函数

(1)

式中，i=1,2,…,n;j=1,2,…,m，其中n为样本数，m为指标数。

2)计算信息矩阵

(2)

3)中心归一化

(3)

式中，

(4)

(5)

(6)

(7)

6)计算对称矩阵COR的特征向量

W=(w1,w2,…,wn)T

(8)

本文采用方根法计算各指标的熵值权重wi，计算公式如式(9)所示。

wi=oi/o,i=1,2,…,n

(9)

7)结合权重W获取融合输入数据

(10)

2.2 长短期记忆网络

长短期记忆网络是一种时间循环神经网络[25]，是循环神经网络(recurrent neural network,RNN)的改进。LSTM可以学习长期依赖关系，有效解决梯度消失和梯度爆炸的问题，在较长的序列中相比于传统的循环神经网络有更好的表现，且适用于非线性模型的预测。与所有的RNN相同，LSTM神经网络有着一种重复神经网络模块的链式形式；不同的是在LSTM中这个重复模块具有4层神经网络层的结构，并以一种特殊的方式进行交互。LSTM结构图如图2所示，其中A代表LSTM单元。经典的LSTM存储块包含存储单元状态、遗忘门、输入门和输出门4个部分。

图2 LSTM结构图

LSTM通过输入门、遗忘门和输出门来实现信息的保护和控制，其主要流程如下。

1)通过遗忘门决定从细胞状态中需要丢弃的信息，如式(11)所示。

(11)

式中，σ为sigmoid函数，Wf为遗忘门的权重矩阵，bf为遗忘门的偏置项。遗忘门会读取前一个细胞的输出ht-1和当前细胞的输入xt的信息，从而输出一个介于[0,1]之间的向量来表示细胞状态Ct-1中的信息保留或丢弃多少。

2)在输入门中确定允许多少新的信息加入到细胞状态中。首先在“input gate layer”的sigmoid层决定信息的更新与否，其次在tanh层生成一个向量，作为更新内容，最后把以上两部分结合起来对细胞状态进行更新。

it=σ(Wi[ht-1,xt]+bi)

(12)

(13)

式中，W*是输入门的权重矩阵，b*是输入门的偏置项。

3)更新旧细胞状态时间，丢弃决定丢弃的信息，更新新状态。

(14)

4)在输出门中确定最终要输出的内容。将细胞状态经tanh处理得到[-1,1]区间内的一个值，并将其与sigmoid门的输出相乘，即为最终输出部分。

ot=σ(Wo[ht-1,xt]+bo)

(15)

ht=ottanh(Ct)

玉米粗缩病容易感染而且难以治理，目前并没有特别有效的治疗药剂。因此，在玉米粗缩病的防治上，主要以农业防治、化学防治为辅的综合防治方法，其治理核心为控制病毒源，降低虫源，避开玉米发病的生育期和灰飞虱传播的高峰期，尽量减少得病机会避免危害。为了防治灰飞虱传播玉米粗缩病，需要把灰飞虱消灭在传播毒之前。灰飞虱突发和爆发性比较强，并且活动性强，带有病毒的灰飞虱传播病毒的时间比较短，传播病毒的几率比较大，所以农民的分散防治难达到防治效果。除此之外，有些灰飞虱已经对部分农药产生抗体，使防治难度大大增加。

(16)

LSTM通过门控状态来控制传输状态，适用于需要长期记忆的任务。

2.3 预警模型的建立

2.3.1框架设计

基于层次结构的食品安全网络舆情指标体系，采用改进的AHP结合LSTM建立AHP-LSTM食品安全预警模型，对食品安全事件进行网络舆情预警分析。预警模型框架如图3所示。

图3 基于AHP-LSTM的食品安全网络舆情预警模型框架

本文所提AHP-LSTM模型建模过程如下。

1)使用AHP算法对训练数据集Samples进行分析，得到数据特征分量并组成新的样本集合Samples’。

2)构建LSTM网络。将训练集作为LSTM网络的输入，将步骤1)中的Samples’作为LSTM网络的期望输出。

3)训练模型。设置LSTM相关参数，执行网络训练过程。

4)将测试数据作为LSTM的输入，根据预期输出构建网络舆情预警模型，进行食品安全事件预警。

2.3.2模型训练

选取109个食品安全相关事件数据作为训练样本，对预警模型进行训练(数据预处理过程见3.1.1节)。首先确定模型参数，对于隐含层节点数和学习效率的调参采用控制变量的方法，先确定非关键参数，重复训练的次数足够多(本文为1 000次)，设置学习效率η，并以一定的速度对其进行衰减，将结果归一化处理至[0,1.0]范围。为了避免随机初始化效果不理想，需要进行多次训练，选择初始化效果最好的，最终确定最优参数[26-27]。部分调参结果如表1所示，p为神经网络的节点数。

表1 部分调参结果

3 结果与讨论

3.1 基于AHP-LSTM的食品安全网络舆情预警实验

3.1.1数据获取与预处理

通过网络爬虫从互联网中抓取与食品安全相关的网络文本，利用文本聚类技术提取食品安全相关事件，并依据指标体系计算事件指标值。对于指标数据中的情感分析，本文通过开源工具SnowNLP实现。SnowNLP是一个用Python语言编写的类库，主要用于处理中文文本，可实现分词、词性标注、情感分析、汉字转拼音、繁体转简体、关键词提取以及文本摘要等功能。在SnowNLP中，情感分类的基本模型是贝叶斯模型,对于有c1和c2两个分类的问题来说，其特征为w1,w2,…,wn，特征之间相互独立，情感倾向P的计算过程如式(17)所示。

(17)

式中，P(w1,w2,…,wn)=P(w1,w2,…,wn/c1)·P(c1)+P(w1,w2,…,wn/c2)P(c2)。

情感倾向取值范围为[0,1]，越接近1表明情感越积极/正面，反之则越消极/负面。

从获取的食品安全事件数据中选择10起典型的食品安全事件，对构建的食品安全舆情预警模型处理过程及结果进行展示。选取事件如表2所示。使用改进的AHP算法将事件相关指标数据进行数据融合，指标数据及融合结果如表3所示。

表2 典型食品安全事件

表3 指标体系数据及AHP融合结果

3.1.2预警等级划分

根据《国家突发公共事件总体应急预案》，有文献将食品安全事件舆情预警等级分为I～Ⅳ 4个等级[28]。I级代表特别严重，II级为严重，III级是较严重，Ⅳ级为一般严重。同时为了方便理解，将[0，1]平均划分为4个区间，区间从低到高依次对应不同的预警级别状态[29]。预警等级划分如表4所示。

表4 预警等级划分

3.2 结果分析

本文选取56个数据组成样本测试集对AHP-LSTM、传统AHP、AHP-BP、AHP-RBF这几个不同的模型进行验证，测试结果的预警正确率如表5所示。其中，AHP-LSTM模型的预警正确率达到71.4%，在所有模型中表现最佳。

表5 AHP-LSTM模型和传统模型预警正确率对比

图4展示了4种模型的预测结果曲线，可以看出LSTM模型的预测结果与期望值曲线基本一致，而其他模型均有相对较大误差。例如BP网络在样例事件17、20、26、27等处有明显与期望值不符的预测结果，而RBF神经网络在样例事件19和事件25处的预警结果与实际期望值不符。整体而言，本文提出的AHP-LSTM模型的稳定性和有效性均相对较高。

图4 LSTM预警模型与传统预警模型的结果对比

在模型训练方面，AHP-LSTM模型能在200次以内达到训练要求，并且误差较小，训练平均相对误差为0.503%。而AHP-BP模型需要500次达到训练要求、平均相对误差为1.27%，AHP-RBF模型需要300次达到训练要求、平均相对误差为1.61%。图5展示了AHP-LSTM模型训练次数与loss值(即损失函数，代表模型输出与真实结果之间的距离)的对应关系，可以看出随着训练次数的增多loss值不断减小，即误差减小。

图5 模型训练次数与loss的关系

由以上结果可知，与传统模型相比，AHP-LSTM神经网络在食品安全事件预警方面具有更好的预警效果。

3.3 案例讨论

针对实验中部分案例事件预警结果进行分析，对应事件编号及相应预警结果如表6所示。

表6 部分案例预警结果

7号事件—禁用农药豇豆媒体披露，查出海南产豇豆含有禁用农药，在武汉、广州、深圳、杭州等地先后查出毒豇豆，发现含有高毒农药水胺硫磷。该事件中，AHP-LSTM预测准确、偏差较小。对应AHP-BP预警等级比实际等级高了一级，传统AHP实预警等级则相对低了一级，而AHP-RBF实际输出为0.85，预警等级高了两级，偏差较大。

18号事件—甲醇白酒台湾宜兰发生疑似私劣酒中毒事件，因食用假米酒而引起甲醇中毒，中毒死亡人数达8人。AHP-LSTM输出值与期望输出最为接近，预警等级一致。对应AHP-BP与传统AHP预警等级相对实际预警等级均高了一级，同时，AHP-RBF实际输出为0.80，预警等级高了两级，偏差较大。

21号事件—真功夫“排骨门” 真功夫排骨中发现胶线、胶粒、脓包、石头，并有异味。AHP-LSTM输出值与期望输出最为接近，预警等级一致。对应AHP-BP和传统AHP模型预警等级比实际预警等级低了一级，而AHP-RBF再次出现较大偏差，预警等级低了两级。

55号事件—饮料砷超标海口部分批发市场、商场、农贸市场、超市等销售农夫果园、水溶C等饮料的总砷超标。在该事件中，AHP预测结果最为准确，而AHP-LSTM偏差较大。经分析，该事件中，相关微博、新闻数据较少，且时间周期较短，不利于网络训练。

从上述具体案例可以看出，相比于传统AHP模型，神经网络模型能够从一定程度上提高预警的准确性，但预警的有效性与模型的选择有很大关系，例如，AHP-BP、AHP-LSTM在多数情况下均能取得不错的预警结果，但AHP-RBF则多次出现较大的预警偏差。

4 结束语

提出了基于层次分析的长短记忆神经网络食品安全网络舆情预警模型AHP-LSTM。通过特征信息的提取，建立食品安全网络事件指标体系结构，将事件指标数据作为LSTM神经网络的输入，使用AHP将指标数据进行数据融合，从而得到风险级别并作为LSTM神经网络的期望输出。训练后的预警模型结果可以用于食品安全事件的风险预警。将该模型与传统模型的准确率进行对比发现，改进后的模型的准确性明显高于传统的预警模型，能更有效地预测食品安全事件的发展趋势，证明了所提模型的科学性与可靠性。本文模型可较为准确地预测食品安全事件趋势，为相关部门提供一定的理论依据与数据支撑，从而更好地采取应对措施。在将来的研究中，我们将运用BiLSTM、attention based BiLSTM等改进的深度学习方法改善本文所提方法的不足，从而更好地适应食品安全事件的预警分析，提高预警分析能力。