杨晓晖 王卫宾
摘 要:针对基于图神经网络的谣言检测方法在聚合邻居节点信息生成谣言表示过程中存在的噪声干扰问题,充分利用社交媒体源帖包含的丰富语义和结构信息对谣言检测的重要影响,提出一种基于门控图神经网络的谣言检测模型,该模型根据信息传播过程建模谣言的传播图和扩散图,基于门控图神经网络聚合邻居信息生成节点表示,利用门控机制去除邻居节点噪声,同时引入根节点语义增强方法提升表征节点的能力。此外,利用注意力机制融合局部结构和全局结构信息学习更加全面的谣言表示用于谣言检测任务。在公开数据集上的实验结果证明,提出的模型在谣言检测性能和早期检测能力方面均优于基线方法。
关键词:社交媒体;谣言检测;图神经网络;注意力机制
中图分类号: TP391 文献标识码: A DOI:10.3969/j.issn.1007-791X.2023.01.008
0 引言
随着移动互联网的迅猛发展,社交媒体已成为人们获取和传播信息的主要途径。然而,由于媒体缺乏对信息有效的监控手段,谣言能够迅速滋生并广泛传播,对网络秩序和社会稳定产生了不利影响[1]。例如,2022年俄罗斯与乌克兰爆发冲突以来,社交媒体上不断出现未经证实或故意伪造的消息,对人们准确了解冲突局势产生了严重干扰,甚至造成社会恐慌。由于社交媒体用户数量极大,谣言在社交媒体上迅速传播,已经开始从各个方面影响人们的日常生活。因此,开展谣言检测任务对维护网络安全和保障社会稳定发展具有重大的现实意义[2]。
早期谣言检测方法主要采用人工提取特征,利用传统的机器学习分类方法识别谣言信息。此类方法依赖繁重的特征工程工作,难以获得复杂、抽象的特征表示,造成方法的鲁棒性较差。由于社交媒体信息经过评论或转发过程形成具有丰富的传播结构信息,目前的方法通过构建传播序列或传播树,利用深度学习获得传播结构特征进行
谣言检测,在一定程度上提高了表征谣言的能力。但这些方法仍只考虑了谣言信息传播的序列特征,不能充分体现出其内部结构信息,因此存在一些限制。最近的一些研究使用图神经网络来解决谣言检测问题,由于图神经网络对图结构数据强大的表示能力,取得了良好的识别效果。尽管如此,现有的基于图神经网络的谣言检测方法在聚合邻居信息学习节点表示时忽略了噪声问题的干扰,限制了谣言检测的性能。此外,社交媒体中的源帖包含丰富的语义和结构信息,在信息传播过程中将会产生广泛的影响力,对谣言检测具有重要作用。
针对现有谣言检测方法存在的不足,本文提出一种基于门控图神经网络的谣言检测模型。首先建模社交媒体中的帖子双向传播结构,利用门控机制去除邻居节点噪声并聚合得到目标节点的表示;接着引入根节点语义增强方法获得可靠的表征节点的能力。同时,融合谣言的局部结构和全局结构信息以获得全面的谣言表示,提升谣言检测的性能。
1 相关工作
随着谣言检测研究的深入,目前提出的谣言检测方法可概括为基于机器学习的谣言检测方法与基于深度学习的谣言检测方法。
1.1 基于機器学习的谣言检测方法
基于机器学习的谣言检测方法,利用人工构造和提取显著特征进行谣言检测。CASTILLO等人[3]通过对热门话题相关的帖子进行分析,人工提取用户信息、文本内容以及引用的外部源等特征对帖子进行可信度评估,利用决策树模型完成谣言的识别任务。YANG等人[4]通过提取微博内容、用户、主题、传播统计、位置和客户端等特征,采用支持向量机(Support Vector Machine, SVM)分类器对微博信息进行谣言检测。GUO等人[5]深入分析了基于谣言用户账户的特征,提出用户可信度,可靠性和名誉等隐含特征,通过实验证明了该特征的有效性。这些方法只是考虑单一信息的特征分析,忽略了信息传播过程之间的差异,而基于事件级特征可以根据其传播结构反映出谣言信息的特点。GUPTA等人[6]提取用户、消息、事件之间的层次关系特征,提出基于事件图优化的方法进行可信度分析识别谣言事件。WU等人[7]基于随机游走图核和RBF核结合的方法,提出了一种基于混合核SVM模型进行谣言检测。MA等人[8]利用传播结构建立树核模型,通过计算传播树子树结构相似度来识别谣言的传播特性,以提升谣言的检测性能。徐建民等人[9]提取微博用户的影响力、情感信息特征嵌入到传播树的节点中,提升了基于传播树核的谣言检测方法性能。然而,基于机器学习的谣言检测方法需要一定的专家知识,依靠人工选择特征,缺乏高阶的特征表示,造成检测模型的鲁棒性较差,无法应对复杂多变的现实环境。
1.2 基于深度学习的谣言检测方法
深度学习飞速发展,其强大的特征学习能力和对数据良好的代表性,在多个领域中都取得不错的效果。研究者开始探索在谣言检测问题中使用深度学习的方法。MA等人[10]对谣言事件中的文本数据进行时间序列排序,利用循环神经网络(Recurrent Neural Network, RNN)学习谣言信息的序列特征。CHEN等人[11]利用卷积神经网络(Convolutional Neural Network, CNN)来提取分散在输入序列中的关键特征,有助于模型有效地识别谣言,尤其是在早期阶段的谣言检测中。MA等人[12]对谣言的消息传播结构建模为树结构,利用递归神经网络捕获节点的隐藏表示。然而,这些方法只考虑了谣言传播过程中的序列特征,不能反应出传播的内部结构信息。图神经网络(Graph Neural Network, GNN)由于其强大的表示能力[13-14],为谣言检测任务提出了新的解决思路。BIAN等人[15]提出了一种用于谣言检测的Bi-GCN模型,通过双向图卷积网络学习消息转发的结构特征,取得了良好的效果。胡斗等人[16]建模社交媒体帖子之间多种交互关系,并提出一种多关系传播结构的检测方法,捕捉更多传播结构特征以提升谣言检测性能。尽管如此,图神经网络在聚合邻居节点信息时可能会产生噪声,无法获得充分的节点表示。
基于此,本文探究谣言自顶向下的信息传播结构和自底向上的信息扩散结构,提出基于门控图神经网络的谣言检测方法,将节点特征表示和聚合后的邻居特征表示利用门控机制进行特征选择,减少邻居的噪声影响。此外,考虑到社交媒体中的源帖包含最原始的语义信息,同时也包含着重要的局部结构信息,提出根节点语义增强方法获得可靠的节点表示,融合谣言的局部结构和全局结构信息实现谣言检测任务。
2 问题定义
形式化地,定义C={c1,c2,…,cm}表示谣言数据集,其中,ci是第i个事件,m表示数据集中事件对应的总数量。对于每个社交媒体事件ci记为ci={ri,wi1,wi2,…,wini-1,Gi},其中ri表示事件ci的源帖,wij表示第j个转发或评论关系的帖子,ni表示事件ci包含的帖子数量,Gi表示事件ci的传播结构。本文将Gi定义为传播图Gi=(Vi,Ei),其中,节点集合表示为Vi={ri,wi1,wi2,…,wini-1},ri表示图Gi根节点,Ei={eist|s,t=0,…,ni-1}表示转发或评论的边集合。如图1(a)所示,如果wi1是ri的一个转发帖子,那么存在一条有向边e01。定义邻接矩阵Ai∈{0,1}ni×ni表示图中的传播关系,其中元素表示为
aist=1 eist∈Ei0其他。(1)
对于事件ci,Xi=[xi0,xi1,…,xini-1]T为事件的特征矩阵,其中xi0表示源帖的特征向量,其他每个特征xij表示wij的特征向量。此外,对于社交媒体谣言检测任务,每个事件ci都包含着一个真实标签yi∈Y,其中Y表示事件的类别标签集合。谣言检测问题的分类器可以用由输入空间C到输出空间Y之间的映射f来表示,记作
f:C→Y。(2)
3 模型框架
本文提出一种基于门控图神经网络的谣言检测模型(Rumor detection model based on gated graph neural network, GGNN-RD),如图2所示。模型主要包括构建传播和扩散图、节点表示、谣言表示、谣言分类器4部分内容。
3.1 构建传播和扩散图
基于转发和评论关系,为每个事件构建传播结构G=(V,E)。定义A∈Rn×n和X分别为事件的邻接矩阵和初始特征矩阵,A仅包含从上方节点到下方节点的边。本文引入Dropedge方法[17]以减小模型的过拟合问题,在训练的每个阶段,通过式(3)随机地从输入图中删除边生成变形数据,这种方法增加了输入数据的随机性和多样性。假设A中边的数据量是Ne,丢弃比例为p,丢弃掉一定比例的边后得到新的邻接矩阵
A′=A-Adrop。(3)
基于A′和X,本文同时构建自顶向下信息传播方向上的传播图GTD和自底向上信息扩散方向上的扩散图GBU,如图1所示。将图GTD的邻接矩阵表示为ATD=A′,图GBU的邻接矩阵表示为ABU=A′T。另外,图GTD和图GBU采用相同的初始特征矩阵X。
其中,基于机器学习的谣言检测方法使用scikit-learn库实现,BU-RvNN、TD-RvNN使用Theano框架实现,GRU-RNN、Bi-GCN和本文提出的模型都采用PyTorch框架实现。为了进行公平比较,数据集采用5折交叉验证的方法以获得稳健的实验结果。谣言检测任务看作分类问题,评估方法采用基于分类的评价指标进行评测。对于Twitter数据集,评估4个分类的整体准确率(Accuracy,Acc)和各类别的F1值(F1)来验证本文模型的谣言检测性能。对于Weibo数据集,通过实验得到分类的Acc和各类别的精确率(Precision,Pre),召回率(Recall,Rec),F1值来验证本文模型的谣言检测性能。本文参考基线方法的相关参数设置[15],对本文所提模型的参数使用Adam[21]优化算法进行更新优化,每个节点的隐藏特征向量的维度为64,DropEdge的丢弃率设为0.2,模型训练迭代次数设为200。
4.2 实验结果分析
首先,对本文提出的GGNN-RD模型与基线方法在谣言检测任务中的性能进行了一系列实验。实验结果显示在表2~4中。
由表2~4的实验结果观察可知,在Twitter15和Twitter16数据集,GGNN-RD相比最优的基线方法在准确率评估指标上提升了至少1.1个百分点,F1值提升了至少0.6个百分点;在Weibo数据集,GGNN-RD相比于最优的基线方法在准确率评估指标上提升了至少1.3个百分点,F1值提升了至少1.2个百分点。因此,对比基线方法,本文提出的GGNN-RD在3个数据上均取得最优的谣言检测性能。
具体实验结果分析如下:
1) 由实验结果观察得到,基于机器学习的谣言检测方法(DTC、SVM-RBF)在所有评价指标上都低于利用深度学习模型的谣言检测方法。原因是机器学习通过人工提取特征,缺乏对谣言检测的高阶特征表示能力,模型的鲁棒性较差。而深度学习方法具有较强的特征学习能力,可以捕捉到谣言信息重要的高阶特征表示,对谣言信息的检测性能更优。这也说明了开展基于深度学习的谣言检测技术研究具有一定的必要性和重要性。
2) 与GRU-RNN方法相比,基于传播结构的谣言检测方法具有较好的性能。这是因为GRU-RNN仅考虑了谣言传播随时间变化的序列特征,忽略了谣言信息的傳播结构特征,从而导致谣言检测性能的下降。实验证明,传播过程含有大量重要的结构信息,基于传播结构的检测方法能够挖掘丰富的传播结构特征,并对谣言进行有效的识别。
3) 本文提出的GGNN-RD模型的实验结果要优于BU-RvNN、TD-RvNN和Bi-GCN模型,BU-RvNN和TD-RvNN分别只考虑了单向信息传播结构,无法获得全面的结构特征。Bi-GCN虽然使用了双向的GCN对于传播图结构进行了建模,但是忽略了聚合邻居节点信息时可能会产生噪声,无法获得较好的节点表示,针对这一点本文模型通过门控循环单元过滤聚合邻居信息而产生的噪声问题。此外,本文模型利用了源贴丰富的语义和结构信息,提出根节点增强方法,并融合了局部结构和全局结构信息特征从而学习更加全面的谣言特征表示。
4.3 消融实验
以往采用平均池化[22]的谣言表示方法无法取得突出的检测性能,为了证明本文所提出的融合局部结构和全局结构信息的谣言表示方法有效性,通过设计消融实验,对本文提出的谣言表示策略和下面3种方法相比较:
1) GGNN-RD-L指在谣言表示时仅考虑局部结构信息的特征表示;
2) GGNN-RD-AVG指在谣言表示时考虑具有平均池化的全局结构信息的特征表示;
3) GGNN-RD-ATT指在在谣言表示时只考虑具有注意力机制的全局结构信息的特征表示。
通过在3个数据集采用4种不同谣言表示方法的消融实验获得最终的实验结果,如图3所示。
从图3中可以看出,融合局部结构和全局结构信息的谣言表示方法GGNN-RD在所有数据集上都取得了最佳实验结果,它明确验证了将局部结构信息与全局结构信息结合起来的重要性。其中,GGNN-RD-L的性能最低,说明仅包含源贴信息的局部结构特征无法得到充分的谣言表示,随着时间的不断推移,社交媒体中的信息会形成丰富的传播结构。GGNN-RD-ATT在所有数据集上的结果都优于采取平均池化的GGNN-RD-AVG方法,这说明采用平均池化的谣言表示可能包含一些嘈杂的信息,而基于注意力机制能够更好地捕获重要信息,这再次说明了融合局部结构和全局结构对于谣言检测任务的必要性。
4.4 早期謠言检测
早期谣言检测是评估一个谣言检测模型的重要指标,实现在社交媒体谣言传播的早期发现谣言,及时对谣言信息进行干预,挽回一定损失[23]。本文设计了早期谣言检测实验,来评估各方法的早期谣言检测效果。具体实现,通过设置了一系列检测截止期限来评估本文提出的模型和基线方法的准确性,在每个截止时间点只选择从源贴发布时间到检测截止时间之间的帖子进行实验,对源帖发布后36 h内多个检测截止时间分别实验得出早期谣言检测的实验结果,如图4、图5所示。
从实验结果中可以发现,在图4、图5中源帖发布的最初期,本文所给出的模型在两个不同的数据集上分别取得82.6%和81.3%的结果,与基线方法相比具有更优的检测性能,说明本文的模型具有良好的早期谣言检测水平。随着时间不断增长,不同谣言检测方法的性能表现均有一定提升,说明谣言检测方法通过社交媒体中的信息传播过程中学习得到的结构特征越来越丰富。同时,本文提出的模型在早期谣言检测性能要明显优于基于传播序列和传播树的检测方法,表明其具有更好的捕获真实环境中谣言的传播模式的能力。在多个检测截止时间节点的性能都优于Bi-GCN模型,从而体现了模型具有良好的谣言表示能力,再次说明了利用门控机制去除噪声,融合局部结构与全局结构信息的谣言表示方法的有效性。
5 结论
本文对基于传播结构的谣言检测问题进行了研究,并提出基于门控图神经网络的谣言检测模型GGNN-RD。通过建模社交媒体中信息的传播过程为图结构,利用门控图神经网络学习传播结构特征。此外,为了挖掘源帖丰富的语义和结构信息,结合谣言的局部结构和全局结构信息以学习更全面的谣言表示。实验结果表明,本文模型较之前的基线方法有较大的性能提升,并且具有更好的早期检测能力。由于社交媒体中包含丰富的对象及其社会交互关系,今后研究工作将考虑利用异质信息网络建模来解决谣言检测问题。
参考文献
[1] 陈慧敏,金思辰.新冠疫情相关社交媒体谣言传播量化分析[J].计算机研究与发展,2021,58(7):1366-1384.
CHEN H M, JIN S C. Quantitative analysis on the communication of COVID-19 related social media rumors[J]. Journal of Computer Research and Development, 2021, 58(7):1366-1384.
[2] 高玉君,梁刚, 蒋方婷,等. 社会网络谣言检测综述[J]. 电子学报, 2020,48(7):1421-1435.
GAO Y J, LIANG G, JIANG F T,et al. Social network rumor detection: a survey[J]. Acta Electronica Sinica, 2020,48(7):1421-1435.
[3] CASTILLO C, MENDOZA M, POBLETE B. Information credibility on twitter[C]//Proceedings of the 20th International Conference on World Wide Web,New York, USA,2011:675-684.
[4] YANG F, LIU Y, YU X H. Automatic detection of rumor on Sina Weibo[C]//Proceedings of the ACM SIGKDD Workshop on Mining Data Semantics,New York, USA,2012:1-7.
[5] GUO H, CAO J, ZHANG Y, et al. Rumor detection with hierarchical social attention network[C]//Proceedings of the 27th ACM International Conference on Information and Knowledge Management,Torino, Italy, 2018:943-951.
[6] GUPTA M,ZHAO P,HAN J. Evaluating event credibility on twitter[C]//Proceedings of the 2012 SIAM International Conference on Data Mining,San Francisco, USA, 2012:153-164.
[7] WU K, YANG S, ZHU K Q. False rumors detection on Sina Weibo by propagation structures[C]//Proceedings of the IEEE 31th International Conference on Data Engineering,Seoul, Korea, 2015:651-662.
[8] MA J, GAO W, WONG K F. Detect rumors in microblog posts using propagation structure via kernel learning[C]//Proceedings of the 55th Association for Computational Linguistics, Stroudsburg, USA,2017:708-717.
[9] 徐建民,孙朋,吴树芳. 传播路径树核学习的微博谣言检测方法[J]. 计算机科学,2022,49(6): 342-349.
XU J M, SUN P, WU S F. Microblog rumor detection method based on propagation path tree kernel learning[J]. Computer Science,2022,49(6): 342-349.
[10] MA J, GAO W, MITRA P, et al.Detecting rumors from microblogs with recurrent neural networks[C]//Proceedings of the 25th International Joint Conference on Artificial Intelligence,Palo Alto, USA, 2016:3818-3824.
[11] CHEN Y X, SUI J, HU L, et al. Attention-residual network with CNN for rumor detection[C]//Proceedings of the 28th ACM International Conference on Information and Knowledge Management, New York,USA,2019:1121-1130.
[12] MA J, GAO W, WONG K, et al. Rumor detection on twitter with tree-structured recursive neural networks[C]//Proceedings of the 56th Annual Meeting of the Association for Computational Linguistics,Melbourne, Australia,2018:1980-1989.
[13] WU Z, PAN S, CHEN F, et al. A comprehensive survey on graph neural networks[J]. IEEE Transactions on Neural Networks and Learning Systems, 2021, 32(1):4-24.
[14] 石川,王睿嘉,王嘯.异质信息网络分析与应用综述[J].软件学报,2022,33(2):598-621.
SHI C, WANG R J, WANG X.Survey on heterogeneous information networks analysis and applications[J].Journal of Software,2022,33(2):598-621.
[15] BIAN T, XIAO X, XU T, et al. Rumor detection on social media with bi-directional graph convolutional networks[C]//Proceedings of the AAAI Conference on Artificial Intelligence, Palo Alto, USA, 2020:549-556.
[16] 胡斗, 卫玲蔚,周薇.一种基于多关系传播树的谣言检测方法[J].计算机研究与发展,2021,58(7):1395-1411.
HU D, WEI L W, ZHOU W, et al. A rumor detection approach based on muti-relational propagation tree[J].Journal of Computer Research and Development, 2021,58(7):1395-1411.
[17] RONG Y, HUANG W B, XU T Y. Dropedge:towards deep graph convolutional networks on node classification[C]//Proceedings of the AAAI Conference on Artificial Intelligence, New York, USA, 2020:1862.
[18] NIKOLENTZOS G, TIXIER A, VAZIRGIANNIS M. Message passing attention networks for document understanding[C]//Proceedings of the AAAI Conference on Artificial Intelligence, New York, USA,2020:8544-8551.
[19] HUANG Q, ZHOU C, WU J, et al. Deep spatial-temporal structure learning for rumor detection on twitter[J]. Neural Computing and Applications, 2020,41(3):219-230.
[20] LUONG M T, PHAM H, MANNING C D. Effective approaches to attention-based neural machine translation[C]//Proceedings of the 2015 Conference on Empirical Methods in Natural Language Processing, Lisbon, Portugal, 2015:1412-1423.
[21] KINGMA D, BA J. Adam: a method for stochastic optimization[C]//Proceedings of the 3rd International Conference on Learning Representations,San Diego, USA, 2015:1-13.
[22] RAO D N, MIAO X, JIANG Z H, et.al. STANKER: stacking network based on level-grained attention-masked BERT for rumor detection on social media[C]//Proceedings of the 2021 Conference on Empirical Methods in Natural Language Processing, Punta Cana, Dominican,2021: 3347-3363.
[23] LU Y J, LI C T. GCAN:graph-aware co-attention networks for explainable fake news detection on social media[C]//Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics,2020:505-514.
Rumor detection model based on gated graph neural network
YANG Xiaohui, WANG Weibin
(School of Cyber Security and Computer, Hebei University, Baoding, Hebei 071003, China)
Abstract:Aiming at the noise interference problem of the rumor detection method based on graph neural network in the process of aggregating neighbor node information to generate rumor representation, a rumor detection model based on gated graph neural network is proposed. It also makes full use of the important impact of rich semantic and structural information contained in social media source posts on rumor detection. In the model, propagation graphs and diffusion graphs based on the propagation process of rumors is constructed, and a node representation is generated by aggregating neighbor information through a gated graph neural network.Gate mechanism is used to remove noise from neighbor nodes. At the same time, a root node semantic enhancement method is introduced to improve the ability to represent nodes. In addition, the attention mechanism is used to fuse local structure and global structure information to learn a more comprehensive rumor representation for the task of rumor detection. Experimental results on public datasets show that the proposed model has better rumor detection performance and early detection ability than baseline methods.
Keywords: social media; rumor detection; graph neural network; attention mechanism