李乐天 郑何真 丁晨
摘 要:为准确快速地对恐怖袭击事件进行分级,帮助建立恐怖袭击事件应急预案,提出一种基于模糊聚类算法和模拟退火遗传算法优化BP神经网络的恐怖袭击事件分级模型。通过模糊聚类算法划分样本训练集,利用BP神经网络的自学习能力获取输入与输出之间的模糊规则,采用模拟退火遗传算法提高神经网络精度。以GTD数据库样本为例,经实验得到普通BP神经网络的分级正确率为94.32%,模拟退火遗传算法优化的BP神经网络分级正确率可提升到99.88%,验证了基于模糊聚类算法和模拟退火遗传算法优化BP神经网络分级模型的有效性。
关键词:恐怖袭击事件;分级模型;模糊聚类分析;BP神经网络;模拟退火遗传算法
DOI:10. 11907/rjdk. 191241
中图分类号:TP301 文献标识码:A 文章编号:1672-7800(2019)005-0021-06
Abstract: In order to classify terrorist attacks accurately and quickly through data analysis,promoting the establishment of emergent contingency plans for new terrorist attacks, this paper proposed the classification model for terrorist attacks based on fuzzy clustering algorithm and BP neural network optimized by simulated annealing genetic algorithm. First we divide samples of terrorist attacks into four different classes, and then obtain the fuzzy rules between inputs and outputs through the self-learning ability of BP neural network, where the simulated annealing genetic algorithm is used to improve the accuracy of the neural network. Taking the sample of GTD database as an example, we achieved the classification accuracy of BP neural network at 94.32% through experiments, and the accuracy of BP neural network optimized by simulated annealing genetic algorithm can be improved to 99.88%, which verifies the effectiveness of the BP neural network classification model optimized by fuzzy clustering algorithm and simulated annealing genetic algorithm.
Key Words: terrorist attacks; classification model; fuzzy clustering analysis; BP neural network;simulated annealing genetic algorithm
0 引言
恐怖主義是人类公敌。GTD数据库[1]是现今最权威的恐怖袭击事件信息数据库,由美国马里兰大学相关研究所START收录,其中对1970-2016年全球恐怖袭击事件进行了最原始的描述,记载数量超过17万件。GTD定义恐怖主义是一种非政府组织活动,该行为经常带有宗教色彩或政治目的。实施者通过非法武力、暴力、威胁、恐吓等方式,以达到某种社会和经济目的[2]。因此,恐怖袭击事件具有极大的杀伤力和破坏力。最大程度地降低事件造成的损失和影响,建立恐怖袭击事件分级模型,将推动政府构建恐怖袭击事件应急预案,对维护社会稳定具有重要意义。
目前常用的分级方法为主观分级法,一般由权威组织或部门选择若干个主要指标,强制规定分级标准。由于评价恐怖袭击事件的危害性比较复杂,不仅取决于人员伤亡和财产损失,还与发生地点、攻击形式、针对对象等诸多因素有关,因此主观分级法不能全面综合地将恐怖袭击事件分级,选取的指标是否科学也有待考证。相关研究有:位珍珍[3]通过对GTD数据库中恐怖袭击来源、袭击地域、目标、手段的可视化图像分析,得出恐怖袭击事件危害影响的比较;王念秦等[4]结合层次分析法,在充分借助主观经验与客观数据的基础上,平衡两者优劣选择组合赋权方法,更好地确保指标权重设计的合理性。梳理朱祖平等 [5]与谢振华等[6]学者的文献资料发现,利用BP神经网络的自学习能力可以建立基于模糊综合评价的非线性映射规则,使评价模型更加高效且克服了模糊性;吕琼帅等[7]、刘学士等[8]采用遗传算法优化BP神经网络,有效改善了BP神经网络收敛速度慢、易陷于局部最优的问题。目前,利用数据挖掘的方式进行恐怖袭击事件分级研究尚处于不成熟时期,大多数研究仅限于针对恐怖袭击事件的数据进行可视化分析。
本文提出一种基于模糊聚类法和改进BP神经网络的分级模型,该模型兼顾主观经验和客观数据,首先利用改进的层次分析法与熵权法分别计算恐怖袭击事件评价指标权重,基于博弈论思想得到最优组合作为最终的指标权重;再利用模糊聚类法对样本数据进行模糊划分,结合评价指标权重对每个类别进行排序分级,并通过训练BP神经网络获取输入到输出的模糊规则。BP神经网络的收敛速度较慢且训练时易陷入局部最优解,为纠正这一偏差,选择模拟退火遗传算法进行优化,有效提升了BP神经网络精确度。
1 评价指标体系建立
1.1 评价指标体系
恐怖袭击事件危害评价受多种因素影响,既有确定的定量指标,又有模糊的定性指标。综合恐怖袭击事件发起的目的与产生后果,建立恐怖袭击事件危害性评价指标体系如图1所示。包含影响范围、损失程度等4个一级指标,袭击有效性、死亡人数等若干个二级指标。在指标量化工作时采取专家综合评价方法确定定性指标值,定量指标直接选用测量值。
1.2 指标权重确定
评价指标权重采取多种方法获得,常用的有主观赋权法和客观赋权法。为充分结合主观经验和客观数据,通过改进的层次分析法和熵权法并利用博弈论组合赋权法得到最优组合权重。
博弈论组合赋权法基本思想为:在主观和客观赋权法之间达成共识,寻求二者之间的一种均衡结果,发挥两者优势,通过极小化组合权重与各基本权重间的偏差实现[9]。
2 恐怖袭击事件分级方法
2.1 分级方法原理
目前常用的主观分级法主要凭借人工经验对恐怖袭击事件划分等级,易受多种随机因素影响且误差偏大。因此,本文应用模糊聚类分析算法对恐怖袭击事件进行等级划分,利用其对数据的挖掘和应对模糊性的优势,得到更加科学合理的分级。利用BP神经网络固有的大规模并行处理和自组织学习能力,寻求恐怖袭击事件评价指标与等级划分之间复杂的非线性映射关系,并通过模拟退火遗传算法优化该网络,以此简化传统模型繁琐的分级过程,提高等级划分效率和精度。
模糊聚类与改进BP神经网络恐怖袭击事件分级模型结构如图2所示,其基本原理为:将归一化的恐怖袭击事件样本数据结合博弈论组合赋权法得到的评价指标综合权重进行模糊聚类分析,获取科学的等级划分,并给定相应的期望值;将聚类后的样本当作训练样本作为BP神经网络的输入,并通过模拟退火遗传算法优化BP神经网络的初始权值和阈值;利用得到的初始值对BP神经网络进行训练,最终获取输入与输出之间的模糊映射规则,BP神经网络的输出即为评价结果,可作为等级划分的参考。
2.4.2 模拟退火遗传算法优化的BP神经网络原理
为有效确保BP神经网络在计算恐怖袭击事件形成的危害性时更加精确,选择模拟退火遗传算法对其优化,步骤如下(见图5):
(1)对BP神经网络进行初始化操作:设计网络结构,确定训练次数等相关参数值。
(2)对模拟退火遗传算法参数进行初始化操作:设定种群大小、编码长度等参数值。
(3)对模拟退火遗传算法进行迭代计算:首先进行染色体编码,进而计算所有个体的适应能力,每个个体代表BP神经网络的权值和阈值。选择适应能力较强的个体进行选择、交叉、变异和退火操作,优化产生新一代种群并再次计算所有个体的适应能力,判断是否停止。一直迭代,直至得到最优网络权值和阈值。
(4)对BP神经网络进行训练:结合上述操作步骤中得到的阈值和网络权值对BP神经网络进行训练。
(5)获取评价结果:以BP神经网络最终的输出值为恐怖袭击事件危害性评价结果,作为等级划分的参考。
3.3 BP神经网络建立
(1)对BP神经网络进行多次重复训练,根据不同结构神经网络的预测能力拟定隐藏层的神经元个数。选用Sigmoid函数作为BP神经网络的激活函数,trainlm函数作为训练函数,相关操作参数设定如下:达到最大的训练次数数量为2 000,学习率为0.1,能够达到最大的训练精度为4×10-7。根据图6情况分析,“▲”代表的预测误差较低,此时隐藏神经元个数为20个。据此可判定BP神经网络隐藏神经元个数为20。
(2)设定模拟退火遗传算法相关参数:其中遗传代数最大为100,种群规模设定为50,交叉概率设定为0.3,变异发生概率为0.05,编码长度为12×20+20+20×1+1=281;初始温度设定为500,每个温度会发生的迭代次数设定为100,降温系数值为0.95,降温的最大次数为100。将模拟退火遗传算法得到的最优初始网络权值和阈值作为初始参数训练BP神经网络,将计算出预测的平均相对误差与普通BP神经网络的预测结果进行对比,结果如图7所示。
根据图7得到较优的结果是SAG算法优化后的BP神经网络。通过实验计算得到普通BP神经网络的分级正确率为94.32%,模拟退火遗传算法优化的BP神经网络分级正确率提升到99.88%,说明模拟退火遗传算法对BP神经网络优化是有效的。
利用测试集的恐怖袭击事件数据对事件分级,选取每个级别部分典型的事件以及某些权重较大的指标进行结果分析,评价模型的有效性,结果如表2所示。
由表2可以看出,本文的分级模型对测试集的分级结果较符合实际,而其分类主要依据在于客观事物的损失上,社会秩序层面考量较少,该模型具有对恐怖袭击事件分级的有效性和普遍性。
4 结语
相对于当今常用的主观分级法,通过数据挖掘思路,基于模糊聚类和改进BP神经网络建立的恐怖袭击事件分级模型,具有高效、便捷等特点,因此该模型对恐怖袭击事件应急处理具有开创性的延伸意义。主观分级法由于人的易错性,可能受到各种随机因素影响,从而使应对恐怖袭击事件的决策出现失误。本文结合兼顾主客观的博弈论组合赋权法和模糊聚类分析,对恐怖袭击事件进行科学分级,利用BP神经网络的自学习能力,解决了其过程冗杂、速度慢的问题,并通过模拟退火遗传算法優化BP神经网络来提高模型的精确性。经过实验分析,验证了该模型的有效性。但是,当新的恐怖袭击事件发生以后,政府很难快速且准确地进行数据采集和危害性预测,所以仍然需要在此领域进行更深层次的研究。
参考文献:
[1] LAFREE G, DUGAN L. Introducing the global terrorism database[J]. Terrorism&Political Violence,2007,19(2):168-173 .
[2] 彭如香,张奥博,杨涛,等. 基于GTD的全球恐怖主义活动现状与发展趋势研究[J]. 计算机应用与软件,2019,36(1):1-5,21.
[3] 位珍珍. 后911时代恐怖主义的GTD数据分析[J]. 情报杂志,2017,36(7):10-15.
[4] 王念秦,张帅,刘鹏. 基于博弈论组合赋权法的泥石流灾害易发性评价云模型[J]. 长江科学院院报,2019,9(1):1-9.
[5] 朱祖平,朱彬. 基于BP神经网络的企业技术创新效果的模糊综合评价[J]. 系统工程理论与实践,2004(4):16-21.
[6] 谢振华,窦培谦. 基于BP神经网络的矿山排土场滑坡预警模型[J]. 金属矿山,2017(6):166-169.
[7] 吕琼帅,王世卿. 基于遗传模拟退火算法优化的BP神经网络[J]. 计算机与现代化,2011(6):91-94.
[8] 刘学士,肖旭,戴勇. 基于遗传算法优化BP神经网络的磨削力预测[J]. 机械设计与制造,2013(1):227-229.
[9] 路遙,徐林荣,陈舒阳,等. 基于博弈论组合赋权的泥石流危险度评价[J]. 灾害学,2014,29(1):194-200.
[10] 郭燕红,邵东国,刘玉龙,等. 工程建设效果后评价博弈论集对分析模型的建立与应用[J]. 农业工程学报,2015,31(9):5-12.
[11] RANA S, JASOLA S, KUMAR R. A boundary restricted adaptive particle swarm optimization for data clustering[J]. International Journal of Machine Learning & Cybernetics,2013,4(4):2101-2112.
[12] CHEN WJ,?CHEN J, SUN HJ, et al. Simulation and?analysis of?irregular multicoil B-0 shimming in?ctype permanent magnets using genetic algorithm and?simulated annealing[J]. Applied Magnetic Resonance,2019,50(1):91-99.
[13] 潘尚峰,卢超,彭一波. 基于改进BP神经网络的机床基础部件可再制造性评价模型[J]. 中国机械工程,2016,27(20):2743-2748.
[14] 王宇钢,修世超. 核模糊聚类和BP神经网络的切削工艺绿色度评价[J]. 机械设计与制造,2018 (11):41-44.
[15] 曹黎侠,冯孝周. 新的改进AHP算法研究及应用[J]. 计算机技术与发展,2010,20(12):115-117,121.
[16] 蔡正杰,梁昌勇,赵树平. 突发环境事件等级评估方法研究[J]. 计算机应用研究,2014,31(11):3217-3220.
[17] 王朝,姚敏,富展展. 基于模糊综合评价的突发事件分级研究[J]. 软件导刊,2019 (1):1-4.
[18] WANG RL, ZHA BB. A research on the optimal design of BP neural network based on improved GEP[J]. International Journal of Pattern Recognition and artificial Intelligence,2019,33(3):489-496.
[19] 刘焕淋,朱平鑫,陈勇,等. 改进遗传模拟退火算法优化室内VLC覆盖均匀性[J]. 中国激光,2019 (9):1-10.
[20] 李今花,王虎,雷建军. 可信网络中基于熵权法的信任评估模型[J]. 华中师范大学学报:自然科学版,2019,53(1):26-29.
[21] 张品一,罗春燕,梁锶. 基于GA-BP神经网络模型的黄金价格仿真预测[J]. 统计与决策,2018,34(17):158-161.
(责任编辑:杜能钢)