基于贝叶斯网络的化学恐怖袭击后果评估方法研究

2021-03-30 06:24盛子健胡啸峰
关键词:贝叶斯人员伤亡恐怖袭击

盛子健,胡啸峰

(1.中国人民公安大学信息网络安全学院, 北京 102623;2.安全防范技术与风险评估公安部重点实验室, 北京 102623)

0 引言

进入20世纪以来,恐怖袭击事件频发,根据2019年全球恐怖主义指数(Global Terrorism Index, GDI)统计,2018年全球恐怖袭击造成的经济损失为330亿美元,死亡人数为15 952人。在全球恐怖主义数据库(Global Terrorism Database, GTD)中,以化学武器为主要武器的恐怖袭击事件有286起。相对于其他恐怖袭击武器类型,化学武器的原材料获取和合成相对容易[1],且具有突发性、群体灾害性、隐匿性和人体损害的多样性等特点[2]。在已有记载的化学恐怖袭击中,1995年东京地铁沙林毒气事件[3]是一起典型事件,日本奥姆真理教在东京地铁站释放沙林毒气,造成12人死亡,约5 500人中毒,1 036人住院治疗。由于在救援的过程中没有合理评估此次事件人员伤亡情况,导致救援力量分配不合理,造成了巨大的损失。因此,面对当前日益紧张的反恐局势,对化学恐怖袭击的后果评估研究具有实际意义。

当前针对恐怖袭击的研究方法很多,总体分为定性研究、定量研究和半定量研究。王振等[4]采用事件树分析恐怖袭击发生之后的后果等级;吴文辉等[5]引入攻击树思想对“软目标”恐怖袭击风险建模;魏静等[6-7]基于贝叶斯网络对恐怖袭击的后果进行预测分析;黄丽达等[8]基于博弈论研究天然气管网遭受恐怖袭击时的脆弱性;龙圣杰等[9]基于社会力原理开发应急引导疏散仿真模型,对生化恐怖袭击情境下引导疏散中行人行为仿真研究;邱凌峰等[10]基于机器学习的方法对全球各国家遭受恐怖袭击的风险进行回归预测;项寅[11]利用全球恐怖主义数据库,基于改进的神经网络构建恐怖袭击风险预警系统;Liu[12]利用时间序列模型中的自回归分布滞后模型,研究恐怖袭击对旅游行业的长短期影响;Zhu[13]基于贝叶斯网络,对化学恐怖袭击进行风险分析;Santoc[14]通过统计知识分析1970~2015年全球恐怖主义数据库中化学恐怖袭击事件的特征;Henderson[15]通过问卷调查分析化学恐怖袭击之后普通民众的态度和应对措施。由于从数据中学习得到的贝叶斯网络反映的是变量间统计学上的关系,无法完全反映出真实的因果关系。

因此本文利用K2算法和恐怖袭击发生的主要脉络,建立基于贝叶斯网络的化学恐怖袭击后果评估模型,研究不同化学恐怖袭击情景下,对人员伤亡等级的预测,旨在为维护地区安全提供决策支持。

1 研究方法

1.1 数据来源和处理方法

实验数据来自GTD,包含1970~2018年全球恐怖袭击的信息,目前共包含190 000多起恐怖袭击案件。其中以化学武器为主要武器的恐怖袭击案件有200多起。当前,GTD是记录全球恐怖主义活动最全面的数据库[13]。对1970~2018年全球恐怖袭击数据进行处理,得到实验数据,处理流程为:

(1)选取事件,在GTD中部分事件由于数据收集不准确,不确定是否属于化学恐怖袭击事件,所以需要删除此类事件,避免干扰实验结果。

(2)选取节点,GTD中有100多个属性,一部分节点来自文献,如恐怖袭击发生地区节点;一部分节点与化学恐怖袭击自身的特性相关,如化学武器类型节点。具体选取节点见表1。

(3)确定人员伤亡人数,GTD中人员伤亡总数记录了恐怖分子和普通群众人员伤亡数量总和。本文研究的是化学恐怖袭击发生之后普通群众的人员伤亡情况,所以人员伤亡属性的数值是人员伤亡总数量减去恐怖分子伤亡数量。

(4)离散化,对GTD中已经离散化的属性,使用GTD已有的划分标准;对非离散化的节点,根据相关的标准进行离散化。如人员伤亡等级依照《生产安全事故报告和调查处理条例》[17]中的划分标准,对人员伤亡属性数值进行离散,得到人员伤亡等级,划分标准见表1。

(5)重新排序,由于部分属性离散化之后数据取值不连续,需要对其重新排序,方便进行学习。如袭击类型的取值为1,2,3,5,6,7,8,将其重新排序为1,2,3,4,5,6,7。

通过以上4步,得到了268条化学恐怖袭击数据,选取了12个相关节点。节点及节点状态信息如表1所示。

1.2 基于贝叶斯网络的后果评估方法

本文实验模型基于贝叶斯网路,贝叶斯网络可对复杂问题正确地更新证据,定量或者定性的分析问题,也可以通过诊断推理找到其中的关键因素,其应用领域广泛[18]。本文从贝叶斯网络的结构建立、贝叶斯网络的参数学习和运用建立的贝叶斯网络模型进行推理分析3个方面展开。

表1 贝叶斯网络结构节点说明

本文先用K2[19]算法得到贝叶斯网络结构,之后根据恐怖袭击发生的主要脉络修正原有结构,从而避免从数据中学习结构较难完全反映真实场景下节点关系的问题。K2算法可以指定贝叶斯网络结构的先验顺序,是贝叶斯网络结构学习中普遍使用的算法。

贝叶斯网络参数主要通过数据中学习得到或者利用专家经验得到。针对不完备数据,常通过最大期望算法(Expectation Maximization Algorithm, EM)[20]算法得到。EM算法是一个在已知部分相关变量的情况下,估计未知变量的迭代技术。EM的算法流程为(1)初始化分布参数,(2)重复直到收敛:E步骤,根据参数的假设值,给出未知变量的期望估计,修补缺失值。

(1)

式中Di是D中第i个记录没有观察到的数据(丢失数据)

(2)

敏感性分析是贝叶斯网络常使用的分析方法,敏感性分析评估了目标节点敏感地感知其他节点的变化程度,得到对目标节点影响力大的节点。敏感性分析用方差缩减值来表示,方差缩减值越大,表明节点对目标节点的影响程度越高[21]。贝叶斯网络推理是通过计算回答查询的过程,具体可以被分为诊断、预测、原因关联和混合使用四大类[22]。其中情景分析是构建一个场景,来预测目标节点的状态概率变化,属于预测推理。关键风险因素诊断推理是通过确定目标节点的状态,观察非目标节点的状态概率变化,属于诊断推理。本文先使用敏感性分析找到贝叶斯网络模型中敏感程度较高的节点。之后通过关键因素诊断推理来确定人员伤亡不同状态下,敏感程度较高节点的状态概率变化。最后采用情景分析法对建立的后果评估模型进行验证。

2 结果讨论

2.1 预测结果分析

利用MATLAB中的贝叶斯网络工具箱,通过K2算法和恐怖袭击发生的主要脉络得到贝叶斯网络结构。中国国家安全研究报告(2014)[23]中指出恐怖袭击从组织到实施袭击,最短时间为4个月,表明恐怖袭击是有计划,有准备的袭击。

图1所示为恐怖袭击发生的主要脉络,恐怖分子的目的对被袭击方的场所和恐怖分子的资源配置有影响,被袭击方的场所对恐怖分子的资源配置有影响,被袭击方和恐怖分子对恐怖袭击发生的后果有影响。如果满足图1中的关系则保留;如果不满足则删除;如果应该存在关系,贝叶斯网络结构却没有体现,则添加对应的因果关系。修正之后的贝叶斯网络结构如图2所示。

图2 修正之后的贝叶斯网络结构

图1 恐怖袭击发生的主要脉络

图2中黑色虚线为删除的关系。由于化学恐怖袭击中存在部分数据丢失,所以采用EM算法进行参数学习。本文采用10折(10-fold cross- validation)交叉验证方法,对人员伤亡等级的分类准确性进行评估。该方法在数据集有限的情况下,同时训练10个模型取均值,相当于扩充了数据集,增加了模型的泛化能力。实验表明,该模型人员伤亡等级的分类准确率为0.75。

2.2 敏感性分析和关键风险因素诊断推理

在风险评估领域,敏感性分析有助于确定哪些风险对目标具有最大的潜在影响。运用Netica软件进行敏感性分析,分析各节点对人员伤亡节点的影响,方差缩减值越大表示该节点对目标节点越敏感程度越高,结果见表2所示。

表2 各节点对人员伤亡的敏感度

通过敏感性分析得到,目标类型、化学武器类型、地区、袭击成功、袭击方式对化学恐怖袭击后果影响较大。通过改变人员伤亡程度状态,观察以上节点前3个最大的状态概率分布,结果如表3所示。

表3 影响人员伤亡的敏感性节点诊断推理

人员伤亡程度为一般事故标准下,发生化学袭击的地点在西欧、中东北非和南亚的概率较高,在0.16以上。在袭击目标类型方面,私人居民和财产被袭击的概率最大,为0.263。在化学武器类型方面,未知类化学武器概率最大,其次是中毒类化学武器,其中在袭击类型方面,非武装袭击概率最大,达到了0.63。

人员伤亡程度为较大事故标准下,发生化学袭击的地点在南亚、中东北非和西欧概率较高,其中南亚为0.328。在袭击目标类型方面,私人居民与财产、教育机构和警察被袭击的概率最高,其中私人居民与财产的概率为0.323。在化学武器类型方面,未知类化学武器出现的概率最大,中毒类化学武器相比爆炸类化学武器概率高0.127。在袭击类型方面,非武装袭击概率最大,达到了0.602。

人员伤亡程度为重大事故标准下,发生化学袭击的地点在南亚、中东和西欧概率较高,其中南亚为0.367。在袭击目标类型方面,教育机构、私人居民与财产和警察被袭击的概率最高,其中教育机构的概率为0.339。在化学武器类型方面,中毒类化学武器出现的概率最大,为0.443,中毒类化学武器相比爆炸类化学武器概率高0.278。在袭击类型方面,非武装袭击概率最大,达到了0.561。

人员伤亡程度为特别重大事故标准下,发生化学袭击的地点在南亚、中东和西欧概率较高,其中南亚为0.405。在袭击目标类型方面,教育机构、私人居民与财产和警察被袭击的概率最高,其中教育机构的概率为0.267。在化学武器类型方面,中毒类化学武器出现的概率最大,为0.517。中毒类化学武器相比爆炸类化学武器概率高0.339。在袭击类型方面,非武装袭击概率最大,达到了0.616。

因此,在日常防范时候,要加强对教育机构、私人住宅地和商业场所的巡逻。非武装袭击在化学恐怖袭击方式中的研究中应占主要地位,因为在4类人员伤亡标准下,出现的概率都在0.5以上。由于袭击成功对人员伤亡影响很大,所以针对化学恐怖袭击的情报工作也应该加强,尽可能阻止化学恐怖袭击的发生。在化学武器类型方面,4类人员伤亡标准下,中毒类化学武器出现的概率总是高于爆炸类化学武器,这也为以后预防化学恐怖袭击提供了新的方向。

通过提取化学恐怖袭击中的武器细节字段,对使用的化学武器进行统计分析,结果如图3所示。从图3中可以看到,酸性物质、氯气、氰化物、催泪瓦斯、杀虫剂、胡椒喷雾剂等出现的频次比较高,其中有些物质属于普通人群难以获取的物质,也有物质属于普通人群容易获取的物质,如杀虫剂等。结合表3中目标类型,建议在学校、私人场所和商业区等密集地区加强对以上物质的排查。

图3 1970~2018年化学恐怖袭击中前10个最常用的武器

2.3 模型验证

阿富汗和伊朗为化学恐怖袭击高发国家,从GTD中选取两个国家内的4起化学恐怖袭击事件进行模型验证。按照数据库中的已有信息,转换成贝叶斯网络节点信息。模型预测结果如图4所示。

事件1:2018年5月3日,袭击者在阿富汗塔克哈尔一所女子学校使用了中毒类气体毒害学生。袭击未造成财产损失,至少使45名学生生病。

事件2:2015年7月4日,两名袭击者在阿富汗赫拉特省赫拉特市投掷了酸性化学武器。袭击中至少有3人受伤。

事件3:2017年6月7日:袭击者向伊拉克摩苏尔居民区的平民发射了袭击中使用了4门氯气迫击炮。袭击中有13人受伤。消息人士将事件归因于伊拉克和黎凡特伊斯兰国(ISIL)组织。

事件4:2007年5月20日,一名身份不明的自杀式汽车炸弹手在伊拉克拉马迪的一个外部市场和警察检查站附近炸毁了他的汽车。据怀疑,肇事者的车内还装有氯气,目标是警察和无辜平民,产生财产损失,2名警察死亡,另有9人受伤。

图4 4起化学恐怖袭击事件的预测结果

由图4可知,建立的人员伤亡评估模型预测结果和上述4起化学恐怖袭击事件中的人员伤亡等级符合。事件1中有45人受伤,属于较大事故;事件2中3人受伤,属于一般事故;事件3中13人受伤,属于较大事故;事件4中2人死亡,9人受伤,属于一般事故。这说明模型能够符合实际发生的结果。

3 结论

本文利用全球恐怖主义数据库中的化学恐怖袭击数据,通过K2算法和恐怖袭击发生的主要脉络构建基于贝叶斯网络的化学恐怖袭击后果评估模型。结果表明,通过10折交叉检验发现该模型分类准确率为0.75;通过敏感性分析和关键风险因素诊断推理发现,中毒类化学武器应该受到更多的关注。当化学恐怖袭击发生初期,可为救援单位合理配置资源提供决策支持。

猜你喜欢
贝叶斯人员伤亡恐怖袭击
欧洲之恐:欧洲可以迅速扑灭恐怖袭击,但仍做不到防患于未然
基于贝叶斯网络的海盗袭击事件影响因素
租赁房地产的多主体贝叶斯博弈研究
租赁房地产的多主体贝叶斯博弈研究
贝叶斯公式的应用和推广
恐怖袭击
英国警戒级别提到“次高”