袁荟岭
(西安建筑科技大学,陕西 西安 710311)
按照《中华人民共和国突发事件应对法》中对突发事件的分类,顶层包括自然灾害、事故灾害、公共卫生事件和社会安全事件4 个大类,各领域专家学者对本学科范畴内的特定事件进行了大量研究。陶鹏等[1]通过建立联防联控机制的文本数据库并开展内容分析,归纳出现实场景下联防联控机制的功能图景及特点;于浩恬等[2]运用结构化方法分析历史事件,构建案例情景库,为建立情景-应对管理平台打下基础,实现对轨道交通运营系统的安全动态监管。
文献中,突发事件有不同的分类体系。美国国土安全部将紧急情况分为生物威胁、化学威胁、干旱、地震、火灾、洪水、放射性和核事故等自然灾害。
在日本的“灾害应对基本法”中,紧急情况分为自然灾害和人为灾害,前者包括天气、地震和火山,后者包括技术灾害和综合灾害。突发事件有不同的分类体系。根据国家质量监督检验检疫总局和国家标准化管理委员会2017 年联合发布的GB/T 35561—2017《突发事件分类与编码》[3],将突发事件概括为4 个一级分类、37 个二级分类、171 个三级分类。本研究将突发事件分为4 类,即自然灾害、事故灾难、公共卫生事件和社会安全事件。由于特大城市突发事件可能演化为多种类型的子事件,因此本文将特大城市突发事件演化描述为一个多标签分类问题。一些最先进的方法包括多标签支持向量机、多标签集成分类器链、多标签逻辑回归和多标签弹性网[4]。
20 世纪80 年代,有学者以东京和大阪等首都圈的发展为例指出,一个城市发展到一定阶段必然会比其他中小城市的发展速度慢[5]。从此关于特大城市发展的理论研究开始从城市布局、经济结构、基础设施、城市交通系统发展到对综合问题的探索。张锋[6]指出随着特大城市人口的流动性、集聚度和规模性加剧,以自然灾害、事故、公共卫生事件及群体性事件为重点的特大城市应急管理面临严峻的风险挑战。余珂等[7]提出特大城市具有人口高度密集、资源要素高度集聚、辐射能力大等显著特征,需要聚焦特大城市人口特征、公共卫生防疫体系、城市治理等方面。
学习向量量化(Learning vector quantification,LVQ)是一种结构简单、性能有效的监督学习方法。近年来,LVQ 神经网络被应用在生活的各方面。李江等应用模糊C 均值聚类对台区负荷的用电类型进行划分,基于学习向量量化神经网络建立LSF 预测模型;李建闽等[8]提出了一种基于双分辨率S 变换和学习向量量化神经网络的电能质量扰动信号检测方法;舒大松[9]利用LVQ 神经网络识别放射性核素。实验结果表明,该模型具有良好的预测性能。
本节将介绍一种新方法,用于演化预测特大城市非常规突发事件。图1 示意性描述了拟议方法的框架。首先,收集描述世界各地特大城市非常规突发事件的数据,对原始数据进行预处理生成可用分类算法处理的规则数据集;然后,用多标签LVQ 分类算法处理数据,构建预测模型;最后,通过比较测试数据集中已识别的类别标签和真实的紧急事件标签,评估预测模型的有效性。
图1 非常规突发事件演变预测框架研究
LVQ 神经网络是一种基于距离的分类算法,属于前向神经网络的一种类型。LVQ 由在地图上规则排列的神经元阵列组成。每个神经元都与一个定义类区域的原型相关联。LVQ 以竞争性的方式训练,通过计算输入和每个原型之间的距离,只激活最佳匹配神经元(BMU)。采用这种方式,以BMU 为特征的类边界被相应调整。当输入与BMU 具有相同的类标签时,它会对原型产生积极的影响。
为了适应训练数据具有多标签的特点,提出了一种LVQm 算法。对于每个输入x,计算x与每个神经元之间的距离,得到BMU,就像在标准LVQ 中所做的那样。类别匹配度由BMU 的标签集和范围从0(表示完全不相交的标签集)到1(表示绝对相同的标签集)的输入来度量。阈值δ∈[0,1]用于确定是否调整BMU。如果匹配度不小于阈值,则按照匹配度和学习率的比例向输入调整Proto-265 型BMU。代替常用的多数投票原则,MAP 神经元被分配了一个由所有不同的投影输入实例的标签组成的集合。LVQm 算法的具体实现过程如下。
由于多标签分类的评价比单标签分类复杂,本文提出了一种基于绩效评价的信息检索和推荐方法。
具体步骤如下:①给定实验数据集,进行5 次交叉验证,即将D分为5 次,其中4 次为训练数据,其余为测试数据。②对于每个生成的训练数据集,使用提出的LVQm 算法构建分类模型。阈值δ是根据标准的最佳值从预设列表{0,0.1,···,1}中选择的,该标准可以是准确率、召回率、精确度、F1 或HL,具体取决于应用要求。③将测试数据输入分类器,并根据预测度量对性能进行评估。④随机数据分割,重复10 次,计算平均结果。
演变既是突发事件发展扩大的结果,也是非常规突发事件最典型的特殊性。基于应急管理的全生命周期,将非常规突发事件应急管理过程分为减少、准备、响应和恢复4 个阶段。
在约简阶段,对可能的子事件进行预测后可阻止演化动因消灭在萌芽状态,避免损失。要采用德尔菲法等成熟、稳健的专家调查方法来分析演变模式和对策,更要在事件的早期阶段进行演变预测。
在准备阶段,对事件演化预测结果的要求是及时预测和及早脱钩。一旦预测到演变,就可以通过实时观测和合理安排避让和制导策略来应对,提前阻断、减缓、转移和消除破坏性能量。
在响应阶段,演化子事件类型的预测结果强调决策的科学性和准确性。决策主体应根据驱动子事件的基本因素进行综合评价,确保决策的科学性。决策的实施、实践的管理需要处置主体的保障。
在恢复阶段,对非常规突发事件的演变预测有助于全面监测和长期跟踪。特大城市演化具有滞后性和多样性,有必要及时跟踪反馈结果,持续监测和跟踪可能的进化路径。
4 个功能(NA、AC、HE 和SE)表示主要事件的类型,类标签表示子事件的类型。图2 概述了实验数据的事件类型和子事件类型的分布。
图2 事件类型和子事件类型的分布
非常规突发事件的演化预测可以归结为一个多标签分类问题。
给定数据集D={(x1,c1),(x2,c2),…,(xN,CN)},其中xi是25 维的二进制向量,Ci是预定义类别标签C={NA,AC,HE,SE}的子集,Ci≠∅。该问题的目标是设计一种学习算法,生成一个能够准确预测未知实例标签的分类器f:D→P(C)。
使用5 倍交叉验证对各种大小的地图的特大城市数据的10 个时期的预测结果。对于每个模型,性能在于准确率(LVQm Acc 算法)、召回率(LVQm Rec 算法)、精确度(LVQm 预算法)、F1(LVQm-F1 算法)和HL(LVQm HL)算法。
图3 显示了使用LVQm-Accuracy 算法分别针对4种类型的子事件的误拒率和误警率。在2 种主要类型的子事件(即事故灾难AC 和社会安全事件SE)上的错误拒绝率和错误警报率都比在另外2种次要类型(即自然灾害NA 和公共卫生事件HE)上好得多。建议采用抽样、阈值、成本敏感分类等方法来解决不平衡问题。
图3 4 类子事件的误拒率和误报率
在对比研究中,采用KNN(K近邻)和SVM(支持向量机)2 种广泛使用的多标签分类方法来预测突发事件的子事件类型。对于给定的K,计算未知实例与每个训练样本之间的距离,并选择K个近邻。然后通过所有检索到的邻居的标签集对未知实例进行分类。本实验还使用5 次交叉验证进行10 个时期的实验,如图4 所示。在图4 中,将KNN(分别取K=1、3、5、7)和支持向量机分别与中等大小的LVQm 的不同变体在准确率、召回率、精确度、F1 和HL 方面进行了比较。KNN 的K值越大,查全率越高,查准率越低。LVQm 的所有变种在综合测度F1 方面都优于多标签KNN 和支持向量机。
图4 多标签预测的性能比较
本文的工作建立在传统LVQ 算法的基础上,提出利用一种新的更新规则来处理多标签数据。提出的LVQ 分类器可以有效预测突发事件的演变。本文的贡献表现在3 方面:首次尝试通过对突发事件及其应对活动的刻画来预测非常规突发事件的演变;LVQ 分类器采用新的学习方案,能够有效处理多标签数据,预测次生灾害;利用世界各地特大城市非常规突发事件的真实数据集讨论该预测模型效益。