王 琳,杨天青,邱 鹏,郝 婧
(1.贵州省工程防震研究院,贵阳 550001;2.中国地震台网中心,北京 100045)
地震是人类共同面临的突发性较强、致灾过程复杂的自然灾害之一,我国是世界上地震活动最强烈、地震灾害最严重的国家之一。传统的震后应急决策主要是根据现行的国家和地方地震应急预案、条例、规范、标准结合决策者的个人经验等来部署现场工作队的规模、结构情况,这可能导致出队方案并非最优,且由于不同工作任务对接存在的脱节,决策部署效率低且人为因素影响较大,本文主要针对地震应急工作实施过程中存在的这些问题进行研究,拟采用支持向量机多属性回归计算模型,为决策者制定出队方案提供一定参考。
目前数据挖掘和人工智能技术的快速发展,多种推荐算法在辅助决策、个性化智能推荐等方面得到了广泛应用,如我们所熟知的购物平台商品智能推送,新闻媒体、公众号的信息推荐、音乐播放平台的每日歌单推荐等。遗传算法是建立在遗传学与自然选择基础上的自适应搜索过程,作为解决复杂问题的一种有效手段,从一个初始化的群体出发,选取性能优良的个体,在这些优良个体之间进行生物化的繁殖,使它们一代代地进化到解空间中越来越好的区域,从而最终得到最优解。K 最近邻分类算法(k-nearest neighbor,简称KNN 推荐算法)的原理是一个样本在某一特征空间中,与其最相似的k 个样本中的大部分属于某一类,则该样本也属于这一类。
地震的发生随机性强,破坏性地震致灾范围广、强度大,给人民的生命财产安全、社会秩序的稳定造成重大威胁,因此地震现场应急工作时间紧任务重,对应急现场工作队员的应急应变能力,专业知识储备情况等要求较高。本文依据应急预案、条例等,对应急现场队成员的情况进行分析后,发现应急现场队成员参与地震应急工龄、实际现场应急次数、到单位的最快集合时间为三个较为重要的,代表现场队员地震应急处置能力的属性,本文利用遗传算法全局最优收敛的特性对支持向量机的上述三个属性参数进行寻优,采用支持向机回归的方法拟合不同属性,有效解决三个不同属性之间的关联性问题,再采用KNN 算法推荐得到最优应急团队[1-4],以得到最优解的支持向量机推荐现场队员。
(1)由于应急团队不同属性的性质不同,通常具有不同的数量级,若各属性间的水平相差很大时直接用原始属性值进行分析,就会突出数值较高的属性在综合分析中的作用,相对削弱数值水平较低属性的作用。因此,为了保证结果的可靠性,需要对原始属性数据进行标准化处理,再利用标准化的数据进行数据分析。本文研究中的备选应急队员在工作年龄、应急次数、应急集合时间三种属性之间关联性较小,因此采用min-max 标准化处理方法,该方法称之为离差标准化,对这三种属性进行数据标准化线性变换,目的是将结果值映射到0 到1 之间[2],函数公式如下:
式(1)中:xmin为样本数据最小值;xmax为样本数据最大值;x为样本数据。
(2)支持向量机的基本概念:首先通过非线性变换将输入空间变换到一个高维空间,然后在这个新空间中求取最优线性分类面,而这种非线性变换是通过定义适当的内积函数来实现的。支持向量机求得的分类函数形式上类似于一个神经网络,其输出是若干中间层节点的线性组合,而每一个中间层节点对应于输入样本与一个支持向量的内积,因此也被叫做支持向量网络[5-8]。结构如图1所示:
图1 支持向量机概念图Fig.1 Concept diagram of support vector machines
SVM 应用于回归拟合分析时,不再是寻找一个最优分类面使得两类样本分开,而是寻找一个最优分类面使得所有训练样本离该最优分类面的误差最小[9],概念图如图2。
图2 回归支持向量机概念图Fig.2 Concept diagram of regression support vector machines
应急团队的学习样本集表示为{(x1,y1),(x2,y2),…,(xi,yi)}(xi∈Rn为输入变量,yi为与xi对应输出变量),回归问题是指从样本中学习一个函数,然后给定一个xi值,能够预测yi的值,SVR 函数公式如下[10-11]:
式(5)中σ 为径向基核带宽的调节参数,结合公式(4)得到支持向量机推荐模型。
式(6)可以看出,支持向量机模型的性能和泛化能力主要取决于参数c 和σ,常采用试验法来确定参数,但容易陷入局部解,因此考虑引入采用遗传算法来确定参数c 和σ,遗传算法具有全局最优解的特点,这样能够保证模型的有效性和准确性。
地震现场应急队员的工龄、应急次数、应急集合时间,是决定应急团队最优解的关键,但这些属性是非线性的,因此需要构建一个SVR 多属性回归模型[5-6],以解决三个不同属性之间的关联性问题,回归模型可构建为:
式(7)中:ri应急队员的综合评分,m(Aκ|i)是应急队员的工龄断评分,K∈{0,1,2,… ,17},共18 个工龄。m(Bs|i)是应急队员参与过地震应急的次数段评分,u∈{0,1,2,… ,8,},共9 个参与地震应急救援次数。m(Cu|i)是应急集合时间评分,v∈{0,1,2,…,9},共10个应急集合时间。
支持向量机回归通过核函数K(x,xi)将数据从空间非线性变换到高维空间,从而使得数据在该空间中被转换成线性组合[11],用支持向量机回归的方法构建非线性回归模型公式如下:
使用序列最小优化方法求解该支持向量机回归问题。
本文以贵州省地震局目前的地震应急出队分组作为参考,按地震应急预案的要求将应急队伍分为ABCD 四类,其中A 为震情监视跟踪组,B 为通信与后勤保障组,C 为烈度评定与灾害评估组,D 为综合协调组,按顺序对组员进行编号A01、02... 09; B01、 01... 10; C01、 02... 18; D01、02...04,分别统计了每位成员的工龄、现场工作次数和集合时间(到单位的最快时间),将应急团队的学习样本集表示为{(x1,y1),(x2,y2),…,(xi,yi)}(xi为输入变量,yi为与xi对应输出变量),使用SVM 工具训练基于支持向量机回归的用户多属性推荐模型,尝试寻求最优的c 值,得到最优分类面,计算出的各个应急队员在上述三个属性条件下离最优分类面最小值ɷ结果详见表1,ɷ值越小,则表示该成员为最优出队选择,反之则相反,根据计算得到的结果可以筛选出所需的应急队员,完成队员的推荐。
表1 应急队员多属性推荐表Table 1 Multi-attribute recommendation table for emergency team members
从表1 可以得出,若每个组只选择一名成员。则A-震情监视跟踪组安排出队的最佳人员是A01,B-通信与后勤保障组的最佳出队人员是B02,C-烈度评定与灾害评估组的最佳出队人员是C14,D-综合协调组的最佳出队人员是D01,在实际的出队安排中,各队选出的最佳人员可作为每队的组长(副组长)候选人,供指挥决策者参考。
通过与传统的贵州省地震应急现场工作队出队情况相比,本文采用的基于支持向量机回归的用户多属性推荐得出的最佳成员在发生在贵州省境内的2019 年10 月沿河MS4.9 级地震与2020 年7 月赫章MS4.5 级地震中担任队长或副队长的角色,是各组中地震应急现场工作经验和技术知识最为丰富,熟知应急工作的流程、内容,综合能力相对突出的成员,这也从侧面映射出地震现场工作对应急技术人员的专业知识储备、应急应变能力要求较高。
经过多年的经验积累与探索研究,我国已形成了一套适宜的应急工作体系,但受人员专业知识背景、工作基本能力等的影响,在近年来的应急工作中,具体实施的环节之间出现了不同程度的任务对接脱节,导致决策部署效率低的现象。
本文采用支持向量机多属性回归计算模型,完善决策者安排出队人员,实验结果与队员实际出队能力相符,证明该方法用于筛选地震应急出队人员是可行的,实现应急团队的智能推荐,不仅能提高地震应急工作与人工智能的结合,推进地震事业走向智能化、信息化,也能完善和弥补传统决策模式导致的决策部署效率低、任务工作脱节等问题。因此通过不断完善队伍人员信息,增加人员属性参数,不断优化,可进一步实现队伍成员的筛选,从决策制定的角度出发,可以为震后应急现场工作快速高效部署、有序实施的提供重要基础支撑。