基于主成分分析及BP神经网络分析的地震人员伤亡预测模型研究①

2012-09-06 10:37朱冉冉
地震工程学报 2012年4期
关键词:人员伤亡神经元神经网络

田 鑫,朱冉冉

(上海理工大学管理学院,上海 200093)

0 引言

近十年以来,中国发生6.0级以上地震二十余多次,造成的人员伤亡及经济损失不计其数,因此建立地震人员伤亡预测模型显得极为重要[1]。近些年来,国内外学者也提出了一些地震人员伤亡预测模型,这些模型通常分为两类,一类是不考虑易损性方法,另一类以易损性为主要参数的方法[2-3]。但是,由于地震人员伤亡受诸多因素影响,并且因素彼此之间存在错综复杂的关系,因此得出的预测模型往往很难达到理想的效果。通过对收集的6.0级以上地震人员伤亡数据的分析,得出其数据符合主成分分析统计规律[4]。本文通过综合考虑后最终选取地震发生时刻、人口密度、地震预报与否、建筑坍塌率、建筑严重破坏率、建筑一般破坏率、设防水准、震级、地震烈度等因素作为评价指标[5-9]。首先运用主成分分析对这些因素进行降维,并算出各主成分,然后在此基础上运用神经网络方法建立预测模型,最后通过实例对预测结果进行检验。

1 主成分分析、BP神经网络模型基本原理及模型

1.1 主成分分析基本原理及模型

主成分分析是数学上数据降维的一种方法,其基本思想是设法将原来众多的具有一定相关性的指标(比如p项指标)重新组合成一组新的互不相关的综合指标来代替原来指标。最经典的做法就是用F1选取的第一个线性组合,即第一个综合指标的方差来表达,即Var(F1)越大,表示F1包含的信息越多。因此在所有的线性组合中选取的F1应该是方差最大的,故称F1为第一主成分。如果第一主成分不足以代表原来P个指标的信息,再考虑选取F2即选第二个线性组合。为了有效地反映原来信息,F1已有的信息就不需要再出现在F2中,用数学语言表达就是要求Cov(F1,F2)=0,则称F2为第二主成分。依此类推可以构造出第三、第四,…,第P个主成分[10]。其模型如下。

设有n各样本,每个样本有p项指标:X1,X2,…,Xp,得到原始数据矩阵

其中,Xi= (x1i,x2i,…,xni),i=1,2,…,p。

用数据矩阵X的p个列向量(即p个指标向量)X1,X2,…,Xp作线性组合,得综合指标向量

也可以简写成:Fi=a1iX1+a2iX2+…+apiXp,i=1,2,…,p。其中Fi与Fj互不相关(i=1,2,…,p),即Cov(Fi,Fj)=0,并有Var(Fi)=0。

1.2 BP神经网络基本原理及模型

BP(Back Propagation)神经网络,即误差反向传播算法的学习过程,由信息的正向传播和误差的反向传播两个过程组成。输入层各神经元负责接收来自外界的输入信息,并传递给中间层各神经元;中间层是内部信息处理层,负责信息变换,根据信息变化能力的需求,中间层可以设计为单隐层或者多隐层结构;最后一个隐层传递到输出层各神经元的信息,经进一步处理后,完成一次学习的正向传播处理过程,由输出层向外界输出信息处理结果。当实际输出与期望输出不符时,进入误差的反向传播阶段。误差通过输出层,按误差梯度下降的方式修正各层权值,向隐层、输入层逐层反传。周而复始的信息正向传播和误差反向传播过程,是各层权值不断调整的过程,也是神经网络学习训练的过程,此过程一直进行到网络输出的误差减少到可以接受的程度,或者预先设定的学习次数为止。

图1 BP神经网络结构示意图Fig.1 Sketch of BP neural network.

BP神经网络计算如下:设第q层(q=1,2,…,Q)的神经元个数为nq,输入到第q层的第i个神经元的连接权系数为(i=1,2,…,nq;j=1,2,…,nq-1)则该多层感知器网络的输入/输出变换关系为

利用该样本集首先对BP网络进行训练,即对网络的连接权系数进行学习和调整,以使该网络实现给定的输入/输出映射关系[11]。经过训练的BP神经网络,对于实施样本的输入也能给出合适的输出。该性质称为泛化功能。

2 样本收集与分析

2.1 样本收集

为了建模的准确性,本文选取了不同震级和设防水准的地区以及一次地震中不同地段、烈度和震级的地区作为样本,并通过查阅文献综合信息[5-6,12-15]最 终选 取 近 几 十 年 国 内 发 生 的 6.0 级 以上地震作为样本,如表1所示。

2.2 基于SPSS的主成分分析

表1 地震灾害人员伤亡表

表2 方差分解主成分提取表

表3 因子载荷矩阵表

2.3 基于MATLAB的BP神经网络分析

借用MATLAB工具箱建立BP神经网络模型。其中模型的输入层为表4数据,输出层为地震人员伤亡数;模型隐含层神经元个数的选择对网络的学习和计算特性具有非常重要的影响,是该网络构成成败的关键,但到目前为止,还没有完善理论来指导隐含层的神经元个数的选择,而只是结合实际情况进行试探性选择[7,11]。在经过综合考虑后,本模型采用隐含层的神经元个数为4;对于传输函数采用logsig及pureline函数。在导入数据后,部分训练代码如下:

表4 指标对应F值表

表5 预测误差分析表

由表5可以看出,预测结果误差率分别为21%、5.5%,预测效果比较理想。

3 总结

本文首先对收集的数据进行主成分分析,以此来降低评价指标维度以及减少评价指标之间相互影响,然后利用结果进行神经网络建模分析,最终通过检验取得良好效果。因此,利用该模型可以有效的预测地震人员伤亡数量,为震后救援工作提供了很好的参考数据。

[1] 陈玉华,马玉虎,王培玲,等.青海省地震预报回顾与展望[J].高原地震,2008,20(3):1-6.

[2] 章在墉.地震危险性分析及应用[M].上海:同济大学出版社,1996.

[3] 诸井孝文,宫村正光.地震人员伤亡预测与研究现状[J].国际地震动态,1993,(3):25-30.

[4] 王学民.主成分分析和因子分析应用中值得注意的问题[J].统计与决策,2007,6:141-143.

[5] 张洁,高慧瑛,刘琦.基于汶川地震的地震人员伤亡预测模型研究[J].中国安全科学报,2011,(3):59-64.

[6] 于山,王海霞,马亚杰.三层BP神经网络地震灾害人员伤亡预测模型[J].地震工程与工程振动,2005,25(6):111-117.

[7] 王海霞,周晓山.预测人员震害损失的神经网络模型[J].世界地震工程,2007,(4):194-198.

[8] 马占虎,周志宇,高晓明,等.2006年甘肃文献5.0级地震灾害损失评估[J].西北地震学报,2007,29(3):256-263.

[9] 杨杰英,李永强,刘丽芳,等.地震三要素对地震伤亡人数的影响分析[J].地震研究,2007,30(2):182-187.

[10] 范金城,梅长林.数据分析[M].北京:科学出版社,2002.

[11] 周润景,张丽娜.模糊与神经网络设计[M].北京:电子工业出版社,2010.

[12] 非明伦,朱月芬,周光全,等.汶川8.0级地震现场灾害调查统计与分析[J].地震研究,2008,31(S1):535-543.

[13] 何永年.中国地震年鉴.2004[M]北京:地震出版社,2005.

[14] 王根龙,刘红帅,张军慧.汶川特大地震之北川县城震害分析[J].西北地震学报,2010,32(2):173-178.

[15] 李永强,杨杰英,杨东生.1996年云南丽江7.0级地震人员死亡的社会学特征[J].震灾防御技术,2011,9(3):284-290.

猜你喜欢
人员伤亡神经元神经网络
神经网络抑制无线通信干扰探究
跃动的神经元——波兰Brain Embassy联合办公
基于神经网络的拉矫机控制模型建立
复数神经网络在基于WiFi的室内LBS应用
基于二次型单神经元PID的MPPT控制
ERK1/2介导姜黄素抑制STS诱导神经元毒性损伤的作用
毫米波导引头预定回路改进单神经元控制
基于支持向量机回归和RBF神经网络的PID整定