项月文饶 泓汤兰荣罗 丽曾文敬
1)中国南昌330039江西省地震局
2)中国江西330031南昌大学
基于SOM和BP神经网络的地震预报技术
项月文1)饶 泓2)汤兰荣1)罗 丽1)曾文敬1)
1)中国南昌330039江西省地震局
2)中国江西330031南昌大学
选取闽粤赣交界地区及东南沿海作为研究对象,以测震学前兆指标作为预报因子,使用SOM网络对地震预报因子进行分类,分别构建BP网络进行学习和预测,克服评测样本数量有限且分布不均匀给测试带来的困难。结果表明,该方法的预测精度优于单一采用BP网络的精度,对地震预报具有一定应用价值。
地震预报;人工神经网络; SOM神经网络; BP神经网络
中国是世界上地震活动强烈的国家之一,地震灾害严重威胁社会经济发展和人民生命财产安全。引发地震的因素很多,强震的孕育和发生会经历复杂的过程,使得地震活动具有高度非线性、信息非完备性、不可逆性和难以用动力学方程描述等特点。
人工神经网络具有较强的非线性处理能力,在模式识别、信号处理、预测评估、自动化控制等领域已得到广泛应用,取得较好的效果。近年来,一些地震科研人员在地震综合预报(陈以等,2011;李炜等,2011;苏义鑫等,2011)、震害预测(李焱等,2011)、地震分析(边银菊,2002)、地震工程(王虎栓,1993)等领域引入神经网络理论,开展了一些研究。初步研究表明,一些结果优于传统的统计模式识别方法,具有独特优势。
本文运用人工神经网络模型,对闽粤赣交界及东南沿海未来半年内可能发生的最大地震震级进行建模和预测,以测震学前兆指标为基础,对该区域中强地震进行研究,取得较好的预测效果,为预报未知地震提供参考信息,对地震预报工作有一定应用价值。
1.1 自组织特征映射(SOM)神经网络
SOM网络模拟大脑神经系统的聚类、自组织、自学习功能,是一种由全互连的神经元阵列组成的自组织、无监督的竞争式学习网络,通过对输入样本的自组织学习,可以在无教师示范情况下对输入样本实现自动聚类。因此,该网络被广泛应用于优化问题、图像压缩、语言识别、机器人控制等领域。
SOM网络为输入层和竞争层(输出层)的双层结构,竞争层可以在一维或二维网络矩阵上,形成输入信号的特征拓扑分布,从而实现提取输入信号模式特征的能力。图1为二维网络结构,输入层有p个输入节点,竞争层上q个输出节点按二维形式构成一个节点矩阵,输入节点和输出节点之间均有权值连接,且竞争层上输出节点之间也可能局部互连。
网络输入层接受样本输入模式后,分成不同区域,各区域中邻近的神经元通过相互竞争与输入模式进行匹配,最终竞争层某个神经元可产生最大响应而成为竞争的胜者,并确定获胜邻域,进而调整与其有关的各连接权值。经过多次迭代学习,SOM网络以自组织方式调整网络权值,自适应形成对输入模式的不同响应检测器,从而实现对输入模式的聚类(张德丰等,2012)。
1.2 BP神经网络
BP网络是一种单向传播的多层前向型神经网络,利用非线性可微分函数进行权值训练,是实际应用广泛的神经网络模型之一,结构简单、可塑性强。因此,该网络在函数逼近、模式识别、数据压缩、信息分类等领域得到广泛应用。
BP网络通常由输入层、中间层(隐含层)和输出层组成,上下层之间为全连接,每层的神经元之间无连接,见图2。BP算法建立在梯度下降法的基础上,由信号的正向传递和误差的反向传播两部分组成。当输入信号进入网络后,从输入层经中间层(隐含层)逐层处理后向输出层传播,每一层神经元输出只对下一层神经元输出产生影响。如果目标输出与实际误差达不到期望值,则转为反向传播,从输出层经中间层(隐含层)逐层修正各层间的权值和阈值,最终回到输入层,经多次误差逆传播修正,直至网络的预测输出达到期望值(飞思科技产品研发中心,2005)。
图1 SOM网络结构Fig.1 SOM network structure
图2 BP网络结构Fig.2 BP network structure
结合江西省历年地震发生频次及分布,将闽粤赣交界及东南沿海地区(21.0°—27.0°N,112.0°—119.9°E)作为研究区域,以保证地震样本足够多。选取1970年1月1日至2014年3月31日该区域地震目录中大于等于ML5.0地震,共23条震例进行研究,见表1。
测震学前兆是指利用地震学方法揭示的地震记录(地震目录、地震图等)中所包含的强震前兆信息,也称震兆,主要包括地震活动图像异常和地震波异常(张国民等,2001)。震兆研究在地震前兆与预报方法系统研究及地震预报方法实用研究中,工作比较系统详细。
因此,本文选取测震学前兆指标作为神经网络的预报因子,分别为半年内ML≥2.0地震累计频度及能量释放累计值、b值、异常震群个数、地震条带个数、是否处于活动期、相关地震区震级。23条震例的震前变化值见表2。从表2可知,7个预报因子数据在不同数量级上,有的差别较大,会导致神经网络训练时间增加,甚至无法收敛(魏红梅等,2007)。因此,事先对数据进行归一化处理,可以简化样本分布,提高网络的训练速度和准确度。结合本文使用神经网络模型的特点,将各输入向量归一化到[0.1 0.9]区间更为适宜。按式(1)对预报因子作归一化处理。
表1 23条震例地震目录Table1 Earthquake catalogue of 23 seismic samples
表2 预报因子汇总及归一化处理后预报因子Table2 Predictor summary sheet and the normalized predictor
其中,x为原始值,y为归一化后的值(即神经网络输入),Valuemax和Valuemin分别为样本的最大值和最小值。归一化处理后的预报因子数据见表2。
将上述经归一化处理的数据通过神经网络进行预测仿真后,要得到真实震级数据,必须按式(2)对网络输出向量进行反归一化处理。
其中,z为归一化后预测值(即神经网络输出),x为反归一化后预测值。
4.1 人工神经网络预测原理
人工神经网络是一种具有高度自适应、自组织、自学习、高度容错、大规模并行处理和分布式信息存储功能的非线性动力学系统,可以自动对大量已知样本进行学习,并获得隐含在样本中的非线性关系,无需分析对象满足一定规律或数学模型。因此,将人工神经网络理论应用于地震预报将是有效的。
利用人工神经网络预测时,需要大量样本数据才能得到较高精确度。针对本文评测样本数量有限且分布不均匀的情况,依据样本点越类似、密度越大,则邻域预测精度越高的网络特性(王杰等,2004),提出首先使用SOM网络对地震预报因子进行聚类,再对各样本类分别构建BP网络进行学习和预测方法,工作流程见图3。通过对预报因子的聚类,使得内在规律较为相似的样本能够集中到各自样本类,从而克服评测样本数量有限且分布不均匀给测试带来的困难,有效提高预测精度。
图3 基于SOM和BP网络模型的地震预报流程Fig.3 Flow chart of earthquake prediction based on SOM and BP network model
4.2 神经网络模型Matlab实现
Matlab是由美国MathWorks公司开发的用于建模仿真、算法开发、实时实现、概念设计的理想集成环境,是目前最好的工程计算和仿真软件。伴随Matlab软件的快速发展,为神经网络理论的实现提供了一种便捷的仿真手段。本文采用Matlab R2011a作为仿真测试平台,对所选23条震例进行仿真实验。
(1)样本数据分类。构建SOM网络模型,对23组样本数据进行分类。利用Matlab神经网络工具箱提供的函数newsom,创建一个SOM网络模型,网络竞争层神经元的组织结构为1×3,其实现代码为net=newsom(minmax(y),[1,3]);。经过300次训练后,样本被自适应分为3类,分类结果见表3。
表3 样本及训练样本和测试样本分类Table3 The classifi cation table of the samples and training samples and test samples
(2)BP网络模型构建。根据SOM网络分类结果,构建3组BP网络模型,采用单隐含层的网络结构进行震级预测。由于选取7个测震学前兆指标作为输入因子(预报因子),故输入层有7个神经元。输出因子为地震的实际震级,则输出层有1个神经元。根据Kolmogorov定理,中间层神经元个数可在10—20之间选取,具体取值需在训练仿真过程中通过观察不同神经元个数对网络性能的影响确定。利用Matlab神经网络工具箱提供的函数newff,创建BP网络模型,由于输入和输出向量已被归一化到[0.1 0.9]区间,故中间层神经元传递函数采用S型正切函数tansig,输出层神经元传递函数采用S型对数函数logsig。网络训练函数采用traingdx,利用动量及自适应lrBP的梯度递减算法,对网络进行训练。其实现代码为net=newff(threshold,[a(i),1],{'tansig','logsig'},'traingdx');。
(3)BP网络训练与仿真。按表3给出的3类训练样本和测试样本,分别对3组BP网络进行训练和仿真。通过对网络中间层神经元个数不同取值时网络性能的比较,确定网络中间层神经元数目的最佳值分别为:第Ⅰ组15个,第Ⅱ组20个,第Ⅲ组15个。对3个样本类共8个测试样本进行预测仿真,经反归一化处理后,得到对应的震级预测结果及误差。测试样本预测震级及误差见表4,3组BP网络的训练误差曲线见图4。
根据地震学家对地震预报的定义,震级误差范围应该在0.5级内(陈运泰,2007)。从表4可见,8个测试震例中,除第13、14号震例的误差超出0.5级,其他均小于0.3级。其中第14号震例误差较大,主要是由于第3组训练样本过少,导致网络的泛化能力较差。由此可见,SOM神经网络和BP神经网络组合的预测效果比较理想,可以满足实际应用要求。
表4 SOM+BP神经网络与BP神经网络预测结果对比Table4 Comparison of predicted results of SOM+BP neural network with BP neural network
图4 BP网络训练误差曲线(a)第Ⅰ组;(b)第Ⅱ组;(c)第Ⅲ组Fig.4 Training error curve of BP network
(4)预测结果对比分析。将本文SOM+BP神经网络组合的预测效果与单一采用BP神经网络(网络结构为7×20×1)的预测效果进行对比,结果见表4。预测误差对比曲线见图5。由表4和图5可知,单一采用BP神经网络的8个测试震例中,第13、15、16、23号震例误差超过0.5级(图5中虚线),最大预测误差1.162 2级,平均预测误差0.488 7级,而采用SOM+BP神经网络仅有第13、14号震例误差超出0.5级(图5中实线),最大预测误差0.645 2级,平均预测误差0.281 2级。无论是最大预测误差还是平均预测误差,SOM+BP神经网络的预测效果明显优于单一BP神经网络。因此,采用将地震预报因子先聚类再分类建模和预测的方法,能有效提高预测精度。
图5 SOM+BP神经网络与BP神经网络的预测误差曲线Fig.5 Predicted error curve of SOM+BP and BP neural networks
本文以地震目录作为数据来源,从中提取出相关的测震学前兆指标用作预报因子,以人工神经网络理论为基础,采用Matlab软件的神经网络工具箱函数构建网络模型,并将SOM和BP两种神经网络模型相结合,实现了对未来半年内最大地震震级的预测。通过闽粤赣交界及东南沿海地区的地震数据检验表明,该方法通过对预报因子的聚类,克服了评测样本数量有限且分布不均匀给测试带来的困难,预测效果明显优于单一BP神经网络,有效提高预测精度,对地震预报工作具有一定应用价值。
边银菊.遗传BP网络在地震和爆破识别中的应用[J].地震学报,2002,24(5): 516-524.
陈以,王颖,张晋魁.组合人工神经网络在地震预测中的应用研究[J].计算机仿真,2011,28(1): 190-193.
陈运泰.地震预测——进展、困难与前景[J].地震地磁观测与研究,2007,28(2): 1-24.
飞思科技产品研发中心.神经网络理论与Matlab7实现[M].北京:电子工业出版杜,2005.
李炜,蒋阿芳,邱剑锋.基于Matlab的BP神经网络模型在地震预报中的应用[J].井冈山大学学报(自然科学版),2011,32(1): 76-80.
李焱,杜广环.改进的BP算法在地震灾害损失预测中的应用[J].科学技术与工程,2011,11(9): 1 902-1 905.
苏义鑫,沈俊等.神经网络和改进粒子群算法在地震预测中的应用[J].计算机应用,2011,31(1): 1 793-1 796.
王虎栓.基于人工神经元网络的峰值地震动物理参数的智能判别[J].地震学报,1993,15(2): 208-216.
王杰,闫东伟.提高预测精度的ELMAN和SOM神经网络组合[J].系统工程与电子技术,2004,26(12):1 943-1 945.
魏红梅,黄世源,贺曼秋.基于Matlab工具箱的地震预测模型[J].东北地震研究,2007,23(3): 64-68.
张德丰,等.Matlab神经网络应用设计第2版[M].北京:机械工业出版社,2012.
张国民,傅征祥,桂燮泰,等.地震预报引论[M].北京:科学出版社,2001.
Research on earthquake prediction based on SOM and BP neural networks
Xiang Yuewen1),Rao Hong2),Tang Lanrong1),Luo Li1)and Zeng Wenjing1)
1)Earthquake Administration of Jiangxi Province,Nanchang 330039,China
2)Nanchang University,Jiangxi Province 330031,China
The border area among Fujian,Guangdong and Jiangxi provinces and southeastern coast area are chosen as the research object.The indices of seismological precursor are used as predictors.Firstly,SOM neural network is used to classify the predictors and then the samples are studied and predicted by establishing BP neural network respectively,which can overcome the problems of the limitation and unevenly distribution of the number of samples.Simulation results show that the prediction accuracy of this method is better than that of just one of BP network,which is quite valuable to the prediction of earthquake.
earthquake prediction,artifi cial neural network,SOM neural network,BP neural network
10.3969/j.issn.1003-3246.2015.04.026
项月文(1983—),男,工程师,硕士,主要从事地震监测与系统管理工作
中国地震局三结合课题(课题编号:141402)
本文收到日期:2015-01-13