基于GA-BPNN的巷道围岩变形模量预测*

2013-08-25 08:27王德永袁艳斌
金属矿山 2013年3期
关键词:模量适应度遗传算法

王德永 袁艳斌 陈 颖

(1.武汉理工大学资源与环境工程学院;2.平顶山工业职业技术学院计算机系)

岩体变形模量对于成功设计和实施岩体工程项目是至关重要的,因为它是岩体破坏前力学特征最具有代表性的参数,在任何岩体行为(包括变形)分析中,该参数也是一个重要的输入参数。通过现场或原位测试,有几种方法来直接确定变形模量,承压板、荷载板、径向承压、面承压和线承压在模量估计的原位测试中是最常见的。这些方法耗时、费用高,并且只能当探测位置是开挖的情况下才能进行测试[1]。另外,原位测试需要麻烦的测试过程,并且验证结果是可疑的[2]。

由于前面提到的原位测试操作困难和费用高,试图对岩体变形模量间接估计开发出经验联系,然后使用回归分析等统计方法获得这些联系。尽管经验公式是经济的和省时的,但是它们包含了连接有限数据的不确定性,岩石类型和岩体异构性质的变化[3]。

近年来,利用反向传播神经网络(BPNN)、模糊逻辑和模糊神经系统等人工智能系统预测岩体属性已经是岩石工程实践方面的热点研究问题[3-8],在这些方法中,BPNN比其他方法使用更广泛,这种方法的快速增长和广泛使用的主要原因是它具有以稳定和有效的方式逼近任何函数的能力。BPNN模型的另外一个潜在好处是它利用并行计算突破大量计算的限制。

尽管BPNN广泛使用,但进行BPNN设计仍然是利用耗时的反复试错方法。BPNN设计需要的时间和工作量是依赖于问题的复杂性和用户的经验。这将导致耗费大量时间和精力去寻找待解问题的最优或接近最优的网络结构。本研究的目标是建立一个利用遗传算法(GA)的BPNN最优设计,用它来预测岩体的变形模量。优化设计的目的是决定隐含节点数、学习因子和动量系数,用来增强系数估计的准确性,同时降低运算时间和工作量。

1 试验样本数据

表1 提取的岩体属性的统计性描述

本研究评价用的数据集来源于实际巷道测量,单独分析来自每个巷道位置的数据集,然后从数据集中剔除那些离散的和不可靠的数据,最终总共选择了76个数据(某巷道实测)用来开发遗传算法和试错训练模型。这些数据集包含通过承载板法测试获得的岩体变形模量、通过使用直径为54 mm的岩芯获得的完整岩石的岩体变形模量(Em)、单轴抗压强度(UCS)、岩体质量指标(RQD)、干密度、单位长度的节理数(J)和孔隙度,对于所有位置也要计算其地质强度指标(GSI)系统,并把它考虑作为一个输入参数,GSI集中描述了岩石结构和岩石表面的情况,它广泛应用于岩体强度和岩体变形参数的估计[1]。表1列出了原始数据集的基本描述性统计的详细情况。

为了确定影响变形模量的参数,共有76个数据生成的几个坐标图说明了这些自变量参数和变形模量的关系(图1)。并且,图中给出了通过二元线性回归建立的回归线,在图1中从点散布的情况来看,已经可以推断出数据UCS(相关系数R2=0.21)、GSI(R2=0.50)以及RQD(R2=0.23)和变形模量关联最密切,并且在变形模量预测中可以作为独立的预测器。

图1 独立变量和变形模量E m之间关系

2 使用试错法设计BPNN

在本研究中,通过神经网络软件NeuroSolutions for Excel管理用试错和GA训练的BPNN设计过程,该软件具有训练网络,并能直接测试网络性能的功能。另外,具有内置的能帮助用户遗传优化网络参数的特点。换句话说,这个软件合并了神经网络和遗传算法来获得网络的大小和参数。

如上所述,有太多的参数影响神经网络性能和最终结构,通过所有这些参数来获得发生较少训练误差的参数设置几乎是不可能的。因此,在本研究中,其中的一些参数被认为和在试错法和GA训练过程中是相同的,比如初始权重、传递函数类型、训练样本的数量和隐含层的数量。

为了达到这个目标,考虑选择初始权值的范围为[-1.0;1.0],1个使用sigmoid传递函数的隐含层,同时,把数据分成1个训练集、1个训练验证(交叉验证)集和1个测试集。训练集采用适合该网络权值,执行交叉验证集是和网络训练同时发生的,被训练集用来确定产生进化的第几代。偶尔,网络权值不会变化,交叉验证数据是通过网络产生,并报告其结果,控制器的停止标准可能是基于交叉验证集的误差,而不是训练集,来确保这个进化的产生。测试集是一组数据,用来评价已经训练的神经网络的进化性能。本研究中,30%的数据被用来测试,剩下的数据用来训练和交叉验证,这种方法也是Nelson和 Illingworth 推荐的[9]。

NeuroSolutions软件的学习因子和动量因子缺省设置一般[10]被试错法过程使用。因此,可以认为隐含层的学习因子ηh=1,动量因子βh=0.7,输出层学习因子ηo=0.1,动量因子βo=0.7,最后,考虑到7个不同的神经网络的表2,依赖试错法得到的文献中提出的建议方法,选定的隐含神经元的个数(Nh)分别为1、2、5、6、7、9 和 14,来建立最有效的神经网络结构。图2展示了用到的反向传播神经网络(BPNN)。

每一个提及的网络在训练集上训练,并使用交叉验证集上来阻止过度拟合,如果停止标准满足,则进行测试。训练次数达到5 000以上停止,或者交叉验证的均方误差MSE开始增长前停止。交叉验证的均方误差MSE定义如式(1):

图2 用到的BPNN结构

这里,Ei和E'i分别表示被测的变形模量和预测的变形模量,n是交叉验证集的训练样本数。每个网络得到了几次训练,并且在运行中保存了最好的网络权值和当交叉验证误差最小时的次数。

表2给出了试错网络的性能,它是根据实验数据和在训练和测试数据集上神经网络输出之间的均方误差(MSE)、平均绝对误差(MAE)和线性相关系数(R)得到的。如果得到的R、MAE和MSE分别为接近于1、0和0,那么神经网络预测是最理想的。如表2所示,试错法结果表明带有7个神经元的1个隐含层和NeuroSolutions软件缺省设置的学习因子η、动量因子β组成的BPNN结构比其他网络展示出了一个更好的性能。

表2 7种试错网络的结果

3 使用遗传算法改进BPNN设计

为了进行遗传训练,首先要随机产生一个网络的初始化种群,每个网络的特点是包括不同参数(基因),这些参数是 Nh、ηh、βh、ηo、βo,由二进制数基因组成的每个种群染色体通过GA训练自动调整这些参数,因此,每个染色体包含5个基因,第1个基因代表网络隐藏层神经元个数,剩余的基因是BP优化算法网络训练的学习因子和动量因子,设置隐藏层神经元个数为[1;15],同时学习因子和动量因子为[0;1]。

接下来对创建的每个网络进行训练,并由基于它获取的最小误差的训练样本进行评价以确定其适应度。优化的目的是为了找到具有一个低训练误差的参数设置,交叉验证数据不是用来训练ANN(神经网络算法)模型,而是用来在训练阶段检测ANN模型,好的网络的特点是混合和变异之后产生一个网络种群。再次评价这个种群网络,并把具有最好网络的特征传给网络的下一代,重复这个过程,直到达到最大代数或用户预先定义的停止条件为止。图3显示了利用GA来找到神经网络的最佳结构的步骤[11]。

图3 使用遗传算法的神经网络训练流程

在执行遗传训练之前,首先应该指定GA参数的初始设置,为了达到这个目标,通过实验来获得遗传操作算子不同层的组合比率、代数(定义为种群中所有网络的训练和评价次数)、种群大小等,这些数值是在计算实践和大量文献检索的基础上获取的[12-15]。

以100个随机产生的染色体(网络)作为遗传算法的开始,这些染色体的结构和前面提到的相同,接下来评估每个染色体的适应度。对竞争选择法具有最好适应度的染色体被遗传操作算子进化产生下一代。为此两点交叉概率、统一变异概率和繁殖概率分别采用0.9、0.01和0.09,表3总结了用到的GA参数,进化网络迭代次数经过70次之后,这些训练运行生成最低误差的设置参数的混合认定为最佳网络。

GA训练之后,软件自动生成总结结果报告,报告内容包括了每一代期间获得的最佳和平均适应度的2个图(图4和图5)和1个总结这2个图的表(表4)。

表3 确定变形模量用到的GA参数

表4 使用GA训练网络获得的训练误差

图4显示了优化每一代期间获得的平均适应度,平均适应度采用的是所有网络相对应代的最小均方误差(MSE)的平均值。图5显示了每代优化期间获得的最佳适应度。最佳适应度是所有网络之间相对应代的全部最小均方误差(MSE)。从图5中可以看出,最佳网络适应度是3.157,它是迭代次数是53时获得的。该网络的参数设置保存并在之后的训练中能够调用。表4总结了最佳适应度和平均适应度,列出了每个图的最小均方误差、最小均方误差产生的代数和最终的均方误差。表5列出了经过遗传算法之后的最优参数。

表5 改进BPNN的最优参数

表6总结了在训练和测试数据之内实测模量和GA-BPNN预测模量之间的均方误差(MSE)、平均绝对误差(MAE)和线性相关系数(R)。表6和表2显示结果对比表明,对于实验数据可比情况下,使用遗传算法的预测结果优于试错法。

表6 GA-BPNN模型在训练和测试数据上的性能

图6显示了GA方法和试错方法的比较结果,从图中明显看出,对于同样的测试数据,虽然给出可接受的结果是十分相近的,但是在BPNN训练中使用GA预测变形模量比试错法预测更好。

图6 变形模量的ANN模型和GA-BPNN模型对比

4 结论

开发了基于BPNN的遗传算法模型来预测变形模量,用遗传算法来提高模量预测的精度,缩短时间,并且能够满足确定BPNN的最优结构和参数的要求。利用遗传算法优化了隐藏层神经元个数、学习因子和动量因子以及输出层的学习因子和动量因子。为了分析和验证所开发模型的性能,对使用建议模型和试错模型的预测结果进行了对比。

采用的数据集来自不同项目,包含经过主成分分析的76个数据集,生成的几个坐标图也显示了变形模量和独立变量之间的关系,决定把UCS,GSI和RQD作为变形模量预测模型开发中的预测器。

试错法的结果表明,BPNN结构有一个带有7个神经元的隐含层组成,隐含层的学习因子和动量因子分别为1和0.7,输出层的学习因子和动量因子分别为0.1和0.7,这些都是NeuroSolutions软件的缺省设置。

最后,使用遗传算法的结果显示了一个最佳效果的网络,该网络隐含侧有8个神经元,学习因子和动量因子分别为0.473和0.891,输出层的学习因子和动量因子分别为0.361和0.615,GA-BPNN网络模型的 R,MSE和 MAE的值分别为0.944,5.21和2.03。结果的比较表明,使用遗传算法比试错法在和承载板发实际测量值比较有更好的预测效果,即遗传算法成为了替代试错法的一个好的选择,它以一种有效的方式构造最优的神经网络结构和内部参数的设计。

[1] Cai M,Kaiser PK,Uno H,Tasaka Y,Minami M.Estimation of rock mass deformation modulus and strength of jointed hard rock masses using the GSI system[J].Int J Rock Mech Min Sci 2004,41:3-19.

[2] Hoek E,Diederichs MS.Empirical estimation of rock mass modulus[J].Int J Rock Mech Min Sci 2005,43:203-15.

[3] Kayabasi A,Gokceoglu C,Ercanoglu M.Estimating the deformation modulus of rock masses:a comparative study[J].Int JRock Mech Min Sci 2003,40:55-63.

[4] 沈建波,屈建国,詹召伟.基于灰色理论的软岩巷道围岩变形预测研究[J].煤矿开采,2011,16(1):22-24.

[5] 赵建海.巷道围岩系统变形预测研究[D].武汉:武汉科技大学,2005.

[6] 葛宏伟,等.人工神经网络与遗传算法在岩石力学中的应用[J].岩石力学与工程学报,2004,23(9):1542-1550.

[7] 范 千.大坝变形预报的神经网络极限学习方法[J].江南大学学报:自然科学版,2011,10(4):435-438.

[8] 杨 杰,吴中如,顾冲时.大坝变形监测的 BP网络模型与预报研究[J].西安理工大学学报,2001,17(1):25-29.

[9] Nelson M,Illingworth WT.A Practical Guide to Neural Nets Reading[M].Mass:Addison-Wesley,1990.

[10] NeuroDimension Inc..NeuroSolutions for Excel,Help Version:6.30[M].Gainesville,FL:NeuroDimension Inc,2012.

[11] Holland J H.Application of natural and artificial systems[M].Ann Arbor:University of Michigan Press,1975.

[12] Javadi AA,Farmani R,Toropov VV,et al.Identification of parameters for air permeability of shotcrete tunnel lining using a genetic algorithm[J].Comput Geotech,1999,25:1-24.

[13] Wang C,Ma G W,Zhao J,et al.Identification of dynamic rock properties using a genetic algorithm[J].Int JRock Mech Min Sci,2004,41(3):453-553.

[14] Podgorelec V,Kokol P.Evolutionary induced decision trees for dangerous software modules prediction[J].Inf Process Lett,2002,82:31-38.

[15] Osman MS,Abo-Sinna MA,Mousa AA.A combined genetic algorithm-fuzzy logic controller(GA-FLC)in nonlinear programming[J].J Appl Math Comput,2004,170:821-840.

猜你喜欢
模量适应度遗传算法
改进的自适应复制、交叉和突变遗传算法
高劲度模量沥青混合料在京台高速车辙维修段的应用
室内回弹模量和回弹再压缩模量试验参数探讨
关于现行规范路基顶面回弹模量的理解和应用
基于自适应遗传算法的CSAMT一维反演
一种基于遗传算法的聚类分析方法在DNA序列比较中的应用
基于遗传算法和LS-SVM的财务危机预测
基于空调导风板成型工艺的Kriging模型适应度研究
基于改进的遗传算法的模糊聚类算法
稻谷堆的压缩密度与体变模量的测定与分析