王 欣, 葛恒清, 张凯婷, 陈友群
(淮阴师范学院 物理与电子电气工程学院, 江苏 淮安 223300)
矿井突水是煤矿开采过程中最具威胁的自然灾害之一,一旦矿井发生突水,将会危及煤矿工人的人身安全,造成巨大的经济损失.如何快速准确地识别突水水源,是防治矿井突水灾害的关键.水源识别常用的方法有:水位动态法、同位素法、水温法、地下水化学法等[1].由于地下水化学数据能够从本质上反映各含水层的特征,因此利用地下水化学方法来识别矿井突水水源具有快速、准确的特点[2].
目前,国内外一些学者根据矿井含水层的水化学成分,运用统计理论及信息融合等方法对矿井突水水源进行识别,如张许良等[1]运用数量化理论建立了焦作矿区地下水判别模型;温廷新等[2]建立了基于Logistic分析的矿井突水水源识别的RF模型;周健等[3]建立了矿井突水水源识别的距离判别分析模型;张瑞刚等[4]运用可拓识别方法建立了谢桥矿井突水水源判别模型;陈红江等[5]将Fisher判别法运用到矿井水源识别中;杨永国等[6]采用非线性方法判别矿井突水水源;徐星等[7]运用BP神经网络建立了矿井突水水源识别模型.上述方法各有其特点,同时也具有一定的局限性.综合考虑以上研究成果,本文提出基于遗传BP神经网络的矿井突水水源识别方法.
将遗传算法和BP神经网络相结合,可以充分发挥两者的优势.利用遗传算法对BP神经网络的初始权值和阈值进行优化,获得BP神经网络的最优权值和阈值,然后利用BP神经网络进行局部寻优,从而得到全局最优解[8-11].其流程图如图1所示.
图1 遗传BP神经网络流程图
针对不同的矿井,用于突水水源识别的特征离子也各不相同[1].综合考虑数据的有效性和离子的重要性,选择Na++K+、Ca2+、Mg2+、Cl-、SO42-、HCO3-等6种水化离子作为矿井突水水源的识别因子;并根据各含水层的水质特征将矿井突水的水源分为4类:二灰和奥陶纪含水层(I)、八灰含水层(II)、顶板砂岩含水层(III)和第四系含水层(IV).
为了验证本文模型的识别效果,引用文[1]中的矿井样本数据,训练样本为35个,待测样本为4个.在该样本数据下,文[3]所采用的距离判别分析法和文[5]所采用的Bayes判别法在回判时,均将第1个训练样本判错,即将属于二灰和奥陶纪含水层(I)的样本误判为第四系含水层(IV).为了体现本文识别模型的优势,特将第1个训练样本与第1个待测样本互换位置,来检验遗传BP神经网络是否能准确识别该样本.
本识别模型采用3层BP神经网络结构,隐含层个数为1.输入节点个数根据识别因子的个数进行确定,为6;输出节点个数根据水源类别进行确定,为4,分别为(0,0,0,1)、(0,0,1,0)、(0,1,0,0)和(1,0,0,0),依次对应二灰和奥陶纪含水层(I)、八灰含水层(II)、顶板砂岩含水层(III)、第四系含水层(IV).隐含层节点个数可以根据式(1)进行确定.
(1)
式中,l为隐含层节点数;n为输入节点数;m为输出节点数;a为1~10之间的调节常数.
根据式(1)和输入输出节点个数可得,隐含层节点个数可以在5~14之间,这里设为L,其具体取值需要通过仿真实验来进行确定.
BP神经网络的训练参数如表1所示.
表1 BP神经网络的训练参数
遗传算法主要用于对BP神经网络的初始权值和阈值进行优化,从而提升BP神经网络的预测效果.BP神经网络的结构为6-L-4,因此可得BP神经网络中需要优化的权值和阈值个数如表2所示.
表2 权值和阈值的个数
将待测样本的预测输出和期望输出之间的误差绝对值之和作为神经网络的目标函数的输出,并以此来计算种群个体的适应度.如下所示.
(2)
(3)
式中,fi为第i个个体的适应度值;p=1,…,m为待测样本的个数;k=1,…,n为输出层节点的个数;Ypk为第p个待测样本时第k个节点的预测输出;Tpk为第p个待测样本时第k个节点的期望输出.
遗传算法参数设定如表3所示.
表3 遗传算法参数设定
对于BP神经网络,可以确定其隐含层节点个数在5~14之间,初步设定为5、7、9、11、13.根据遗传BP神经网络的流程,其相关参数按表1~表3进行设置,通过大量的仿真实验可以得到,针对隐含层中不同节点个数,所对应的识别模型预测输出与期望输出的误差绝对值之和如表4所示.
表4 隐含层不同节点个数所对应的误差绝对值之和
从表4可以得出,当隐含层的节点个数为5时,该遗传BP神经网络的期望输出与预测输出的误差绝对值之和最小,为0.0054,因此将BP神经网络的隐含层节点个数确定为5.
根据确定的BP神经网络的结构和遗传算法的参数,分别利用35组训练样本和4组待测样本对该网络进行训练和测试,可以得到4组待测样本的误差进化曲线如图2所示.
图2 误差进化曲线
从图2可以看出:随着遗传代数的增大,4组测试样本的误差绝对值之和逐渐减小,并最终趋于稳定.
遗传BP神经网络与BP神经网络相比,其优势在于可以利用遗传算法来获得BP神经网络的最优初始权值和阈值,为了验证其良好的识别效果,将遗传BP神经网络和BP神经网络的训练结果和仿真输出进行比较.
将BP神经网络的网络结构和参数按照遗传BP神经网络来进行设置,即两者唯一的区别在于:遗传BP神经网络采用通过遗传算法优化后的最优初始权值和阈值,而BP神经网络采用随机初始权值和阈值.利用35组训练样本分别对遗传BP神经网络和BP神经网络进行训练,其训练结果分别如图3和图4所示.
图3 遗传BP神经网络MSE收敛曲线 图4 BP神经网络MSE收敛曲线
由图3和图4可知,遗传BP神经网络的网络误差为4.0612e-8,经过20步训练即可达到收敛;而BP神经网络的网络误差为8.2021e-8,经过24步训练后达到收敛.可以得出:在相同的网络结构和参数下,遗传BP神经网络的收敛速度更快,网络误差更小.
分别利用训练好的遗传BP神经网络和BP神经网络对4组测试样本进行仿真,其预测输出分别如表5和表6所示.
表5 遗传BP神经网络的仿真输出
表6 BP神经网络的仿真输出
由表5和表6可知,遗传BP神经网络可以准确地对4组待测样本进行识别,且平均绝对误差较小,而BP神经网络可以准确识别后三组样本,但第一组识别错误.可以得出:在相同的网络结构和参数下,遗传BP神经网络的拟合能力更强,预测准确度更高.
在同样的样本数据下,将遗传BP神经网络的判别结果与距离判别分析法[3]和Bayes判别法[5]的识别结果进行比较,如表7所示.
表7 不同方法的识别结果比较
由表7可知,遗传BP神经网络的判别准确率可以达到100%,而距离判别法和Bayes判别法在第1个待测样本中均判别错误,准确率为75%.
针对BP神经网络收敛速度慢和存在局部极小的缺点,提出了一种基于遗传算法优化BP神经网络的矿井突水水源识别模型,在同样的训练样本和待测样本下,与BP神经网络、距离判别法、Bayes判别法等方法的识别效果进行比较.结果表明,经过遗传算法优化初始权值和阈值的BP神经网络收敛速度更快,降低了陷入局部极小值的可能,并且具有更高的识别精度.
[1] 张许良,张子戌,彭苏萍. 数量化理论在矿井突(涌)水水源判别中的应用[J]. 中国矿业大学学报, 2003, 32(3):251-254.
[2] 温廷新,张波,邵良杉. 矿井突水水源识别预测研究:以新庄孜矿为例[J]. 中国安全科学学报,2014,24(2):100-106.
[3] 周健,史秀志,王怀勇. 矿井突水水源识别的距离判别分析模型[J]. 煤炭学报,2010, 35(2):278-282.
[4] 张瑞钢,钱家忠,马雷,等. 可拓识别方法在矿井突水水源判别中的应用[J]. 煤炭学报,2009, 34(1):33-38.
[5] 陈红江,李夕兵,刘爱华. 矿井突水水源判别的多组逐步Bayes判别方法研究[J]. 岩土力学,2009, 30(12): 3655-3659.
[6] 杨永国,黄福臣. 非线性方法在矿井突水水源判别中的应用研究[J]. 中国矿业大学学报,2007, 36(3):283-286.
[7] 徐星,王公忠. BP神经网络在矿井突水水源识别中的应用[J]. 煤炭技术,2016, 35(7): 144-146.
[8] 杨志磊,孟祥瑞,王向前,等. 基于GA-BP网络模型的煤矿底板突水非线性预测评价[J]. 煤矿安全,2013,44(2):36-39.
[9] 李建林,昝明军,韩乐.矿井突水水源判别方法与应用[J].河南理工大学学报(自然科学版),2014, 33(5):590-594.
[10] 陈荣,徐用懋,兰鸿森. 多层前向网络的研究:遗传BP算法和结构优化策略[J]. 自动化学报,1997, 23(1):45-51.
[11] 李恒志,牛国庆,刘慧玲. 改进的GA-BP神经网络在矿井突水水源判别中的应用[J]. 中国安全生产科学技术,2016, 12(7):77-81.