基于改进GWO-ELM 的矿井突水水源识别算法∗

2020-10-09 02:47韩金亮韦昊然蒋欣欣陈梦洁韩瑞泽
计算机与数字工程 2020年7期
关键词:突水学习机灰狼

韩金亮 韦昊然 蒋欣欣 陈梦洁 韩瑞泽

(中国矿业大学 徐州 221116)

1 引言

随着我国煤矿行业的进一步深化改革,煤矿行业的安全风险管控工作面临更大挑战,其中矿井突水事故频频发生,对煤矿生产及人员生命安全造成严重危害。矿井突水指煤矿开采过程中煤层底板受地下水的高压而被突破,地下水迅速渗入矿井,造成淹井现象,严重制约我国煤炭行业生产发展。突水事故发生的主要原因是开采条件、岩石力学、水文地质等诸多复杂因素综合作用,其中矿井不同水层的水化学成分能够有效反映对应水层的本质特征,地下水化学成分的迁移、集聚与分散都与水层环境变化有着密切联系[1],因此水源判别技术成为了近年来煤矿开采突水预警的重要技术之一,在煤矿灾害防治工作中起到重大作用。

近年来,对煤矿突水预警机领域研究方法较多,如数值模拟法、主成分分析法、熵值法、灰色系统法、神经网络法等。姜谙男[2]等提出运用最小二乘支持向量机原理进行矿井突水煤层底板突水量的预测,提高了传统支持向量机对煤层底板突水量的预测准确率;陈红江等[3]利用距离判别分析法对底板突水量进行有效预测;吕纯[4]运用Elman 神经网络算法对谢一矿地下进行水化学特征分析及突水水源判别,实现人工智能在煤矿防控领域的突破性进展;李红梅等[5]建立Bayes 判别分析模型对煤层底板突水危险性进行有效评价,对矿井水害进行有效防控;刘德旺[6]通过概率模型建立突水系数法对回坡底煤矿奥灰突水危险性进行评价;徐星[7~8]等利用神经网络的强泛化性特点进行矿井水源的判别,改进的提出粒子群算法优化的BP 神经网络算法与改进的Elman 神经网络进行突水水源的判别,有效推动煤矿水害防控工作。但不同的研究方法存在一定的局限性,如传统前馈式神经网络的鲁棒性较弱,训练过程的权值阈值对数据变化非常敏感、距离判别法的高度线性导致非线性关系难以发掘等问题。针对上诉问题,Huang 等[9,17]提出的极限学习机(Extreme Learning Machine,ELM)方法可以有效提高神经网络的计算效率,解决传统网络的训练缺点,实现神经网络在工程应用领域的重大突破。

ELM 是一类具有快速学习能力的单隐含层神经网络算法,其学习方式基于最小二乘法思想,克服传统神经网络的反馈式误差更新低效等缺点。但在建立ELM 模型时初始权值阈值随机确定使得最小二乘法得到的最终权值阈值有较大差异,从而导致ELM 模型的隐含层输出矩阵随着训练样本不同而产生较大差异。为了解决上述问题,本文引入GWO(Grey Wolf Optimizer)灰狼算法[10,16]进行极限学习机算法(ELM)的优化改进,将模型误判率作为目标函数运用GWO 灰狼算法优化ELM 的初始权值阈值,提出一种改进GWO-ELM 算法进行矿井水源识别,为高效判断突水水源提供理论依据,进行有效的煤矿水害的防控。

2 基于GWO改进极限学习机算法

2.1 极限学习机算法概述

极限学习机是一种特殊的单隐层神经网络算法。相对于传统的神经网络尤其是单隐层前馈神经网络其不同之处在于学习的方法不同[17]。传统的前馈式神经网络算法是通过梯度下降法利用反向传播的方式迭代来更新权值和阈值,而ELM 极限学习机则是通过增加隐层节点的个数来达到精确学习的目的,隐层节点的个数一般根据样本的个数来确定,由于许多前向神经网络中,默认最大的隐层节点的个数就是样本数,因此无需通过迭代即可达到精确非线性拟合的效果。

设输入层与隐含层间的连接权值矩阵w 、隐含层神经元与输出层神经元的连接权值矩阵β 分别为

其中wij为隐含层第i 个神经元与输入层第j 个神经元xj的连接权值,βik为隐含层第i个神经元与输出层第k 个神经元的连接权值。同时,假设单隐含层神经元阈值向量b 为

则由则极限学习机ELM 得到的输出神经元y的拟合统一表达式为

其中g(x)为选定函数,称之为网络激活函数。一般原理选择:

为了计算仿真模型的输出函数,我们需要将训练集输入网络进行训练拟合,设含有q 个训练集样本的输入矩阵X和输出矩阵Y分别为

用向量wi表示神经结构中单隐含层第i 个神经元与输入层神经元的连接权值向量,向量xj表示第p 个训练样本的输入层神经元向量,即

设置该神经结构中的神经元激活函数为

对于一个有l 个隐含层节点的神经结构模型,H 假设为极限学习机ELM 的单隐含层输出矩阵,自变量与权值的内积,则ELM 神经元的输出矩阵H可以表示为

设该样本训练集的输出神经元函数为t,则将所有输出函数排成矩阵构成网络输出矩阵T,T 的结构简单表示如下:

其中T′表示矩阵输出矩阵T的转置。

2.2 GWO灰狼算法对ELM的改进过程

GWO灰狼算法由Mirjalili等于2014年[10]提出,该算法以系统化、层次化思想、递进化思想与导向随机思想为基本框架,是一种基于灰狼的狩猎生存特点而提出的一种新型群体智能算法。相关研究[10,16]表明该算法的优化性能高于一般群算法,具有简单和高效等特点。

GWO 灰狼算法分为狩猎、围捕、攻击三大主要步骤[10,16]。灰狼的狩猎过程首先进行目标包围,该步骤的数学公式为

其中t 为当前的群体更新的迭代数,A 和B 为系数向量;Xp为全局最优解向量,表示目标猎物所在的空间位置;X 为优化问题的潜在解向量,表示灰狼狩猎过程所在的空间位置。A 和B 的运用群算法中动态搜索的改进思想进行更新,计算方式表示为

其中a(t)的值随迭代数t 的增加从2 递减到0,r1和r2为[0,1]内的随机向量。

在锁定猎物进行包围后灰狼开始进行围捕,该过程的灰狼分为4个等级α、β、δ、ω进行不同层次的围捕行为。搜索单位ω依照根据当前最佳搜索单位α、β、δ进行更新,α、β、δ 3个等级对应的搜索单位灰狼围捕方式为

其中搜索单位λ=α、β、δ,X(t+1)为更新后的潜在最优解向量。

灰狼算法的最后阶段是攻击,在进行猎物围捕后灰狼开始抓获目标猎物,即搜索到GWO 算法获得最优解。该过程的灰狼行为构建通过式a(t)的线性递减来实现。对灰狼算法进行改进,在猛狼围攻行为中取消狼群定位的判定距离,提出多维围攻半径的概念,并依据狼群更新的位置此判断子代狼是否转入围攻行为,提高灰狼的全局搜索能力与收敛速度。

改进灰狼算法优化ELM 极限学习机的思想是初始化灰狼算法的参数,通过极限学习机算法随机给定的初始权值阈值训练,通过误差反馈调整灰狼更新的空间位置,使得灰狼的适应度值不断优化,直到获得符合条件的全局最优解,即ELM 模式识别的最优权值与阈值,形成最优的识别模型。简要步骤为

Step 1 参数初始化。随机设定灰狼坐标参数与位移参数,随机设定极限学习机的网络权值与阈值。

Step 2 计算训练误差与猎物搜索。通过计算初始ELM 训练的网络进行仿真误差或误判率的计算,将最低误判率的网络对象作为猎物进行灰狼围捕。

Step 3 网络权值阈值更新。根据灰狼的猎物围捕进行网络初始权值阈值更新,通过ELM 的计算方式重新训练网络的权值与阈值。

Step 4 迭代更新。将新的网络作为新的猎物对象进行灰狼围攻,返回2),如果得到更新的网络仿真误判率低于前一代网络误判率,则进行3),否则回到2)。当误判率低于设定值或迭代次数达到最大值则停止更新。

Step 5 将最终得到的网络结构进行矿井水源判别,进行有效的煤层底板突水水源识别。

3 矿井突水水源识别方法应用

本文选取的研究对象是位于安徽省淮南市的顾北矿区。顾北矿区主要含水层按照自上而下的顺序有第四系石炭系裂隙岩溶含水层、第四系孔隙潜水含水层、奥陶系碳酸盐岩溶岩含水层、二叠系灰岩含水层,其中第八层灰岩含水层、第二层灰岩含水层、奥陶系碳酸盐岩含水层为底板的主要含水层。第八灰岩层厚6m~8m,水压高,富水性强,多次发生突水;第二灰岩层厚12m~20m,水压高,富水性强,导水性强。在地下开采过程中,井下开采时二灰层的岩层水往往依靠垂向导水断层涌入矿井造成大型矿井突水灾害。来自煤层底部的奥陶系碳酸盐岩因其富水性强、水压强度高而对煤矿开采构成最大威胁,多次发生大规模突水事故。因此,在开采第四系孔隙潜水含水层与石炭纪裂隙岩溶含水层时,若采样水的大部分组成来自于奥陶纪碳酸盐岩溶含水层等低含水层,则发生矿井水害的可能性较大[12~15],对采矿人员的生命财产造成严重威胁。

在GWO-ELM 水源判别的过程中,将第四系孔隙潜水含水层、二叠纪灰岩含水层、石炭纪裂隙岩溶含水层和奥陶纪碳酸盐岩溶含水层分别作为第一层水源、第二层水源、第三层水源与第四层水源进行模式识别。含水层中水化学成分多,针对离子对于不同水源的差异性问题以及不同水源数据的有效性问题,根据有关文献[7~8]选取(Na++ K+)、Ca2+、Mg2+、Cl-、SO42-、HCO3-共6 种不同离子(组)的浓度(dB/L-1)作为GWO-ELM 模式识别的样本数据,样本数据如表1所示。

依据ELM 理论,输入样本共有6 组向量,因此隐含层节点数设为6;由于不同离子的度量差异较大,根据统计学原理将原始数据进行最小归一化处理后作为神经网络的训练数据源,即将样本水化学源数据的每一个指标数据xij按照公式:

进行归一变换。不失一般性,每一次ELM 更新训练的输入矩阵由随机选取的70%样本矩阵构成,将剩下30%的样本数据作为回判样本进行误判率的计算。为了增强网络的鲁棒性在训练样本进行±噪声处理,使最终训练得到的网络权值与阈值稳定性提高。将GWO 的迭代上限设置为500 次,将训练结束后的网络作为矿井突水水源判别模型,随机选取未训练的样本水源进行回判验证。实验数据共计25组,计算结果如表2所示。

表1 顾北矿区不同水层样本数据

根据回判验证结果,25 项随机样本中传统ELM 错判8 项,判断正确率为68.5%;GWO-ELM 错判3项,判断正确率高达92.3%,较传统判别方法判别准确率高20 个百分点,将矿井水源的判别结果进行图1可视化分析。

表2 回判计算结果

图1 回判结果可视化

将不同的ELM 算法的水源判别结果与实际水源进行比对,根据比对图可知传统ELM 对第2、3层的判别准确率最低,GWO-ELM 算法对第4 层水源判断完全正确,第2、3 层同样存在误判对象,因此第2、3层水源的判别准确率仍然可以提高。

将GWO 的迭代过程进行图2 可视化分析,分别计算每一代的灰狼集体平均误判率与头狼最低误判率,训练的最低误判率在480 代后收敛于5%以内,平均误判率随着代数振幅不断缩小,整体呈下降趋势,说明GWO 对ELM 的权值阈值更新具有高效性。能够有效利用于矿井突水水源判别。

图2 GWO-ELM算法轨迹

4 结语

本文以顾北矿区不同水层的水源样本作为实验对象,按照改进灰狼算法的优化方式对ELM 极限学习机算法进行改进,建立改进GWO-ELM 算法对样本水源进行预判,将水化学指标作为网络输入向量,对应水源层为输出向量,通过GWO对网络初始权值阈值的更新迭代有效得到适用于矿井突水水源判别的单隐含层神经网络模型,解决了矿井水源判别的低效率、低准确率突破等问题,提高了神经网络结构的稳定性与鲁棒性,实现了机器学习在煤矿安全领域的实质性,对煤矿灾害防治工作中起到重大推进作用。

猜你喜欢
突水学习机灰狼
警惕平板学习机骗局
基于多变量的太灰含水层突水风险性分类判别研究
“机”关
灰狼和山羊
谷谷鸡和小灰狼
灰狼的大大喷嚏
灰狼照相
承压水上采煤断层活化突水的数值模拟分析
从学习机到上网本