王居尧,王凯君
(潞安矿业集团公司,山西 长治 046204)
瓦斯涌出异常特征对煤矿瓦斯等灾害预警指标的研究具有极其重要的理论与实际意义。陈亮[1]对河南、贵州等地的矿井掘进期间的瓦斯涌出规律进行分析发现,掘进工作面瓦斯涌出受掘进速度、地质构造、瓦斯含量、煤层厚度及煤体强度等影响十分显著,导致瓦斯涌出表现出多种动态特征。目前,很多非线性的瓦斯涌出量预测方法得到应用,并且显示出了较好的性能。比如,神经网络法、灰色系统法、遗传规划法、基因表达式程序设计法[2]等。但是对于这种非线性系统预测问题,预测模型规模急剧增大,运行时间变长,而且瓦斯涌出量受到的影响因素多且具有一定的相关性[3],存在复杂非线性和大量扰动成分,导致输入信息存在重叠部分和无效的干扰成分[4],降低预测模型的准确度。
考虑众多复杂的影响因素最终的作用结果都会体现在综采工作面瓦斯浓度数据上,最后会形成一个具有时序性的随机过程,瓦斯参量时间序列信息必然按照其数据顺序和数据大小蕴含大量有关系统动态演化过程的痕迹和特征信息[5]。瓦斯参量时间序列中先前状态的信号特征必然包含其后续状态发展变化的趋势特征信息。近年来,很多学者已经把时间序列分析方法应用到矿井瓦斯相关参量的预测问题中,如王栓林等[6]对煤矿安全监控系统采集的瓦斯浓度序列进行分析,运用时间序列分析法建立了突出危险前兆信息获取模型;黄凯峰[7]提出了煤矿安全监测监控系统瓦斯浓度异常信号辨识算法,建立了安全监测监控系统瓦斯浓度异常信号模型。本文提出将核极端学习机(Extreme Learning Machine with Kernels,KELM)以及万有引力算法(Gravitational Search Algorithm,GSA)相结合建立瓦斯涌出量预测模型,在结合方式和算法方面进行了优化改进,提高预测模型的预测精度和预测效率,为瓦斯涌出量预测提供研究依据,为煤矿瓦斯灾害的防治提供新的方法,提高煤矿瓦斯灾害的防治水平。
核极端学习机网络因为引入了核函数,所以无需设定隐含层节点数,但是需要确定核函数,而核函数的参数对核极端学习机的性能有很大影响,核极端学习机不能自动设定核参数[8],需要人为设定,故本文采用改进的万有引力算法对核极端学习机的核参数进行寻优,以确保核极端学习机的性能最优。将核极端学习机与改进的万有引力算法相结合建立基于改进万有引力算法—KELM的瓦斯涌出量预测模型(IGSA-KELM瓦斯涌出量预测模型)。首先将输入样本作为KELM网络的输入量,然后采用改进的万有引力搜索算法对KELM网络的核参数和输出权值寻优,优化KELM网络的性能。
万有引力搜索算法(Gravitational Search Algorithm,GSA)[9-10]是受物理学中牛顿引力理论启发而提出的一种元启发式算法,具备全局优化能力强、流程简单易行等优点,在非线性问题的处理中更能凸显其优越性。万有引力算法会高效的搜寻到核极端学习机的最优参数,提高模型的预测精度和效率。但是其仍然存在易陷入局部极值和早熟收敛的缺陷,故本文对万有引力算法进行改进,以提高算法的寻优性能,满足瓦斯涌出量预测的需求。
极端学习机[11-12](Extreme Learning Machine,ELM) 是一种单隐层前馈神经网络 (Single-hidden Layer Feedforward Neural Networks,SLFNs),由Huang G.B等人在2004年用来解决回归问题时提出的,主要针对传统神经网络方法训练速度慢、反向感知机(Back Propagation,BP)网络效率低且易陷入局部极值等问题而提出的。把迭代求解隐层输出权值的方式变为求解线性方程组的方式[13],克服了传统机器学习算法的缺陷,提供更好的整体性能,更快地学习速度和更低的计算成本。KELM引入了非线性映射效果更好的核函数理论,具有更加强大的函数逼近能力,通过设定合适的核参数,能够提高算法的稳定性和识别率,具备更高的精度,更快地学习速度和更强大的泛化能力。
核极端学习机在极端学习机的基础上引入了核函数,虽然解决了极端学习机对隐含层节点数选择、初始权值和阈值设定的随机性等问题,降低了算法的不稳定性,提高了算法的预测精度和效率,但是核极端学习机也因此增加了对核参数的依赖性,只有选定合适的核参数才可以保证核极端学习机的稳定性和预测的精度及效率。本文采用改进的万有引力算法来优化核极端学习机,对核极端学习机的核参数和输出权值进行寻优,以提高本文建立模型对瓦斯涌出量预测的精度和速度。
万有引力算法模仿了物体间的万有引力作用,用于解决优化问题,主要包含四个特征属性:粒子位置、惯性质量、主动引力质量以及被动引力质量。粒子位置向量由所要寻优的参数构成,质量最大的粒子位置最好,即是所要寻优参数的最优解。
万有引力算法的流程如图1所示。
万有引力算法具备全局优化能力强、流程简单易行等优点,在实际问题中能得到很好的运用,在非线性问题的处理中更能凸显其优越性,已经成功应用于工程和其他领域的许多问题中,但是作为智能算法的一员,万有引力算法也存在易陷入局部极值和早熟收敛的缺陷。为克服上述缺点,采用反向学习机制(Opposition Based Learning, OBL)来初始化GSA的初始种群,使初始种群分布更加均匀,引入Tent混沌映射提高种群的多样性,促进GSA算法的探索与开发能力。
OBL生成初始种群的步骤如下:①确定初始种群个数为随机生成初始种群(即第一组候选解),计算每个个体的适应度值;②生成反向估计值,得到第二组候选解并适应度值;③将两组候选解按照个体适应度值的大小排序,取前个粒子构成问题的解空间,即GSA初始种群。
TENT混沌映射产生混沌序列步骤如下:①将种群迄今搜索到的最优解归一化到(0,1)区间内,令其等于初值x0,即k=0;②迭代产生混沌序列X,k自增1;③当达到最大迭代次数时则停止迭代,保存X序列;④将序列X反归一化载波到原解空间,得到新解;⑤比较新旧解的适应度值,留下性能更好的解。
目前,对于核参数和输出权值还没有具体且有效的设定依据,故采用改进的万有引力搜索算法来智能选取最佳的核参数和输出权值,对KELM神经网络进行优化,以保证模型预测的准确性。
将核极端学习机与改进的万有引力算法相结合建立基于改进万有引力算法—KELM的瓦斯涌出量预测模型(IGSA-KELM瓦斯涌出量预测模型)。首先将输入样本作为KELM网络的输入量,然后采用改进的万有引力搜索算法对KELM网络的核参数和输出权值寻优,优化KELM网络的性能。
基于改进万有引力算法—KELM的瓦斯涌出量预测模型的主要流程如下:①搜集整理数据,得到原始输入样本数据;②按照贡献率确定P个主成分,主成分个数P等于KELM网络的输入节点个数,初始化核极端学习机;③利用改进的万有引力搜索算法对KELM网络的核参数和输出权值进行寻优,将寻优结果映射到网络模型的核参数和输出权值;④将训练集作为KELM网络的输入训练核极端学习机;⑤计算网络误差,若满足条件,继续步骤⑥,否则返回步骤③;⑥将测试集输入到核极端学习机,进行测试分析。
采用某煤矿的实际数据(18个样本)进行实验分析。由于影响瓦斯涌出量的因素很多,这里选取了掘进工作面瓦斯绝对涌出量的13个影响因素,分别是煤层瓦斯含量(X1)、煤层深度(X2)、煤层厚度(X3)、煤层倾角(X4)、采高(X5)、工作面长度(X6)、推进速度(X7)、工作面采出率(X8)、邻近层瓦斯含量(X9)、邻近层厚度(X10)、层间距(X11)、层间岩性(X12)、开采强度(X13),将这些影响因素作为瓦斯涌出量的特征指标,用主成分分析法对这13个影响因素的样本数据进行处理,并结合改进的万有引力算法建立基于IGSA-KELM的瓦斯涌出量预测模型,实现对掘进工作面的绝对瓦斯涌出量Y的预测。部分实验数据如表1所示。
表1 瓦斯涌出量影响因素原始数据
表2 原始数据平均值和标准差
根据主成分分析的步骤,数据标准化处理后,要求出协方差矩阵及其特征根和特征向量,根据方差贡献率确定主成分。特征根的计算结果如表3所示。
表3 特征根计算结果
本文选取前五个主元作为KELM网络的输入向量。
网络模型共有三层:一个输入层,一个隐含层,一个输出层。上节根据主成分分析选定五个主成分,因此设定KELM网络有五个输入节点,分别对应五个主成分。KELM网络模型的目的是预测瓦斯涌出量,因此本文有一个输出节点,即瓦斯涌出量。将确定主成分后的18个样本的前15个作为训练集,后3个作为测试集。将15个训练样本及其结果输入到模型中进行训练,同时建立GSA-KELM和PSO-KELM瓦斯涌出量预测模型,将这三种模型进行比较,用测试样本来验证所建立模型的预测效果。
图2为三种模型的瓦斯涌出量预测值与实际值的对比曲线。
图2 瓦斯涌出量预测值与实际值对比
由图2可以看出,三种模型总体的预测都相对比较准确。但IGSA-KELM的预测结果更能逼近瓦斯涌出量的实际值,具有更好的拟合精度,而且IGSA-KELM神经网络预测模型的最小误差为0.02,最大误差为0.09,平均相对误差为0.01。因此,IGSA-KELM 神经网络预测模型能更准确地预测出掘进面绝对瓦斯涌出量,得到更高精度的预测结果。
针对瓦斯涌出量受其他因素的影响,并且存在着复杂的非线性关系,缺少相应的历史监测数据分析算法,难以发现参量发展变化趋势,用一般的线性模型很难准确预测,本文从瓦斯涌出量模型出发,进行基于时间序列的预测方法的研究,提出将核极端学习机及万有引力算法相结合,建立瓦斯涌出量预测模型,在结合方式和算法方面进行了优化改进,提高了预测模型的预测精度和预测效率,为瓦斯涌出量预测提供了新的方法。