基于CS-LSTM的工作面瓦斯浓度智能预测研究

2022-09-26 08:08梁运培栗小雨李全贵毛树人郑梦浩李建波

矿业安全与环保 2022年4期

梁运培，栗小雨，李全贵，毛树人，郑梦浩，李建波

(1.煤矿灾害动力学与控制国家重点实验室，重庆 400044；2.重庆大学资源与安全学院，重庆 400044)

智能化矿山建设是一个多系统、多层次、多技术、多专业相互融合的复杂的系统工程，是保障煤炭行业安全快速高质量发展的必由之路[1]。矿井瓦斯浓度监测是瓦斯事故预防的重要手段之一。瓦斯浓度是一种随时间变化的时序数据，在时间上具有天然的连续性[2]，挖掘其时变规律，预测其变化趋势，对煤矿瓦斯事故的预防具有重要意义[3]。

目前，瓦斯浓度的预测方法主要包括两类：

1)基于统计学的预测方法，如支持向量机模型(SVM)[4]、支持向量回归算法(SVR)[5]、最小二乘支持向量机模型(LS-SVM)[6]、自回归积分滑动平均模型(ARIMA)[7-8]、灰色预测模型[9]，以及统计学方法集成学习的预测模型[10]。该类模型结构简单、构建方便，但由于瓦斯浓度数据具有动态、高度非线性的特点，该类方法难以充分挖掘其隐含特征。

2)基于深度学习的预测方法，如基于循环神经网络(RNN)的预测模型[11]、基于LSTM的预测模型[12-13]、基于门控递归单元(GRU)的预测模型[14]、基于双向门控递归单元神经网络(Adamax-BiGRU)的预测模型[15]，以及与全连接神经网络(FC)相结合构建的LSTM-FC瓦斯浓度预测模型等[16]。

基于深度学习的预测模型可对瓦斯浓度时序数据进行更深入的挖掘学习，但存在模型最佳参数需依靠经验调整的弊端，无法确保预测精度。针对这一问题，MA X L等[17]提出了基于GA优化灰色神经网络(GNN)参数的瓦斯浓度预测方法；贾澎涛等[18]利用粒子群优化算法(PSO)对卷积神经网络(CNN)和Adamax优化的BiGRU相结合的瓦斯浓度预测方法。前人的研究提高了瓦斯浓度的预测精度，但尚未取得令人满意的结果。究其原因，在于优化算法的选择，部分优化算法存在易陷入局部最优的缺点，难以确保寻优的有效性。而CS算法与GA、PSO算法相比，具有参数少、易实现、搜索路径优、寻优能力强的特点。目前基于CS算法优化的模型已应用于电力系统优化调度[19]、短期电力负荷预测[20]等电力领域，此外，在心电图心电信号识别分类[21]、发动机故障诊断[22]等方面也有应用研究。上述应用研究证明CS搜索算法是一种有效的模型寻优算法，但其在瓦斯浓度预测方面的应用鲜见报道。

笔者针对瓦斯浓度监测数据在时间维度上存在的变化特性，通过CS搜索算法对LSTM模型超参数进行寻优，构建出最优的CS-LSTM瓦斯浓度预测模型，提高了瓦斯浓度的预测精度，旨在提高煤矿瓦斯安全态势的预判能力。

1 瓦斯浓度监测数据获取及特征分析

瓦斯浓度可直观反映工作面的瓦斯情况[23]，其井下获取过程及用途如图1所示。

图1 工作面瓦斯浓度数据获取过程及用途

由煤矿开采环境及作业工序的复杂性分析可知，工作面瓦斯浓度的变化具有以下特征：

1)周期性。瓦斯浓度受到井下多种因素的影响，存在着周期性的变化规律，且在大多数周期内，其变化幅度相似。通过机器学习瓦斯浓度周期变化特征，可用于预测其在下一周期的变化情况[24]。

2)趋势性。瓦斯浓度数据是一组随时间变化的时间序列，其变化在时间上具有趋势性，包括水平、上升和下降趋势。趋势性变化是预测的重要依据之一[25]。

3)波动性及高度非线性。井下复杂的开采条件，使瓦斯浓度监测数据具有较大的起伏波动，同时使其具备了高度非线性的特征。

瓦斯浓度的上述特征使得通过传统统计学方法或简单机器学习搭建的模型无法很好地学习其隐含规律，因此需要搭建合适的深度学习模型，以深入挖掘学习瓦斯浓度数据中存在的周期性及趋势性，分析其波动性特征，进而有效预测未来某段时间内的瓦斯浓度变化，提高煤矿瓦斯安全态势的预判能力，为工作面日常瓦斯监控监管工作提供决策支持。

2 数据处理及算法模型

根据瓦斯浓度时序性特征，以及监测数据的质量，利用样条插值法对瓦斯浓度的缺失值进行插补，以获得具有均匀时间间隔的监测数据。利用LSTM对瓦斯浓度进行预测，并利用CS对LSTM模型的层数、每层神经元的个数，以及全连接(Dense)层层数、Dense层神经元个数4个超参数进行寻优，从而探究具有最佳网格结构的LSTM预测模型，提升瓦斯浓度预测精度。

2.1 缺失值插补

由于井下复杂的环境条件，以及设备故障、通信故障等原因，瓦斯浓度实际记录数据常会存在缺失值，从而导致预测出现困难。基于样条插值法在对点源时间序列数据缺失值插补方面具备的优越性[26]，通过样条插值法可对瓦斯浓度时间序列数据缺失值进行补充。

样条插值法是通过可变样条做出1条经过一系列点的光滑曲线，从而将m个数据点划分为m-1个区间，之后求解每个区间段的多项式，以此求出位于区间内部的缺失值[27]，其求解过程基于以下原则：

1)曲线方程在节点处的值必须相等，即位于区间内部的点的值必须符合左右2个方程；

2)节点处的一阶导数的值必须相等；

3)第一个端点和最后一个端点必须过第一个和最后一个方程。

2.2 LSTM模型

LSTM网络通过门控制将短期记忆与长期记忆相结合，具备良好的长时序列数据处理能力。LSTM由多个重复的结构模块组成，每个结构模块均包含3个门：遗忘门、输入门及输出门。LSTM结构模块如图2所示。LSTM网络通过激活函数σ实现对3个门的控制，从而实现对历史信息的保留和遗忘。

图2 LSTM结构模块

LSTM预测模型主要包括三步：

1)由Sigmoid函数层决定的遗忘门层ft，计算公式如下：

ft=σ(Wf[ht-1,xt]+bf)

(1)

式中：σ为Sigmoid激活函数；Wf为遗忘门权重矩阵；h为神经元输出；x为神经元输入；t为当前时刻；t-1为上一时刻；b为偏置项。

2)增加状态量的输入门层it，可选择更新。计算公式见式(2)、(3)、(4):

it=σ(Wf[ht-1,xt]+bi)

(2)

(3)

(4)

3)输出层Ot计算公式如下：

Ot=σ(Wo[ht-1,xt]+bo)

(5)

ht=OttanhCt

(6)

式中Wo为输出门权重矩阵。

2.3 CS算法

CS算法是模拟布谷鸟寻巢产卵行为的一种寻求目标函数最优化问题的仿生算法，为了简化自然界中布谷鸟的繁衍习性，YANG X S等[28]将布谷鸟的产卵行为假设为3个理想状态：

1)布谷鸟1次只产1个卵，并随机选择鸟窝位置来孵化它；

2)在随机选择的1组鸟窝中，最好的鸟窝将会被保留到下一代；

3)可选择的寄生巢的数量是固定的，寄生巢主人发现外来鸟蛋的概率为P(0

CS搜索寻优过程中，布谷鸟根据Levy飞行规则进行巢穴的选择与更新。Levy飞行是一类非高斯随机过程，由长时间的短步长和短时间的长步长组成，其平稳增量服从Levy稳定分布。在飞行过程中，步长较小的短距离行走与偶尔较大步长的长距离行走相互交替，有利于增加种群多样性、扩大搜索范围，不至于陷入局部最优。

根据Levy飞行的巢穴更新公式如下：

Xt+1=Xt+α·L(λ)

(7)

式中：Xt、Xt+1分别为时刻t、t+1的巢穴位置；α为步长缩放因子；L(λ)为Levy随机路径；λ为步长规模参数。

采用Mantegna方法，生成服从Levy飞行的随机步长，如式(8)所示：

(8)

3 基于CS-LSTM的瓦斯浓度预测模型

3.1 CS-LSTM模型结构

CS-LSTM预测模型通过t-1时刻的瓦斯浓度数据，实现对t时刻瓦斯浓度的预测。CS-LSTM模型结构及预测流程如图3所示。

图3 CS-LSTM模型结构及预测流程

CS-LSTM瓦斯浓度预测步骤如下：

1)搜集整理原始数据，判断数据是否存在缺失值。若存在缺失值，则利用样条插值法对缺失值进行插补，然后利用最大—最小归一化法对数据进行无量纲化处理(见式(9))，之后得到一维瓦斯浓度时间序列。

(9)

式中：x*为归一化后的瓦斯浓度；x为单个瓦斯浓度。

2)搭建LSTM模型基础框架，设置LSTM预测模型评价指标为均方误差ems(MSE)。ems越小，表明预测模型准确度越高。ems计算公式如下:

(10)

3)利用CS算法对LSTM结构进行寻优。设置CS算法适应度函数F：

F=1/ems

(11)

设置CS算法的搜索参数、迭代次数等。

4)将CS算法最优参数组合输入LSTM模型中，完成预测并输出预测结果。

3.2 模型评估

选择平均绝对误差ema(MAE)、均方根误差erms(RMSE)与模型运行时间t作为预测模型的评估指标。其中，ema和erms越小，表明预测结果的精度越高；t越小，模型的预测速度越快。ema及erms的计算公式如下：

(12)

(13)

4 工作面瓦斯浓度预测

4.1 数据预处理

研究数据取自松藻矿区打通一矿采煤工作面生产数据，该工作面平均开采深度450 m，煤层厚度2.9 m，采用综采的方式沿倾向仰采，绝对瓦斯涌出量为5.44 m3/min。基于每间隔1 min取样、同一分钟取最大值的原则，共选取该工作面5 760组瓦斯浓度(CH4体积分数，下同)监测数据为原始样本。预处理过程如下：

1)根据实际开采情况，剔除未进行开采活动时的记录数据，将剩余共2 990组瓦斯浓度历史监测数据作为样本进行CS-LSTM模型的训练与预测。

2)利用箱线图方法对原始数据进行异常值识别。识别效果如图4所示，异常值识别结果见表1。

图4 箱线图异常值检测结果

表1 箱线图检测异常值

3)为验证样条插值法对于缺失值插补的有效性，假设第x个数据采集点为缺失值x=200i(i=1,2,…,14)，构造生成一个预处理数据序列，然后利用样条插值法对缺失值进行插补。插补后的数据与真实数据的ema为0.006 8、erms为0.008 7，验证结果表明样条插值法满足本文数据处理的需求。

将步骤2)中检测出的异常值视为缺失值并利用样条插值法进行插补，最后将数据按照8∶2的比例划分为训练集与测试集。

4)缺失值填充后，利用式(9)对数据进行无量纲化处理。

4.2 CS寻优

将搭建好的LSTM基础框架[i,j,nk,ml]输入CS算法中进行寻优。设置CS算法搜索空间维度最低为4，最高为8。设置种群规模为10，巢穴丢弃(发现)率P=0.25，L(λ)随机路径中β=1.5，步长缩放因子α=0.1，适应度函数为F=1/ems。

CS寻优最终结果为F=1 831.232 34，最优巢穴位置为[2,1,58,63,188]，即最佳LSTM模型网格结构为2层，其对应神经元个数分别为58、63，全连接层为1层，其对应神经元个数为188。

4.3 预测结果分析

4.3.1 优化效果分析

对比CS算法优化结果与GA算法寻优结果,以验证CS算法寻优的优势，结果如图5所示。

图5 CS-LSTM、GA-LSTM寻优结果

由图5可知，在相同的搜索步数下，CS算法搜索区间范围为[297.955 675，1 831.232 340]，GA算法搜索区间范围为[375.222 092，702.368 742]，即CS算法的搜索范围相较于GA算法更广，搜索区间更大。

GA算法的搜索结果区间变化小，数据分布比较均匀，其原因可能是陷入局部最优，而CS算法可以更好地避免这种现象。因此，基于Levy飞行CS算法具有更好的寻优性能。

4.3.2 预测效果分析

将最优超参数组合输入到LSTM模型中，对未来12 h的瓦斯浓度进行预测。应用CS-LSTM模型预测瓦斯浓度结果如图6所示。

图6 CS-LSTM模型瓦斯浓度智能预测结果

由图6可知，瓦斯浓度预测数据的拟合效果整体较好，但在极值点的拟合效果略差。原因可能是在极值点左右数值变化较大，存在突变的情况，因此其规律及特征更难以学习。未来需对极值点的预测精度进行改进。

将LSTM、GA-LSTM、CS-LSTM模型的预测结果进行比较，对比情况如表2所示。

表2 LSTM、GA-LSTM、CS-LSTM预测结果对比

3种模型的损失(Loss)曲线如图7所示。

图7 LSTM、GA-LSTM、CS-LSTM模型Loss曲线

由表2可知，在预测精度上，LSTM效果最差，GA-LSTM次之，CS-LSTM最佳。结合图7中3个预测模型的Loss曲线，LSTM模型损失函数值下降速度明显低于优化后的LSTM模型。CS-LSTM与GA-LSTM相比，Loss曲线下降速度稍快,但相差并不明显。结合表2和图7结果来看，CS-LSTM模型更胜一筹。

4.4 模型应用探讨

瓦斯浓度是煤矿安全监测监控系统的主要监测参数之一。在监测数据上传至地面中心站之后，可以利用CS-LSTM预测模型对下一阶段的瓦斯浓度变化曲线进行预测。随着监测数据的持续上传与分析预测，模型不断得到更新，若模型多次预测均显示某时间段瓦斯浓度变化存在异常，则系统提示异常信息并发出报警信号，同时结合生产实际提供可能的异常原因及解决方案，达到瓦斯智能治理的目的。

5 结论

1)提出了一种CS-LSTM的瓦斯浓度智能预测模型。通过对瓦斯浓度实时监测数据隐含规律的分析，预测工作面未来12 h的瓦斯浓度变化，实现了对工作面瓦斯浓度的智能预测。

2)针对高度非线性的瓦斯浓度监测数据，利用CS算法对LSTM预测模型的网格结构进行优化，以Levy飞行的方式更新巢穴位置，避免陷入局部最优的情况，相较于GA算法具有更好的优化效果。

3)CS-LSTM模型相对于LSTM及GA-LSTM模型，RMSE为0.023，其值最小，预测效果较好，能够满足矿井工作面瓦斯浓度智能预测的需求。