回采工作面瓦斯涌出量预测模型

2022-03-06 08:52邵良杉
关键词:瓦斯工作面神经网络

邵良杉,王 振

(辽宁工程技术大学 系统工程研究所,辽宁 葫芦岛 125105)

0 引言

瓦斯是煤矿安全的主要隐患之一,中国瓦斯事故占到煤矿事故的80%以上.准确预测瓦斯涌出,不仅是瓦斯防护和治理、煤矿通风系统设计的重要基础[1],也为矿井高质量生产提供了安全保障.随着工业化、信息化的发展,机械程度不断提高,矿井开采深度不断增加,工作面的产能加重,随之带来工作面瓦斯涌出量的上升,制约着煤矿的安全生产和经济效益[2].因此研究一种瓦斯涌出量的预测模型显得极为重要.

近年来,许多学者针对瓦斯涌出量预测进行了研究.吕伏等[3]提出将主成分分析法应用于采掘工作面瓦斯涌出的多步线性回归预测中.万仁宝等[4]将灰色系统与神经网络相结合,在小信息量的情况下做出准确预测.付华等[5]通过优化粒子群和Elman神经网络的权重和阈值建立绝对瓦斯涌出量预测系统模型.施式亮等[6]通过分解瓦斯实时涌出数据,通过粒子群算法优化支持向量机(SVM),利用优化过的SVM预测多个本征模函数,并对结果进行累加从而得出瓦斯预测值.温廷新等[7]运用灰色关联和因子分析对指标进行分析提取,利用量子遗传算法对最小二乘支持向量机进行了优化,建立了煤与瓦斯突出预测模型.林海飞等[8]为提高煤层瓦斯含量预测的科学性及准确性,提出基于粒子群优化误差反向传播神经网络的瓦斯含量预测模型.

以上研究存在一定局限性,瓦斯涌出情况多变且不稳定,传统预测方法的预测结果与实际情况相差较远,因此需要更为优化的预测方法.本文采用因子分析去除数据相关性并浓缩数据的优点,运用改进遗传算法,对BP网络进行优化,建立预测回采工作面瓦斯涌出量的优化模型,并通过对实测数据进行预测和误差分析验证该模型的准确性.

1 因子分析及IGA-BP理论

1.1 因子分析原理

因子分析(factor analysis,FA)通过研究变量之间的内部依赖性,对具有错综复杂关系的变量进行简化.因子分析依据其运算出发点的不同可以分为两类,即R型与Q型,前者以相关系数矩阵作为基础,而后者则是通过相似系数矩阵实现[9],本文采用R型因子分析.

设p个变量Xi(i= 1,2,… ,p),待观测变量通过m(m<k)个两两正交的公共因子F= [f1,f2,… ,fm]T表示,其数学表达式为

式中,每个变量都是标准化的变量,iε为特殊因子,满足E(εi) = 0,作用于其对应的Xi(i=1,2,… ,p)变量;αij为Xi在fj上的负担承载,与fj和Xi的关系的强弱成正比.模型的矩阵形式表示为

式中,Λ为公共因子F的负载矩阵;F为通过因子载荷矩阵找出,其运算过程可以转化为

式中,R(X)*= cov(X)-cov(ε),若ε未知,可用R(X)代替R(X)*.可证明,就是一个解,其中α1=α11+α21+ … +αk1,λ1是ΛΛT的一个特征根,1b是对应的征根1λ的任意一个模为1的特征向量,记;则可证也是所求.同理可求α3,… ,αm.进一步解因子值,可得R为X的相关系数矩阵,令βj=R-1αj,通过Fi=Xβj计算,得到公共因子值.

1.2 改进遗传算法

近年来,遗传算法[10](genetic algorithm,GA)应用广泛,但在应对局部搜索时,有大概率陷入“早熟”的问题,影响其收敛性.针对该问题,对GA算法改进(IGA算法),方法如下.

(1)选择每个交叉和突变产生的个体,并将交叉概率Pc和突变概率Pm设置为固定值,不随环境变化而变化.

式中,f ′为交叉染色体中较大的适应值;为种群中平均适应值;fmax为最大适应函数值;δ为最优的个体的适应函数值同种群的平均适应函数值之间的差值;f为个体的适应度函数值.

在交叉和变异动态调整的过程中,为了避免算法较早地收敛到局部最优值和个体的过度繁殖,染色体的适应度函数值的极大值要无限趋近或等于最大适应度函数值的中间值.

(2)在遗传算法初期确定适应度函数时,通过探究其优化惩罚系数γ,惩罚函数设计达到最佳效果.其极值问题为

式中,f(x)为适应度函数;x为待求解函数g(x)的一个可行解;γ为惩罚系数;hi(x)为松弛变量,i=1,2,… ,m.

对惩罚系数γ进一步优化为

式中,t为迭代次数,当t较小时,γ接近于γmax,保证了算法的全局搜索能力;随着t的增大,γ以非线性减小,从而保障了算法的局部求解能力.

2 模型设计及数据分析

2.1 基于IGA的BP神经网络流程

IGA-BP算法步骤如下.

步骤1BP神经网络赋初值,设定网络各层神经元个数,设置网络参数,完成网络连接权值和阈值的初始化.

步骤2对GA进行优化,初始化IGA的种群,设置IGA参数.

步骤3提供相应的BP神经网络的学习模式.

步骤4计算适应度函数.选择均方差来作适应 度函数,为

式中,M为训练样本总数;kjy为第k个样本第j个网络输出节点的理论输出;为第k个样本第j个网络输出节点的实际输出;C为网络样本的数目.

步骤5染色体解码.

步骤6群体评价.

步骤7染色体选择.将评价结果进行比较,选择性能优秀的染色体进行下一步操作.

步骤8染色体交叉.

步骤9染色体保留.

步骤10在BP神经网络中,利用IGA对其中的权值、阈值进行优化,同时导入到BP算法中以初始值进行训练,并根据训练结果进行权值和阈值的调整.如果达到预定的误差要求,则停止迭代,输出最终值,否则进入步骤3.

2.2 参数选取及相关性分析

经过实际现场调研及相关资料的参考,选择12个因素作为回采工作面瓦斯涌出量的主要影响因素[11]:原始瓦斯量X1、煤层埋藏深度X2、煤层厚度X3、倾角X4、工作面长度X5、推进速度X6、采出率X7、临近层瓦斯量X8、临近层厚度X9、临近层间距X10、岩性X11、开采深度X12.

参照文献[12]提供的某矿18组回采工作面瓦斯涌出量数据,对以上提及的12个因素进行Pearson相关性的分析.Pearson系数及Sig.(2-tailed)检验结果表明:煤层倾角、工作面长度、临近厚度、临近层间距与其他8个指标之间的t值的显著性概率p大于0.05,相关系数不异于0,相关性较弱.原始瓦斯量、煤层埋藏深度、煤厚、推进速度、采出率、临近层瓦斯量、岩性、开采深度这8个指标t值的显著性概率p小于0.05,可见相关系数显著异于0.故而变量的关联性较强,可以降维.

在12个主要因素中提取8个高度相关的指标并对其进行因子分析,从而得到少数公共因子,实现对回采工作面瓦斯涌出量的影响因素降维.为保证指标选取的可靠性,通过KMO值和巴特利球体检验对8个高度相关的指标检测:样本KMO值为0.8大于0.6,属于允许域;巴特利球度检验近似卡方为164.193,显著性概率p为0.000,小于0.05;可知在各个指标数据间具有一定的相关性并能够进行因子分析.

3 瓦斯涌出量预测模型

3.1 实验数据选取

将实测数据中原始瓦斯量、煤层埋藏深度、厚度、推速、采出率、临近层瓦斯量、岩性、开采深度8个指标作为因子分析的变量,采用SPSS软件对回采工作面瓦斯涌出量的影响因素进行回归分析,在分析方法上,采用主成分提取法,得出公共因子碎石图,见图1.

图1 公共因子碎石图Fig.1 common factor scree plot

由图1可以看出,前2个成分的特征值有较为明显坡度变化,而自第3个成分的特征值开始,其变化幅度快速地趋于稳定.由碎石准则[13]可见,所取的两个公共因子能够更加明显地实现对原变量方差的解释.

总方差解释见表1.由表1可知,第一和第二个公共因子的方差累积贡献率达到91.137%,包含了总数据的大部分信息.提取2个公共因子f1和f2.参数空间的维数由原来的8维降至2维后,消除了冗余,算法的泛化能力得以增强.

表1 总方差解释Tab.1 total variance explained

所选取的初始因子具有过强的综合性,故需对所取因子做一定处理从而降低初始因子的综合性.本文选用正交旋转的方法,由旋转成分矩阵(表2)可得,公共因子f1由原始瓦斯量、煤层埋藏深度、厚度、推速、采出率、开采深度构成,公共因子f2由临近层瓦斯量、岩性构成.以回归法实现因子值计算过程获得因子得分矩阵表见表3.

表2 旋转成分矩阵Tab.2 rotated component matrix table

表3 成分得分系数矩阵Tab.3 componentscore coefficient matrix table

3.2 实验数据处理

由于煤层倾角X4、工作面长度X5、临近厚度X9及临近层间距X10与另外8个变量之间的相关性较弱,因此将煤层倾角、工作面长度、临近厚度、临近层间距,以及所选取的2个公共因子作为IGA-BP神经网络的特征因子.为便于数据处理,加快训练网络的收敛速度,对数据进行规范化[14],本文采用Z-score归一化方法对其他指标数据进行处理,部分数据见表4.

表4 回采工作面瓦斯涌出量相关数据Tab.4 data about gas emission quantity of working face

3.3 FA-IGA-BP神经网络预测

(1)参数设置

瓦斯涌出量预测结果准确性与BP神经网络隐含层节点数目息息相关[15-16],节点数过少将引起网络训练次数增多,训练结果的精度也会随之下降;网络节点数目过多会延长训练时间,使网络过拟合化.为解决这类问题,需要设计者进行反复实验和依据自身的经验来确定[17].本文借鉴“试错法”的思想,由式(9)、式(10)和式(11)求BP网中隐含层神经元的个数,试验系统的训练结果,进而确定较优的BP网络拓扑结构.

式中,m为隐含层的节点数;n为输入层的节点数;l为输出层的节点数;α为1~10之间的调节参数.结合实验数据情况,选取BP神经网络隐含层节点数区间为[3,13],测试隐含层节点从3到13的仿真误差,对其拟合后的数据特征进行比较,结果见表5.

表5 隐含层节点数目测试结果Tab.5 test results of hidden layer nodes

由表5可知,隐含层节点数为13时,3次重复实验均具有明显优越性,故选定隐含层节点数为13.

选择1~15组数据作为网络的训练集,16~18组数据作为网络的测试集,并在Matlab R2016b中建立基于FA-IGA-BP算法的回采工作面瓦斯涌出量预测模型.BP神经网络拓扑结构为“6-13-1”,即网络包含6个输入节点、13个隐含层节点和1个输出层节点,传递函数为{'logsig','purelin'}.训练算法采用标准梯度算法trainlm,训练目标为0.00001,学习速率为0.3,训练次数为6000.IGA每个种群的维数为105×(6×13+13×13+1),其余参数设置:群体大小为20;最大允许迭代次数为1000;最大权值ωmax为0.9;最小权值ωmin为0.4;迭代次数为 1000;交叉概率Pc1为0.4、Pc2为0.9;变异概率Pm1为0.01、Pm2为0.1;δ为0.001.

训练集经过训练后,IGA算法的适应度值可以达到3.38×10-6,收敛性能和精度都较高.从进化的过程中可以看出,IGA对BP神经网络的训练是良好的,可以得到一系列适用于回采工作面瓦斯涌出量预测的最优权值和阈值,数据见表6.

表6 IGA得到的最优权值和阈值Tab.6 optimal weights and thresholds obtained by IGA

(2)预测结果分析

采用回代估计方法得到训练集瓦斯涌出量的预测值,并与实测值比较[18-19],见图2.预测相对误差见图3.由图3可知,模型训练集的相对误差均小于5%,证明该预测模型具有良好的预测准确度.

图2 训练样本瓦斯涌出量预测值和实测值对比Fig.2 comparison between predicted value and measured value of gas emission in training samples

图3 训练样本预测值相对误差Fig.3 relative error of training sample prediction values

测试样本中预测值与实际值的对比见图4.由图4可知,模型对瓦斯涌出量的预测精度良好.

图4 测试样本瓦斯涌出量预测值与实测值对比Fig.4 comparison between the predicted value and the measured value of the gas emission of the test sample

选取5种预测模型进行对比分析,结果见表7,可知,基于FA-IGA-BP神经网络模型的预测结果与实际的情况更为吻合.样本16的相对误差虽然高于IGA-BP神经网络模型,但误差在可接受的范围内.FA-IGA-BP模型最大相对误差为3.794%,平均误差为2.945%,低于IGA-BP模型的3.338%、GA-BP模型的5.007%、GA模型的6.271%、BP模型的6.179%.

表7 瓦斯涌出量预测结果及误差Tab.7 prediction results and error comparison of test samples

平均相对变化量EARV可以用来表示神经网络的泛化能力,值越小泛化能力越强,计算公式为

式中,Y(i)、y(i)、分别为实际值、预测值和平均值.

通过计算得到FA-IGA-BP神经网络模型的平均相对变化量为0.0137,低于IGA-BP神经网络的0.0228、GA-BP神经网络的0.0405、GA模型的0.0823、BP模型的0.0554,表明该模型的泛化能力较强.

此外,均方根误差ERMSE具有对预测值中的异常误差反应敏锐的特点[20],能良好地反映预测的准确程度,计算公式为

式中,Y(i)为实际值;y(i)为预测值;n为预测值个数.

利用均方根误差公式计算得出,FA-IGA-BP模型的预测均方根误差20.050%,而IGA-BP模型的预测均方根误差为25.800%,GA-BP模型的预测均方根误差为34.442%,GA模型预测均方根误差为40.898%,BP模型均方根误差为40.604%,说明基于FA-IGA- BP神经网络模型的预测更加准确.

4 结论

(1)综合选取影响瓦斯涌出量的12个因素,应用因子分析对相关性较强的8个影响因素进行因子分析,提取出两个公共因子f1和f2,有效减少判别因子之间的数据冗余,使算法的泛化能力得到增强.

(2)通过改进遗传算法(IGA)对BP神经网络的权重和阈值进行寻优,优化神经网络结构及算法的全局收敛性,建立最佳预测模型,选用实测数据进行预测分析,同时与其他预测模型对比.结果表明,FA-IGA-BP模型的预测准确度较高,最大相对误差为3.794%,平均误差为2.945%,能满足回采工作面瓦斯预测的工程需求.

(3)选取的瓦斯涌出的影响因素还存在一定的局限性,对人为影响因素的选取及分析较少,下一步工作需要全面分析影响瓦斯涌出的因素,进一步提高预测的准确性.

猜你喜欢
瓦斯工作面神经网络
冲击地压矿井综采工作面同时相向回采可行性分析
中天合创门克庆煤矿3103智能化工作面
多工作面隧道通风技术
神经网络抑制无线通信干扰探究
11采区永久避难硐室控制瓦斯涌出、防止瓦斯积聚和煤层自燃措施
基于神经网络的中小学生情感分析
高瓦斯矿井防治瓦斯异常涌出措施的应用
基于神经网络的拉矫机控制模型建立
煤与瓦斯突出防治技术途径探讨
基于支持向量机回归和RBF神经网络的PID整定