李燕,南新元,蔺万科
(新疆大学 电气工程学院,新疆 乌鲁木齐 830047)
煤与瓦斯突出是煤岩体破碎后大量瓦斯向巷道空间快速涌出的复杂现象。随着煤矿开采的不断深入,煤与瓦斯突出发生的频率越来越高,是当前煤矿开采过程中的重大破坏性事故之一[1-2]。因此,快速准确地预测煤与瓦斯突出危险性,是保障煤矿安全生产的关键措施之一。
近年来,众多研究者从不同角度对煤与瓦斯突出的预测方法进行了探索。付华等[3]利用等距映射算法结合加权支持向量机(Support Vector Machine,SVM)对煤与瓦斯突出进行预测,提高了预测速度,但由于缺少对SVM 自身参数的优化,预测精度不高。Liu Haibo 等[4]针对SVM 预测煤矿工作面瓦斯突出分辨率低的问题,通过粒子群算法对SVM 的核参数进行优化,提高了预测精准度,但该算法容易陷入局部最优解,导致响应速度过慢。Wu Yaqin 等[5]为解决神经网络对煤与瓦斯突出预测性能低的问题,将神经网络与SVM 相结合建立煤与瓦斯突出预测模型,该模型比传统神经网络具有更好的预测性能,但数据量过大,导致训练速度缓慢。郑晓亮等[6]提出利用数据挖掘多重填补-SVM 算法预测煤与瓦斯突出,解决了数据严重缺失的问题,但该算法忽略了对主控因素的筛选,运算时间较长。韩永亮等[7]为提升极限学习机对煤与瓦斯突出预测的精度,将遗传算法与SVM 相结合,提高了预测准确度,但该算法的泛化性能不高,鲁棒性较差。
针对上述算法存在的缺陷,本文提出了一种改进灰狼算法(Improved Grey Wolf Optimizer,IGWO)优化SVM 的煤与瓦斯突出危险性预测方法。首先,利用灰色关联熵权法去除冗余数据,提取主控因素;然后,通过越界处理机制和嵌入莱维飞行的随机差分变异策略的结合对灰狼算法(Grey Wolf Optimizer,GWO)进行改进,利用IGWO 对SVM 的参数进行优化;最后,将主控因素输入到IGWO-SVM 中分类,实现煤与瓦斯突出危险性预测。仿真结果表明:与基于鲸鱼算法-支持向量机(Whale Optimization Algorithm-SVM,WOA-SVM)、灰狼算法-支持向量机(GWOSVM)和粒子群-支持向量机(Particle Swarm Optimization-SVM,PSO-SVM)的预测方法相比,基于IGWO-SVM 的预测方法具有更高的预测精度和更快的预测速度,预测准确率达到96.67%,预测速度为5.58 s。
熵权法是一种通过信息熵评价不同指标效用价值后进行赋权的方法[8]。指标的信息熵越小,其权重越高,在总体评价中的影响越大。因此,采用信息熵确定指标权重是判别不同指标是否具有效用价值的有效方法。熵权法计算步骤如下:
(1)假设有m个待评价项目和n个评价因子。建立原始判别矩阵,rij为第j(j=1,2,···,n)个评价因子下第i(i=1,2,···,m)个待评价项目的评价值。
正向因子公式为
逆向因子公式为
(3)原始判别矩阵标准化。标准化后的矩阵为
(4)确定评价因子的熵值Sj、熵权 ωj。
灰色关联度是分析各因素间变化趋势的一种方式。灰色关联度相比于其他理论,在小样本和信息不确定的研究上占据很大优势,它通过对比参考对象和比较对象变化曲线间的差别来衡量两者的相关程度[9]。灰色关联度的计算步骤如下:
假设有b个影响因素和e个参考对象。可列比较序列如下:,其中y为参考对象序号,k为影响因素序号,hy(k)为第y个序号中的第k个影响因素值。可列参考序列如下:,hy(0) 为第y个参考对象序号中的参考对象值。
(1)数据归一化处理。通过数据归一化处理降低各种因素间可能存在量纲不同而导致的差异性。
(2)求绝对差值。假设hy(0)和hy(k)在 第y个参考对象序号的绝对差值为 Δ,则。
(3)灰色关联度系数ξy(k)计算。
(4)灰色关联度计算。利用平均值法求解灰色关联度 γy。
实际上,每个指标在体系中占据的权重是各异的。如果采用常见的专家赋值法对权重进行确定,容易受到人为主观判别影响。因此,为能够更加精确地反映真实情况,使用灰色关联度时需要对各指标的权重进行科学合理计算,故本文在灰色关联度的计算上加入熵权,提出灰色关联熵权法,其计算公式为
GWO 利用4 种等级的灰狼通过不断更新当前位置,从而找到全局最优位置后对猎物进行围捕[10]。4 种等级的灰狼分别为领头狼 α、次级狼 β、第3 级狼δ和基层狼θ。GWO 主要包括以下步骤:
(1)包围猎物。当狼 α,β,δ发现猎物的位置之后,带领狼 θ展开对猎物的围捕,通过不断搜索去更新当前位置[11]。灰狼群体进行围捕的公式为
式中:D为猎物与灰狼之间的距离;Xp(t)为猎物在第t次迭代时的位置;X(t)为 灰狼个体在第t次迭代时的位置;A、C为系数向量。
式中:a为距离控制因子,在种群进行不断迭代时,其数值由2 线性递减为0;r1,r2为[0,1]区间内均匀分布的随机数;T为最大迭代次数。
当 |A|>1时,灰狼离开目前正在捕捉的猎物,去找寻其他更容易抓捕的猎物;当 |A|<1时,灰狼对当前猎物展开攻击。
(2)位置更新。在狼群包围猎物之后,狼 θ将会在狼 α,β,δ的指导下对猎物进行捕捉,直至最后捕获猎物,灰狼个体的位置会不断进行更新。
式中:Dα,Dβ,Dδ分别为灰狼个体与狼 α,β,δ的距离;Xα,Xβ,Xδ分别为狼 α,β,δ 所在位置;X1,X2,X3分别为狼 α,β,δ 对 θ 狼指导后更新的位置;X(t+1)为灰狼个体更新后的位置。
GWO 的主要灵感来源于狼群严格的社会领导层级和群体狩猎行为。领头狼 α是狼群狩猎活动的主要决策者,次级狼 β和第3 级狼 δ则 辅助 α狼作出决定,基层狼 θ负责执行狼 α,β,δ的决定并对猎物进行围捕。在GWO 的位置更新过程中,狼 α,β,δ对狼群个体引导能力是相等的,这样会造成狼群个体在寻优过程中易陷入局部最优和寻优速度慢的缺陷。为了改善该缺陷,本文引入越界处理机制和嵌入莱维飞行的随机差分变异策略对GWO 进行改进,提出了一种IGWO。
2.1.1 越界处理机制
目前GWO 对处于边界外的种群个体采用丢弃或者将其拉回边界的方法。如果使用丢弃方法处理越界种群个体,则会减少种群多样性;采用拉回边界方法处理越界个体,则会导致边界附近出现个体聚集的现象。为此,本文引入精英策略对越界灰狼的位置进行调整更新,可以使越界个体的位置向最优个体位置逼近,增加最优解的个数。
当当前 越界灰狼位 置X*≥Xmax或X*≤Xmin(Xmax为狼群位置的上限,Xmin为狼群位置的下限)时,越界灰狼的更新位置公式为
式中:L为当前搜索过程中适应度最好的个体与其临近个体间的欧氏距离;d为种群个体维数。
2.1.2 嵌入莱维飞行的随机差分变异
通过对GWO 原理分析可知,当前个体的位置在寻优过程中会随着最优个体的位置与自身距离的变化不断进行更新,即当前个体位置会越来越靠近最优个体的位置。用这种方法更新个体位置具有较大的缺陷:如果当前个体靠近的位置不是全局最优,而是局部最优时,会导致大量个体聚集在局部最优附近,将会造成算法未达到最优效果就停止收敛的现象。为解决该问题,本文吸取了莱维飞行的随机差分变异策略的优点,将嵌入莱维飞行的随机差分变异策略融合到GWO 中,该策略可以防止个体在更新位置时由于早熟收敛而陷入局部最优的问题,并且加快了种群收敛速度。
嵌入莱维飞行的随机差分变异计算公式为
式中:τ为[0,1]之间的随机数;X′为被随机选中个体的位置;Levy为莱维飞行步长服从重尾的指数概率分布。
Levy 服从参数为s的分布公式为
式 中:s为随机步长;µ为约束因 子;λ为调节参数,λ ∈(0,2],一般取 λ=1.5。
从图1 可看出,当种群迭代到第120 次时,IGWO就已经达到了最优适应度,而GWO,PSO 和WOA在种群迭代到最大次数时都无法达到最优适应度。IGWO 无论是在收敛速度还是收敛精度上都比GWO,PSO 和WOA 更优。从图2 可看出,IGWO 的收敛速度最快,当种群迭代到第50 次时就已经达到了最优适应度,具有很好的局部搜索和全局搜索能力。GWO 的收敛速度次之,当种群迭代到第180 次时达
利用正态分布对随机步长进行计算,计算公式为
式中v为约束因子,µ,v均服从与N(0,1)的正态分布为尺度参数。
式中 Γ为标准的Gamma 函数积分运算。
利用PSO,WOA,GWO,IGWO 4 种算法对单峰函数Sphere 及多峰函数Griewank 进行测试[12-14],验证IGWO 的优越性。选择单峰测试函数的原因是为了检验算法收敛快慢程度,而多峰测试函数则是为了验证本文算法是否会陷入局部最优。仿真测试参数设置如下:最大迭代次数为500,种群个数为30。对以上算法进行20 次仿真,获得的测试曲线结果如图1、图2 所示。到最优适应度;WOA 的收敛速度略微慢于GWO,当种群迭代到第230 次时才达到最优适应度,并且WOA 在种群迭代次数为50~150 时陷入了局部最优;对于PSO,当种群迭代到最大次数时也无法达到最优适应度,且该算法在迭代次数为120~250 时陷入局部最优。
图1 Sphere 函数优化曲线Fig.1 Sphere function optimization curves
图2 Griewank 函数优化曲线Fig.2 Griewank function optimization curves
由于SVM 的预测精度和学习能力直接受到核参数g和 惩罚参数c的制约。为提升SVM 的分类能力,本文采用IGWO 优化SVM 的核参数和惩罚参数。利用IGWO-SVM 与灰色关联熵权法结合对煤与瓦斯突出进行预测,预测流程如图3 所示。
图3 IGWO-SVM 预测流程Fig.3 Prediction process of IGWO-SVM
(1)利用灰色关联熵权法对影响煤与瓦斯突出的各因素按照熵权进行排序,筛选出主控因素,将其分为训练样本和测试样本,并进行归一化处理。
(2)算法参数初始化,在规定范围内随机产生狼群位置,即随机的g和c的初始值。
(3)将当前SVM 的预测精度作为适应度函数,以提高预测精度为优化目标,计算所有灰狼个体的适应度。
(4)对在边界外的狼群采用越界处理机制进行位置更新,对在边界内的狼群采用嵌入莱维飞行的随机差分变异策略进行位置更新。
(5)根据位置更新记录灰狼个体适应度,最优适应度灰狼个体分别为 α,β,δ。
(6)重复步骤(4)和步骤(5),直至达到最大迭代次数,输出适应度最优的灰狼位置作为SVM 的参数进行训练,然后用测试集进行煤与瓦斯突出预测。
煤与瓦斯突出是多种因素共同导致的一种非线性复杂动力过程[15]。根据煤与瓦斯突出机理的综合作用假说及相关文献的查阅[16-18]可知,煤层埋深的增加会伴随着瓦斯压力及瓦斯含量的增大,而瓦斯含量和瓦斯压力的增大会引起瓦斯放散指数增加,易导致煤与瓦斯突出危险性增强,故选择瓦斯压力、瓦斯含量及瓦斯放散初速度作为煤与瓦斯突出的影响因素。
煤的坚固性系数是煤体抵抗破坏能力的指标,其大小主要取决于煤的物理性质,煤的受破坏程度越大,坚固性系数越低,它是煤与瓦斯突出发生的重要参数之一,故选其作为影响因素。
随着开采深度的不断增加,煤体承受的地应力作用也会越强,进而导致煤体内部的瓦斯内能升高,煤层发生瓦斯突出的概率就越大,因此开采深度也是影响煤与瓦斯突出的重要因素之一。
由以上分析可知,影响煤与瓦斯突出的因素主要包括瓦斯压力(G1,MPa)、瓦斯含量(G2,m3/t)、瓦斯放散初速度(G3,mmHg)、煤的坚固性系数(G4)、煤的破坏类型(G5)、开采深度(G6,m)。
本文通过收集整理相关文献所列山西西坡矿、沙曲矿和寺河矿等矿井的样本数据[19-21],得到了90 组现场测试数据,部分样本数据见表1。依据煤与瓦斯突出危险性等级,可将其分为3 类:无突出危险、一般突出危险、严重突出危险,分别用1,2,3 表示。根据煤的破坏程度,可将其分为5 类:非破坏煤、破坏煤、强破坏煤、粉碎煤、全粉煤,分别用Ⅰ,Ⅱ,Ⅲ,Ⅳ,Ⅴ表示。
从表1 可看出,各个影响因素数据的量纲差异比较大,故需对其进行无量纲化处理。除此之外,为减少影响因素之间的数据冗余现象,应从样本数据中提取主控因素,进而提高预测效率。本文应用灰色关联熵权法对上述影响因素进行筛选,以突出危险性等级作为参考数列,以瓦斯含量、瓦斯压力等作为比较数列,运用Matlab 软件进行数值仿真,结果见表2。从表2 可看出,以上影响因素的关联度从大到小的排序如下 :开采深度(G6)>瓦斯放散初速度(G3)>瓦斯压力(G1)>瓦斯含量(G2)>煤的破坏类型(G5)>煤的坚固性系数(G4),关联度的顺序反映了影响因素对煤与瓦斯突出作用的强弱,关联度顺序越靠前,则相应的影响因素对煤与瓦斯突出的作用就越强。因此,本文选取瓦斯压力(G1)、瓦斯含量(G2)、瓦斯放散初速度(G3)和开采深度(G6)作为预测煤与瓦斯突出危险性等级的主控因素。
表1 部分样本数据Table 1 Part of sample data
表2 灰色关联度Table 2 Grey relation degree
根据灰色关联熵权法筛选出的主控因素,从90 组样本数据中随机选出60 组数据作为训练样本,包括突出样本40 组,非突出样本20 组,测试样本则取剩余30 组数据。为分析本文提出的优化算法在煤与瓦斯突出危险性预测上的准确度和可靠性,将相同的样本组分别在 IGWO-SVM、PSO-SVM、WOA-SVM 及GWO-SVM 4 种算法上进行对比试验,不同算法的预测结果如图4-图7 所示。
从图4 可看出,30 个样本中有1 个样本预测结果为1,实际测试集分类结果为2;有2 个样本预测结果为2,实际测试集分类结果为3;有2 个样本预测结果为3,其中1 个实际测试集分类结果为1,另一个实际测试集分类结果为2,其余25 个预测结果正确,GWO-SVM 的预测准确率为83.33%。
图4 GWO-SVM 预测结果Fig.4 Prediction result of GWO-SVM
从图5 可看出,30 个样本中有1 个样本预测结果为3,实际测试集分类结果为2,其余29 个预测结果正确,IGWO-SVM 的预测准确率为96.67%。
图5 IGWO-SVM 预测结果Fig.5 Prediction result of IGWO-SVM
从图6 可看出,30 个样本中有5 个样本预测结果为2,其中有2 个实际测试集分类结果为1,3 个实际测试集分类结果为3;有1 个样本预测结果为1,实际测试集分类结果为3,剩下24 个预测结果正确,WOA-SVM 的预测准确率为80.00%。
图6 WOA-SVM 预测结果Fig.6 Prediction result of WOA-SVM
从图7 可看出,30 个样本中有5 个样本预测结果为2,其中有2 个实际测试集分类结果为1,3 个实际测试集分类结果为3;有3 个样本预测结果为3,实际测试集分类结果为1,其余22 个预测结果正确,PSO-SVM 的预测准确率为73.30%。
图7 PSO-SVM 预测结果Fig.7 Prediction result of PSO-SVM
由4 种算法的预测结果可得:IGWO-SVM 在预测煤与瓦斯突出危险性方面精确度较高。
4 种算法预测时间对比如图8 所示,在预测耗时上,IGWO-SVM 运行时间只有5.58 s,而其他3 种预测算法运行时间都超过了15 s。IGWO-SVM 在预测性能上有了较大的提升。
图8 4 种算法预测时间对比Fig.8 Comparison of prediction time of four algorithms
(1)利用灰色关联熵权法分析各个影响因素对煤与瓦斯突出的影响程度,根据关联度排序提取瓦斯压力、瓦斯含量、瓦斯放散初速度和开采深度作为煤与瓦斯突出主控因素。
(2)通过越界处理机制和嵌入莱维飞行的随机差分变异策略结合对GWO 进行改进,利用测试函数对IGWO 的性能进行估计,通过与PSO,WOA 和GWO 对比验证了IGWO 的优越性。
(3)在提取煤与瓦斯突出主控因素的基础上,运用IGWO 对SVM 的参数进行优化,使用IGWO-SVM对煤与瓦斯突出危险性等级进行预测,将IGWO-SVM和GWO-SVM,WOA-SVM,PSO-SVM 算法进行仿真对比,结果表明:基于IGWO-SVM 的煤与瓦斯突出危险性预测方法具有更高的预测精度和较快的预测速度,预测精度达到96.67%,预测速度为5.58 s。