吴 菡 郭永刚 何军杰 苏立彬
(西藏农牧学院水利土木工程学院, 西藏林芝 860000)
岩爆作为高地应力状态下施工扰动导致的岩体崩裂、溅射现象,极大危害着施工安全,影响了工程进度。[1]随着水利、交通、矿冶等领域地下工程建设向着深部发展,岩爆问题已成为深部地下工程建设中亟待解决的问题。[2]岩爆倾向性预测能够有效防控岩爆灾害,降低人员伤害及财产损失。[3]因此准确地进行岩爆倾向性评价具有十分重要的意义。
岩爆倾向性预测主要分为两类:单指标预测及多指标预测。前者认为:岩爆的本质是岩体破坏问题,可基于岩石力学参数建立Brown-Hoek判据[4]、二郎山判据[5]等单一的特征指标实现岩爆倾向性评价。然而单一的评价指标不能全面准确地描述岩爆特征,甚至可能忽视对岩爆特征解释较强的评价指标,进而影响岩爆预测准确率。后者引入神经网络或机器学习等先进算法[6-7],综合脆性、强度、能量等多种岩石力学参数实现岩爆倾向性预测。如任燕娟等改进了模糊物元理论,选取了脆性系数、变性能指标、冲击能指标作为评价指标进行岩爆倾向性评价。[1]黄明健等利用RS算法确定岩爆指标权重,构建云模型确定岩爆等级。[8]赵国彦等采取Vague熵确定指标权重,建立了基于Vague集的岩爆分级预测模型。[9]刘冉等利用粗糙集逐级筛选评价指标,建立粗糙集-多维正态云岩爆分级预测模型。[10]赵亚东等利用信念网络进行岩爆倾向性预测,多指标预测较为全面地描述了岩爆特征,结果较为准确,有一定工程应用价值。[11]但过多的预测指标不仅增加了模型计算的难度,还可能导致预测模型训练时间过长,影响模型预测性能。故须结合多种理论,充分挖掘各评价指标与岩爆等级间的内在联系,构建更为合适的岩爆倾向性预测指标体系,实现有效的岩爆倾向性评价。
采用结构简单的仿生灰狼算法(GWO)-优化支持向量机(SVM)模型,不仅保持了SVM模型强泛化性,适宜于分析非线性小样本的优点,还避免了SVM模型受人为因素影响,易于陷入局部最优的问题。[12-14]实际上,评价指标间大多存在相关性,对岩爆倾向性预测模型影响较大,须在不损失分类性能的前提下提取评价指标。主成分分析法(PCA)通过构建人造特征,在保证原始数据大部分信息的情况下,对脆性系数、强度参数、能量指标等6种评价指标实施指标数据降维,消除指标相关性,构建新的岩爆倾向性预测指标体系。[15-16]基于此,将整合改进的支持向量机模型(GWO-SVM)和PCA算法建模,构建PCA-GWO-SVM岩爆倾向性预测模型。然后再根据搜集的国内外64组岩爆实测样本对PCA-GWO-SVM模型进行测试、训练,并与其余模型进行对比,分析验证所建模型的可靠性和优越性。
2014年,受灰狼群体合作狩猎行为的启发,Mirjalili 等提出灰狼优化算法(GWO)[17]。GWO优化过程(寻找SVM模型参数c、g最优解)即狼群的捕猎过程。GWO算法利用候选解确定猎物可能位置,一般假设猎物处于α狼位置,捕获到猎物就等于找到最优解,最佳α狼位置即为参数c、g的最优解。[14]
1.1.1划分社会等级模拟
标准灰狼算法中,将狼群按适应度高低依次分为四级:α、β、γ和ω,低等级狼必须服从高等级狼的决策。α狼等级最高(适应度最高),是狼群的统领,负责组织和管理其余灰狼,代表问题的最优解。β狼等级低于α狼,高于γ、ω狼,是辅助α狼的狼群顾问,α狼死后β狼会代替α狼指挥狼群,代表问题的第二优解。γ狼等级上从属于前两种狼,是狼群的重要组成部分,通常扮演哨兵、看护人等角色,代表问题的第三优解。ω狼为最低级狼,是搜索狼,在狼群内部关系中起到平衡作用,代表的解较差。ω狼主要负责以α、β、γ狼的位置矢量为中心,开展搜索活动,以便更新其余狼的位置矢量。[18]设计GWO算法时,将模拟灰狼搜索猎物、包围猎物、攻击猎物等行为。
1.1.2包围猎物行为模拟
(1)
参考猎物位置而发生的灰狼位置更新公式为:
(2)
1.1.3狩猎行为模拟
理论上灰狼识别猎物(最优解)的过程是由α狼指导β、γ、ω狼共同完成的。假设α狼所在位置矢量为目前的最优解,依据等级高低,灰狼位置矢量所代表的解的质量依次降低。每次迭代后,须要保留适应度最好的3匹狼的位置(确定问题的前三最优解——α、β、γ狼所在的位置矢量),之后其余灰狼参考3匹狼位置进行移动,以便确定问题的最优解。数学模型如下:
(3a)
(3b)
迭代后,ω狼随机落入以猎物可能位置为中心的R圈内(根据式(3)计算半径R),即ω狼依据α狼、β狼、γ狼的位置能够随机更新位置,靠近猎物,以实现有效的狩猎行为。
1.1.4攻击行为模拟
1.1.5搜索行为模拟
主成分分析(PCA)的核心是通过线性组合原始数据,保留原有影响因素主要特征的情况下,人为构建新的、相互独立的特征指标组合,并实现特征维数约简,优化预测模型性能。其数学模型[15-16]如下:
假定有m样本和n个岩爆评价指标构成原始评价矩阵Xmn,即Xmn=(X1,X2,…,Xj,…,Xn)T,其中Xj=[x1j,x2j,…,xij,…,xmj]T由原变量指标xij构成。设通过PCA降维后的新成分为F1,F2,…,Fn,即Fk=pk1X1+pk2X2+…+pknXn(k=1,2,…,n)。
主成分具体计算步骤[15-16]如下:
1) 建立标准化初始评价矩阵,即:
j=1,2,…,n;i=1,2,…,m
(4)
2)计算标准化指标间的相关系数矩阵R=(rjk)n×n:
(5)
k,j=1,2,…,n,
式中:rjk为第j个指标与第k个指标间的相关系数。
3)计算矩阵R的特征值λ1,λ2,…,λn及其对应特征向量l1,l2,…,ln。
4)确定主成分。计算主成分贡献率及累计贡献率,选择特征值大于1,且累计贡献率超过85%的对应前f个主成分:
(6a)
(6b)
t,f=1,2,…,n
式中:υf为第f个主成分的贡献率;υt为前t个主成分的累计贡献率。
岩爆发生机制十分复杂,影响岩爆的因素具有随机性、突发性等特点。对于岩爆倾向性评价指标的选择须综合考虑各种因素,应选择易于获取的,具有代表性的参数。[7]因此,选取3种反映岩石主要特征的力学参数σθ、σc、σt以及3种反映围岩性质的指标σθ/σc、σc/σt、Wet组成以下3种预测评价指标组合。
1)岩石应力系数σθ/σc、岩石脆性系数σc/σt、弹性变形能指数Wet。
2)围岩最大切向应力σθ、岩石单轴抗压强度σc、岩石单轴抗拉强度σt、弹性变形能指数Wet。
3)σθ、σc、σt、σθ/σc、σc/σt、Wet。
GWO优化SVM主要过程[14,17-18]为:1)初始GWO算法各参数。创建一个随机的灰狼群(候选解),初始化α、β、γ和ω狼位置矢量,并计算相应α、β、γ狼的适应度(初始解)。2)计算ω狼的适应度,用适应度高的ω狼替换适应度低的α、β、γ狼(位置矢量和解值都替换)。3)ω狼参考α、β、γ狼位置对猎物实施包围和狩猎行为,具体模拟如式(3)。4)判断计算是否完成(达到最大迭代次数),否则返回步骤2)。迭代完成后,此时α狼位置值即为SVM模型参数c、g的最优解。
PCA-GWO-SVM模型进行岩爆倾向性预测的主要过程为:1)依据预测指标搜集岩爆实测数据,并利用PCA对岩爆数据集进行预处理,得到主成分数据。2)将训练数据集输入GWO优化后的SVM模型,挖掘预测指标与岩爆等级间的内在联系。3)模型训练完成后,基于已测算的评价指标进行岩爆倾向性预测。
岩爆等级划分尚无明确统一的数值标准,[18]目前研究常用的岩爆等级划分,通常分为4级:Ⅰ(无岩爆)、Ⅱ(轻微岩爆)、Ⅲ(中级岩爆)、Ⅳ(强烈岩爆),即每组岩爆实测样本有且仅对应一组确定的岩爆类型。[1-12]
通过文献[1-12,19-20]搜集了国内外64组岩爆实测样本(表1),作为原始岩爆样本集。其中Ⅰ级岩爆、Ⅱ级岩爆、Ⅲ级岩爆、Ⅳ级岩爆样本各有16组,避免样本数据不均衡对预测结果的影响。同时,依据各等级比例,从4种岩爆样本中各抽取4组样本,作为模型的测试集(共12组测试数据)。
表1 岩爆实测样本与主成分数据
使用主成分分析,消除指标相关性,实现数据降维之前必须进行标相关性分析。[15]为避免不同量级量纲对指标间相关性系数有所影响,应对原始岩爆数据进行标准化处理后,再进行相关性分析。[16]计算结果如表2所示。
表2 评价指标相关性矩阵
由表2可知:组合1、2指标间相关系数在 [0.02,0.52]间,呈微弱相关,描述了岩体自身的冲击倾向性特征,且维度无冗余,PCA预处理无意义。对于组合3,σθ与σθ/σc间相关系数为0.741,呈显著相关,可能干扰预测效果,有必要进行PCA预处理。计算结果详见表1、表3及图1。
表3 评价指标主成分系数矩阵和旋转因子矩阵
由图1可知:前3个主成分累计贡献率为85.885%,即3个主成分能合理解释原始变量85%的信息,且主成分对各原始变量均有良好的表达效果,提取效果较好。
(7)
(8)
(9)
旋转因子矩阵表示主成分与各因子间的包容关系。由表3可知:主成分F1较大值分别有0.877和0.797,即F1与σc、Wet关系密切,故F1可归纳为岩石的抗压因子。同理,主成分F2与σθ、σθ/σc关系密切,可归纳为岩石的抗剪因子。主成分F3与σt、σc/σt关系密切,可归纳为岩石的抗拉因子。
总之,由上述分析可知主成分F1、F2、F3包含大部分原始信息,且理论上符合岩石的物理力学特征,故可将3个主成分视为6个原始变量进行岩爆倾向性预测。
为比较所建模型GWO-SVM预测效果,论证主成分分析的有效性,将前述3组岩爆预测指标及PCA预处理后的岩爆综合预测指标(3个岩爆预测主成分组合,编号PCA-3),分别与SVM模型、PNN模型和Elman模型结合进行岩爆预测,表4、表5分别为不同模型的预测准确率和耗时。
表4 不同输入指标下模型准确率
表5 4种模型预测实现时间
纵向比较,PCA优化前后模型准确率提升6.25%~12.5%,运行时间缩短11.20%~58.42%。
与等指标数量的输入组合比较,引入PCA的模型运行时间普遍降低29.12%~64.19%,准确率提升6.25%~37.5%。表明PCA可整体提升岩爆倾向性预测模型的性能,选择PCA-3作为最优预测指标组合具有一定优越性。
横向比较,同等条件下,GWO-SVM模型预测准确率普遍高于其余模型18.75%~56.25%,与SVM模型相比,GWO-SVM模型预测准确率提升18.75%~31.25%,表明:GWO算法能有效优化SVM模型准确率,且GWO-SVM模型预测准确率普遍优于其他模型,将GWO-SVM模型应用于岩爆倾向性预测是合理可行的。
机器学习是一种监督学习算法,[19-20]通过精确度、召回率、F1得分等常用的机器学习评价指标[12]进一步分析不同输入组合下,SVM和GWO-SVM模型的岩爆预测性能,结果如表6所示。
表6 不同评价指标组合下2种模型测试集的基础评估
由表6可知:GWO-SVM的精确率最高可达0.95,对比同等条件下的SVM算法提升了0.225。与输入组合PCA-3结合的GWO-SVM模型召回率和F1得分,均明显优于其余情况,充分说明提出的GWO-SVM算法与输入组合PCA-3结合,进行岩爆预测分级方法是合理且有效的。
基于前文分析,选择PCA-3作为输入组合,结合苍岭隧道(2实例)、多雄拉隧道(2实例)、锦屏二级水电站(2实例)和钟南山隧道(2实例)4个工程实例进一步分析所建模型的实际工程应用前景。同时为保证实际工程应用效果,对比同等条件下标准SVM岩爆预测模型结果,如表7所示。
表7 工程预测结果
SVM模型错误地将苍岭隧道实际等级Ⅲ岩爆预测为II级岩爆,将锦屏二级水电站实际等级Ⅳ岩爆预测为Ⅲ级岩爆,将钟南山隧道实际等级Ⅲ岩爆预测为II级岩爆,工程实例预测准确率为62.5%,与理论结果一致,但模型预测结果普遍低于实际岩爆等级,易导致人员防护不到位,造成较大安全危害。
GWO-SVM模型错误地将苍岭隧道实际等级II岩爆预测为Ⅲ级岩爆,工程实例预测准确率为87.5%,与理论结果相差较小,同时由于预测结果高于实际岩爆等级,人员所采取的防护措施对实际岩爆有效,保证了施工安全,故GWO-SVM模型实际工程应用符合理论预期,具有较大的工程应用前景。
1)选取σθ、σc、σt、σθ/σc、σc/σt和Wet构成岩爆倾向性评价指标,采用PCA优化指标结构,获得3个符合岩爆特征的最优评价指标:抗压因子F1、抗剪因子F2、抗拉因子F3。
2)为避免SVM模型出现局部最优问题,采用GWO算法优化SVM模型参数c、g,优化后SVM模型预测性能获得了整体提升(模型预测准确率提升18.75%~31.25%,精确率提升9.47%~81.82%,召回率提升27.18%~50.08%,F1得分提升20.03%~53.99%)。表明GWO算法能有效优化SVM模型,GWO算法与SVM模型组合是合理可行的。
3)将PCA引入GWO-SVM、SVM、PNN和Elman,4种模型,相应预测结果均优于初始模型,整体优化了模型预测性能,准确率提升了6.25%~12.5%,运行时间缩短了11.20%~58.42%。
4)所建的PCA-GWO-SVM模型准确率最高达93.75%,模型错判所造成的危害较小,与主元分析结合的GWO-SVM岩爆倾向性预测模型是合理可行的。