朱志洁,张宏伟,陈 蓥
(辽宁工程技术大学矿业学院,辽宁阜新 123000)
煤矿井巷中,回采巷道是煤炭运输、矿井通风、行人运料的重要通道,回采巷道的稳定性与矿井安全、高产、高效生产密切相关[1~2]。因此,有必要对回采巷道的稳定性进行预测,针对不同稳定性的回采巷道提前采取相应的支护措施,确保回采巷道的稳定和矿井安全、高效的生产。
回采巷道常见的分类方法有:单因素指标分类法、多因素复合指标分类法、多因素综合单一指标分类方法、模糊聚类分类法、神经网络分类法、支持向量机分类法等。这些分类方法都存在自身的缺陷,单因素指标分类法只考虑了一种影响因素,对巷道稳定性存在片面性;多因素复合指标分类法和多因素综合单一指标分类法虽然避免了单一分类指标法的缺陷,但考虑的因素还不够全面;模糊聚类分类法[3]考虑到各指标的模糊性,能够更加科学、准确的对其进行分类,但分类指标权值的确定存在主观性;支持向量机分类法[4]可以很好地处理样本各指标之间的非线性映射关系,对于小样本具有很好的适应性,但分类效果受参数的选择影响明显;神经网络法[5]易陷入局部最优解,并且推广能力较差。基于以上各分类方法的不足,本文在对回采巷道稳定性影响因素全面分析的基础上,采用主成分分析(PCA,Principal Component Analysis)和随机森林(RF,Random Forest))相结合的方法对巷道围岩的稳定性进行预测,为巷道设计和支护方案的选择提供依据。
(1)围岩强度。围岩强度的大小对回采巷道稳定性所起的作用是显而易见的。一般较软弱的围岩易发生破坏和变形,巷道不易维护;与之相反,较坚硬的围岩就不易发生破坏和变形,巷道相对容易维护。本文采用围岩的单轴抗压强度来量化围岩强度。
(2)埋藏深度[6]。开采深度大,支承压力也大,煤体塑性破坏范围就越大,巷道维护就越困难。
(3)节理发育程度[7]。一般岩体都不同程度地含有层理、节理、裂隙等弱面,这将降低岩体的强度。在节理裂隙不发育、完整性好的岩体中,巷道围岩的稳定性比较好;反之,则比较差。
(4)直接顶厚度与采高比值。在全部垮落法的工作面,基本顶岩层对工作面顶板压力的影响程度主要取决于直接顶的厚度。即直接顶越厚,破断后易形成平衡结构,基本顶对工作面的影响就越小[8]。因此,以老顶距离煤层的远近作为矿山压力显现的重要指标之一,本文采用直接顶厚度与采高的比值进行衡量。
(5)巷道宽度。巷道宽度的大小是影响巷道顶底板移近量的主要因素之一,宽度越大,顶底板移近量越大。
(6)松动圈尺寸[9]。巷道掘进后,围岩应力的分布发生变化,围岩产生了应力变化区,在该区内存在应力集中现象,当应力值超过围岩体的极限强度时,周边岩体产生破裂,使巷道周围形成了一定厚度的破裂区域,即围岩松动圈。松动圈厚度越小,巷道越稳定;反之则越不稳定。
随机森林[10](Random Forest)是由 Leo Breiman 提出的一种集成学习算法,该算法由多个彼此相互独立决策树组合,在树的生长和训练样本的选择过程中引入了随机性,以降低决策树结构分类器的方差。大量的研究表明[11~14],随机森林具有很高的预测精度,能够很好地容忍噪声点和异常值,可以有效避免过度拟合问题。本文基于Bootstrap方法和随机选取分裂属性集方法构建随机森林。采用该方法随机产生多个训练子集,在各个训练子集上分别建立分类器,根据各个分类器的分类效果投票确定最终的分类结果。构建随机森林算法具体流程[15]如下:
(1)利用Bootstrap方法重采样,随机产生k个训练集 D1,D2,…,Dk;
(2)利用每个训练集,生成对应的决策树C1,C2,…,Ck;
(3)在每个非叶子节点上选择属性前,从M个属性中随机抽取m个属性作为当前节点的分裂属性集,并以这m个属性中最好的分裂方式对该节点进行分裂;
(4)每棵树都完整生长,而不进行剪枝;
(5)对于测试集样本X,利用每个决策树进行测试,得到对应的类别C1(X),C2(X),…,Ck(X);
(6)采用投票的方法,将k个决策树中输出最多的类别作为测试集样本X所属的类别。
PCA方法是一种利用降维思想的多元统计分析方法,采用该方法能够抓住研究问题主要矛盾,使复杂的研究问题得到简化,提高分析问题的效率[15]。
假设某一事物由m个指标组成,分别用X1,X2,…,Xm表示,由这m个指标组成了m维随机向量X=(X1,X2,…,Xm)',设 μ 为随机向量 X 均值。对随机向量X进行线性变换,可转变成新的综合变量,用Y表示。这样,新的综合变量可以由原来的变量线性表示,即满足下式:
式中系数μij可以根据下列原则来确定:
①μi12+μi22+…+μim2=1(i=1,2,…,m);
②Yi与 Yj(i≠j;i,j=1,2,3,…,n)线性无关;
③Y1为,X1,X2,…,Xm的所有线性组合中方差最大者;Y2为与Y1不相关的X1,X2,…,Xm的所有线性组合中方差最大者;…;Yn为 Y1,Y2,…,Yn-1都不相关的 X1,X2,…,Xm的所有线性组合中方差最大者。
这样确定的新变量指标Y1,Y2,…,Yn-1分别称为原变量指标X1,X2,…,Xm的第1主成分,第2成分,…,第n主成分。其中,Y1的方差占总方差的比例最大,Y2,…,Yn-1的方差依次减小。分析实际问题时,常挑选前面几个最大的主成分,这样既可以减少变量的数目,又抓住了问题的主要矛盾,使各变量之间的关系得到了简化。
搜集河南省平顶山矿区回采巷道稳定性相关数据[16]:围岩强度 X1,巷道跨度 X2,直接顶与煤层厚度之比X3,巷道埋深X4,节理发育程度X5,松动圈尺度X6(表1),其中节理发育程度:1为很不发育,2为不发育,3为中等发育,4为较发育,5为发育。围岩类别分为5类:I为极稳定,II为稳定,III为中等稳定,IV为不稳定,V为极不稳定。采用SPSS19.0统计分析软件,对该模型各输入参数对回采巷道的稳定性影响程度进行相关性分析。各指标与巷道稳定性相关系数分别为:围岩强度X1(-0.741),巷道跨度X2(0.695),直接顶与煤层厚度之比 X3(-0.817),巷道埋深 X4(0.610),节理发育程度X5(0.921),松动圈尺度X6(0.913)。由此可知,各指标对回采巷道稳定性影响程度由大到小分别为:节理发育程度、松动圈尺度、直接顶与煤层厚度之比、围岩强度、巷道跨度、巷道埋深,其中,围岩强度和直接顶与煤层厚度之比两指标为负相关,其他指标为正相关。
应用Matlab数学计算软件,对巷道稳定性的影响因素按以下步骤提取主成分:
(1)原始数据标准化。回采巷道稳定各影响因素的量纲和数量级存在差异,在主成分分析前需对原始数据标准化处理。
(2)采用标准化后的数据进行相关系数矩阵R的求解。相关系数矩阵见表2。
(3)求矩阵R的特征值和相应的特征向量及贡献率,并提取主要成分。由表3可知,前3个主成分的方差占总方差的88.82%,根据主成分的选则标准,原来的6项指标可由这3个主成分代替。
表1 回采巷道围岩稳定性样本Table 1 Sample data of gateway surrounding rocks stability
表2 各指标相关系数矩阵Table 2 Correlation coefficient matrix of each factor
表3 主成分及其贡献率Table 3 Principal components and contribution rate
(4)主成分因子荷载矩阵见表4。根据表4中PCA矩阵模型,给出因子Y1,Y2和Y3与原始变量之间的关系。
表4 主成分因子载荷矩阵Table 4 Factor load matrix of the principal component
根据表4中的矩阵可以写出因子表达式:
根据上述表达式对标准化后的数据进行PCA计算,计算后的主成分载荷相关数据见表5。
表5 主成分计算后样本数据Table 5 Calculated data of the principal component
选取表5中样本1~20作为训练集,用于模型训练;选取表5中样本21~30作为测试集,用于检验训练好模型的预测效果。选取PCA降维处理后Y1,Y2和Y3作为回采巷道稳定性预测的输入参数,不同稳定性的类别作为输出参数,建立随机森林的回采巷道稳定性预测模型。随机森林算法应用科罗拉多大学博尔德分校Abhishek Jaiantilal开发的randomforest-matlab工具箱实现。选取训练集样本,应用工具箱中classRF_train()函数创建随机森林分类器,其中随机森林参数决策树的个数为100、分裂属性集中的属性个数为2。
为了验证识别回采巷道稳定性模型是否满足实际要求,将表5的全体训练样本代入已建立好的随机森林模型进行回判,误判率为0。
应用训练好的回采巷道分类预测的PAC-RF模型对表5中样本21~30待判检验样本进行判别,采用RF模型进行对比预测,判别结果见表6,由表6可知,PAC-RF模型只有29号样本误判,预测准确率为90%,判别结果与实际类别基本一致;而RF模型24号、29号样本均被误判,预测准确率为80%。同时,采用支持向量机和BP神经网络对回采巷道的稳定性预测,预测准确率均为70%。可见PCA-RF的误判率较低,对回采巷道稳定性预测具有良好的适用性和有效性,可以在工程中运用。通过该模型的应用,可以针对性地采取支护方案,确保回采巷道的安全,实现矿井的安全高效生产。
(1)对回采巷道的稳定性影响程度进行相关性分析,确定各指标对回采巷道稳定性影响程度由大到小分别为:节理发育程度、松动圈尺度、直接顶与煤层厚度之比、围岩强度、巷道跨度、巷道埋深。
(2)采用PCA对回采巷道稳定性影响因素进行降维处理,简化了样本数据,提高了模型的预测效率。
(3)将PCA与随机森林算法相结合,建立了回采巷道稳定性预测的PCA-RF模型。结果表明:该模型可以相对准确地对回采巷道稳定性进行预测,预测结果与实际情况基本一致,这为合理经济地选择回采巷道支护方案提供了可靠的保障。
[1] 刘玉堂.我国缓倾斜、倾斜煤层回采巷道围岩稳定性分类的研究[J].煤炭学报,1989,14(3):21-36.[LIU Y T.Study the gateway surrounding rock classification of dip and flat dip coal state in China[J].Journal of China Coal Society,1989,14(3):21-36.(in Chinese)]
[2] 杨双锁.煤矿回采巷道围岩控制理论探讨[J].煤炭学报,2010,35(11):1842-1853.[YANG S S.Study on the surrounding rock control theory of roadway in coalmine[J].Journal o f China Coal Society,2010, 35(11):1842-1853.(in Chinese)]
[3] 李洪,蒋金泉,张开智.回采巷道围岩分类的模糊聚类分析方法[J].西安科技大学学报,2005,25(1):12-16.[LI H,JIANG J Q,ZHANG K Z.Fuzzy clustering analysis of tunnel surrounding rock classification [J].Journal of Xi’an University of Science& Technology,2005,25(1):12-16.(in Chinese)]
[4] 朱一丁,马文涛.回采巷道围岩分类的支持向量机方法[J].采矿与安全工程学报,2006,23(3):362-365.[ZHU Y D,MA W T.Method of support vector machines for classifying surrounding rocks of gateways [J]. Journal of Mining & Safety Engineering,2006,23(3):362-365.(in Chinese)]
[5] 贺超峰,华心祝,马菁花,等.基于BP神经网络的回采巷道围岩稳定性分类[J].矿业工程研究,2012,27(3):6-9.[HE C F,HUA X Z,MA J H,et al.Classification of surrounding rock stability of roadway based on BP neural network [J].Mineral Engineering Research,2012,27(3):6-9.(in Chinese)]
[6] 李彦斌,杨永康,苏学贵.埋深对巷道围岩稳定性影响研究[J].太原理工大学学报,2011,42(6):603-606.[LI Y B,YANG Y K,SU X G.Study on the stability of surrounding rocks of a coal roadway in different depth[J].Journal of Taiyuan University of Technology,2011, 42(6):603-606.(in Chinese)]
[7] 王鲁明,赵坚,万德连.巷道裂隙围岩稳定性影响因素的数值分析[J].岩土力学,2005,26(10):44-48.[WANG L M,ZHAO J,WAN D L.Numerical analysis of influencing factors in stability of cracked surrounding rock of a laneway[J].Rock and Soil Mechanics,2005,26(10):44-48.(in Chinese)]
[8] 马建宏,韦四江,李小军.直接顶厚度对回采巷道稳定性影响的数值模拟研究[J].河南理工大学学报(自然科学版),2007,26(6):647-651.[MA J H,WEI S J,LI X J.Numerical simulation on stability o f gateway under the influence of the thickness of immediate roof[J].Journal of Henan Polytechnic University(Natural Science),2007,26(6):647-651.(in Chinese)]
[9] 靖洪文,付国彬,郭志宏.深井巷道围岩松动圈影响因素实测分析及控制技术研究[J].岩石力学与工程学报,1999,18(1):70-74.[JING H W,FU G B,GUO Z H.Measurement and analysis of influential factors broken zone of deep roadways and study on its control technique[J].Chinese Journal of Rock Mechanics and Engineering,1999,18(1):70-74.(in Chinese)]
[10] 方匡南,吴见彬,朱建平,等.随机森林方法研究综述[J].统计与信息论坛,2011,26(3):32-38.[FANG K N,WU J B,ZHU J P,et al.A review of technologies on random gorests[J].Statistics &Information Forum,2011,26(3):32-38.(in Chinese)]
[11] 张华伟,王明文,甘丽新.基于随机森林的文本分类模型研究[J].山东大学学报(理学版),2006,41(3):139-143.[ZHANG H W,WANG M W,GAN L X.Automatic text classification model based on random forest[J].Journal of Shandong University(Natural Science),2006,41(3):139-143.(in Chinese)]
[12] 郭颖婕,刘晓燕,郭茂祖,等.植物抗性基因识别中的随机森林分类方法[J].计算机科学与探索,2012,6(1):67-77.[GUO Y J,LIU X Y,GUO M Z,et al.Identification of plant resistance gene with random forest[J].Journal of Frontiers of Computer Science and Technology,2012,6(1):67-77.(in Chinese)]
[13] 张建,武东英,刘慧生.基于随机森林的流量分类方法[J].信息工程大学学报,2012,15(5):621-625.[ZHANG J,WU D Y,LIU H S.Internet traffic classification based on random forest[J].Journal of Information Engineering University,2012,15(5):621-625.(in Chinese)]
[14] Long-jun DONG,Xi-bing LI,Kang PENG.Prediction of rockburst classification using Random Forest[J].Transactions of Nonferrous Metals Society of China,2013,23(2):472-477.
[15] 朱志洁,张宏伟,韩军,等.基于PCA-BP神经网络的煤与瓦斯突出预测研究[J].中国安全科学学报,2013,23(4):45-50.[ZHU Z J,ZHANG H W,HAN J,et al.Prediction of coal and gas outburst based on PCA-BP neural network[J].China Safety Science Journal,2013,23(4):45-50.(in Chinese)]
[16] 庞建勇,郭兰波.煤巷围岩稳定性综合分类及锚杆支护形式合理选择[J].淮南矿业学院学报,1998,18(1):9-15.[PANG J Y,GUO L P.Overall classification on rooks stability of coal roadway and rational choice of rooks bolting[J].Journal of Huainan Mining Institute,1998,18(1):9-15.(in Chinese)]