基于声发射特征提取和机器学习的煤破坏状态预测

2023-01-05 05:32李振雷SOBOLEVAleksei宋大钊王洪磊曹亚利
工程科学学报 2023年1期
关键词:梅尔煤岩煤样

李振雷,李 娜,杨 菲,SOBOLEV Aleksei,宋大钊✉,王洪磊,纳 然,曹亚利

1) 北京科技大学金属矿山高效开采与安全教育部重点实验室,北京 100083 2) 北京科技大学土木与资源工程学院,北京 100083 3) 俄罗斯科学院远东分院哈巴罗夫斯克联邦研究中心,哈巴罗夫斯克 680000

近年来,随着我国浅部煤炭资源日益枯竭,许多煤矿已经进入深部开采阶段[1-3],开采规模、强度和深度不断加大,采场结构越来越复杂,煤岩动力灾害的发生频次和破坏程度均呈上升趋势[4-7],有效预测煤岩失稳破坏具有重要的工程意义.声发射监测技术是评价煤岩材料稳定性的一种重要手段,能够有效揭示煤岩受载破坏特征规律,在实验室和工程现场得到了成功的应用,被证明是一种有效的地球物理预警方法[8-10].

在煤岩破坏声发射信号研究方面,国内外学者进行了大量研究,发现声发射特征参数与煤岩损伤破坏程度密切相关.Jin 等[11]通过煤岩单轴压缩声发射实验研究,验证了煤岩受载塑性应变与声发射特征参数之间具有高度正相关关系.邓绪彪等[12]发现粉砂岩应力-应变全过程可划分为7 个阶段且都具有不同的声发射综合特征,分析得到峰前软化段的多种声发射特征可以作为岩石破裂前兆.任建喜等[13]分析了冲击倾向性煤岩在动静载下的声发射特性,得出声发射能量演化规律可作为判断煤岩所处应力状态及先期加载应力水平的参考依据.纪洪广等[14]提出岩体内部声发射和压力具有相互耦合模式—“升压平静-降压活跃”和“升压降压平静”模式,可以作为冲击地压事件预测的判别依据.

常规的声发射特征参数与煤岩的受力水平及破坏状态之间尚未揭示出显著的函数关系,难以进行煤岩损伤程度的定量化准确评价.语音识别领域的特征提取技术能够提取出准确表征语音信号的特征参数[15-16],如梅尔倒谱系数、线性预测倒谱系数、离散小波变换等.目前,语音特征提取技术已经在其他涉及波形处理的工程领域得到了的应用.Mei 等[17]通过倒谱系数分析桥梁变形、跨中刚度等信号,不仅实现桥梁损伤识别,还定量分析出损伤程度.江莺等[18]利用倒谱系数、短时过零率等特征参数提出了根据火花放电声音进行电除尘中火花识别的方法.声发射与声音信号本质上都是机械波,因此语音识别领域的特征提取技术在理论上适用于煤岩声发射特征分析.Wang 等[19]将自动语音识别的特征提取技术应用于煤样声发射的特征分析,得到了煤样声发射梅尔倒谱系数的变化规律,并提出了利用梅尔倒谱系数(MFCC)评价煤样应力状态的准则.近年来随着计算机技术的迅速发展,机器学习算法被广泛应用,可以实现对样本数据的深度学习,具有较高的准确率且识别速度快[20].专家学者们[21-23]将梅尔倒谱系数、线性预测倒谱系数等高维的特征参数与卷积神经网络、K 均值聚类、隐马尔可夫模型等机器学习方法相结合在地震信号震源类型识别、地震相分析、矿山微震事件识别分类等方面进行了应用,效果良好.

综上可知,将语音识别领域的特征提取技术和机器学习方法应用到煤岩破坏声发射分析领域有望得到可喜的结果.本文同步采集了煤样单轴压缩过程的声发射全波形数据和应力数据,提取了声发射信号梅尔倒谱系数作为样本特征,并以煤样的应力状态作为样本标签,利用机器学习方法建立了煤样破坏状态预测模型,实现了对煤样危险状态的准确预测.

1 煤样破坏状态预测方法

1.1 声发射梅尔倒谱系数提取

Davis 和Mermelstein 提出了梅尔倒谱系数(Melfrequency Cepstral coefficient,简称MFCC),是对信号波形的短时能量谱的一种表示,是将波形信号的对数功率谱通过线性余弦变换运算投影至非线性梅尔尺度中所得[24].Mel 尺度的值和赫兹频率之间的转换关系为:

式中,f为赫兹频率.

煤样声发射的MFCC 求解步骤分为五步:

(1)波形分帧:在非常短时间内,声发射信号由一次裂纹扩展产生,因此可以视为平稳信号.将声发射波形分割成等长度的短帧片段.本文实验中声发射采样率为3 MHz,因此将每一帧长度设定为40 ms,对应的窗口长度为120000(见图1 中N),同时为减少帧与帧之间的变化过大,相邻帧之间重叠一段长度,设定为10 ms,对应的重叠长度为30000(见图1 中L).

图1 声发射信号分帧示意图Fig.1 Schematic diagram of acoustic emission signal framing

(2)加汉明窗:为了增加声发射信号s分帧后每一帧与相邻帧之间的连续性,对帧信号进行窗函数处理得到信号s',即让波形的每一帧乘以汉明窗,计算公式为[21]:

式中,s(n)为信号s的第n个值;s'(n)为信号s'的第n个值;N为每帧数据的长度;α为汉明窗系数.

(3)离散傅里叶变换:将声发射信号从时域变换到频域,对分解后的每一帧信号作傅里叶变换,计算频率域上的每一帧的功率谱,计算公式为[23]:

式中,X(k)为功率谱X的第k个值.

(4)滤波并提取对数能量谱:通过梅尔滤波器组滤波,计算每个梅尔滤波器输出能量的对数,得到对数能量,即相应频带的对数功率谱,计算公式如式(4)所示[21].其中,梅尔滤波器组是一系列的三角窗,均匀重叠地排列在梅尔频率轴上.

式中,s(m)为对数能量s的第m个值;M为滤波器总数;H为滤波器组;Hm(k)为第m个滤波器转换函数的第k个值.

(5)离散余弦变换:利用离散余弦变换把频谱变换到时域上,所得结果就是梅尔频率倒谱系数,计算公式为[21]:

1.2 基于机器学习的预测模型构建

机器学习算法可以实现对样本数据的转换、处理和深度学习,具有较高的准确率且识别速度快,如决策树、随机森林[25]、人工神经网络等[26].Light GBM 算法(Light gradient boosting machine)是一种使用单边梯度采样和互斥特征捆绑方法相结合的改进梯度提升决策树算法.该算法具有训练效果好、训练速度快、能处理海量数据、不易过拟合等特点.本文优选此方法构建煤样破坏状态预测模型,构建过程如图2 所示.

图2 煤样破坏状态预测模型构建流程图Fig.2 Flow chart for the building of coal failure forecasting model

首先,制作声发射样本,将采集的声发射数据分割成长度为120000 个数据点的40 ms 声发射片段,每个声发射片段作为一个样本;其次,提取样本特征,前12 个梅尔倒谱系数作为样本特征,MFCCn是第n个特征;然后,添加样本标签,定义煤样当前受力与其峰值载荷的比值为煤样的应力状态,设置0.8 为应力状态阈值,若声发射样本对应的应力状态小于0.8 即为安全,样本标签为y=0,若大于0.8 即为危险,样本标签为y=1;最后,训练预测模型,使用Light GBM 算法中LGBM Classifier 函数构建煤样破坏状态预测模型.借鉴文献[27]的做法,本文采用机器学习库sklearn 提供的Grid-SearchCV(网格搜索和交叉验证结合法)对Light GBM 主要参数进行调优,参数设置如表1 所示,其余参数均为默认值.参数调优步骤主要包括:选择较高的learning rate 以加快收敛速度,一般大于0.1;对决策树基本参数调优;调整正则化参数以防止过拟合;降低learning rate 来提高模型准确率.

表1 Light GBM 算法参数设置Table 1 Parameter setting of Light GBM algorithm

根据周志华[28]的研究,训练集数据占总数据量的比例一般为2/3~4/5,本文取训练集占总样本80%,测试集占总样本20%.为保证划分后的数据集分布均匀,本文利用sklearn 的分层抽样函数StratifiedShuffleSplit 从每个煤样的声发射样本中抽取80%作为训练集,其余样本作于测试集.各煤样声发射样本中安全和危险样本数量统计如表2 所示.

表2 煤样声发射样本统计Table 2 Statistics of acoustic emission samples of each coal sample

1.3 模型预测效果评价

K折交叉验证是检验机器学习模型效果的常用方法[28],它能够充分利用有限的数据.借鉴Jung和Rodriguez 等[29-30]的研究,本文设置K为5,即使用五折交叉验证方法来评价建立的预测模型的预测效果.五折交叉验证将前述得到的训练集数据分割为5 个子集,其中一个子集作为验证数据,其他四个子集用于训练[31].每个子集均被用作一次验证集,其余四个被用作训练,由此可以得到五个子模型用于检验整体模型的预测稳定性.交叉验证有效利用了有限数据,使评价结果能最大程度地体现模型的整体性能.

准确度(ACC)、真阳性率(TPR)、真阴性率(TNR)以及受试者工作特征曲线(ROC)和该曲线下围成的面积(AUC)等是评价机器学习模型预测效果的常用指标[31-32].准确度表示预测正确的样本占总样本的比例,即模型找到的真阳性类和真阴性类占整体预测样本的比例,其取值范围是[0,1],越接近1 则说明模型预测性能越好.真阳性率表征分类为1 样本的预测准确度.真阴性率是分类为0 样本的预测准确度.TP 是真阳性,表示被预测为正样本的正样本;FN 为假阴性,表示被预测为负样本的正样本;FP 是假阳性,表示被预测为正样本的负样本;TN 为真阴性,表示被预测为负样本的负样本.基于混淆矩阵(表3)中TP、TN、FN和FP 的准确度、真阳性率和真阴性率的计算公式见式(6)~(8).ROC 曲线是一种显示分类模型在所有分类阈值下分类效果的图表,曲线的横纵坐标分别是假阳性率(FPR)和真阳性率(TPR),其中FPR=1-TNR.AUC 被定义为ROC 曲线下的面积,作为一个数值能更清晰地判断模型效果.ROC 曲线的(0,1)点代表完美的分类与阈值,所以曲线越接近这一点或对应的AUC 值越大,则说明分类器效果越好.

表3 混淆矩阵[33]Table 3 Confusion matrix[33]

2 煤样加载实验

2.1 实验系统

实验系统主要包括压力机和声发射采集系统,系统示意如图3 所示.压力机采用YAW-600微机控制电源伺服岩石试验机.声发射采集系统采用DS5 声发射采集仪,最高采样频率为10 MHz,声发射前置放大器的放大倍数分别为20、40 和60 dB 可调,声发射传感器为RS2-A,响应频率为50~400 kHz,中心频率为150 kHz,实验中每个试样布置6 个声发射传感器.

图3 实验系统示意图及声发射探头布置图Fig.3 Schematic diagram of experimental system and layout of acoustic emission sensors

2.2 实验方案

实验采用轴向行程控制的加载方式,加载速率分别设为3、7、11、15 和20 μm·s-1,应力和应变数据的采集频率设置为25 Hz.声发射采集仪采样频率设置为3 MHz,放大器的放大倍数调至20 dB.试样采自于宽沟煤矿,按照国际岩石力学学会的标准将原煤加工成φ50 mm×100 mm 圆柱体标准煤样,将10 块煤样分成5 组加载速率,见表4.实验前,为使声发射传感器与试样充分接触,在传感器上涂抹耦合剂,然后固定于试样上,布置方式如图3 所示.实验时同步采集声发射数据和应力数据,直至实验结束.

表4 煤样加载实验方案Table 4 Coal sample loading scheme

3 实验结果及分析

3.1 煤样受载声发射梅尔倒谱系数变化规律

利用1.1 节所述的方法,将煤样破坏过程中的声发射数据分割成40 ms 的片段,利用Python 程序中librosa 模块实现提取MFCC,选取梅尔倒谱系数的前12 个系数作为声发射特征参数和描述煤样破坏状态的样本特征,同时MFCC 的值使用滑动平均的处理方法,采用Python 编程语言库中的rolling 和mean 函数,窗口长度设为10.煤样在加载过程中声发射信号变化规律近似.限于篇幅,本文以4-1 煤样的一个声发射通道采集信号为例展开叙述.4-1 煤样的MFCC 与应力随时间的变化如图4 所示.图中,MFCC-n表示第n个MFCC,每一个MFCC 点对应一个应力采集点,其中虚线表示煤样载荷达到峰值载荷的80%所在时刻.

由图4 可以看出,MFCC-1、MFCC-2 和MFCC-12 的MFCC 曲线与应力表现出正相关的规律.在压密和弹性阶段MFCC-1 的整体变化不大,当应力即将达到峰值时,MFCC-1 突然增加,在后破裂阶段,即煤样承载力达到峰值强度后,MFCC-1 上下波动幅度较大.MFCC-2 表现出相似的规律,但是在煤样即将到达应力峰值前的突增程度没有MFCC-1 明显.MFCC-3 至MFCC-6 整体上随着应力增加而逐渐减小,在前期加载过程中波动幅度较小,其中当应力约超过峰值载荷的80%后,MFCC-3、MFCC-4 及MFCC-6 出现明显的突降,同时在应力达到峰值以后,MFCC 曲线随着应力的变化表现出尤为显著的波动.MFCC-7 至MFCC-11 表现出较为一致的规律,在压密阶段和弹性阶段都出现了显著的波动,当应力约超过峰值的80%后,MFCC 随着应力的增加,先短暂增大而后突然下降,且在煤样达到强度极限时,MFCC-7 至MFCC-10 减小到其极小值.

图4 4-1 煤样MFCC 与应力随时间的变化.(a) MFCC-1;(b) MFCC-2;(c) MFCC-3;(d) MFCC-4;(e) MFCC-5;(f) MFCC-6;(g) MFCC-7;(h) MFCC-8;(i) MFCC-9;(j) MFCC-10;(k) MFCC-11;(l) MFCC-12Fig.4 Variation of MFCC and stress of coal sample No.4-1 with increasing time: (a) MFCC-1;(b) MFCC-2;(c) MFCC-3;(d) MFCC-4;(e) MFCC-5;(f) MFCC-6;(g) MFCC-7;(h) MFCC-8;(i) MFCC-9;(j) MFCC-10;(k) MFCC-11;(l) MFCC-12

分析发现,在应力峰值的80%这一时间点前后,梅尔倒谱系数具有不同的变化规律,约在超过该值后多数表现出明显突增或突降或先增加后突降的现象,如MFCC-1、MFCC-3、MFCC-10 等.通过肉眼观察可以得到梅尔倒谱系数随应力状态变化的直观特征,但是难以利用梅尔倒谱系数对煤样的破坏状态进行定量化分析预测.

3.2 加载速率对声发射梅尔倒谱系数的影响

由3.1 节分析可知,MFCC-1 和MFCC-2 在应力峰值80%附近表现出的突增趋势最为明显.通过这两个系数分析加载速率对梅尔倒谱系数变化规律的影响,分别选取不同加载速率下的煤样1-2、2-1、3-1、4-2 和5-1,声发射通道选取与3.1 节中的相同,然后对声发射数据进行梅尔倒谱系数提取.由图5 可以看出,煤样在不同的加载速率下,MFCC-1 都在压密和弹性阶段随着应力的增加保持较为平稳的增长,而在80%峰值载荷附近突然增大,且在试样达到峰值载荷后,系数值上升到最大值.由图6 可以看出,煤样在不同的加载速率下,MFCC-2 的变化规律与MFCC-1 基本相同,在80%峰值载荷附近突增的幅度略小于MFCC-1.可见,本文采取的加载速度3~20 μm·s-1范围内对煤样梅尔倒谱系数的变化规律没有产生大的影响,实验采集的煤样声发射数据均可以作为煤样破坏状态预测模型的样本集.

图5 不同煤样在不同加载速率下MFCC-1 的变化.(a) No.1-2,3 μm·s-1;(b) No.2-1,7 μm·s-1;(c) No.3-1,11 μm·s-1;(d) No.4-2,15 μm·s-1;(e) No.5-1,20 μm·s-1Fig.5 Variation of MFCC-1 of different coal samples under different loading rates: (a) No.1-2,3 μm·s-1;(b) No.2-1,7 μm·s-1;(c) No.3-1,11 μm·s-1;(d) No.4-2,15 μm·s-1;(e) No.5-1,20 μm·s-1

图6 不同煤样在不同加载速率下MFCC-2 的变化.(a) No.1-2,3 μm·s-1;(b) No.2-1,7 μm·s-1;(c) No.3-1,11 μm·s-1;(d) No.4-2,15 μm·s-1;(e) No.5-1,20 μm·s-1Fig.6 Variation of MFCC-2 of different coal samples under different loading rates: (a) No.1-2,3 μm·s-1;(b) No.2-1,7 μm·s-1;(c) No.3-1,11 μm·s-1;(d) No.4-2,15 μm·s-1;(e) No.5-1,20 μm·s-1

3.3 煤样破坏状态预测模型效果分析

使用五折交叉验证方法评价建立的预测模型的预测效果.将训练集数据分割为5 个子集,每个子集数据均被用作一次验证集,其余四个被用作训练,由此得到5 个子模型,通过分析5 个子模型的预测效果来评价整体模型的预测性能.本文的训练集数据利用sklearn 的分层抽样函数StratifiedShuffleSplit 从试样1-1、1-2、2-1、2-2、3-1、3-2、4-1、4-2、5-1、5-2 中抽取的80%声发射数据组成的数据集,即利用这些数据来进行五折交叉验证,分组情况和五折交叉验证结果如表5、表6 和图7 所示.

图7 基于五折交叉验证的模型ROC 曲线图Fig.7 ROC graph based on five-fold cross validation

表5 五折交叉验证方法分组情况Table 5 Grouping of the five-fold cross validation

由表6 可以看出,煤样破坏状态预测模型预测的准确率为88.61%、真阳性率为72.34%、真阴性率为93.16%、AUC 为0.93.虽然Fold-1、Fold-3、Fold-4 的真阳性率相对于Fold-2 和Fold-5 偏低,但他们的整体值都较高并且未出现过拟合现象,由此可知Light GBM 算法的拟合情况良好.从预测准确度可知,各种状态下预测模型的准确率均在83%以上,最高超过96%,真阴性率表现同样优秀,ROC 曲线也都非常靠近左上角(0,1)点,AUC值均在0.88 以上,最高达到0.99,说明模型的预测效果良好且稳定.

表6 基于五折交叉验证的模型ACC、TPR、TNR 和AUC 结果Table 6 Results showing the ACC,TPR,TNR,and AUC of the forecasting based on five-fold cross validation

将1.2 节划分好的测试集的声发射数据输入煤样破坏状态预测模型中,计算煤样声发射样本的预测结果.然后将预测结果与实际声发射样本标签对比,得到模型在测试集上的混淆矩阵并计算ACC、TPR、TNR 和AUC,分别为93.87%、85.67%、96.03%和0.98,均优于模型五折交叉验证的结果,说明煤样破坏状态预测模型在测试集上的实际预测效果良好.

4 讨论

4.1 梅尔倒谱系数在预测模型中的重要度

机器学习具有能处理大规模数据集、计算速度快、拥有较强的自适应特征学习能力等特点,在分析类似MFCC 的高维数据方面具有显著优势.通过3.3 节模型效果评价结果可知,MFCC 作为样本特征,煤样破坏状态预测模型的预测效果良好.为研究各样本特征的重要度对预测结果的影响,使用Light GBM 算法中plot_importance 函数画出MFCC 重要度条形图进行分析,如图8 所示.选择五折交叉验证中各方面准确率较优的Fold-5 划分方法,即训练集为煤样1-1、1-2、2-1、2-2、3-2、4-1、4-2、5-1,验证集为煤样3-1、5-2.

图8 煤样破坏状态预测模型的MFCC 特征重要度Fig.8 Importance of each MFCC parameter of the forecasting model

由图8 可知,MFCC-2 重要度最高,符合煤样的MFCC 随时间的变化规律,与应力状态呈现正相关且在破坏前出现明显的突增特征,可以较容易地观察出分类标志;MFCC-12 在加载中期与应力状态呈正相关,在达到峰值载荷80%后先上升然后出现小幅突降,分类标志并不明显,但是具有较高的重要度;MFCC-3 和MFCC-1 重要度次之,结合图4 可以看出系数值在接近应力峰值时发生突增或突降,分类标志亦较为明显;MFCC-10 和MFCC-8 具有一般重要度,在接近应力峰值时发生突降,但前期加载过程中表现出明显的波动性变化,在一定程度上影响了分类标志;MFCC-11、MFCC-4 和MFCC-7 的重要度普遍较低,在煤样整个加载过程中,MFCC 基本保持不变或一直上下波动且幅度较大,基本难以体现出与应力状态较强的相关性,分类标志不明显;MFCC-5、MFCC-9 和MFCC-6 的重要度最低,分类标志难以识别.可见,与应力状态具有相关性或分类特征明显的梅尔倒谱系数往往在模型中的重要度较高,如MFCC-2、MFCC-3 和MFCC-1;但是也存在直观感受相关性较弱的系数而具有较高重要度的现象,如MFCC-12、MFCC-10 和MFCC-8;这说明在煤样破坏状态预测方面,机器学习可以识别出肉眼难以辨识的重要样本特征及其潜在的特征规律.

4.2 不同重要度样本特征组合对模型预测效果的影响

为优化煤样破坏状态预测模型的样本特征,对不同MFCC 组合作为样本特征对模型的影响进行研究.根据图8 样本特征重要度的排序,从重要度最大的MFCC-2 开始依次添加一个重要度次大的系数直到将12 个系数全部添加,得到12 种特征组合,再依次减去重要度最大的系数得到11 种特征组合,共23 种MFCC 特征组合.然后分别使用不同的组合作为样本特征训练得到23 个机器学习模型,计算每个模型的ACC、TPR、TNR,分析使用不同MFCC 特征组合作为样本特征模型的预测效果.23 种MFCC 特征组合如表7 所示,中括号内的数字表示选用的MFCC 编号,如MFCC-[2,12]表示使用MFCC 的第2 个和第12 个系数作为样本特征.

表7 23 种MFCC 特征组合Table 7 23 MFCC feature combinations

煤样破坏状态预测模型的ACC、TPR、TNR 和AUC 如图9 所示.由图可知,组合[1~15]包含重要度较高的样本特征MFCC-2、MFCC-12、MFCC-3 和MFCC-1,ACC 一直保持在82%以上,而没有包含高重要度样本特征的组合[16~23]的ACC 开始下降,说明存在重要度高的样本特征能使模型保持良好的预测效果.

图9 不同样本特征下煤样破坏状态预测模型的ACC、TNR、TPR 和AUCFig.9 ACC,TNR,TPR,and AUC of the forecasting model under different MFCC combinations

从图中还可以看出,从组合[1~6],每增加一个样本特征,模型的预测准确度都有所变化,而从组合[6~14],再增加或减少样本特征已经对模型的预测准确度没有大的影响,说明当特征组合中包含有重要度高的样本特征后再改变模型的样本特征,对模型的影响十分有限.

此外,从组合[14~15],缺少了MFCC-3 这一特征,TPR 从84.68%突然下降到69.02%,AUC 减小至0.89,ACC 也发生明显降低.为分析导致这一现象的原因,增加两个样本特征组合,即[2,1,10,8,11,4,7,5,9,6]和[12,1,10,8,11,4,7,5,9,6],并训练得到2 个机器学习模型,计算2 个模型的ACC、TPR、TNR、AUC 分别为86.65%、92.84%、84.92%、0.91和84.82%、91.83%、82.86%、0.90.对比表7 中第14个组合即[3,1,10,8,11,4,7,5,9,6]的预测效果(即ACC、TPR、TNR、AUC 分别为85.67%、84.68%、85.95%、0.92)发现,使用这3 个样本组合训练的模型的预测效果相近,即当样本组合中存在MFCC-2、MFCC-12 和MFCC-3 中的任意一个特征时,模型的预测结果都较好;当样本组合中同时缺少这三个特征时,模型的预测效果显著降低.这表明,样本特征MFCC-2、MFCC-12 和MFCC-3 是关键的样本特征,关键样本特征对模型的影响非常大,它主要影响模型的真阳性率和真阴性率,尤其是严重影响真阳性率,在缺少关键样本特征的情况下,模型在危险样本上的预测准确度将严重失准,这对灾害预测十分不利,为合理运用样本特征组合进而取得最优的模型预测效果提供了依据.

5 结论

(1) 提取了煤样加载全程的12 个声发射梅尔倒谱系数作为煤样破坏预测的特征参量,该参量随煤样载荷的升高而规律性变化,在煤样受力约超过峰值载荷的80%后表现出明显突增或突降或先增加然后突降的现象,而在前期加载过程中,MFCC-1、MFCC-2 和MFCC-12 与应力呈现正相关的规律,MFCC-3 至MFCC-6 整体上与应力呈现负相关的规律,MFCC-7 至MFCC-11 随应力增加出现较明显的波动,可以很好地表征煤样的破坏状态.

(2) 将声发射梅尔倒谱系数作为样本特征,煤样应力状态作为样本标签,利用机器学习的Light GBM 算法构建了煤样破坏状态预测模型,可以预测煤样的危险状态.在测试集上的预测准确度、真阳性率、真阴性率和AUC 分别为93.87%、85.67%、96.03%和0.98;进一步利用五折交叉验证方法评价了预测模型的稳定性,结果显示交叉验证模型的准确度、真阳性率、真阴性率和AUC 分别为88.61%、72.34%、93.16%和0.93,说明模型的预测效果和稳定性均良好.

(3) 讨论了样本特征组合对模型预测效果的影响,发现机器学习方法可以识别出肉眼难以辨识的重要样本特征,样本中含有重要度高的样本特征是模型预测准确度高的关键,在样本中增加重要度低的样本特征对模型预测准确性的影响十分有限,样本中缺少关键样本特征时将显著影响模型的真阳性率、真阴性率和AUC.

猜你喜欢
梅尔煤岩煤样
煤中水分存在形式及不同能量作用下的脱除机理探究
基于梅尔频谱分离和LSCNet的声学场景分类方法
玉华矿4-2煤裂隙煤岩三轴压缩破坏机理研究
碟盘刀具复合振动切削煤岩的损伤力学模型
基于CT扫描的不同围压下煤岩裂隙损伤特性研究
水分对某矿突出煤层坚固性系数影响研究
突出煤样孔径分布研究
梅尔维尔鲸
“熊”视眈眈
煤岩裂缝导流能力影响因素分析