基于高光谱特征吸收峰的煤岩识别方法

2021-06-10 07:10徐良骥孟雪莹吴剑飞
光谱学与光谱分析 2021年6期
关键词:煤岩计算公式微分

韦 任, 徐良骥, 孟雪莹, 吴剑飞, 张 坤

1. 安徽理工大学空间信息与测绘工程学院, 安徽 淮南 232001 2. 深部煤矿采动响应与灾害防控国家重点实验室, 安徽 淮南 232001

引 言

用采煤机切割煤层, 当切割到岩层时, 应用煤岩识别方法可及时调整采煤机滚筒高度来避免造成欠/过切割[1]。 采煤机滚筒调高是通过人工判断采煤机滚筒截割物料成份实现的[2]。 由于人工识别的效率较为低下, 存在较多不确定因素, 且井下环境复杂, 所以逐步实现自动化无人开采是全世界未来煤炭开采的趋势。 煤岩识别是实现无人开采的关键技术。 如何实现高效准确的煤岩识别一直是国内外的研究热点。 早在20世纪60年代以来, 美国、 英国这些世界主要产煤国就对煤岩识别技术进行了大量研究[3]。 近些年来, 国内学者在国外学者的理论基础上提出了很多新的观点。 李亮等利用探地雷达技术进行煤岩界面探测, 并以郭庄煤矿为试验地进行试验, 实现了气煤与砂岩的区分, 且误差较小[4]。 孙继平等提出了基于可见光图像、 红外图像识别、 γ射线、 雷达、 红外、 有功功率、 震动、 声音等多参数信息融合煤岩界面识别方法[5]。

纵观现有的主要的煤岩界面识别方法, 主要是依据煤与岩石的一些物理性质进行区分。 而我国的地下矿井种类较多, 情况复杂, 很难将这些方法普遍用于各地矿井。 高光谱遥感具有波段多而窄、 信息丰富的特点。 HUNT等学者验证了矿物和有机物在400~2 500 nm间由化学成分和分子结构引起的识别性高光谱吸收带, 这些吸收带被广泛应用于识别矿物和岩石[6]。 以此为基础, 通过对煤岩的构成成分的差异造成的光谱响应的差别, 结合高光谱每个波段信息含量丰富的特点, 笔者提出了基于光谱的煤岩识别手段。

1 实验部分

1.1 煤岩样品的采集

淮南矿区煤种较为丰富, 煤质优良。 煤的品种包括1/3焦煤、 气煤、 焦煤、 瘦煤等; 岩石种类包括砂岩、 页岩、 灰质砂岩等。 试验样品采集于淮南潘二、 潘四、 谢桥等矿区, 煤样与岩石均来源于矿区井下, 保持了样品最初的特征。 为保证煤样与岩样的随机性, 采取均匀采样的方法, 获取了总共48组样本数据。 其中煤样本23组, 岩样25组。 ASTER光谱库的附属文件指出沉积岩的粗糙表面漫反射光谱反射率等效于其500~1 500 μm粒度粉末试样的漫反射光谱[7]。 而煤岩均属于沉积岩。 为了增加模型的泛化能力, 使模型适用于更多场景, 将新鲜的煤样与岩石碾成块状, 而后使用打磨机将其研磨为粉末状, 采用1 mm筛子对粉末状的煤与岩石进行筛选, 制成实验用样品。

图1 典型的煤岩样本

1.2 煤岩光谱曲线的测定与预处理

本实验所用的是美国ASD公司生产的ASD FieldSpec4高光谱仪, 光谱范围为350~2 500 nm。 测量时间选在晚上, 保证了暗室的环境。 背景为黑色绒布, 保证视场内仅有白板, 背景反射率为0。 测试光源为1 000 W卤素灯, 光源照射方向与垂直方向夹角为45°; 光源距离设置为30 cm, 探头距离5 cm, 探头与垂直方向保持15°夹角。 测试前进行暗电流校正和白板校正, 测试过程中每隔三十分钟进行一次白板校正。 每个样品采集30条光谱曲线, 共取得1 440组数据。

将采集得到的数据进行剔除异常值处理, 而后取算术平均值作为样品的实际反射率。 因为高光谱数据冗余量大, 煤的整体反射率偏低, 所以煤的光谱曲线部分波段会出现很多“毛刺”, 因此对取得平均值后的数据使用origin软件进行平滑处理, 达到去除噪声的效果, 并且能最大程度的保存原始光谱曲线的信息。 部分典型的处理后的煤岩反射图如图2所示。

图2 典型的煤岩光谱曲线图

1.3 煤岩光谱差异机理分析

由图2可知, 煤的整体反射率较低, 而岩石反射率偏高。 在1 450 nm附近处岩石有个较强的吸收谷, 部分煤样如1/3焦煤、 气煤存在一个较弱的吸收谷。 这是因为1 450 nm附近的波段主要是水分子的O—H官能基伸缩振动的第一倍频, 由水分子引起的一个吸收带[8]。 在1 900 nm附近, 由于岩石中含有的二价铁离子和煤炭中含有的Al2O3, 岩石与少部分煤样产生了第二个较强的吸收谷[9]。 在2 130~2 250 nm波段范围内由于Al元素存在形式的不同, 导致了煤与岩石的光谱产生了较大的差别。 煤的组分中Al元素的存在形式主要是Al2O3, 而岩石中Al元素的存在形式则为Al(OH)3。 Al(OH)3的Al—OH晶格振动使得其在2 209 nm附近具有强吸收峰, 而Al2O3在2 209 nm附近不具有强吸收峰[10]。 根据物质的组分特性的不同进行特征波段选取, 相当于对冗余量较大的高光谱信息进行了“降维”。 提取2 130~2 250 nm的波段作为特征向量进行煤岩识别, 使用随机森林算法进行分类, 并计算分类精度与Kappa系数, 与其他方法进行比较。

1.4 基于煤岩差异机理的煤岩识别算法构建

基于煤岩在2 130~2 250 nm间的差异性, 采取了连续统去除法、 一阶微分法、 二阶微分法和SCA-SID四种算法来进行煤岩的识别, 具体的识别流程图如图3所示。

图3 煤岩识别流程图

1.4.1 连续统去除法

连续统去除法是一种有效增强感兴趣吸收特征的光谱分析方法, 它可以有效突出光谱曲线的吸收和反射特征[11]。 连续统去除法选取光谱曲线上的峰值, 用一条相对平滑的曲线将各个峰值连接起来, 这条曲线称之为包络线[12]。 连续统去除法的作用是将光谱数值归一化值0—1之间, 扩大了特征波段的区别, 便于提取差异化特征。 经过连续统去除法后的光谱曲线如图4所示。

经过包络线去除后, 利用python编程, 提取几个典型的吸收特征参数:光谱吸收谷处的位置(P)、 吸收深度(H)、 光谱吸收指数(SAI)、 吸收谷面积之比(S)以及基线的斜率K为特征向量区分煤与岩石。 主要的光谱吸收特征参数如下:

吸收位置P: 连续统去除后的吸收谷中, 反射率值最小的点对应的波长值λmin。

吸收深度H: 吸收位置P点到1的距离, 计算公式为

H=1-Rλmm

(1)

式(1)中,Rλmin表示P点的反射率。

光谱吸收指数SAI计算公式为

(2)

式(2)中,d为对称度, 计算公式为

(3)

式(3)中,λl为吸收谷左肩对应的波长,λr为吸收谷右肩对应的波长。Rl和Rr分别为λl和λr对应的反射率的值。

图4 连续统去除后的典型光谱曲线值

吸收谷面积之比S的计算公式为

(4)

式(4)中,Al为吸收谷P点左侧的面积,A为吸收谷的整体面积。

基线的斜率K: 基线为连接吸收谷左肩和右肩的直线,K的计算公式为

(5)

提取的五个特征组成了一个五维向量集合{P,H, SAI,S,K}, 将这个五维特征向量输入到随机森林算法分类器中, 分类器最大深度为5, 最终得到分类结果混淆矩阵如图5和表1所示, 0为煤样本, 1为岩石样本(后面的混淆矩阵中0均为煤样, 1均为岩样), 有一个煤样和一个岩样被误分, 最终正确率达到83.3%。

图5 连续统去除法混淆矩阵

表1 煤岩识别算法的结果比较

1.4.2 一阶微分变换&二阶微分变换

微分是一种被广泛应用的光谱分析方法, 使用微分变换方法可以去除部分线性或接近线性的噪声对目标光谱的影响, 从而使得光谱中含有的丰富信息更加真实可靠。 在微分变换中, 一阶微分与二阶微分是较为常用的方法。 煤与岩石的一阶和二阶微分如图6(a,b)所示。

图6 光谱微分变换

光谱一阶微分变换的计算公式为

(6)

光谱二阶微分变换的计算公式为

(7)

式(6)和式(7)中,i表示波段号,λi表示第i波段的波长值,Rλi表示第i波段波长λi吩应的反射率的值。 表示λi处光谱的一阶微分值, 表示λi处光谱的二阶微分值。

图6(a)是煤岩的一阶微分曲线图, 可以看出图中存在9个差异较明显的波段, 其中差异较大的有4个波段, 分别为1 416~1 440, 1 860~1 914, 2 122~2 176和2 209~2 240 nm。 而根据煤岩的物性组分中Al的存在形式的差别, 选取2 122~2 176和2 209~2 240 nm作为煤岩识别的波段, 使得识别精度达到最高。 将得到的特征波段分别采取平均值操作, 构成特征向量, 结果可视化如图7所示, 煤与大部分岩石的一阶微分值差异较大, 比较容易识别。 针对这两个特征波段, 使用高斯径向基作为核函数, 采用SVM算法进行分类, 对煤与岩石这两个类别进行识别, 识别结果如表1和图8(a)所示。

图7 微分变换特征分布

图6(b)是煤岩的二阶微分曲线图, 在2 203~2 217 nm处煤岩二阶微分值差异明显, 选取此波段为二阶微分识别波段, 做平均值处理, 结果可视化如图7(b)所示。 采用以高斯径向基为核函数的SVM算法进行分类识别, 最终得到的结果如表1和图8(b)所示。

图8 微分变换法混淆矩阵

数据集中包括36个训练集样本和12个测试集样本, 其中含有5个煤样和7个岩石样本。 其中, 一阶微分算法中有两个岩石样本被误分, 煤样均被识别, 识别率达到了83.3%。 二阶微分算法中仅有一个岩石样本被误分, 识别率达到了91.7%。

1.4.3 基于光谱相关角与光谱信息散度模型融合的方法

光谱角匹配算法是一种通过计算光谱间的矢量夹角来比较物质相似性的方法, 常被用来进行矿物之间的识别[13]。 但由于夹角的大小只与光谱矢量方向有关, 与其辐射亮度无关, 因此当两种矿物的光谱矢量方向相似而辐射亮度大小有差别时, 区分效果较差, 并且光谱角只考虑夹角的绝对值, 而不能识别待匹配光谱的正负相关性[14]。 光谱相关角则可以避免以上问题, 可以反映出光谱相对于其均值的变化。 光谱信息散度则是以信息论为出发点来比较两光谱的相似性。 它们的计算方法如下:

光谱相关角(SCA)的计算公式为

(8)

式(8)中,μx和μy为两光谱曲线的均值。

对于光谱曲线上的x和y, SCA的计算公式为

(9)

(10)

光谱信息散度(SID)的计算公式为

ΨSID(x,y)=D(x‖y)+D(y‖x)

(11)

根据信息论, 光谱x和y的自信息为

I(xi)=-logp(xi)

(12)

I(yi)=-logq(yi)

(13)

其中, 式中的p(x)和q(y)分别为

(14)

(15)

信息论中两光谱曲线的相关熵为

(16)

(17)

光谱信息散度的计算公式则为

(18)

使用单一的SCA模型或者SID模型只能从单一的角度去反映光谱间的相似性。 采用模型融合的方法, 将光谱的形态信息与信息论中的“信息”相融合, 可以显著提高矿物的识别能力。

SCA模型与SID模型融合后的SCASID(x,y)tan模型计算公式为

SCASID(x,y)tan=ΨSID(x,y)tan(SCA(x,y))

(19)

计算得出的结果如图9所示。

图9 SCA-SID特征分布

采用以高斯径向基为核函数SVM算法对得到的特征数据进行分类, 最终得到的混淆矩阵如图10所示, 仅有一个岩石样本被误分, 正确率达到91.7%。

图10 SCA-SID法混淆矩阵

2 结果与讨论

(1)从表1和混淆矩阵可以看出分类效果最佳的是二阶微分算法和SCA-SID算法。 连续统去除法各有一个岩石样本和煤样被误分, 识别率达到了83.3%, Kappa系数为0.66; 一阶微分法有两个岩石样本被误分成了煤样, 识别率为83.3%, Kappa系数为0.68; 二阶微分法和SCA-SID模

型法均仅有一个岩石样本被误分成了煤样, 分类的精度均达到了91.7%, Kappa系数均为0.83。

(2)从分类的精度的角度来说一阶微分法和连续统去除法分类精度较低, 二阶微分法和SCA-SID模型法的精度与Kappa更高。 从模型的复杂度的角度出发, 二阶微分法得到特征向量的计算过程和所花费的时间更少, 时间和空间复杂度更低, 所以在实际工程应用中, 二阶微分法比SCA-SID模型法更具有高效性和可靠性。

3 结 论

(1)提出了四种基于吸收特征波段的煤岩识别方法, 结合煤岩构成成分Al元素的存在形式的不同产生的特征吸收峰(2 130~2 250 nm)进行了特征向量提取, 并根据实际情况选用了随机森林算法和SVM算法作为识别的算法。 结果表明, 连续统去除法、 一阶微分法、 二阶微分法、 SCA-SID模型法的识别准确率达到了83.3%, 83.3%, 91.7%, 91.7%, Kappa系数分别为0.66, 0.68, 0.83, 0.83。 其中二阶微分法的模型复杂度较SCA-SID的更低, 更有利于煤岩的识别。

(2)相比于传统的煤岩识别方法, 使用高光谱技术是建立在对煤岩光谱差异的机理上进行的。 目前, 基于高光谱技术的煤岩识别算法设计相关研究较少, 本工作提出的四种煤岩识别算法较传统方法更具有可靠性和高效性, 为实际工况下的煤岩识别提供了方法参考。

猜你喜欢
煤岩计算公式微分
电机温升计算公式的推导和应用
玉华矿4-2煤裂隙煤岩三轴压缩破坏机理研究
拟微分算子在Hp(ω)上的有界性
基于CT扫描的不同围压下煤岩裂隙损伤特性研究
上下解反向的脉冲微分包含解的存在性
2019离职补偿金计算公式一览表
借助微分探求连续函数的极值点
屯兰矿半煤岩巷道支护参数数值模拟研究
基于测井响应评价煤岩结构特征
对不定积分凑微分解法的再认识