杨 恩,王世博,葛世荣,向 阳
(中国矿业大学 机电工程学院,江苏 徐州 221116)
由于煤炭形成沉积过程的影响,煤层顶板与煤层交界处多为富含碳质物质的碳质页岩或黑色页岩[1-2],常使得顶板岩石外观颜色上呈现出类似于相邻煤层煤炭的黑色[3-4]。由于黑色的顶板岩石与煤层煤炭外观色泽相近,在采煤机滚筒截割煤层的工作过程中,往往难以准确区分煤炭与周围岩石,导致煤岩界面处黑色的岩石被滚筒同时截割下落混入煤中,此现象是导致开采煤炭中矸石增多的主要因素之一,也是无人化开采煤岩识别研究中需要解决的主要问题[5-7]。因此研究能够准确区分煤炭和黑色顶板岩石的方法至关重要。中国国家标准GB/T 5751《中国煤炭分类》和国际标准ISO 11760 Classification of coals对煤炭给出了相同的定义标准,即煤炭是主要由植物遗体经煤化作用转化而成的富含碳的固体可燃有机沉积岩,含有一定量的矿物质,其灰分产率小于或等于50%。据此,如果能够准确、快速地得到原位固体煤炭与周围黑色岩石的灰分产率,即可判定煤岩类型,进而控制采煤机滚筒的截割位置。
近红外反射光谱技术是一种高信噪比、实时、低廉、针对原位物质的光谱分析技术,不仅在煤矿和岩矿遥感等定性识别探测领域得到了应用[8-11],而且已在煤炭、矿物、土壤等成分定量分析检测领域中得到了较多应用[12-14],其中灰分产率分析是基于近红外反射吸收光谱的煤质成分定量分析研究中的主要内容,已有国内外众多学者建立了多种基于近红外反射吸收光谱的煤炭灰分产率预测方法。ANDRES等[15-16]基于主成分分析法(PCA)和偏最小二乘法(PLS)建立了煤炭灰分指标与其近红外光谱之间的定量数学关系模型,此模型对未知煤样灰分具有较高的预测精度和较快的预测速度。KIM等[17]在煤炭的近红外光谱中选择了1 680,1 942,2 100,2 180,2 300 nm等信息含量最高的波长点,建立了灰分的多元回归分析(MRA)预测模型,在煤炭灰分的在线分析中取得了有效的结果。赵凯等[18]采用主成分分析、自组织映射神经网络-模糊C均值聚类(SOM-FCM)双层聚类方法有效地优化煤炭样本,降低了煤炭近红外光谱数据维数,并搭建了基于GA-BP神经网络的煤炭灰分预测模型,有效提高了模型学习精度。雷萌[19]针对基于机器学习的煤炭灰分近红外光谱分析,研究了多种提高建模光谱数据质量和预测模型性能的学习算法。基于近红外反射吸收光谱分析的煤炭灰分预测的研究为煤矿井下煤岩灰分产率的原位获取提供了启示。
然而以上文献中的各种煤炭灰分预测模型,在煤炭光谱采集时,大部分试样为粉碎后的均质粉末试样,并且近红外光谱仪光纤探头均为靠近粉末试样获取煤炭光谱。在常见煤矿井下现场工作面煤壁、原位煤炭和顶板岩石均为块状试样,同时采煤机机身离煤层顶端较远,顶板与煤层交界岩石离采煤机机身距离常见为1.5~3.0 m,鲜有相关文献对于实时获取原位块状煤炭和顶板黑色岩石灰分产率的研究。然而地物反射光谱成分定量探测和定量遥感已取得了长足的发展[20-21],也为煤矿井下煤岩灰分等成分定量探测提供了参考和思路。获取原位煤岩的反射光谱并研究煤岩感知识别方法,为降低含矸量、煤岩识别等研究提供依据。
笔者收集了同一井下综采工作面的碳质页岩和烟煤块状试样75个,在实验室利用近红外光谱仪和光纤准直镜采集了距离块状煤岩试样表面3 m处的近红外波段(1 000~2 500 nm)反射光谱。基于煤岩灰分产率及其反射光谱建立了两类支持向量机(SVM)煤岩预测模型。
从山西马兰煤矿同一井下综采工作面现场收集了顶板与煤层交界处的碳质页岩以及烟煤大块状试样75个,试样收集后放入自封袋保存,其中煤样42个,岩样33个,试样外观均呈黑色,较为相似。
如图1所示,在实验室采集每块试样较平整表面的反射光谱。为减小被测煤岩物质双向反射特性的影响[20,22-23],使用4个50 W卤钨聚光灯按上下左右90°间隔排列,均以45°入射角照射所选平整表面中心,形成直径约10 cm,光照度约20 000 lux的圆形光斑。使用荷兰Avantes AvaSpec近红外光谱仪进行光谱采集,其光谱波长为1 000~2 500 nm,光谱分辨率为8.9 nm,采集每条光谱曲线耗时约为1 ms,同时采用PTFE材料白板进行反射参照标定。使用直径2.5 cm准直镜进行光束准直,准直镜连接于Y型石英光纤合并端,分支端的一端连接光谱仪进行光谱采集,另一端连接650 nm激光光源以进行目标试样对准。准直镜固定于三维旋转台以进行探测目标对准调节,调节旋转台保持准直镜轴线垂直对准试样表面的光斑中心,准直镜与光斑中心保持距离l=3 m。准直镜视场角(FOV)θ=0.12°,镜头直径d=2.5 cm,如图1(b)的实验原理示意所示,光谱仪所采集光谱为准直镜视场角所形成圆台在试样表面底面圆区域的平均反射光谱,底面圆的直径D、面积A分别约为
(1)
(2)
计算机通过USB3.0与光谱仪连接,实时显示并可同时采集反射光谱曲线。每个试样的探测区域共采集10条反射光谱曲线,进行断点修正和去噪,然后计算其均值作为该试样表面的反射光谱。
图1 块状煤岩试样反射光谱采集实验Fig.1 Reflectance spectra acquisition experiment of block coal or rock sample
在每块试样进行反射光谱采集时,标记光谱采集表面的7.5 cm2圆形区域。在所有试样完成反射光谱采集后,将每块试样的圆形光谱采集区域打磨下表面至0.5 cm深度内的试样,碾成粉末,将粉末放至灰化马弗炉进行灰分产率分析,获得每块试样反射光谱采集区域的灰分产率。
为有效去除由于仪器性能以及环境等因素影响所产生的光谱曲线噪声,笔者采用Savitzky-Golay(SG)卷积平滑算法对实验采集光谱数据进行滤波去噪处理[24-25],其核心求解算法为
(3)
图2为75个块状煤岩试样表面在近红外波段(1 000~2 500 nm)的经断点修正、滤波去噪、取均值后的光谱反射率曲线。受黏土矿物、石英等矿物影响,反射光谱曲线在近红外波段明显地表现出水平至正向斜率倾斜的整体变化趋势[4],小部分试样光谱曲线受原位试样中水分影响,1 400和1 900 nm波段附近出现吸收特征。由图2可以看出一大部分煤岩试样的反射光谱波形相似并且重叠交叉,从波形难以有效区分。
图2 75个煤岩试样的光谱反射率曲线Fig.2 Reflectance spectra curves of 75 coal and rock samples
为了研究能够根据原位块状煤岩的反射光谱有效区分煤岩的方法并建立识别模型,从75条试样光谱曲线中随机选择50条为训练样本,其中煤样28个,岩样22个,其余25条光谱曲线为测试样本,其中煤样14个,岩样11个。
为有效增强光谱反射吸收特征强度,利用一阶微分(FD)、二阶微分(SD)、连续统去除(CR)、标准正态变量变换(SNV)4种方法预处理图2中所有75条煤岩反射光谱曲线[14,24]。4种预处理方法的核心求解算法如下:
(1)一阶微分
(4)
其中,xi,λ+Δλ1,xi,λ-Δλ1为光谱向量xi,λ中的元素,即编号为i的样本在波长λ+Δλ1,λ-Δλ1处的光谱值;Δλ1为一阶微分的波长间隔;x′i,λ为波长点λ的一阶微分光谱反射率。本文选择Δλ=3 nm。
(2)二阶微分
(5)
其中,x′i,λ+Δλ2,x′i,λ-Δλ2分别指编号为i的样本在波长λ+Δλ2,λ-Δλ2处的光谱值(光谱反射率)对波长的一阶微分;Δλ2为二阶微分的波长间隔;x″i,λ为波长点λ的二阶微分光谱反射率。
(3)连续统去除
(6)
其中,xi,λ为光谱向量xi,λ中的元素,即编号为i的样本在波长λ处的光谱值;zi,λ为波长点λ的包络线值;cri,λ为波长点λ的连续统去除光谱反射率。
(4)标准正态变量变换
(7)
xi,λ,A=-lgxi,λ
(8)
(9)
结合文献[4],为了进行光谱预处理分析说明,在图2中选择了灰分产率在50%附近的5个煤样和5个岩样的光谱曲线为代表,如图3所示,其中,煤1~煤5的灰分产率分别为39%,40%,48%,41%,43%,岩1~岩5的灰分产率分别为60%,57%,59%,52%,53%。由图3可知,这10条反射光谱曲线的整体轮廓波形较为相似。图4分别为此10条反射光谱曲线经一阶微分、二阶微分、连续统去除、标准正态变量变换预处理后的光谱曲线。由图4可知,经4种算法预处理后,光谱曲线整体波形发生变化,反射吸收特征有所增强,但各个试样的光谱曲线依旧波形趋势相似并且重叠交叉,难以有效区分。然而,因物质光谱的反射吸收特征是其物质成分的“指纹”,含有丰富的物质成分信息,反射吸收特征的增强更利于煤岩光谱与其物质成分关系的研究。
图3 代表性煤岩试样的光谱反射率曲线Fig.3 Spectral reflectance curves of representative coal and rock samples
图4 代表性煤岩试样光谱反射率曲线经4种方法预处理后的光谱曲线Fig.4 Spectral curves of representative coal and rock samples whose spectral reflectance curves had been preprocessed by four methods
煤岩灰分主要来源于其黏土矿物、石英等矿物成分,矿物和有机物成分影响其反射光谱吸收特征,物质成分含量与光谱值的相关性分析是一种有效的获取特征波长点的方法[24,26]。为此选取前述50个训练样本,对其灰分产率与去噪后反射光谱以及前述4种算法预处理后光谱各波长点处的光谱值进行相关性分析,其中波长λ处的相关系数rλ为
(10)
式中,X′i,λ为波长λ处的光谱值;yi为第i个样本的灰分产率。
此50个煤岩样本的灰分产率与去噪后反射光谱以及4种算法预处理后光谱在各波长点处的相关系数如图5所示,图中同时标出了每种相关系数曲线的最大值。由图5可知,连续统去除预处理方法的最大相关系数出现在波长1 698 nm处,为0.777,大于其他4种相关系数曲线的最大值,其中二阶微分预处理方法的最大相关系数最小。对连续统去除1 698 nm处进行线性、指数、幂函数回归分析,如图6所示。
由图6中的各类回归方法可知,灰分产率回归分析的决定系数均较低,因此常见线性和非线性回归函数均不能有效进行灰分预测。然而,连续统去除预处理方法最大相关系数波长点1 698 nm位于1 700 nm光谱带附近,1 700 nm为煤岩中主要有机基团倍频和合频的典型谱带[27],如芳香结构中C—H伸缩振动3 030 cm-1与脂肪侧链中CH2对称伸缩振动2 850 cm-1的合频[28]。本实验煤岩主要有机成分为芳香环状结构化合物、脂肪侧链结构化合物[29-30],煤岩灰分产率间接取决于这些主要有机成分的含量,与此同时,连续统去除预处理方法1 698 nm波长点附近左右区间相关系数曲线连续,为最大相关系数曲线段,因此考虑采用1 698 nm波长点附近左右区间连续统去除光谱建立原位煤岩灰分产率预测模型。本文选取的连续统去除光谱波长点区间为1 693~1 703 nm,所含波长点对应相关系数见表1。
根据前述对50个煤岩样本主要有机成分的特征谱带、灰分产率-光谱相关波长点的分析,借鉴定量遥感和化学计量学的思路[21,24,31],选取表1中的11个波长点处连续统去除预处理光谱为训练数据,建立煤岩灰分产率机器学习预测模型。与其他机器学习算法相比,支持向量机(SVM)算法更适合于本实验的小训练样本、多维度成分因素、非线性关系问题[21],为此本文建立煤岩灰分产率支持向量回归(SVR)预测模型。同时以表1中11个波长点处连续统去除预处理光谱为训练数据,50个试样的煤岩类型为预测目标数据,建立煤岩类型支持向量分类(SVC)预测模型,以对比回归和分类两类支持向量机方法对基于反射光谱原位煤岩识别的有效性。
图5 50个训练集煤岩试样灰分产率与反射光谱及预处理后光谱的相关系数曲线Fig.5 Correlation coefficient curves between ash yields and reflectance spectra and preprocessed spectra of 50 training coal and rock samples
图6 图5(d)中1 698 nm处灰分产率与光谱值的回归分析Fig.6 Regression analyses between ash yields and spectral values at 1 698 nm inFig.5(d)
表1 50个训练集煤岩试样灰分产率与其连续统去除预处理光谱的最大相关系数区间
Table 1 Interval of maximum correlation coefficientsbetween ash yields and continuum removal-preprocessedspectra of 50 training coal and rock samples
波长点/nm相关系数1 6930.7701 6940.7711 6950.7731 6960.7731 6970.7741 6980.7771 6990.7761 7000.7721 7010.7691 7020.7691 7030.768
SVR基本原理为将光谱数据映射到高维空间并建立最优界面,使得所有数据到此界面的距离最小,此时最优界面回归函数为
(11)
(12)
(13)
其最优界面求解过程与SVR类似,亦借助Lagrange变换法[32],各参数意义与SVR类似,其中,yic为第i个训练样本的类型代号,本文使用0代表煤,1代表岩。
对于SVR和SVC煤岩预测模型的建立,本文采用5折交叉验证求解最优γ和c,两个参数的搜索范围均取2-10~210,指数步长均取0.5,由50个煤岩训练试样的表1中11个波长点处连续统去除预处理光谱值及其灰分产率、煤岩类型为训练数据,求解最优γ和c的过程如图7所示。由图7(a)可知,煤岩灰分产率SVR预测模型训练中,煤岩试样5折交叉验证的验证集煤岩灰分产率平均最小均方差(MSE)为0.002 182,此时最优解为c=24.5,γ=2-8。由图7(b)可知,煤岩类型SVC预测模型训练中,煤岩试样5折交叉验证的验证集煤岩类型平均最大预测精度(PA)为94%,此时最优解为c=24,γ=2-4.5。此时,由前述50个煤岩样本为训练集,建立了煤岩灰分产率支持向量回归(SVR)预测模型和煤岩类型支持向量分类(SVC)预测模型。
为进一步验证以上所建立的SVR和SVC两种煤岩预测模型的有效性,取前述25个测试煤岩试样连续统去除预处理后光谱在表1中11个波长点处的光谱值,用上述两种模型进行灰分产率和煤岩类型预测,预测结果如图8所示。表2列出了SVR模型对25个测试煤岩试样灰分产率预测的均方根误差(RMSE)、决定系数(R2),以及两类SVM方法对测试试样的预测精度(PA),3个评价参数的计算方法如下
(14)
(15)
图7 交叉验证求解两类支持向量机预测模型的最优参数Fig.7 Processes of searching for the optimal parameters of two types of SVM prediction models by cross validations
图8 两类支持向量机预测模型对测试煤岩样本的预测结果Fig.8 Prediction results of test coal and rock samples by two types of SVM prediction models
式中,yi,yip分别为第i个测试试样的实测、预测灰分产率;N为测试试样类型被正确预测的个数。
同时,使用两类SVM预测模型对50个训练样本的同类光谱数据进行了预测,预测结果数据同时也列于表2中。
表2 两类支持向量机预测模型对煤岩样本的预测结果数据
Table 2 Prediction result data of coal and rock samples bytwo types of SVM prediction models
预测模型测试试样RMSER2PA/%训练试样RMSER2PA/%SVR0.050.88920.030.9298SVC——96——98
由表2可知,测试试样的预测精度均达到90%以上,训练试样均达到95%以上,SVC类型预测方法略高于SVR灰分产率回归预测方法。由图8(a)可知,测试试样预测灰分产率与实测灰分产率整体趋势是一致的,同时SVR灰分产率回归RMSE为5%,故本文SVR模型对天然原位煤岩试样固体表面灰分产率的预测较为精确。
本实验在仿真模型预测测试试样时,还测试了两种预测模型对每一个测试集试样光谱的预测时间,均在0.1 s以内,加上每个试样单条光谱曲线采集时间约为1 ms,即每个试样光谱采集和类型预测总耗时不超过0.1 s。因此,以本实验中50个煤岩训练样本在表1中11个波长点处连续统去除预处理光谱值,及其灰分产率、煤岩类型建立的SVR,SVC两种原位煤岩感知识别模型对同一煤矿试样能够有效识别,并且能够对试样类型实时快速预测。
此外,考虑到光纤准直镜探头将来应用于煤矿井下时应具有防爆功能,针对防爆玻璃窗对近红外反射信号的衰减问题,可采取增加煤岩探测区域光照度的措施。本实验煤岩表面探测区域光照度只有20 000 lux,GOETZ等[13]通过设计专用聚光探头提高了光照度,其在指定波段光照度为40倍日光照度,在100 000 lux以上,实现了传送带上矸石中矿物含量的在线精确测定。同时,煤岩探测区域光照度的增加不仅可增加探测距离,而且还可增加反射光谱的信噪比。
(1)依据常见顶板高度,距烟煤和碳质页岩原位块状试样表面3 m处通过光纤准直镜采集的近红外波段(1 000~2 500 nm)反射光谱,通过SG去噪,经FD,SD,CR,SNV四种方法预处理后,与试样灰分产率的最大相关系数出现在1 698 nm波长点处,由连续统去除(CR)预处理方法获得,且其波长点位于与煤岩主要有机成分有关的1 700 nm光谱带附近。
(2)煤岩训练样本的近红外反射光谱在经CR预处理后,以1 693~1 703 nm波长区间的11个波长点处预处理光谱值,及训练样本灰分产率、煤岩类型建立了SVR煤岩灰分产率预测模型、SVC煤岩类型预测模型,两种原位煤岩感知识别模型对同一煤矿试样识别率均达到90%以上,并且能够对试样类型实时快速预测。
(3)本实验所用原位煤岩感知预测方法,为煤矿井下采煤工作面中煤层与顶板间煤岩界面的远距离、准确、快速、低成本识别或界定提供了参考。