基于激光诱导击穿光谱技术的煤灰分特征研究

2023-12-12 12:00李云红余天骄周小计管今哥郑永秋张成飞
激光与红外 2023年11期
关键词:灰分光谱粒子

李云红,余天骄,周小计,管今哥,郑永秋,张成飞,程 博

(1.西安工程大学电子信息学院,陕西 西安 710048;2.北京大学电子学院,北京 100871;3.中北大学 省部共建动态测试技术国家重点实验室,山西 太原 030051;4.内蒙航天动力机械测试所,内蒙古 呼和浩特 010076)

1 引 言

在我国煤炭开采行业领域中,煤炭检测的精度和对煤炭成份分析不仅影响着煤炭的利用率还影响着煤炭企业经济的发展。而传统的检测分析方法主要是人工煤炭检测,实验分析常用设备有灰分仪和碳硫仪[1-2]等,检测速度慢、效率低、实验仪器操作复杂、精确度低,随着科学技术的发展已不能够满足大规模的实验检测分析。为了准确检测煤样的各种元素含量以及灰分值等关键工业指标,利用激光诱导击穿光谱技术进行煤样的光谱强度信息采集,这在煤炭检测分析中是一种安全、可靠、快速的技术。

近年来,更多的学者开展了对煤炭灰分检测的深入研究。Xie G[3]研制了一种基于伪双能X射线透射的实时灰分分析仪,通过X射线灰分含量与5个特征参数的线性关系,验证了X射线灰分分析仪的可行性。郭西进[4]等利用多层神经网络对煤泥浮选尾矿灰分进行检测。然后对其灰分值进行回归预测,并与实际尾矿灰分值进行比较分析。建立了基于深度卷积网络的灰分检测模型,验证其具有较好的实时性。郭宇潇[5]等使用机器学习方法结合LIBS技术进行定量的分析,提出了一种两阶段的变量选择方法。研究结果表明了,该方法在LIBS定量分析中的高效性和普适性。李云红[6]等通过搭建激光测量煤灰分实验平台,研究了三种不同标准煤样在不同厚度下的谱线强度和相对标准偏差。实验结果表明,煤样的厚度对煤灰分准确度的测量具有较大的影响。王龙龙[7]等利用机器学习从大量数据中找到选煤过程中参数的规律,同时利用机器视觉进行矸石分拣灰分预测,提高了选煤厂在选煤过程中的效率。Ali D等[8]利用随机森林、人工神经网络、自适应神经模糊推理系统来预测细粒高灰分煤炭特征。LegnaioliS[9]等利用安装在发电厂的激光诱导击穿光谱技术实验装置,研究了煤炭灰分含量的影响。实验结果表明,样品的选择应考虑LIBS测量灰分的大小,可以有效的避免燃烧器在运行期间结垢结渣。ZhaoyuQiu[10]等采用多项式回归(PR)、特征选择多项式回归(PRFS)和粒子群优化支持向量机(PSO-SVM)建立了煤的灰分预测模型。Zhang K[11]等提出了一种基于神经网络回归的灰分在线测量方法,用于快速估算煤炭的灰分含量。周涛[12]等利用基于激光诱导击穿光谱技术与传统的激光熔覆分析手段进行对比,实验结果表明激光诱导击穿光谱技术能够有效的克服传统分析手段所需的复杂预处理程序。

由于神经网络模型具有较强的自适应和自学习的能力,对于非线性模型问题能够很好的建模和逼近,为解决非线性模型提供了思路。本文利用激光诱导击穿光谱技术进行了煤炭灰分特征的快速识别,结合了粒子群优化BP神经网络模型的定量分析,利用均方根误差(RMSE)、平均绝对百分比误差(MAPE)、平均绝对误差(MAE)作为煤炭灰分预测模型的综合评价指标。探究了煤炭灰分的特征规律,建立了一种快速、安全的灰分检测识别方法,此方法对煤炭的勘探和开发具有一定参考价值。

2 实验原理和测试流程

激光诱导击穿光谱(Laser-Induced Breakdown Spectroscopy,LIBS)技术测量原理为,脉冲激光经过透镜和反射镜聚焦在样品表面上,在高强度的激光脉冲作用下样品表面粒子会吸收激光烧灼能量由固态烧融状态转化为蒸汽状态,最终形成等离子体。同时温度的升高使得等离子体发生迅速膨胀,煤样的表面由于热压力的产生会分解为不规则的小颗粒。在冷却过程中处于激发态原子、离子发生能级跃迁并产生特征谱线,该过程由光纤收集信号传至光谱仪最终由计算机分析。

LIBS分析仪测试流程如图1所示。首先要进行初始化包括程序的初始化和光谱仪的初始化,然后设置光谱仪相关参数包括光谱覆盖范围、分辨率、信噪比等,同时光谱仪会自动进行对暗背景的测量。其次器件激光器会自由运行并不断由Q开关向光谱仪发送触发信号,接收到触发信号的光谱仪经过设定的延迟时间开始进行光谱测量。并对光谱信号进行积分,当积分时间结束后将光谱数据传输到电脑中判断是否达到测量点数。如果没有达到,则等待Q开关的下一次触发。如果达到则复位平移台,保存光谱数据同时建立初始煤炭样本光谱信息数据库,作为测试模型训练集和测试集。通过matlab软件建立定量分析优化灰分预测模型,并对煤炭样本灰分值预测。

图1 LIBS分析仪测试流程

3 实验设计

3.1 实验装置

LIBS的实验装置,如图2所示。实验环境在北京大学电子学院量子电子所冷原子与精密测量实验室,采用调Q的Nd∶YAG脉冲激光器作为激发光源,脉冲激光器波长为1064 nm,脉冲宽度10 ns,频率为1 Hz。在激光诱导击穿光谱的煤质检测应用场景下,要求光谱仪不但有较广的光谱探测范围200~950 nm,还要求有较高的分辨率,因此光谱数据的采集使用AVANTES公司的AvaSpec-Dual型光纤光谱仪,焦距为10 nm,光学的分辨率为1150。实验中的光谱信号由光纤收集后传至光纤光谱仪进行分光探测,并通过光谱数据传输至计算机分析。同时在实验检测中使用195 nm~467 nm的单通道可以检测到Si、Al、Fe、K等煤质灰分值检测所需的元素特征谱线。

图2 LIBS实验系统框图和实物图

3.2 样品制备

实验样品为济南众标科技有限公司销售的标准煤粉样品,并以此建立了表1相应煤灰分值的数据库初始样本。实验中煤粉样品的颗粒小于0.5 mm,将标准的煤粉样品放在模具中,通过自动压饼机在20 t压力下压制成饼状的煤样,防止煤粉在实验过程中飞溅造成实验环境的污染。煤饼的直径为4 cm,厚度为0.7 cm,并进行统一样品编号。

表1 数据库初始样本

3.3 实验测量

将压好的煤饼样品固定在LIBS测量系统的电动平台上测量。每个煤饼表面选定不同测量位置,经过100 μs左右的延迟时间收集光谱信号。每次激光脉冲击打样品表面后,产生在样品表面的浮尘,会吸收激光能量利用吸尘器除尘。在处理基底噪声方面,通过增加光谱仪的延迟来消除噪声。在实验进行前,开机LIBS仪器15 min,能够更好地提高激光器稳定性。

LIBS测量过程中由于硬件设备产生的波动以及煤饼制样过程中存在的不均匀性,每条光谱数据的特征向量会不同。通过多条光谱数据的平均处理来削弱测量产生的波动,并对煤样光谱数据模型的训练集和测试集的合理划分。

4 PSO-BP神经网络的灰分预测

4.1 主成分分析(PCA)算法

在光谱数据预处理之前,经常会遇到维度较高的数组,并且变量与变量之间存在着很多相互的关系,造成数据在处理过程中很难抓住主要特征信息。主成分分析算法的核心是通过数值的变化将多维的特征变量转换为维度较小的不相关变量。同时这些变量尽可能反映出数据预处理之前的相关信息。利用主成分分析算法分析光谱数据的响应特征,将原始数据的变量转化为相对独立的数据变量。同时数据在降维的过程中能够排除数据的异常点,简化数据的结构。降维往往作为预处理步骤,在数据应用到其他算法之前对其清洗。在利用主成分分析方法之前对输入光谱数据先进行归一化处理,可以降低光谱的不确定性,提高光谱与元素浓度之间的相关性。

设x1,x2,…xp为P个原始特征变量,数据样本个数为n,构成n×p维矩阵X:

(1)

对矩阵X进行主成分分析主要步骤如下[13-15]:

(1)为了避免数据受到量纲的影响,对光谱数据进行标准化处理。并计算出P×P维的协方差矩阵A。

cov(xi,xj)=E[(xi-E(xi))(xj-E(xj))]

(2)

(3)

(2)计算出特征值对应的特征向量。用特征值分解方法求协方差矩阵A的特征值,得到λ1,λ2,…λp特征值。对应特征值的大小λ1≥λ2≥…λp,此时对应的最大特征值λi特征向量为:

(4)

4.2 BP神经网络

BP算法(Back Propagation)是一种多层前馈神经网络,是由输入层、隐含层、输出层三部分组成,如图3所示。BP神经网络算法的传播方向包括,正向传播与反向传播。正向传播,是从输入层x1经过LR传输至输出层y1。若输出值y1与期望输出预测结果存在一定的误差,则进行反向传播。通过神经网络的反复学习训练后,梯度下降不断修正参数使得实际输出值与期望值不断地接近。BP神经网络根据梯度下降法,不断更新调整网络各层的输入层和隐含层之间权值和阈值,而隐含层和输出层之间阈值容易使得BP神经网路获得局部最优解,这会使得灰分预测值和灰分实际真值相差甚远,最终导致模型预测精度降低。

图3 BP神经网络模型

其中,隐含层的节点数公式如下[16]:

(5)

式中,s表示的是神经网络的节点数;m与n分别代表的是BP神经网络的输入节点数和输出层的节点个数;λ代表是常量取值范围为λ∈(1~10)。

使用激活函数为非负的Sigmoid函数:

(6)

式中,e是纳皮尔常数2.7182…,Sigmoid函数作为激活函数,进行信号转换,转换后的信号被传送至下一个神经元。隐含层选取Sigmoid函数,该函数的梯度随着x增大或减小均趋于0,在反向传播时会造成“梯度消失”现象。

BP神经网络训练的步骤如下:

令样本x={x1,x2,…,xn}为输入向量,y={y1,y2,…,yk}为输出向量,xn为输入层个数,LR为隐含层个数,yk为输出层个数,Wij和Wjk分别为输入层到隐含层和隐含层到输出层的连接权值。

4.3 粒子群算法

粒子群算法(Particle Swarm Optimization,PSO)是一种模拟鸟群觅食行为的智能搜索算法。通过群体中的个体相互协作和信息共享来寻找最优的解。其基本思想是模拟鸟群搜寻食物的路径找到食物最多的地点,即根据局部的最优解寻找全局最优解。粒子群算法对于解决高维光谱数据优化问题具有一定的优势。

粒子群算法优化主要包括两方面:第一,对于BP神经网络拓扑结构的优化。第二,对权值和阈值进行优化。粒子群算法的关键是粒子位置和速度,逻辑步骤如下:

(1)初始化规模为N粒子群中每个粒子的位置和速度。

(2)计算粒子群中每个粒子的适应值。

(3)若某个粒子当前的适应值相比于之前记录该粒子的最优解pbest更好,则更新此时的最优解pbest。

(4)若某个粒子当前的适应值相比于之前记录的全局最优解gbest更好,则更新此时的最优解gbest。

(5)更新后的最优解gbest符合要求,则结束程序。反之更新粒子的速度和位置:

v(k+1)=wv(k)+c1r1(pbest(k)-present(k))+c2r2(gbest(k)-present(k))

(7)

present(k+1)=present(k)+v(k+1)

(8)

其中,w代表惯性权重;c1和c2代表是学习因子;r1和r2代表伯努利分布的0到1的随机数;v(k)代表是某个粒子在k时刻的速度;present(k)代表是某个粒子在k时刻的位置。

(6)继续循环到步骤(2)中。

4.4 粒子群算法优化BP神经网络

粒子群算法优化BP神经网络模型的训练流程图如图4所示。整个模型的训练学习过程包括粒子群算法和BP神经网络。而粒子群算法优化BP神经网络模型,通过对各层神经元权值和阈值的不断修正,使得误差函数沿梯度方向下降。当误差平方和小于目标误差时满足实验条件,输出最优权值、阈值。同时对模型的最优参数进行训练输出预测结果。

图4 粒子群优化流程

5 模型评价指标

实验选取均方根误差(Root Mean Square Error,RMSE)、平均绝对百分比误差(Mean Absolute Percentage Error,MAPE)、平均绝对误差(Mean Absolute Error,MAE)来评估模型的性能。即RMSE、MAPE、MAE越接近于0,表明模型预测具有较好的精度。其指标评价的计算公式如下:

(9)

(10)

(11)

6 结果与讨论

实验模型以180组激光诱导击穿光谱实验测试光谱数据为基础,分别用BP神经网络模型和PSO-BP神经网络模型对数据进行训练和测试。在表1编号中1~140样本数据用于训练集,141~180号样本数据作为测试集。在实验过程中,由于测得的原始光谱数据是4096的高维向量,数据样本量过大。同时存在一种元素对应多条特征谱线的情况,多出来的特征谱线反应都是同一元素的特征,而过多的参数数量在模型训练的过程中更容易出现过拟合等负面的影响。因此通过主成分分析特征提取,提取后每条数据的向量维度为27维,分别对应着样本煤主要元素成分Si,Al,Fe,Ca等元素。

通过建立BP神经网络,设置输入层神经元个数为6,隐含层神经元个数为15,输出层神经元个数为1。先后对比了1到27不同维度下,BP神经网络模型预测值和灰分实际真值,同时以RMSE、MAPE、MAE为评价预测模型分析的指标。表2所示为不同维度训练模型BP网络训练结束后得到预测值,通过主成分分析技术对数据进行预处理之后,6维训练效果明显好于其他维度。因此先后比较了27维、7维、6维和5维,对应的均方根误差、决定系数、平均绝对误差大小。而6维BP神经网络的预测结果较为准确,对应的均方根误差、决定系数、平均绝对误差较低,效果明显好于相邻维度的大小,则选择6维BP神经网络对其进行模型优化。

表2 不同维度BP网络模型训练结果

如图5所示BP神经网络模型算法下,27维、7维、6维和5维下的预测结果输出值和实际真值结果分析比较。

图5 BP神经网络模型预测结果

为了避免BP神经网络陷入局部极小值,提高预测模型的精度,建立PSO算法优化BP神经网络模型。优化后的6维BP神经网络模型,决定系数R2为0.88501更接近于1,表明建立的模型具有较好的预测性能。平均绝对误差MAE为0.43882,均方根误差RMSE为0.51984,平均绝对百分比MAPE为2.83 %。在6维PSO-BPNN实验中使用MATLAB仿真软件对180组光谱数据进行训练和预测,模型训练之前对光谱数据进行归一化处理。设置输入层节点数为6,隐含层节点数为15为,输出层节点数为1,粒子群初始粒子数量为50,期望误差设置为0.001。采用PSO-BPNN方法预测灰分值的适应度函数值变化过程如图6所示,从图6的实验结果可以看出PSO算法能避免BP神经网络陷入局部极小值。初始迭代时获取的适应度函数值大于4.0,随着迭代次数的迅速下降当迭代次数增加至10次时,适应度函数值的变换逐渐的在变缓。当迭代次数到达20次时,训练样本的均方误差到达最优状态,灰分预测值与灰分真值无限逼近。此实验结果灰分值预测具有较少的迭代次数,有效的验证了,基于粒子群算法优化结合BP神经网络方法,能够更好地提升灰分值预测的精度同时具有较好的收敛效果。

图6 PSO-BPNN网络模型预测结果和迭代次数

7 结 论

(1)为了快速识别煤炭灰分特征,提出了基于粒子群优化的BP的煤炭灰分优化识别方法。发现优化后的BP神经网络模型,能够更好的克服在寻优过程中容易陷入局部最优缺陷,提升了模型的泛化能力和预测精度,同时削弱了神经网络陷入局部最优的局限。

(2)对比了27维、7维、6维和5维预测模型的分析指标。优化后的6维BP神经网络模型,决定系数R2为0.88501更接近于1,表明建立的PSO-BP模型具有较好的预测性能,此时的灰分预测值与灰分实际真值无限逼近。

(3)通过对煤炭灰分特性研究,对模拟分析的结果进行综合评价。实验验证了,本文提出煤炭灰分值参数的预测优化算法的有效性,为后续的LIBS术应用于煤炭检测提供一定的理论依据。由于煤炭成分的相对复杂性,本次研究未对预测模型的鲁棒性进行考虑,未来研究还将进一步改进,以提高设计模型预测的准确性。

猜你喜欢
灰分光谱粒子
基于三维Saab变换的高光谱图像压缩方法
基于灰分回控的智能密度控制系统在寨崖底选煤厂的应用
灰分在线检测对选煤智能化建设作用的思考
潘集选煤厂重介灰分控制系统的开发与应用
不同重量僵蚕总灰分含量的比较研究
基于粒子群优化的桥式起重机模糊PID控制
基于粒子群优化极点配置的空燃比输出反馈控制
星载近红外高光谱CO2遥感进展
苦味酸与牛血清蛋白相互作用的光谱研究
铽(Ⅲ)与PvdA作用的光谱研究