PSO-LSSVM对LIBS定量分析精度的提高

2021-11-11 05:24林晓梅王晓檬黄玉涛林京君
光谱学与光谱分析 2021年11期
关键词:定标谱线系数

林晓梅,王晓檬,黄玉涛*,林京君

1.长春工业大学电气与电子工程学院,吉林 长春 130012 2.长春工业大学机电工程学院,吉林 长春 130012

引 言

土壤是发展经济的重要物质基础,但我国土壤受重金属污染程度日益严重。因此,如何提高土壤重金属定量分析的稳定性和精确度十分重要。随着激光技术的发展,LIBS技术逐渐被应用到土壤的定量分析中[1]。

土壤定量分析受基体效应影响较大,因此应用LIBS技术定量分析时,通常需要结合一些分析方法来提高LIBS的分析精度[2]。Villas-Boas等[3]将偏最小二乘回归方法与LIBS技术结合分析土壤中金属元素,拟合系数均高于0.85。汪萍等[4]用LIBS技术和三元二阶非线性回归方法对土壤中Mn元素进行检测,测量浓度与参考浓度的相关系数为0.97。De等[5]用LIBS技术和内标法结合检测土壤中的Ca,拟合系数提高到0.989。孟德硕等[6]将LIBS技术与ANN结合检测土壤中的Cu,测量误差在10%以下。邹孝恒等[7]采用LIBS技术与遗传算法和偏最小二乘法相结合,提高了土壤中金属元素的检测精准度。

近年来,诸如卷积神经网络(CNN)等人工智能算法被广泛应用于检测土壤中的元素[8]。但是,卷积神经网络存在平移不变性、池化层和过度拟合等缺点;最小二乘支持向量机(LSSVM)作为新一代机器学习算法,能够避免神经网络过拟合和支持向量机训练耗时长的问题[9]。然而,LSSVM的参数搜索是采用网格搜索法选择模型参数并进行交叉验证,搜索精度低和效率慢都是此算法的缺陷[10]。LSSVM建模过程中,对预测结果影响较大的参数为惩罚系数和核函数参数g[11]。LSSVM模型中的参数一般是根据经验来设定的,盲目性大和效率低都是需要解决的问题[12]。为了克服LSSVM算法存在的缺陷,需要采用其他算法优化模型参数,得到最优的参数组合(γ,g)。常用的优化算法一般操作步骤繁琐、耗时较长,可能存在一定的盲目性,并且其精度和收敛速度会因计算的问题维度过高而受到影响[13]。本工作选取粒子群算法(PSO)来优化模型参数,避免了一些传统的优化算法在选择参数时存在的问题,获取最佳的惩罚系数γ和核函数参数g组合,提高了LIBS的重复性和检测精度。

1 实验部分

1.1 装置

实验室所搭建的LIBS系统如图1所示。光源为Nd∶YAG激光器(Nimma-400型),波长为1 064 nm,脉冲宽度为8 ns,激光能量为90 mJ。激光器产生的激光经过反射、聚焦透镜聚焦到样品表面,形成激光等离子体。等离子体的光谱信号经光纤探头耦合至光谱仪(Avaspec-2048-USB2)进行分光等处理,实现样品的成分分析。通过控制三维移动平台来移动样品,激光器与光谱仪由数字延时发生器(BNC575,美国Berkeley Nucleonics Corp)同步控制。

图1 实验系统原理图

1.2 样品制备

为了确保土壤样品中Cr和Pb元素的含量稳定,土壤样品是由Cr(NO3)3和Pb(NO3)2的固体结晶和标准土壤样品GBW07403混合而成的,加水制成溶液,使分析元素均匀分布于样品中。土样的制作必须要确保样品的干燥,所以在制成溶液过后,需要对溶液进行烘干处理。烘干处理后称取样品5 g,并将其放进模具,施加的压强为30 MPa,施压时间为30 min,最终制成的圆饼直径为30 mm,厚度为3 mm。标准土壤样品本身所含分析元素与添加的分析元素相比含量极低,可忽略不计。样品浓度如表1所示。

表1 样品中Pb和Cr元素的浓度

1.3 LSSVM算法

最小二乘支持向量机(LSSVM)是在支持向量机(SVM)的基础上,由Suykens等提出的机器学习方法[14]。此模型为一个等式约束优化问题,表示为

(1)

式(1)中:ω=[ω1,…,ωn]T为权值系数向量;γ为惩罚系数;ek为误差向量;ek,1, 2,…,N。根据Mercer条件来定义核函数

K=(xk,xl)=φT(xk)φ(xl)

(2)

式(2)中:φ(·)=[φ1(·), …,φn(·)]T为非线性映射函数;l=1, 2, …,N。最终得到LSSVM的非线性模型

(3)

式(3)中:αk(k=1, 2, …,n)为拉格朗日乘子,αk∈R;b为偏差向量。

1.4 PSO算法

PSO算法将优化问题的所有潜在解视为多维空间中的点,粒子即为不同的点,因此群体由多个粒子构成。粒子会在PSO初始化后随机生成,这些随机粒子(随机解)会为了寻找最优解而进行迭代。所有粒子都具有一个自己的矢量速度,最优解就在这些不同粒子之间的相互竞争中被搜寻出来[15]。粒子迭代优化自身的位置和速度的公式为

Xik(t+1)=Xik(t)+Vik(t+1)

(4)

Vik(t+1)=ωVik(t)+c1r1(Pik(t)-

Xik(t))+c2r2(Pgk(t)-Xik(t))

(5)

式(5)中:r1和r2为随机参数,取值(0,1)之间;t为迭代次数;c1和c2为学习因子,其数值是非负的;ω为惯性权重系数;Pi(t)为个体极值pBest;Pg(t)为全局极值gBest;k=1, 2,…,d。

选取模型预测结果均方根误差RMSE作为判别依据,如果预测精度越高,均方根误差的数值就越低。RMSE的表达式如式(6)

(6)

式(6)中:Xi为实际值,Yi为预测值,n为训练样本个数。

2 结果与讨论

2.1 特征谱线选取

实验获得的样品光谱范围为205~1 031 nm,若将全光谱数据进行分析,则会导致处理时间过长和分析结果不佳等问题。选择Pb Ⅰ 368.35 nm和Pb Ⅰ 405.78 nm两条相对较好的特征谱线进行对比分析。土壤中含有丰富的元素,Fe作为基体元素对特征谱线的影响尤为严重。其中Pb Ⅰ 368.35 nm谱线受Fe Ⅰ 368.60 nm影响较大,而Pb Ⅰ 405.78 nm受其他谱线的干扰较小,谱线强度也更高,背景噪声相对较低,故选择Pb Ⅰ 405.78 nm作为Pb的分析线。同理,选择Cr Ⅰ 425.44 nm,Cr Ⅰ 427.48 nm和Cr Ⅰ 428.97 nm三条Cr元素特征谱线进行对比分析。Cr元素的三条谱线与Fe的元素特征谱线距离相对较近,其中Cr Ⅰ 427.48 nm附近的Fe元素特征谱线最强,受干扰程度最大,而Cr Ⅰ 428.97 nm谱线与其他元素谱线重叠,受干扰严重,所以选择Cr Ⅰ 425.44 nm作为Cr的分析线。Pb和Cr元素特征谱线分布如图2所示。

图2 Pb和Cr元素特征谱线分布

2.2 定量分析

2.2.1 基于LSSVM的定标模型

用PSO算法对LSSVM优化之前,先测试LSSVM算法对定标模型的校准效果。每个浓度的样品采集20组数据,将其中的17组数据设为训练集,3组数据设为预测集,构建定标模型。为对该模型的精确度进行评估,故将所有训练集和预测集的数据拟合,拟合效果由相关系数R2来评价。得到的Pb拟合曲线如图3所示,Cr拟合曲线如图4所示。从拟合曲线中可以看出,Pb元素RMSEC为0.026 0 Wt%,RMSEP为0.101 8 Wt%;Cr元素RMSEC为0.027 2 Wt%,RMSEP为0.078 8 Wt%。Pb元素定标模型拟合系数R2为0.922 3,Cr元素的R2为0.948 0,从结果可以看出拟合效果不佳。从图像中可以看出,随着浓度的增加,预测值逐渐低于实际值,这是自吸收效应导致的结果,说明LSSVM模型对自吸收效应校准的能力不高,仍需要引入其他算法对该模型进行优化。

图3 基于LSSVM的Pb元素定标模型

图4 基于LSSVM的Cr元素定标模型

2.2.2 基于PSO-LSSVM的定标模型

在LSSVM模型中,需要先确定参数然后选取核函数,其中需要确定的参数为惩罚系数γ和核函数参数g。核函数参数g主要与泛化能力相关,g越大,得到的训练模型会越平滑,泛化能力越强。γ主要与拟合能力相关,惩罚系数γ越大,拟合能力越强,但模型的平滑性和泛化能力就会降低。因此需要确定最佳的惩罚系数γ和核函数参数g组合,使模型的分析效果最佳,故引入PSO算法对LSSVM模型进行优化。

初始化PSO算法的各种参数:学习因子c1=1.5,c2=1.7,迭代次数t=50,种群数量sizepop=20。用PSO对训练集进行参数识别,最终得到最佳的惩罚系数γ和核函数参数g组合,其中Pb元素模型的最佳参数组合为γ1=8 096.8,g1=138.865 7; Cr元素模型的最佳参数组合为γ2=4 908.6,g2=393.563 5。确定最佳参数后,用最佳的参数组合构建LSSVM的定标模型。得到的Pb拟合曲线如图5所示,Cr拟合曲线如图6所示。从图中可以看出,Pb元素RMSEC为0.022 4 Wt%,RMSEP为0.045 8 Wt%;Cr元素RMSEC为0.019 1 Wt%,RMSEP为0.042 0 Wt%。Pb元素定标模型拟合系数R2为0.982 8,Cr元素的R2为0.985 0。拟合系数R2的提高十分明显,PSO算法的优化使LSSVM的拟合效果有了很大的提升。同时,RMSEC和RMSEP的数值都有所降低,模型的稳定性和精确度都得到了一定程度的提高,提高了分析精度。两种方法的分析结果如表2所示。

图5 基于PSO-LSSVM的Pb元素定标模型

图6 基于PSO-LSSVM的Cr元素定标模型

表2 LSSVM和PSO-LSSVM数据对比

3 结 论

利用LSSVM和PSO-LSSVM两种方法对土壤中的Pb和Cr元素建立定标模型。从分析结果可以看出,Pb和Cr元素的LSSVM定标模型拟合系数R2只有0.922 3和0.948 0,拟合效果不佳,RMSEC为0.026 0 Wt%和0.027 2 Wt%,RMSEP为0.101 8 Wt%和0.078 8 Wt%,说明定标曲线的精确度可以进一步提高。应用PSO对LSSVM进行优化后,获得了Pb和Cr最佳惩罚系数γ和核函数参数g组合,分别为(8 096.8, 138.865 7)和(4 908.6, 393.563 5)。用PSO-LSSVM建立Pb和Cr元素的定标曲线,R2分别提高到0.982 8和0.985 0,拟合效果明显提升,RMSEC降低到0.022 4 Wt%和0.019 1 Wt%, RMSEP降低到0.045 8 Wt%和0.042 0 Wt%,精确度得到了一定程度的提高。结果表明LIBS技术结合PSO-LSSVM方法提高检测精度是可行的。

猜你喜欢
定标谱线系数
我国为世界大豆精准选种“定标”
基于HITRAN光谱数据库的合并谱线测温仿真研究
基于恒星的电离层成像仪在轨几何定标
这些待定系数你能确定吗?
打雪仗
过年啦
基于角反射器的机载毫米波云雷达外定标实验
锶原子光钟钟跃迁谱线探测中的程序控制
两张图弄懂照明中的“系数”
4m直径均匀扩展定标光源