激光诱导击穿光谱技术实时检测蔷薇属植物

2022-08-22 12:58于玮周卓彦孙仲谋张兴龙刘玉柱
量子电子学报 2022年4期
关键词:谱线蔷薇正确率

于玮,周卓彦,孙仲谋,张兴龙,刘玉柱,2,3∗

(1南京信息工程大学,江苏省大气海洋光电探测重点实验室,江苏 南京 210044;2江苏省大气环境与装备技术协同创新中心,江苏 南京 210044;3南京信息工程大学,江苏省气象光子学与光电探测国际合作联合实验室,江苏 南京 210044)

0 引言

蔷薇属植物在日常生活中较为常见,主要包括玫瑰、蔷薇和月季。蔷薇属植物不仅可以用于园林观赏[1],同时也具有重要的食用价值[2]、经济价值[3]和药用价值[4]。例如,在香料行业中,蔷薇属植物是重要的花香来源,从蔷薇属植物中提取的精油具有重要的香料价值[5]。而我国蔷薇属芳香资源具有多样性,因此,快速、准确地辨别蔷薇属植物具有重要意义。

辨别蔷薇属植物的方法有很多,如细胞学[6]通常利用染色体的结构、数目和核型来进行区分,孢粉学[7]借助光镜和扫描电子显微镜对花粉的孔、沟数目、花粉壁以及纹饰等特点进行探讨,形态学[8]通过观察叶片或种皮的微形态来探讨和划分植物间的亲缘关系,分子生物学[9]在DNA序列的基础上为植物辨别提供了可靠证据。但这些方法大都比较复杂,需要对样品进行预处理,过程繁琐,且检测时间较长,对实验环境要求也较高。

激光诱导击穿光谱(LIBS)技术是一种全新的物质元素分析方法,其可以分析元素周期表中几乎所有的元素,同时又具有实时、原位、在线、灵敏度高、可多元素同时分析的优点[10,11],可用于定性[12,13]和定量[14]分析,在多个领域得到了广泛应用[15−18]。广义回归神经网络(GRNN)是一种神经网络模型,最早由Specht[19]提出。GRNN是径向基神经网络的一种,具有很强的非线性映射能力和学习速度,网络最后收敛于样本聚集较多的优化回归[20]。在样本数据量少时,GRNN也能达到不错的预测效果,还可以处理不稳定数据。

本文将LIBS技术与GRNN相结合,用于检测和辨别蔷薇属植物。首先,利用LIBS技术原位在线探测蔷薇属花,从光谱数据中可观察到三种花共有的元素包括C、H、O、N、Mg、Ca、Na和K,并且在月季和玫瑰的光谱中还可以观测到Mn的特征谱线。此外,在玫瑰、蔷薇和月季的光谱中都观察到了CN,通过计算三种花光谱中CN的振动温度和转动温度,验证了实验条件的相似性。其次,通过对比分析玫瑰、蔷薇和月季的光谱图,选取强度差异较显著的特征谱线作为变量。本研究基于Mn、Ca、Na的15条特征谱线建立非线性判别模型GRNN。挑选玫瑰、蔷薇和月季的各100个光谱数据,其中90个作为训练集,剩余10个作为测试集。结果显示,GRNN可以很好地区分三种花,预测判别的正确率可达93.3%。

1 实验方案与装置

实验装置示意图如图1所示。本研究采用Continuum公司的Nd:YAG单脉冲激光器。激光器波长为1064 nm,脉冲持续时间为6 ns,调Q时间为1.5µs,脉冲重复频率为10 Hz。实验样品为购买于商店的玫瑰、蔷薇和月季,如图2所示。其中,玫瑰和蔷薇产自云南,月季产自江苏。样品仅作烘干处理,未经任何化学处理。调节激光脉冲能量到260.34 mJ,使信号稳定并达到理想的实验效果。激光通过三个反射镜改变光路,再通过聚焦透镜(焦距为150 mm)聚焦于花瓣上,产生高温等离子体,通过光纤探头耦合进入光纤,传输到四通道光谱仪,再将信号传送到计算机进行光谱分析。采用的光谱仪产自Avantes公司,光谱窗口范围是200∼890 nm,分辨率为0.1 nm。

图1 实验装置示意图Fig.1 Schematic diagram of experimental setup

图2 实验样品图(玫瑰,蔷薇,月季)Fig.2 Picture of experimental samples(Rosa rugosa Thunb.,Rosa sp.and Rosa chinensis Jacq.)

2 实验结果与讨论

2.1 蔷薇属植物的元素组成分析

将激光打在玫瑰、蔷薇和月季的花瓣内侧,得到三种花的光谱信息。由于光谱仪存在漂移现象,要对得到的光谱数据进行校正。与NIST数据库中的特征谱线进行比对后,对光谱进行标定。蔷薇属植物的花香成分主要是醇类、萜烯类和芳香烃类物质。因此,玫瑰、蔷薇和月季的光谱图中都有C、H、O的特征谱线,分别如图3、图4和图5所示。此外,三种花中都含有N、Mg、Ca、Na和K元素。图6将玫瑰、蔷薇和月季的光谱图进行对比,由图可见玫瑰和月季的光谱中都有Mn的特征谱线,而蔷薇的光谱图中未曾发现。其中,玫瑰中有257.61、259.37、260.57、293.31、293.93、294.92、403.08、403.31、403.45 nm这9条Mn的特征谱线,月季中只有257.61、259.37、260.57、403.08、403.31、403.45 nm这6条特征谱线。通过对比,还可观察到玫瑰中Mn特征谱线的相对强度要高于月季中的。以上差异表明利用LIBS技术来辨别蔷薇属植物是可行的。不同植物具有不同的生长习性,因此本实验所选用的三种花并不是产自同一地区的。而通过图3和图4可以看出,同一产地的玫瑰和蔷薇的光谱具有一定差异。本实验设计作为一种研究方法存在一定的局限性,涉及后续的应用,还可考虑产地气候、土壤等因素,从而来提高检测的准确率。

图3 玫瑰在240∼875 nm波段的LIBS光谱。(a)240∼300 nm;(b)350∼440 nm;(c)500∼675 nm;(d)700∼875 nmFig.3 LIBS spectrum of Rosa rugosa Thunb. in the band of 240-875 nm (a) 240-300 nm;(b)350-440 nm;(c)500-675 nm;(d)700-875 nm

图4 蔷薇在240∼875 nm波段的LIBS光谱。(a)240∼300 nm;(b)350∼440 nm;(c)500∼675 nm;(d)700∼875 nmFig.4 LIBS spectrum of Rosa sp. in the band of 240-875nm.(a)240-300 nm;(b)350-440 nm;(c)500-675 nm;(d)700-875 nm

图5 月季在240∼875 nm波段的LIBS光谱。(a)240∼300 nm;(b)350∼440 nm;(c)500∼675 nm;(d)700∼875 nmFig.5 LIBS spectrum of Rosachinensis Jacq. in the band of 240-875 nm(a)240-300 nm;(b)350-440 nm;(c)500-675 nm;(d)700-875 nm

图6 玫瑰(a)、蔷薇(b)和月季(c)的光谱对比图Fig.6 Spectral comparison of Rosa rugosa Thunb.(a),Rosa sp.(b)and Rosa chinensis Jacq.(c)

2.2 CN光谱的模拟与温度计算

如图3(b)、4(b)、5(b)所示,实验在玫瑰、蔷薇和月季的光谱中探测到了CN。为了更好地说明探测过程的物理参数,还进一步研究了CN的振动温度和转动温度。CN形成的主要过程如下:

而蔷薇属植物中的CN是由花中的C元素和N元素反应以及由花中的C元素和空气中的N2反应形成的。利用双原子分子光谱仿真软件LIFBASE对蔷薇属植物光谱中的CN进行模拟,校正基线和波长偏移,调节振动温度和转动温度,使得模拟值尽可能地接近实验值。最终得到玫瑰、蔷薇和月季光谱中CN的振动温度分别为7600、7800、7600 K,而转动温度分别为7700、7800、7800 K。该结果表明测量三种花的光谱时实验条件具有相似性。其中,月季中CN的模拟和实验光谱如图7所示。

图7 月季中CN的模拟光谱(a)和实验光谱(b)Fig.7 Simulation spectrum(a)and experimental spectrum(b)of CN in the Rosa chinensis Jacq.

2.3 利用GRNN对蔷薇属植物进行预测

本研究利用玫瑰、蔷薇和月季光谱中的特征谱线并结合GRNN来识别三种花。GRNN是一种有监督学习、非线性回归的神经网络,其使用径向基函数作为激活函数,具有良好的泛化性能和较高的正确率。传统的鉴别蔷薇属植物的方法都过于繁杂,因此,将GRNN应用到蔷薇属植物的分类识别中具有重要意义。

首先采集蔷薇属植物的光谱数据,选择特征谱线作为特征变量,接着产生训练集和测试集并创建GRNN模型,然后通过仿真测试,最后输出性能评价,得到预测正确率。从玫瑰、蔷薇和月季的光谱数据中各选择单个花朵的100个测量光谱作为样本。在光谱选择过程中要注意筛查是否存在纯空气谱,从而避免这些异常数据对模型建立产生影响,模型建立的好坏会直接影响预测结果的接近程度。由于等离子体的不稳定性和背景噪声的干扰,直接分析整个波段的数据会导致辨别效果不佳。此外,一个光谱包含8192个数据,数据量较大,直接计算耗时较长。因此,对比三种花的光谱图,选择差异较明显的15个特征峰作为变量,如表1所示。本研究采用随机法产生训练集和测试集,从三类中随机挑选90个样本作为训练集,每类中剩下10个样本则自动成为测试集,这种方法不失一般性。因为GRNN隐含层节点的激活函数采用了高斯函数,它对输入信息具有局部激活特性,所以对接近于局部神经元特征的输入信息具有较强的吸引力,准确率会大大提高。

表1 选取的15条特征谱线Table 1 The selected 15 characteristic spectral lines

30个测试集的预测结果如图8所示,其中标签1、2、3分别表示玫瑰、蔷薇和月季,从图中可看出1个蔷薇数据集和1个月季数据集被误判为玫瑰,正确率可达93.3%。

图8 玫瑰、蔷薇和月季的预测结果Fig.8 Forecast results for Rosa rugosa Thunb.,Rosa sp.and Rosa chinensis Jacq.

3 结论

利用LIBS技术探测玫瑰、蔷薇和月季这三种蔷薇属植物,实验观察到三种花中都含有C、H、O、N、Mg、Ca、Na和K元素。此外,还在玫瑰和月季中探测到了Mn元素。蔷薇属植物中的CN是由花中的C元素和N元素反应以及由花中的C元素和空气中的N2反应形成的。通过LIFBASE软件模拟CN光谱,得到了玫瑰、蔷薇和月季中CN的振动温度和转动温度。三种花振动温度和转动温度的近似证明了探测过程中实验条件具有相似性。GRNN不同于反向传播神经网络(BPNN),其权值和阈值只与训练样本有关,无需迭代,计算量小,计算速度快,且具有良好的预测能力,在识别蔷薇属植物方面有一定的优越性。将LIBS技术与GRNN相结合,选取光谱中的15条特征谱线作为变量,三种花各挑选100个测量光谱,90个作为训练集,10个作为测试集,得到预测结果的正确率达到93.3%。综上所述,本实验将LIBS技术和GRNN相结合应用到蔷薇属植物的识别中进行方法研究是具有可行性的。实际上,具体应用于探测蔷薇属植物时,还需考虑样品产地的气候、土壤等因素对光谱产生的影响。

猜你喜欢
谱线蔷薇正确率
“羲和号”首次获得三种太阳谱线轮廓
依据不同波段光谱诊断闪电回击通道温度*
个性化护理干预对提高住院患者留取痰标本正确率的影响
基于彩色CCD的棱镜摄谱实验数据处理
门诊分诊服务态度与正确率对护患关系的影响
花开恣意是蔷薇
生意
生意
生如蔷薇,为情芬芳