利用光谱趋势参数快速判定小麦粉DON等级的研究

2020-05-25 00:33祖广鹏陈桂云徐剑宏陈坤杰
光谱学与光谱分析 2020年5期
关键词:波段校正光谱

吴 威, 祖广鹏, 陈桂云, 徐剑宏, 陈坤杰*

1. 南京农业大学工学院,江苏 南京 210031 2. 江苏省农业科学院食品质量安全与检测研究所,江苏 南京 210014

引 言

脱氧雪腐镰刀菌烯醇(DON),属单端孢霉烯族化合物,通常存在于感染了赤霉病的谷物中。DON含量超标的食物具有致癌、致畸、致突变的作用,危害人类和家畜的生命健康[1-2]。我国在《食品中真菌毒素限量》(GB2761—2011)标准中规定了小麦等制品 DON 的限量指标为1 000 μg·kg-1 [3]。

1 实验部分

1.1 样本制备和光谱采集

实验共采集了102个具有不同DON浓度的小麦样品,品种为镇麦168。这些小麦样本在扬花期接种了赤霉菌毒素。样本经过去皮、磨粉、过筛,其粗细程度满足我国标准粉规格。使用近红外光谱仪InfraXact(Foss,USA)收集样品光谱。光谱仪配备硅探测器(570~1 100 nm), 铟镓砷探测器(1 100~1 850 nm)。样品以2 nm间隔在570~1 848 nm范围内扫描,数据采集的频率为每次扫描3 s。每个样品扫描两次,取其平均值。通过ISIscan(Infrasoft International,Port Matilda,PA,USA)收集光谱数据。

1.2 DON测定

DON含量参考值按照《GB 5009.111—2016 食品安全国家标准食品中脱氧雪腐镰刀菌烯醇及其乙酰化衍生物的测定》[15](第二法免疫亲和层析净化高效液相色谱法HPLC),使用HPLC系统(SHIMADZU,SPD-10A,UV-VIS DETECTOR ; LC-10AT VP)进行定量测定。

1.3 数据预处理

利用Unscrambler®X,v10.1(CAMO Software AS,Oslo,Norway,2011)软件进行数据预处理。所有样本的光谱首先通过15点Savitzky-Golay函数平滑,然后通过去趋势处理,最后进行乘法散射校正(MSC)。

1.4 基于趋势参数的特征波长选取方法

在光谱矩阵中,每一行对应一个样本的光谱,并把样本按DON浓度从低到高进行排列。第一列为样本的DON浓度,其后的640列为570~1 848 nm波段下的光谱值(吸光度)。选取其中所有的奇数行作为校正集光谱,所有偶数行数据作为验证集光谱,校正集和验证集均有51个样本。在这样的光谱矩阵中,单波段下所有样本的吸光度从上到下的递增趋势越强,则说明该波段下的吸光度与DON浓度的变化趋势越是一致,则该波段可以作为评估DON浓度的特征波段。据此,可以为每一个波段定义一个判断递增趋势的趋势参数,以期找到递增趋势最强的特征波段,具体做法如下:

1.5 二次判别分析QDA模型

利用Unscrambler®X,v10.1软件中的二次判别分析QDA模块进行分析建模。提取校正集中特征波段下的光谱,采用两个阈值1 000和2 000 μg·kg-1,将校正集数据分成低、中、高程度三类污染水平,因此QDA建模的类别数为3。假设所有变量的先验概率均相等,权重均为1.00。所构建的模型在验证集特征波段的光谱下进行模型检验。DON的分类准确性通过计算被正确分类的样本数占样本总数的百分比来评估。

2 结果与讨论

2.1 样本中的DON含量分布

在102个小麦样品中,DON水平为319~31 437 μg·kg-1不等,通过可见光-近红外光谱法分析小麦样品,并且以570~1 848 nm之间的吸光度记录光谱。图1显示了6种不同DON浓度小麦样品的Vis-NIR原始光谱,其范围在319~5 895 μg·kg-1DON范围内。从这些谱图的比较来看,低DON水平的小麦样品与含有高DON水平的小麦样品具有相同的Vis-NIR谱带,因此表明两种样品中的主要官能团和化学成分是共存的。

图1 六种不同DON浓度(用高效液相色谱法测量)小麦样品的Vis-NIR光谱

Fig.1 Vis-NIR spectra of wheat samples with six different DON concentrations (measured by high performance liquid chromatography)

2.2 选取的特征波段

按照1.4节的特征波长选取方法,计算各个波段对应的趋势参数,结果如图2所示,可见在666,1 238和1 660 nm波段处出现三个局部最大值,将其提取作为评估DON浓度的特征波段。

图2 各个波段下趋势参数分布图Fig.2 Distribution of trend parameter of each band

2.3 二次判别分析QDA分类结果

只提取校正集样本的三个特征波段(666,1 238和1 660 nm)下的光谱。采用两个阈值1 000和2 000 μg·kg-1,事先将校正集数据分成低、中、高程度污染。利用QDA将校正集样本分成三类,结果的混淆矩阵如表1(左侧)所示,校正过程中整体分类正确率为88.24%。低和中度污染水平样本都100%被正确分类; 重度污染的31个样本中只有6个样本被误判为中度污染,剩余的25个(80.64%)的重度污染样本被正确分类。利用校正集构建的TP-QDA模型去判定验证集合中的样本,验证集也只选取三个特征波段的光谱,验证结果如表1(右侧)所示。验证集总体判断正确率为86.27%。

表1 趋势参数(TP)-二次判别分析(QDA)模型的校正及验证结果

Table 1 The calibration and validation results of Trend Parameter(TP)-Quadratic Discriminant Analysis (QDA) model

参考类别(HPLC测量结果)校正分类结果验证分类结果轻度中度重度轻度中度重度轻度400200中度01661144重度00250228

主成分分析PCA是选取特征波段最有效的方法之一,谷物中DON含量检测的文章中很多都采用了主成分分析[11-15],从而对数据进行降维。以下将对相同的校正集样本,采用PCA选取特征波段,建模方式仍为QDA分析,PCA-QDA模型检测的准确率仍在原来的验证集样本中测试,从而对趋势参数法和主成分分析法选取特征波段的有效性做一一对比。

对校正集全光谱数据进行主成分分析,选取前2个主成分,解释了91%的变量。QDA分析时采用PCA的选取的两个主成分,PCA-QDA模型的校正和验证集分类结果,以及其与TP-QDA模型检测结果的对比如表2所示。可见,除了验证集中的轻度污染样本,TP-QDA模型在各个分类中的分类正确率以及整体分类正确率都高于PCA-QDA模型,因此,趋势参数法选择的特征波段能获得更高的识别率。

表2 TP-QDA和PCA-QDA模型校正和验证识别准确率对比结果

Table 2 The classification accuracy comparison of TP-QDA and PCA-QDA model in calibration and verification sets

准确率TP-QDAPCA-QDA校正验证校正验证轻度分类准确率/%10066.6750100中度分类准确率/%10087.5062.5081.25重度分类准确率/%80.6481.8174.1965.62整体分类准确率/%88.2486.2768.6272.55

3 结 论

通过定义各个波段下光谱的趋势参数,可以得到与小麦粉中DON浓度最相关的特征波段,选出的特征波段有助于快速准确地判定小麦粉中DON含量的等级。分类模型表现出良好的预测性能,总体分类率高,小分类错误率低,模型简单,无需昂贵耗材,能快速分析大量的样品,所提出的分类模型在筛选小麦样品的脱氧雪腐镰刀菌烯醇含量方面具有实际应用价值,使得NIR光谱学成为监测安全程序的强有力的工具。但是该方法还需要在更多品种小麦样本中进行普适性验证。

猜你喜欢
波段校正光谱
基于三维Saab变换的高光谱图像压缩方法
最佳波段组合的典型地物信息提取
高光谱遥感成像技术的发展与展望
劉光第《南旋記》校正
基于MR衰减校正出现的PET/MR常见伪影类型
基于PLL的Ku波段频率源设计与测试
在Lightroom中校正镜头与透视畸变
小型化Ka波段65W脉冲功放模块
机内校正
星载近红外高光谱CO2遥感进展