近紫外-可见-短波近红外多光谱成像数据的糯玉米种子热损伤粒的无损快速鉴别

2021-09-14 09:32吴静珠赵丽丽
光谱学与光谱分析 2021年9期
关键词:胚乳糯玉米标准差

王 冬,韩 平*,吴静珠,赵丽丽,徐 恒

1. 北京农业质量标准与检测技术研究中心,北京 100097 2. 全国生态环保优质农业投入品评价技术机构(CAQS-TRP-004),北京 100097 3. 北京工商大学食品安全大数据技术北京市重点实验室,北京 100048 4. 北京博普特科技有限公司,北京 100193

引 言

玉米种子不完善粒(Defective Kernals)指有缺陷或受到损伤但尚有使用价值的玉米颗粒。 中华人民共和国国家标准GB 1353—2018 《玉米》[1]规定, 1, 2, 3, 4和5等级玉米中, 不完善粒含量分别为不超过4.0%, 6.0%, 8.0%, 10.0%和15.0%; 中华人民共和国农业行业标准NY/T 519—2002 《食用玉米》[2]规定, 1, 2和3等级玉米的不完善粒占比不超过5.0%。 热损伤粒是指发热或干燥受热后籽粒显著变色或受到损伤的颗粒, 是不完善粒的一种。 玉米干燥过程对温度有严格的规定。 中华人民共和国国家标准GB/T 21017—2007《玉米干燥技术规范》规定[3], 食用玉米、 淀粉发酵工业用玉米、 饲料用玉米的允许受热温度分别为50, 55和60 ℃。 超过规定的干燥温度很容易导致玉米种子热损伤。 热损伤玉米种子不仅在种子活力方面会受到影响, 而且在营养价值、 口感等方面亦会降低其价值。 中华人民共和国国家标准GB/T 5494—2019 《粮油检验 粮食、 油料的杂质、 不完善粒检验》[4]规定了不完善粒的检测方法, 包含电动筛选器法和手筛法。 然而, 目前对热损伤粒的检测仍需人工观察玉米种子表皮、 胚、 胚乳是否有显著变色, 不同检验人员对玉米种子不完善粒定义理解存在偏差, 检验时把握尺度也有差异, 玉米种子不完善粒检验过程中很可能出现差异较大的情况[5]; 相对于虫蚀粒、 病斑粒、 破损粒、 生芽粒、 生霉粒等其他种类不完善粒, 热损伤粒外观的改变相对而言不明显, 故较其他不完善粒更难以准确分辨。 因此, 针对玉米种子热损伤粒, 建立一种客观、 高效、 无损、 快速的检测方法成为当前亟待解决的问题。

随着化学计量学的发展和计算机技术的进步, 近红外光谱技术近几年飞速发展, 并在种子品质无损快速检测等领域得以广泛应用[6-7]。 与此同时, 多光谱以及高光谱技术在提供光谱信息的同时, 还可以提供样品的空间分布信息[8-9], 从而为种子胚部、 胚乳部的局部光谱数据的采集提供了解决方案。 近年来, 一些学者就多光谱、 高光谱技术检测种子品质开展了有关研究, 并取得了一定的进展。 Choi等[10]采用高光谱成像研究了罗勒种子溯源, 发现1 449~1 457, 1 242~1 254, 1 380和1 696 nm对产自新加坡、 巴基斯坦、 越南、 印度的罗勒种子产地溯源有重要作用。 张婷婷等[11]采用可见-近红外高光谱成像结合连续投影算法和遗传算法测定甜玉米种子电导率, 进而对甜玉米种子活力进行预测; 其中, 全谱数据经多元散射校正预处理, 采用偏最小二乘回归所建模型, 校正、 预测决定系数分别为0.983和0.974; 采用遗传算法从全谱853个变量筛选出25个关键变量; 采用多元散射校正预处理, 基于遗传算法筛选关键变量所建的偏最小二乘回归模型的校正、 预测决定系数分别为0.976和0.973。 Nie等[12]采用近红外高光谱成像结合深度卷积神经网络算法分别研究了杂交秋葵种子和杂交丝瓜种子的分类; 当类别数量从2个增至6个时, 杂交秋葵种子深度卷积神经网络模型的校正、 预测准确率不低于98%, 杂交丝瓜种子深度卷积神经网络模型的校正、 预测准确率不低于95%。 Jayme G. A. Barbedo等[13]采用近红外高光谱成像研究了3个品种小麦籽粒发芽的检测, 结果表明, 918和1 411 nm和小麦籽粒发芽损伤具有高度关联性, 将上述两个波长数据结合为一个指数即可准确判断小麦籽粒的发芽情况。 Collins Wakholi等[14]采用近红外高光谱成像研究了玉米种子活力的快速检测, 分别采用线性判别分析、 偏最小二乘判别分析和支持向量机建立玉米种子活力判别模型, 结果表明, 支持向量机模型准确率最高, 白色、 紫色和黄色玉米种子活力判别准确率分别为100%, 100%和98%。

糯玉米(waxy corn)又称黏玉米或蜡质型玉米, 其栽培技术简单、 周期短, 可用作食材、 牲畜饲料以及工业原料等, 具有较高的经济价值、 营养价值和加工价值。 然而, 针对糯玉米种子热损伤粒的无损快速鉴别目前尚未见报道。 中华人民共和国国家标准GB/T 22326—2008 《糯玉米》规定[15], 1, 2和3等级糯玉米中的不完善粒占比不超过6.0%; 中华人民共和国农业行业标准NY/T 524—2002《糯玉米》规定[16], 1, 2和3等级糯玉米中的不完善粒占比不超过5.0%。 为糯玉米种子热损伤粒的无损快速鉴别、 种子不完善粒无损快速检测、 种子质量快速筛查等提供具有参考价值的信息。以糯玉米为例, 采用多光谱成像技术研究糯玉米热损伤粒的无损快速检测, 分别以胚面向上、 胚面向下方式采集对照组和热损伤组糯玉米种子多光谱成像数据, 提取胚面向上胚部、 胚乳部单点多光谱数据以及胚面向下胚乳部单点多光谱数据, 并融合胚面向上胚部和胚乳部多光谱数据; 对各数据做基线校正预处理, 计算各光谱数据样本标准差, 分析热损伤对糯玉米种子不同部位多光谱数据影响的差异; 建立热损伤糯玉米种子偏最小二乘判别分析(partial least square-discriminant analysis,PLS-DA)模型, 统计模型校正、 交互验证数据正确率。 作为对比, 采用近红外光谱仪配合颗粒样品采样附件采集糯玉米种子胚面向上、 胚面向下近红外光谱数据, 并将糯玉米种子胚面向上及胚面向下近红外光谱数据融合; 做基线校正预处理后, 计算各数据的各光谱数据样本标准差, 分析热损伤对糯玉米种子不同部位近红外光谱数据影响的差异; 建立热损伤糯玉米种子PLS-DA模型, 统计模型校正、 交互验证数据正确率。

1 实验部分

1.1 材料

京科糯2000玉米种子, 采购于京研益农(北京)种业科技有限公司。 将糯玉米种子分为对照组和热损伤组(实验组)各50粒, 对照组置于阴凉干燥处, 热损伤组样品放入电热恒温鼓风干燥箱, 做高温干燥处理, 模拟糯玉米种子热损伤过程。

1.2 仪器

(1)多光谱成像仪: 丹麦Videometer公司, 型号: VideometerLab4。 采集多光谱图像面积为90 mm×90 mm, 图像有效像素2 192×2 192, 图像空间分辨率41 μm·pixel-1; 采用19个高功率发光二极管作为光源, 按波长顺序依次照射样品, 光谱波长范围365~970 nm, 光谱变量数19个, 以仪器内部自带白色陶瓷片作为光谱参比, 积分球收集样品反射光信息, 电荷耦合元件(charge-coupled device,CCD)检测器对样品反射光信号进行检测。

(2)近红外光谱仪: 美国VIAVI公司, 型号: NIR1700。 采用卤钨灯作为光源, 采用线性渐变分光(linear variable filter,LVF)原理, 波长范围908~1 676 nm, 光谱中心分辨率10 nm, 光谱变量数125个, 以聚四氟乙烯白块作为光谱参比, 光谱累加平均50次, 配合颗粒样品采样附件, 采用线阵列铟镓砷检测器(InGaAs detector)测量样品漫反射近红外光谱数据。

(3)电热恒温鼓风干燥箱: 上海卉绿科学仪器有限公司, 型号: DGG-9246A, 温度分辨率0.1 ℃, 恒温波动度±1.0 ℃。

1.3 方法

采用电热恒温鼓风干燥箱对糯玉米种子热损伤组样品进行高温干燥处理, 温度设定80.0 ℃, 干燥8 h。 将糯玉米种子胚面向上放置记为GU, 糯玉米种子胚面向下放置记为GD, 分别采用多光谱成像仪、 近红外光谱仪采集糯玉米种子胚面和胚乳面多光谱成像数据和近红外光谱数据。

1.4 数据处理

(1)多光谱成像仪数据处理: 采用Videometer多光谱成像仪采集对照组和热损伤组糯玉米种子多光谱成像数据。 其中, 糯玉米种子胚面向上放置(GU)时分别采集胚部和胚乳部单点多光谱数据, 胚面向上胚部光谱数据记为GUEm, 胚面向上胚乳部光谱数据记为GUEn; 糯玉米种子胚面向下放置(GD)时采集胚乳部单点多光谱数据, 记为GDEn。 将GUEm和GUEn数据初级融合为GUEm-GUEn数据。 对各组数据做基线校正预处理, 在此基础上计算各光谱数据样本标准差; 分别采用GUEm, GUEn, GDEn和GUEm-GUEn数据建立偏最小二乘-判别分析(partial least square-discriminant analysis,PLS-DA)模型, 并讨论前3主成分得分分布情况以及各模型判别正确率。 糯玉米种子多光谱采集区域示意图如图1所示。

图1 糯玉米种子多光谱采集区域示意图(a): 胚面向上胚部GUEm(+)、 胚面向上胚乳部GUEn(×);(b): 胚面向下胚乳部GDEn(○)Fig.1 The diagram of the areas for collectingthe spectra of waxy corn seed

(2)近红外光谱数据处理: 采用VIAVI近红外光谱仪采集对照组和热损伤组单粒糯玉米种子多光谱成像数据。 其中, 糯玉米种子胚面向上放置所采集光谱数据记为GUS, 胚面向下放置所采集光谱数据记为GDS。 对各组数据做基线校正预处理, 在此基础上计算各光谱数据的样本标准差; 分别采用GUS, GDS以及GUS-GDS初级融合数据建立PLS-DA模型, 并讨论前3主成分得分分布情况以及各模型判别正确率。

2 结果与讨论

2.1 多光谱数据分析

图2是京科糯2000玉米种子对照组(a)和热损伤组(b)部分样品。 采用Videometer多光谱成像仪采集样品的多光谱成像后, 使用仪器自带图像处理软件扣除背景得到图2。 从图2可见, 仅用肉眼观察可见光照片难以将对照样品和热损伤样品加以区分。

图2 京科糯2000玉米种子对照组(a)和热损伤组(b)Fig.2 The control group (a) and the heat-damagedgroup (b) of Jingkenuo 2000 corn seeds

京科糯2000玉米种子对照组和热损伤组样品的多光谱成像数据如图3所示, 其中, (a1)为对照组胚面向上胚部光谱(GUEmDZ)、 (a2)为热损伤组胚面向上胚部光谱(GUEmRSS)、 (b1)为对照 组胚面向上胚乳部光谱(GUEnDZ)、 (b2)为热损伤组胚面向上胚乳部光谱(GUEnRSS)、 (c1)为对照组胚面向下胚乳部光谱(GDEnDZ)、 (c2)为热损伤组胚面向下胚乳部光谱(GDEnRSS)。 从图3可见, 各光谱从365~970 nm的吸光度基本呈上升趋势, 并普遍存在970 nm处吸光度较高而365 nm处吸光度较低的趋势。 另一方面, 热损伤样品和对照样品的多光谱数据在365~970 nm范围内的光谱轮廓未见明显区别。

图3 糯玉米种子多光谱(a1): GUEmDZ; (a2): GUEmRSS; (b1): GUEnDZ; (b2): GUEnRSS; (c1): GDEnDZ; (c2): GDEnRSSFig.3 The multi-spectra of waxy corn seeds(a1): GUEmDZ; (a2): GUEmRSS; (b1): GUEnDZ; (b2): GUEnRSS; (c1): GDEnDZ; (c2): GDEnRSS

为研究多光谱数据中各变量所对应吸光度值的变化规律, 对GUEmDZ, GUEmRSS, GUEnDZ, GUEnRSS, GDEnDZ和GDEnRSS数据分别做基线校正预处理以消除光谱平移对数据的影响, 再统计各光谱数据样本标准差, 如图4所示。 由于对数据做基线校正预处理, 波长365 nm所对应变量数据的样本标准差值为0。 在405~780 nm范围内, GUEmDZ样本标准差较GUEmRSS样本标准差大, 在850~970 nm范围内, GUEmDZ和GUEmRSS样本标准差规律不明显; 在405~970 nm范围内, GUEnDZ样本标准差普遍较GUEnRSS样本标准差小; 在405~970 nm范围内, 除波长690 nm所对应的标准差值较为接近外, 其他波长对应的GDEnDZ样本标准差较GDEnRSS的样本标准差小。 以上数据结果说明, 高温削弱了糯玉米种子胚的差异, 在光谱上表现为热损伤组糯玉米种子胚的多光谱数据变异相对较小而对照组糯玉米种子胚的多光谱数据变异相对较小; 另一方面, 高温增强了糯玉米种子胚乳的差异, 在光谱上表现为热损伤组糯玉米种子胚乳的多光谱数据变异相对较大而对照组糯玉米种子胚乳的多光谱数据变异相对较小。

图4 糯玉米种子多光谱各变量数据样本标准差○: GUEmDZ; *: GUEmRSS; △: GUEnDZ;▽: GUEnRSS; +: GDEnDZ; ×: GDEnRSSFig.4 The standard deviation of the multi-spectraof waxy corn seeds○: GUEmDZ; *: GUEmRSS; △: GUEnDZ;▽: GUEnRSS; +: GDEnDZ; ×: GDEnRSS

对造成上述结果的原因分析如下: 种子胚的主要成分是蛋白质, 蛋白质的种类很多, 多以蛋白质高级结构(折叠、 螺旋、 叠加及组合等)的形式存在, 这是蛋白质具有生物学功能的重要原因之一。 高温可导致蛋白质发生变性, 失去了原有的一些高级结构, 变性后的蛋白质较变性前的蛋白质在化学键组成、 分子结构及分子构象等方面的差异相对较小, 因此胚对照组光谱变量数据样本标准差普遍高于热损伤组; 而胚乳的主要成分是以淀粉为主的多糖类物质, 本研究的高温环境导致热损伤组糯玉米种子胚乳中部分多糖类物质化学键断裂, 形成由多种糖类构成的复杂混合物, 其化学键的组成、 分子结构及分子构象较对照组样品增大, 因此对于胚乳部多光谱数据, 对照组光谱变量数据样本标准差普遍低于热损伤组。

对胚面向上胚部光谱(GUEm)PLS-DA模型、 胚面向上胚乳部光谱(GUEn)PLS-DA模型、 胚面向下胚乳部光谱(GDEn)PLS-DA模型、 胚面向上胚部光谱和胚乳部光谱融合数据(GUEm-GUEn)PLS-DA模型计算主成分累积贡献率, 上述4个模型的前3主成分累积贡献率分别为97%, 98%, 95%和93%, 亦即各模型潜3主成分累积贡献率皆超过90%。 将GUEm, GUEn, GDEn, GUEm-GUEn四模型的前三主成分得分绘制3D散点图, 分别如图5(a—d)所示, 其中, “○”表示对照组样品, “△”表示热损伤组样品。 从图5可见, 四种模型的前三主成分得分的3D散点图中, 对照组和热损伤组具有一定的分离趋势。

图5 糯玉米种子多光谱PLS-DA判别模型前3主成分得分散点图(a): GUEm; (b): GUEN; (c): GDEn; (d): GUEm-GUEn; ○: 对照组; △: 热损伤组Fig.5 The scatter plots of the first 3 principal components of PLS-DA models of the multi-spectra of waxy corn seeds(a): GUEm; (b): GUEN; (c): GDEn; (d): GUEm-GUEn; ○: control group; △: heat-damaged group

分别采用胚面向上胚部光谱数据(GUEm)、 胚面向上胚乳部光谱数据(GUEn)、 胚面向下胚乳光谱数据(GDEn)建立京科糯2000玉米种子热损伤粒的PLS-DA判别模型, 并建立GUEm和GUEn融合数据的热损伤粒PLS-DA判别模型, 结果如表1所示。 从表1可见, GUEm, GUEn, GDEn和GUEm-GUEn四模型的校正数据正确判别率皆在96%~100%之间, 而交互验证数据正确判别率皆在92%~100%之间; 四模型中, GUEm-GUEn模型正确率最高。

表1 京科糯2000玉米种子热损伤粒PLS-DA正确率Table 1 The accuracy of PLS-DA for heat-damagedkernels of Jingkonuo 2000 corn seeds

2.2 近红外光谱数据分析

采用VIAVI近红外光谱仪采集京科糯2000玉米种子对照组和热损伤组样品的近红外光谱如图6所示, 其中, a为对照组胚面向上光谱(GUSDZ)、 b为热损伤组胚面向上光谱(GUSRSS)、 c为对照组胚面向下光谱(GDSDZ)、 d为热损伤组胚面向下光谱(GDSRSS)。 从图6可见, 各光谱呈相似的趋势, 热损伤样品和对照样品在908~1 676 nm范围内未见明显区别。

图6 糯玉米种子近红外光谱(a): GUSDZ; (b): GUSRSS; (c): GDSDZ; (d): GDSRSSFig.6 The NIR spectra of waxy corn seeds(a): GUSDZ; (b): GUSRSS; (c): GDSDZ; (d): GDSRSS

为研究近红外光谱数据中各变量所对应吸光度值的变化规律, 对GUSDZ, GUSRSS, GDSDZ和GDSRSS数据分别做基线校正预处理以消除光谱平移对数据的影响, 再统计各光谱数据样本标准差, 如图7所示。 由于对数据做基线校正预处理, 波长964 nm所对应样本标准差值为0。 从图7可见: 对于胚面向上数据, GUSDZ样本标准差普遍高于GUSRSS; 而对于胚面向下数据, GDSDZ样本标准差普遍低于GDSRSS; 该规律在1 400~1 676 nm范围内更为明显; 该结果和多光谱样本标准差的分析结果一致。

图7 糯玉米种子近红外光谱数据的样本标准差○: GUSDZ; *: GUSRSS; △: GDSDZ; ▽: GDSRSSFig.7 The standard deviation of the near-infraredspectral data of waxy corn seeds○: GUSDZ; *: GUSRSS; △: GDSDZ; ▽: GDSRSS

分别对胚面向上(GUS)、 胚面向下(GDS)以及GUS-GDS融合数据建立PLS-DA模型, 并计算模型主成分累积贡献率。 结果表明, GUS, GDS和GUS-GDS模型的前3主成分累积贡献率分别为99%, 99%和96%, 亦即各模型前3主成分累积贡献率皆超过95%。 将GUS, GDS和GUS-GDS模型的前三主成分得分绘制3D散点图, 分别如图8(a—c)所示, 其中, “○”表示对照组样品, “△”表示热损伤组样品。 从图8可见, 三个模型的前三主成分得分的3D散点图中, 对照组和热损伤组具有一定的分离趋势, 其中GUS和GDS模型对照组和热损伤组的分离趋势更明显。

图8 糯玉米种子近红外光谱PLS-DA判别模型前3主成分得分散点图(a): GUS; (b): GDS; (c): GUS-GDS; ○: 对照组; △: 热损伤组Fig.8 The scatter plots of the first 3 principal components of PLS-DA models of the NIR spectra of waxy corn seeds(a): GUS; (b): GDS; (c): GUS-GDS; ○: control group; △: heat-damaged group

分别采用胚面向上光谱数据(GUS)、 胚面向下光谱数据(GDS)以及GUS-GDS融合数据建立京科糯2000玉米种子热损伤粒的PLS-DA判别模型, 结果如表2所示。 从表2可见, 各模型正确率皆为100%。

表2 京科糯2000玉米种子热损伤粒PLS-DA正确率Table 2 The accuracy of PLS-DA for heat-damagedkernels of Jingkonuo 2000 corn seeds

3 结 论

分别采用多光谱成像仪、 近红外光谱仪针对京科糯2000玉米种子热损伤组、 对照组分别采集了多光谱成像数据和近红外光谱数据。 针对多光谱成像数据, 提取了胚面向上胚部、 胚面向上胚乳部单点多光谱数据以及胚面向下胚乳部单点多光谱数据, 并将胚面向上胚部和胚乳部数据融合; 针对近红外光谱数据, 采集了单粒种子胚面向上、 胚面向下近红外光谱数据并将单粒种子数据融合。 对各数据做基线校正预处理后, 计算样本标准差, 并分析热损伤和对糯玉米种子各部位的影响, 结果表明, 高温过程对糯玉米种子胚、 胚乳有不同程度的影响, 表现在光谱数据样本标准差上, 热损伤组胚部多光谱数据样本标准差较对照组普遍较小, 热损伤组胚向上近红外光谱变量数据样本标准差较对照组普遍较小, 热损伤组胚乳部多光谱数据样本标准差较对照组普遍较大, 热损伤组胚乳部近红外光谱数据样本标准差较对照组普遍较大, 亦即本研究中采用的近紫外-可见-短波近红外多光谱数据和近红外光谱数据具有相似的规律。 分别基于多光谱数据、 近红外光谱数据建立糯玉米热损伤粒PLS-DA模型, 结果表明, 多光谱数据PLS-DA的校正数据正确率在96%~100%之间, 交互验证数据正确率在92%~100%之间, 其中, 基于糯玉米种子胚向上胚部和胚乳部融合的多光谱数据所建PLS-DA模型准确率最高, 校正数据正确率为100%, 交互验证数据正确率在98%~100%之间; 近红外光谱数据PLS-DA模型的校正数据、 交互验证数据正确率皆为100%。

本研究表明, 基于近紫外-可见-短波近红外多光谱数据可以对糯玉米种子热损伤粒进行无损快速鉴别, 而基于近红外光谱数据所建糯玉米种子热损伤粒判别模型具有更高的准确度。 然而, 跨年度样品、 不同高温环境导致的热损伤样品以及其他品种玉米种子的热损伤粒无损快速鉴别仍需进一步深入研究。

猜你喜欢
胚乳糯玉米标准差
用Pro-Kin Line平衡反馈训练仪对早期帕金森病患者进行治疗对其动态平衡功能的影响
高粱种子胚乳完整程度对芽苗建成的影响
浅论糯玉米苗期田间管理
为什么种子含有丰富的营养?
黑糯玉米果冻的加工工艺研究
黑糯玉米新品种‘华耘黑糯501’的选育
小麦胚乳A、B型淀粉粒的形成与生长特征及氮素调节
对于平均差与标准差的数学关系和应用价值比较研究
黑糯玉米色素清除亚硝酸盐及阻断亚硝胺合成的研究
医学科技论文中有效数字的确定