基于可见/近红外漫透射光谱的马铃薯黑心病及淀粉含量同时在线无损检测

2020-06-13 02:01丁继刚韩东海李永玉彭彦昆
光谱学与光谱分析 2020年6期
关键词:黑心心病预处理

丁继刚,韩东海,李永玉*,彭彦昆,王 绮,韩 熹

1.中国农业大学工学院,国家农产品加工技术装备研发分中心,北京 100083 2.北京伟创英图科技有限公司,北京 100070

引 言

我国是马铃薯第一生产大国,据统计资料,中国的马铃薯种植面积和产量均居世界首位[1]。2015年我国启动了马铃薯主食化战略,推进马铃薯加工成馒头、面条、米粉等主食,马铃薯将成为稻米、小麦、玉米外又一主粮[2]。但是马铃薯产品内部品质参差不齐,采后检测分级技术发展落后,严重制约了马铃薯产业主食化发展进程。提高马铃薯内部品质快速无损检测对推进马铃薯主食化和马铃薯加工产业化发展有着重要现实意义。

国内外诸多学者基于可见/近红外光谱对马铃薯块茎中的干物质含量[3]、淀粉含量[4-5]、钾含量[6]以及内部多品质参数[7-8]进行了无损检测研究,大部分研究都是基于可见/近红外漫反射光谱和局部漫透射光谱的马铃薯常见内部营养品质的快速无损检测。但是马铃薯在成长和收获过程中果心极易发生褐变,俗称“黑心病 ”。病变先在中心附近发生,逐渐波及整个马铃薯不能食用。黑心病马铃薯的存在严重影响马铃薯经济价值及其产业化加工[9],田芳、高海龙等基于机器视觉和高光谱成像技术对马铃薯黑心病进行了无损检测研究[10-13],但目前还未见马铃薯黑心病及淀粉含量同时在线无损检测相关研究报道。现今推进我国马铃薯主粮加工产业化进程中,实现马铃薯黑心病及淀粉含量在线同时检测分选具有重要的现实意义。

利用实验室自主搭建的可见/近红外漫透射光谱在线采集系统,以马铃薯黑心病及淀粉含量信息在线同时检测为目的,基于马铃薯可见/近红外漫透射光谱,建立马铃薯黑心病及淀粉含量在线预测模型,实现马铃薯黑心病及淀粉含量同时在线无损检测,为推进马铃薯主食化产业发展提供一定技术参考。

1 实验部分

1.1 材料

马铃薯样品:马铃薯品种为冀张薯8号,属于中晚熟品种,购于物美超市。挑选表面无虫眼、无机械损伤样品,共计271个。其中121个用于采集健康马铃薯光谱建立淀粉定量预测模型,其余150个用于制备黑心马铃薯建立黑心马铃薯判别预测模型。为消除样品表面尘土、温度、湿度及储藏时间给实验带来的影响,实验前将样品清理干净,置于相对湿度40%~55%室温下放置24 h。

黑心马铃薯样品:将健康马铃薯用75%乙醇分三次进行表面喷洒灭菌消毒,以防止密封过程微生物引起的表面感染病变,马铃薯表面干燥后利用真空包装机对马铃薯进行真空包装,以制造厌氧封闭环境,将包装后的马铃薯置于36 ℃恒温培养箱中保存24 h,致使马铃薯自然发病,拆袋后立即置于2℃的冷藏环境中急速降温保存24 h以加速黑心病发病率。最后共制116个外观无明显褐变的黑心马铃薯样品。

1.2 马铃薯可见/近红外漫透射光谱采集系统

马铃薯可见/近红外漫透射光谱采集系统主要包括输送模块、光源模块、光谱采集模块,控制模块、数据分析模块。4个50 W卤素灯光源水平方向间隔90°布置在样品四周,漫透射光透过样品后进入布置于样品下方的检测器,4个光源与检测器利用运载托盘较好地实现了隔离,防止了外界无用杂散光直接进入样品下方检测器,减少了环境噪声的影响,如图1所示。该系统所用光谱仪为美国Ocean Optics公司生产的USB2000+光谱仪,扫描波长范围为550~1 100 nm,光谱分辨率为1 nm。此外还有自行设计的运载托盘、传送带、运行导轨、样品杯、调平脚座等,整体光谱采集系统实物及光路原理如图1所示。

图1 光谱采集系统实物及光路原理图Fig.1 Spectral acquisition system physical and optical path schematic

1.3 方法

1.3.1 马铃薯可见/近红外漫透射光谱采集

为避免因系统不稳定而对实验结果产生影响。采集光谱前开机预热30 min,待光源能量稳定后校正白参考,采集样品光谱。通过上位机软件控制运载托盘带动马铃薯依次通过检测室,马铃薯到达检测位置通过到位传感器触发采集马铃薯漫透射光谱,光漫透过马铃薯内部,将携带内部品质信息的漫透射光谱经过运载托盘的通光孔进入下置的光谱仪,由光谱仪接收光谱信号。光谱采集积分时间为4 ms,平均次数为4次,样品在线检测速度约4个·s-1,光谱范围550~1100 nm。237个马铃薯样品分别采集可见/近红外漫透射吸光度光谱后立即判别黑心情况,健康马铃薯直接用于淀粉标准理化值测定。

1.3.2 黑心马铃薯判别和健康马铃薯淀粉标准理化值测定

采集完光谱的马铃薯样品沿纵径切开,采用目视方法判断马铃薯是否发生黑心病。健康马铃薯和黑心马铃薯断面图如图2所示。未发生黑心病的马铃薯样品根据碘还原法[14]测定淀粉含量,每个样品测定3次,并以平均值作为该样品淀粉含量标准理化值。

图2 健康马铃薯和黑心马铃薯断面图Fig.2 Sectional view of healthy potatoes and black heart potatoes

2 结果与讨论

2.1 马铃薯淀粉标准理化值测定结果分析

121个马铃薯样品的淀粉标准理化值统计结果如表1所示,所测样品淀粉标准理化值的范围是13.29%~19.43%,马铃薯样品淀粉标准理化值均值为15.77%,标准差为1.34%。

表1 马铃薯淀粉含量标准理化值统计结果Table 1 Statistical results of standard physical and chemical values of potato starch content

2.2 马铃薯可见/近红外漫透射光谱预处理分析

受外界检测环境及仪器性能的影响,所采集的原始光谱两端噪音较大影响建模结果,故只保留了600~1 000 nm波段范围的光谱信息。121个健康马铃薯和116个黑心马铃薯原始光谱如图3(a),(b)所示。

先将采集的黑心马铃薯与健康马铃薯光谱分别进行了平均处理,如图3(c)所示。从平均光谱中可以看出,黑心马铃薯与健康马铃薯样品漫透射吸光度光谱曲线有显著的差异。健康马铃薯组织呈淡黄色,而黑心马铃薯褐变组织主要呈黑色,600~900 nm波段范围内黑心马铃薯样品的吸光度数值明显高于健康马铃薯样品。由于黑心组织的影响,健康马铃薯在663 nm附近叶绿素的吸收峰明显高于黑心马铃薯。另外因黑心马铃薯内部褐变组织失水导致黑心马铃薯在760 nm附近水的特征吸收峰强明显低于健康马铃薯。基于黑心马铃薯原始光谱明显区别于健康马铃薯样品,利用原始光谱建模分析应可以实现黑心马铃薯快速判别。本文主要考虑在线检测判别速度为约4个·s-1,需尽可能使模型运行过程简单,因此下一步直接利用原始光谱进行黑心马铃薯判别分析。

121条健康马铃薯原始光谱曲线分别采用SG卷积平滑(savitzky-gloay smoothing,SG Smoothing)、标准正态变量变换(standard normal variable transform,SNV)、多元散射校正(multiplication scattering correction,MSC)、一阶导数(first derivation,FD)以及SG平滑加一阶导数(SG+FD)预处理方法进行了预处理,预处理结果如图4所示。

图3 黑心马铃薯与健康马铃薯光谱对比图(a):健康马铃薯原始光谱;(b):黑心马铃薯原始光谱;(c):平均光谱Fig.3 Spectrum comparison of black-heart potatoes and healthy potatoes(a):Original spectrum of healthy potatoes;(b):Original spectrum of black-heart potatoes;(c):Average spectrum

图4 马铃薯预处理光谱图(a):原始光谱;(b):SG卷积平滑;(c):标准正态变换;(d):多元散射校正;(e):一阶导数;(f):SG平滑+一阶导数Fig.4 Potato pretreatment spectrum(a):Original spectrum;(b):SG convolution smoothing;(c):Standard normal transformation; (d):Multivariate scatter correction;(e):First derivative;(f):SG smoothing+first derivative

原始光谱曲线经SG卷积平滑后的光谱曲线有效滤除了随机噪声,同时也较好地保留了在原始光谱中660,750,840和960 nm附近的特征峰,分别如图4(a)和(b)所示。121条马铃薯原始光谱分别经SNV和MSC预处理后均消除了样品内组织分布不均造成的散射影响,使原始光谱中出现的特征峰更加显著,如图4(c)和(d)所示。经一阶导数处理后不仅原始光谱中出现的特征峰更加明显,而且在波长640,680和878 nm波长附近也出现了新的特征峰,如图4(e)所示。根据相关研究报道,680 nm附近为色素吸收特征峰,878 nm波长附近为淀粉的特征吸收峰[15]。说明通过一阶导数预处理强化了原始光谱中隐藏在较宽吸收频带的微小特征峰,增强了极值点、拐点等局部位置光谱吸光度对内部成分含量等变化的响应差异,提高了分辨率和灵敏度。但导数处理也会引入不必要的噪声降低信噪比,因此有必要先经SG平滑滤除随机噪声再进行一阶导数预处理,SG平滑加一阶导数预处理光谱曲线如图4(f)所示。

2.3 马铃薯黑心病定性判别模型的建立

基于237个马铃薯样品(其中黑心马铃薯为116个,健康马铃薯为121个)600~1 000 nm波段原始光谱曲线,利用偏最小二乘判别分析法(partial least squares-discriminat analysis,PLS-DA)建立了黑心马铃薯判别预测模型,将237个样品用Kennard-Stone算法按3∶1的比例分为校正集177个样品(其中黑心马铃薯87个,健康马铃薯90个),验证集60个样品(其中黑心马铃薯29个,健康马铃薯31个)。黑心马铃薯PLS-DA判别模型结果如图5所示。校正集出现4个错判样品(3个黑心马铃薯,1个健康马铃薯),校正集判别正确率为97.74%,验证集出现1个错判样品(1个黑心马铃薯),验证集判别正确率为98.33%,模型总体判别正确率为97.89%。误判黑心马铃薯为发病较为轻微的马铃薯,光谱之间差异较小,误判黑心马铃薯如图6所示。误判的1个健康马铃薯体积显著大于普通马铃薯且外形不规则,由于光源穿透能力有限,且外形不规则导致光谱采集过程信号失真产生误判。

图5 PLS-DA判别模型结果散点图Fig.5 Scatter plot of the PLS-DA discriminant model results

图6 误判黑心马铃薯样品Fig.6 Misjudged black-heart potato sample

2.4 马铃薯淀粉定量预测模型的建立

将121个健康马铃薯利用Kennard-Stone算法按3∶1的比例划分为校正集和验证集,其中90个样品作为校正集,31个样品作为验证集。基于不同预处理方法分别建立了马铃薯淀粉偏最小二乘(partial least squares,PLS)定量预测模型,建模结果如表2所示。

表2 不同预处理方法的淀粉含量模型结果Table 2 Results of starch content model for different pretreatment methods

结果显示,基于一阶求导预处理光谱的马铃薯淀粉预测模型结果优于其他预处理方法,其中原始光谱先经SG平滑再进行一阶求导的模型结果最优。如前所述,经一阶导数处理后的光谱不仅保留了原始光谱原有的特征峰,同时出现了包括878 nm处淀粉特征吸收峰在内的其他新的微小吸收峰。马铃薯淀粉属于葡萄糖的高聚化合物,成分复杂,吸收峰众多,一阶导数预处理提高了分辨率和灵敏度,分辨了更多重叠峰,但导数处理也会引入不必要的噪声降低信噪比,因此先经SG平滑滤除随机噪声再进行一阶导数预处理结果优于其他预处理方法。经SG平滑加一阶导数预处理后马铃薯淀粉偏最小二乘方法定量预测模型校正集和验证集的相关系数分别为0.906和0.879,均方根误差分别为0.627% 和0.793%,模型结果散点图如图7所示。

图7 最优马铃薯淀粉含量模型结果散点图Fig.7 Scatter plot of the optimal potato starch content model results

为进一步精简模型并提高模型预测精度,利用竞争性自适应重加权采样(competitive adaptive reweighted sampling,CARS)[16]对SG平滑结合一阶求导后的光谱数据进行了特征波长的筛选,算法运行结果根据RMSECV最小原则最终确定的蒙特卡洛采样次数为55次,所选特征波长变量数为22个,运行结果如图8所示。

图8 马铃薯淀粉含量特征波长提取图(a):变量选择数目趋势图;(b):RMSECV关系图; (c):变量回归系数路径Fig.8 Wavelength extraction map of potato starch content(a):Trend number of variable selection;(b):RMSECV relationship diagram;(c):Variable regression coefficient path

利用CARS算法筛选出的淀粉含量特征波长建立了马铃薯淀粉PLS预测模型,模型结果散点图如图9所示,马铃薯淀粉预测模型校正集和验证集的相关系数分别为0.928和0.908,优于全波段建模的0.906和0.879;均方根误差分别为0.556%和0.633%,优于全波段建模的0.627%和0.793%。这可能是由于CARS算法引入指数衰减函数来控制变量保留率,并从去除权重低点和保留最小误差点两方面进行波长选择[17],此方法能有效去除无关变量和共线性变量,提高光谱与待测组分间的相关性,提高预测模型的精度。

图9 提取特征波长后的马铃薯淀粉含量模型结果散点图Fig.9 Scatter plot of potato starch content model after extracting characteristic wavelength

3 马铃薯黑心病及淀粉含量同时无损在线检测外部验证实验

将马铃薯黑心病及淀粉的预测模型分别同时植入到在线检测系统中,对马铃薯黑心病及淀粉含量进行了同时在线检测外部验证。在线检测系统自动采集马铃薯漫透射光谱,先通过马铃薯黑心病判别模型自动判别是否黑心马铃薯,如果是直接显示结果,而不是将采集数据代入到淀粉定量预测模型,最终显示健康状况和淀粉预测结果,检测速度约4个·s-1。

本研究利用未参与建模的50个马铃薯样品(其中黑心马铃薯25个,健康马铃薯25个)进行了黑心病和淀粉含量同时无损在线检测外部验证。结果显示,在线检测系统对50个马铃薯样品黑心总体判别正确率为96%,其中25个黑心马铃薯判错2个,判别正确率为92%,误判黑心马铃薯均为褐变组织较为轻微的样品。25个健康马铃薯未出现误判样品,判别正确率为100%,黑心病外部验证结果如图10(a)所示。25个健康马铃薯在线检测系统淀粉含量预测值与标准理化值相关系数为0.893,预测均方根误差为0.713%;外部验证结果如图10(b)所示。综上所述基于马铃薯可见/近红外漫透射光谱完全可以实现对马铃薯黑心病及淀粉含量的同时无损在线检测。

图10 模型外部验证结果(a):黑心病外部验证结果;(b):淀粉外部验证结果Fig.10 Model external verification results(a):External verification results of black-heart disease; (b):External verification results of starch content

4 结 论

以马铃薯为研究对象,基于可见/近红外漫透射原理,利用实验室自行搭建的可见/近红外漫透射光谱在线检测系统,建立了马铃薯黑心病及淀粉含量在线预测模型,探讨了马铃薯黑心病及其他内部品质同时在线无损检测方法。结果表明:基于自行搭建的可见/近红外漫透射在线检测系统建立的黑心马铃薯定性判别预测模型,校正集和验证集判别正确率分别为97.74%和98.33%。健康马铃薯漫透射光谱经SG平滑加一阶导数预处理结合CARS算法筛选特征波长后建立的淀粉PLS定量预测模型Rc和Rp分别为0.928和0.908,RMSEC和RMSEP分别为0.556%和0.633%。将所建模型植入到在线检测系统,利用50个未参与建模马铃薯样品模型进行了外部实验验证。黑心马铃薯定性判别总正确率为96%,淀粉在线预测结果与标理化值相关系数为0.893,均方根误差为0.713%。表明利用自行搭建的在线可见/近红外漫透射光谱检测系统可以实现马铃薯黑心及淀粉含量的同时在线检测,为马铃薯品质快速无损评价提供了参考。

猜你喜欢
黑心心病预处理
求解奇异线性系统的右预处理MINRES 方法
黑心小贩
便秘是否也是一种心病?
高COD二噻烷生产废水预处理研究
法博士之黑心主播
“黑心”茭白
关注孩子的“心病”
古人医心病
藏有黑心药的布娃娃
基于预处理MUSIC算法的分布式阵列DOA估计