戈永慧,宋进,潘磊庆,屠康*
(1.南京农业大学食品科学技术学院,江苏 南京 210095;2.南京农业大学工学院,江苏 南京 210031)
猕猴桃(ActinidiachinensisPlanch)是猕猴桃科(Actinidiaceae)猕猴桃属(Actinidia)的多年生落叶藤本植物,具有独特的风味、较高的营养价值和保健价值,深受消费者的喜爱[1]。猕猴桃是典型的呼吸跃变型果实,采后不耐储,在常温下贮藏成熟和衰老很快,而且极易腐烂,因此,低温是延长猕猴桃贮藏期的有效方法。但猕猴桃属于冷敏性水果,长时间低温条件极易导致果实发生冷害,并且冷害症状先从组织内部开始,只有在转移到常温销售条件下才会急剧表现出来,此时的损失已无法挽回[2-4]。
猕猴桃果实冷害症状主要表现为表皮发黑、凹陷,皮下组织木质化和褐变,果肉呈水浸状和果心发硬等,冷害导致猕猴桃的品质下降,影响果实的销售[5-6]。我国是世界上最大的猕猴桃生产国,近年来,随着猕猴桃贮藏量和贮藏时间的增加,低温造成的冷害损失也日趋严重,尤其是中华系猕猴桃‘红阳’最为明显,0 ℃下贮藏3个月后冷害发病率达80%以上[7-8]。因此,需要寻找一种全面、准确、快速检测猕猴桃冷害和判别冷害程度的方法,实现对猕猴桃果实冷害不同阶段的检测。
Suo等[9]将猕猴桃切片、削皮后观察皮下和果实内部的冷害症状,将冷害划分为5个等级,但这种检测方法破坏了猕猴桃的自身结构,检测后的猕猴桃不能用于整果销售。高光谱成像技术基于传统的成像技术和光谱技术,具有简便、快速、无损、准确等优点,通过一次连续扫描,可以同时对样品内、外部进行无损检测[10-13]。与近红外技术相比,高光谱技术的测量区域为样品的整体,而不是局部区域,采集的光谱信息更具有代表性,而且高光谱技术可以同时获取被检测物体的空间信息和光谱信息,具有“图谱合一”的特点,具有更广泛的应用前景[14]。
关于高光谱成像技术检测农产品冷害已有相关报道。Pan等[15]基于人工神经网络模型(ANN)建立了桃冷害的检测模型,正常和冷藏样本的冷害分类准确率可达95.8%;Cen等[16]基于高光谱成像系统对黄瓜的冷害检测结果显示,正常黄瓜与冷害黄瓜之间的光谱图像差异很难被观察到,光谱信息更适用于样品内部的冷害检测;Wang等[17]利用近红外(NIR)光谱技术对不同冷害程度的中华猕猴桃‘Zesy002’的研究结果表明,猕猴桃冷害与光学特性存在相关关联机制,证明光学技术可以实现猕猴桃冷害的检测。但基于高光谱成像技术检测猕猴桃冷害的研究鲜有报道。本研究选取‘红阳’猕猴桃为研究对象,采用高光谱技术采集400~1 000 nm和1 000~2 000 nm波长范围光谱信息,通过变换建模方法,优化预处理方式以及筛选特征波长,建立猕猴桃果实不同冷害阶段的分级模型,旨在为猕猴桃采后贮藏过程中的冷害提供一种无损甄别方式。
供试材料为八成熟的‘红阳’猕猴桃,购于南京众彩物流有限公司。
CTHI-250B型恒温恒湿箱购于施都凯设备公司;可见-近红外高光谱成像系统:ImSpector V10E成像光谱仪购于芬兰Specim公司;ICLB1620CCD摄像机购于美国Imperx公司;IT3900ER 150W卤素光源购于美国Illumination Technologies公司;Spectra Image取像软件、HIS Analyzer分析软件购于五铃光学股份有限公司。短波红外高光谱成像系统:ImSpector N25E成像光谱仪购于芬兰Specim公司;Raptor EM285CL摄像机购于英国Raptor Photonics公司;IRCP0076-ICOMB001移动平台、Spectra Image取像软件、HIS Analyzer分析软件均购于五铃光学股份有限公司。
1.2.1 试验样本的处理挑选果面无缺陷且大小均匀、一致的果实,放入相对湿度为(90±5)%、温度为0 ℃的冷库贮藏,每隔1周取样,置于25 ℃、相对湿度(90±5)%货架3 d[9],进行高光谱反射图像的采集。采集图像后削皮进行猕猴桃冷害等级的判别,通过观察皮下果肉木质化、水浸状、褐变等冷害症状的面积,结合猕猴桃出库后的商业价值,将冷害分为4个等级,冷害等级的判别参考Yang等[18]的研究结果并加以改进,判别标准如下:0级为正常(未发生冷害);1级为极轻(0<可见病症≤1/4),不影响果实销售,仍具有商业价值;2级为较轻(1/4<可见病症≤1/2),失去部分商业价值,影响果实销售;3级为严重(1/2≤可见病症),不可食用,彻底失去商业价值。剔除异形、破损等样品后,共有猕猴桃样品208个,每个冷害等级的样本各52个。
1.2.2 高光谱图像的采集采用线扫描采集每个样品正、反两面的高光谱反射图像,相机镜头和光源分别距样本30.0和24.0 cm。为了减少阴影面积,2个光源分别固定于样品斜上方45°的位置。可见-近红外高光谱成像系统有效范围为400~1 000 nm的440个波长,光谱分辨率为2.8 nm,设置光源强度60 W,曝光时间3 ms,平台移动速率6.2 mm·s-1。短波红外高光谱成像系统的有效范围为1 000~2 000 nm的144个波长,光谱分辨率为6.2 nm,光源强度设置为255 W,曝光时间3 ms,平台移动速率为13.78 mm·s-1。
1.2.3 高光谱图像的校正由于光源强度不均、相机暗电流等会对光谱信息产生影响,因此需要进行黑白板校正以消除冗余信息。使用聚四氟乙烯标准校正白板(反射率为99.99%)获取全白反射图像,盖上相机的不透明镜头盖获取全黑反射图像,由公式计算得到校正后的相对反射图像。高光谱图像校正公式如下:
R=(R0-B)/(W-B)。
式中:R为校正后的高光谱图像;R0为原始图像;B为全黑反射图像;W为全白反射图像。
1.3.1 光谱特征信息提取使用MatlabR2010b软件提取光谱数据并分析。分别选用猕猴桃整果在689和1 494 nm波长处的灰度图像为掩膜特征图像,进行二值化阈值分割和背景去除,因为在这2个波长下图像中背景与样本的光谱相对反射值差值最大[19-20]。统计样本总的像素点数量和有效光谱值总和,提取每个样本的平均光谱值,经归一化得到相对反射率,再计算同一样本正、反两面的平均光谱用于后续数据处理和分析。
1.3.2 光谱预处理方法选择由于光谱包含了噪声、背景颜色、吸收峰重叠以及基线漂移等一些无用的信息,为提取更有效的光谱信息和提高模型的检测精度和稳定性,需要对光谱信息进行预处理来削弱或消除无用信息对光谱信息的影响。本研究采用的预处理方法有自动标准化(Autoscale)、变量标准化(standard normalized variate,SNV)、多元散射校正(multiplicative scatter correction,MSC)和一阶导数(the first derivative,1-st),比较不同预处理方法对模型的影响。
1.3.3 光谱特征波长筛选由于高光谱数据量庞大,选择特征波长有利于降低计算负担,对于简化模型非常重要。本研究采用连续投影算法(SPA)、竞争性自适应重加权算法(CARS)进行特征波长的选择,比较不同特征波段筛选算法的建模结果。
1.3.4 模型的建立与评估基于主成分分析(principle component analysis,PCA)构建不同冷害等级猕猴桃的主成分模型,基于偏最小二乘判别分析(partial least squares-discriminant analysis,PLS-DA)和支持向量机(support vector machine,SVM)优化模型,分别建立400~1 000 nm和1 000~2 000 nm全波段范围和特征波段范围猕猴桃冷害等级的判别模型,通过建模集和预测集的判别正确率对模型进行评价。
不同冷害等级的‘红阳’猕猴桃的皮下果肉组织的冷害症状如图1所示,‘红阳’猕猴桃冷害症状主要表现为皮下组织木质化和褐变、果实内部呈水浸状,皮下组织木质化和褐变的面积随着冷害程度的加剧逐渐增大,猕猴桃内部水浸化呈由内向外扩散的趋势,这与索江涛[8]的研究结果相一致。
图1 不同冷害等级的‘红阳’猕猴桃的皮下果肉组织的冷害症状
如图2所示:在400~1 000 nm、1 000~2 000 nm波长下,不同冷害程度猕猴桃的平均光谱的总体趋势是相似的,正常样品的相对反射率高于冷害样品,冷害等级越高,相对反射率越低,这可能是由于冷害过程中猕猴桃果实中的成分发生了变化[9],样本的组织塌陷、色素受损造成光反射减少,从而导致相对反射率随冷害程度加剧而降低。研究表明,在500~700 nm波段下,相对反射值的大小与水果蔬菜中叶绿素、类胡萝卜素、花青素的含量有关[21]。在540 nm处存在的峰主要与猕猴桃中的花青素有关,在630 nm处的宽峰和660 nm处波谷,与猕猴桃中的叶绿素有关,且花青素、叶绿素的含量越高,其相对反射率越高[22]。在770、970 nm和1 450、1 900 nm处均有明显的水分吸收谷,来源于水分子O—H键的伸缩振动,与水分子的结构有关[23-24]。在837~876 nm存在碳水化合物的吸收带,1 786 和1 190 nm附近处的吸收谷源于碳水化合物中碳氢键(C—H)的强烈振动[19]。
图2 不同冷害程度的猕猴桃反射光谱信息
由图3-a可见:在400~1 000 nm波段下,PC1和PC2涵盖了约90%的光谱数据信息,4组样本存在聚类现象,未发生冷害(0级)与发生冷害(1、2、3级)之间有良好的区分,但冷害等级0、1、2级之间有少量样本重合。由图3-b可见:在1 000~2 000 nm波段下,PC1和PC2包括约94%的光谱数据信息,不同冷害等级的样本在一定程度上可以区分开,但相邻冷害等级的猕猴桃分布存在一定数量的交叉。因此,为了实现对猕猴桃冷害等级准确的定性分析,需要进一步分析并建立猕猴桃冷害的预测模型。
图3 不同冷害程度的猕猴桃在400~1 000 nm(a)和1 000~2 000 nm(b)波长范围的主成分得分散点图
根据含量梯度法[25],对4个冷害等级的208个样本以3∶1的比例进行建模集和预测集的划分(建模集∶预测集=156∶52),经自动标准化(Autoscale)、变量标准化(SNV)、多元散射校正(MSC)、一阶导数算法对原始光谱进行预处理,建立400~1 000 nm和1 000~2 000 nm波长的偏最小二乘判别分析(PLS-DA)和支持向量机(SVM)模型,以建模集正确率和预测集正确率选择最优建模方式。
由表1可知:对于PLS-DA模型,Autoscale建模集、预测集的正确率均高于其他预处理方法,预处理结果最优。SNV-SVM模型建模集正确率高于其他预处理,但预测集正确率最低,因而不适于作为SVM模型最恰当的预处理方式;而Autoscale-SVM建模集和预测集正确率均达到90%以上,建模集正确率仅次于SNV-SVM,表明Autoscale为SVM模型的最佳预处理方法。综合以上2种建模方法结果,Autoscale-SVM模型建模集正确率高于Autoscale-PLS-DA,因此,在400~1 000 nm波段范围采用Autoscale预处理后建立的SVM模型最优。
表1 基于400~1 000 nm波长范围对不同预处理方法下猕猴桃冷害模型的比较
由表2可知:不同预处理方式的SVM模型建模集和预测集的正确率均高于PLS-DA。对于SVM模型,经Autoscale预处理后预测集正确率比原始光谱高7.7%,表明Autoscale提升了模型预测准确率和建模效果,这与Huang等[26]的研究结果一致;而经SNV、一阶导数、MSC预处理的模型正确率较低,可能是由于不恰当的预处理方式会放大原始光谱中的噪声与干扰信息,导致模型准确率下降[27]。因此,基于Autoscale-SVM模型可以更好地判别不同冷害程度的猕猴桃(1 000~2 000 nm)。
表2 基于1 000~2 000 nm波长范围对不同预处理方法下猕猴桃冷害模型的比较
2.4.1 基于连续投影算法(SPA)提取特征波长SPA是一种前向选择特征波段的算法,提取的特征波段共线性小、冗余度低[28]。根据SPA算法得出的RMSE值大小作为挑选特征变量的依据,在400~1000 nm波段,经SPA算法共筛选出的12个特征波长分别为:400、401、412、446、479、504、609、645、729、799、961、1 000 nm。对于1 000~2 000 nm波段下,共筛选出4个特征波长,分别为:1 442、1 479、1 538、1 943 nm。
2.4.2 基于竞争性自适应重加权算法(CARS)提取特征波长CARS算法由多次重复筛选得到一系列的波长变量子集,得到的最优特征波长组合交叉验证均方根误差(RMSECV)最小[29]。图4为400~1 000 nm波段下,CARS算法筛选特征变量过程,蒙特卡罗采样次数为50,在第28次采样时,RMSECV最小,说明在前27次采样中剔除了与冷害无关的波长变量,而在后22次采样中可能剔除了与冷害相关的关键变量[30],RMSECV最小时得到的14个特征波长分别为:400、653、689、719、767、831、853、888、890、891、934、954、960、980 nm。1 000~2 000 nm波段下CARS算法筛选特征变量过程如图5所示,在第32次采样时,RMSECV最小,得到10个特征波长分别为:1 466、1 479、1 509、1 538、1 553、1 575、1 626、1 634、1 964、1 985 nm。
图4 400~1 000 nm波段下CARS算法变量筛选流程
图5 1 000~2 000 nm波段下CARS算法变量筛选流程
2.4.3 模型的建立与评估对预处理后的光谱信息,基于SVM模型分别建立全波段和SPA、CARS筛选特征波段的猕猴桃冷害检测的判别模型,结果见表3。
表3 基SVM算法的猕猴桃冷害全波长范围和特征波长预测模型
在400~1 000 nm波长范围,基于SPA算法特征波长预测模型的建模集、预测集正确率分别达100%和94.2%,建模集正确率高于全波长和CARS特征波长模型,预测集正确率与CARS-SVM模型相等,并且比全波长模型高3.8%,因此,基于SPA算法建立的猕猴桃冷害分级模型效果最优。在1 000~2 000 nm波长范围,SPA-SVM模型具有最低的建模集正确率,可能是由于SPA算法筛选特征波长时,仅保留了4个特征波长,导致模型精度下降。CARS-SVM模型的建模集和预测集正确率分别为92.3%和86.5%,对彻底失去商业价值的猕猴桃(3级)预测判别准确率达100%,比全波长模型的预测结果更好、运行速度更快。因此,基于CARS特征波长建立的模型预测效果优于全波长和SPA-SVM模型。
在400~1 000 nm波长范围SPA-SVM模型为猕猴桃冷害的最佳分级模型,建模集正确率、预测集正确率分别达100%、94.2%,未发生冷害的猕猴桃识别正确率达100%,具有最佳预测效果。
猕猴桃采后冷藏容易诱发冷害,导致果实损失严重,甚至失去商业价值。在已有的研究中,猕猴桃冷害的无损检测大都基于近红外技术,Wang等[31]基于可见近红外光谱(500~1 000 nm)和双激光系统(730和850 nm)将猕猴桃冷害分为3个等级,建立的判别模型的正确率分别为88.5%和85.2%,而本文采用高光谱技术,建立的SPA-SVM模型(400~1 000 nm)预测集正确率为94.2%,说明在400~1 000 nm波长范围,基于高光谱成像技术建立的SPA-SVM模型具有一定的优越性。
本研究PCA结果表明,发生冷害与未发生冷害的猕猴桃之间有良好的区分,但相邻等级猕猴桃样本间存在少量重叠。Autoscale对原始光谱进行预处理可以提高模型的正确率,使用Autoscale构建的 PLS-DA 和SVM模型相对于其他预处理方式的建模效果更好,Autoscale-SVM模型在2个波长范围都优于Autoscale-PLS-DA模型,相对于PLS-DA来说,SVM算法的建模向量之间关联程度较小,对于解决非线性识别表现出更高的优越性[32]。
通过比较特征波长选择方式可以对模型进一步优化,有利于提高模型的正确率和运行速度。本研究在400~1 000 nm波长范围基于SPA算法筛选了12个特征波长,其中504、609、645 nm位于叶绿素、花青素、类胡萝卜素的吸收带500~700 nm附近,799和961 nm分别接近于水分的吸收谷770、970 nm。SPA-SVM 建模结果优于全波长,建模集、预测集正确率可达100%和94.2%,未发生冷害(0级)的猕猴桃识别正确率达100%。在1 000~2 000 nm波长范围基于CARS算法筛选了10个特征波长,其中1 466、1 964 nm接近于水分的吸收点1 450、1 900 nm,1 479、1 509、1 538 nm位于C—H键的第二组合频1 333~1 538 nm区域,1 634 nm接近于C—H伸缩振动的一级倍频吸收峰1 652 nm[33]。CARS-SVM的建模集、预测集正确率分别为92.3%和86.5%,对彻底失去商业价值的猕猴桃(3级)预测准确率为100%,既保证了模型准确率,又极大地减少了运算量。由于不同波长范围的猕猴桃冷害模型对应不同的最优特征波长选择方式,因此,每一项建模试验都有必要进行选择特征波长的比较,尤其是大数据量的检测。
本文基于高光谱成像技术建立的SPA-SVM(400~1 000 nm)模型对猕猴桃冷害分级具有一定的优越性(建模集正确率为100%,预测集正确率为94.2%),对未发生冷害的猕猴桃识别率达100%,具有较好的建模效果,因此高光谱可以全面、准确、快速检测猕猴桃冷害程度。本研究为高光谱成像技术预测猕猴桃冷害等级、无损检测猕猴桃的品质提供了理论基础,但对于模型的实际应用,以及如何将猕猴桃内部的冷害与外部信息结合仍需进一步探讨,后续将进行光谱与图像信息融合研究。