林思寒,黎 静,,薛 龙,*,刘木华,,陈金印,陈 明,张一帆
(1.江西农业大学 工学院/江西省现代农业装备重点实验室,江西 南昌 330045;2.江西省果蔬采后处理关键技术与质量安全协同创新中心,江西 南昌 330045)
翠冠梨是国内最早成熟的蜜梨新品种,果肉细嫩松脆,是盛夏时节解渴的佳品。但在运输过程中易造成碰压伤害,因其果皮厚实颜色深,肉眼不易识别,碰压伤害会衍生翠冠梨腐烂[1],从而导致大量损坏,增加生产成本。目前国内对翠冠梨的品质研究多为种植期间施肥、授粉、套袋,储藏过程中温度、保鲜膜的选择等对翠冠梨的影响[2]。而翠冠梨成熟后在采摘、运输和包装过程中,由于机械挤压和碰撞而造成其表面的破损和碰压伤等早期损伤的快速检测研究报道还不多见,因此研究出快速有效分选出机械损伤果的无损检测方法,实现翠冠梨品质在线检测显得十分必要。
高光谱成像技术能够同时获得空间和光谱信息,是一种快速、无损的安全评价方法[3]。洪添胜等[4]应用高光谱图像技术并结合PCA方法对雪花梨表面的碰压伤进行可视化研究。王斌等[5]利用高光谱图像技术对腐烂、病害及正常梨枣进行分类研究。Zhao等[6]应用高光谱图像技术比较了4种分类算法,其中马氏距离分类和光谱角映射效果最好。Hu等[7]利用连续投影算法结合支持向量机建立分类模型,用以区分落叶萼(DCF)和宿萼(PCF)。另外,由于高光谱图像包含了光谱信息,因此可以用于水果内部品质的检测,例如库尔勒梨可溶性固形物的检测[8],沙梨糖度的预测[9]以及蓝莓的硬度和可溶性固形物的预测[10]。可见高光谱成像技术在水果在线品质检测方面有很好的前景,不仅可以根据水果的外部品质对其进行分级,还可以对水果的内部品质进行预测[11]。
本研究的主要目的是基于高光谱成像技术采集翠冠梨的图像信息和光谱信息,对翠冠梨完好果和不同损伤天数的机械损伤果进行检测识别,为翠冠梨品质在线无损检测提供理论依据,为水果的高光谱在线检测系统的建立提供技术支持。
图1 高光谱图像采集系统示意Fig.1 Schematic diagram of hyperspectral imaging system
研究所用的翠冠梨均采购自江西省吉安市的果园,共30个外形(形状、大小)相近没有破损的翠冠梨作为试验样品。随机挑选其中20个样品用于建立品质无损检测模型,10个样品用于验证模型的检测精度。样品保存在2 ℃条件下,采集高光谱图像前放置于室温为25 ℃条件下2 h,如样品表面还存留水滴,则用试纸轻轻擦干。
翠冠梨的高光谱图像数据通过高光谱图像系统采集得到,高光谱图像系统如图1所示。该系统主要由1台CMOS照相机(Photonfocus,瑞士),1台行扫描光谱摄制仪(ImSpector V10E),2个250 W的光纤卤素灯(ALPHA-1501,21 V/250 W Halogen Tugsten Lamp)和一套光学移动平台等部件组成。光谱范围400~1 000 nm,光谱分辨率约为1 nm。
高光谱图像数据采集时,将翠冠梨样品放置于移动平台上,为了获得清晰且不失真的图像,保证采集到的样本图像完整,要考虑采集高度、相机曝光时间和平台运行速度这3个可变因素[12-13]。经过反复调试,样品图像采集时移动速度为7 mm/s,曝光时间50 ms,物距15 cm。整个实验过程中共采集高光谱图像300幅,包括Day0的30个翠冠梨高光谱图像,以及在1~7 d、11 d和14 d的共270幅(每天30幅)有机械损伤的翠冠梨高光谱图像。
首先采集翠冠梨完好样品的高光谱图像数据并记为Day0,然后将30个翠冠梨样品从40 cm高处以自由落体方式落下,使其赤道附近形成直径2~3 cm无汁液渗出且肉眼不宜发觉的碰压伤并标记位置。24 h后采集损伤区域的光谱图像数据,并记为Day1。之后每24 h采集翠冠梨相同损伤区域的光谱图像数据,并分别记为Day2~Day7。另外,采集第11天和第14天的相同损伤区域的光谱图像数据,并分别记为Day11和Day14。
由于翠冠梨果形状各异,各波段下光源强度分布不均匀以及相机中的暗电流存在,导致采集到的图像含有较大噪声。这些噪声会影响高光谱图像质量,为了消除噪声,需要对图像进行校正。校正时,采集反射率为99%的标准白色校正板得到白板图像B2,然后盖上相机镜头采集得到黑板图像B3,按照公式(1)计算出校正后的图像R[14]。
(1)
式(1)中:R为标定后的光谱图像;B1为原始光谱图像;B2为白板图像;B3为黑板图像。然后应用中心化方法对校正后的光谱数据进行光谱预处理。
通常高光谱数据包含空间和光谱信息,因此其数据量非常庞大,同时也会因为数据冗余的因素导致浪费大量计算时间,不利于水果在线的快速检测,因此需要应用特征波长下的光谱信息来简化运行模型,提高运算速度。本文主要采用竞争性自适应重加权算法[15]和连续投影算法提取特征波长[16]。
竞争性自适应重加权算法(competitive adaptive reweighted sampling,CARS),通过自适应重加权采样(ARS)技术选择出PLS模型中回归系数绝对值大的波长点,去掉权重小的波长点,利用交互验证选出RMSECV值最低的子集,可有效寻出最优变量组合。
连续投影算法(successive projections algorithm,SPA)是一种波长选取方法,能够有效消除原始光谱矩阵中冗余的信息,并使矢量空间的共线性达到最小,降低模型的复杂度,提高建模的速度和效率,在利用光谱分析技术检测作物和食品中某些重要成分含量的有效波长选取中得到了很好的效果。
提取特征波长后,应用偏最小二乘法(partial least square,PLS)再结合线性判别式分析(linear discriminant analysis,LDA)建立全谱和特征光谱模型预测翠冠梨表面机械损伤,并利用蒙特卡罗双层交互检验方法优选偏最小二乘法中的主成分数。
本研究高光谱图像的处理主要基于ENVI 4.3和Matlab R2014a软件实现,完成光谱预处理、建模分析。
根据高光谱原理可知,翠冠梨光谱图像上每个像素点都存在不同波长的光谱信息[17],利用ENVI软件提取翠冠梨样品完好果和碰压果对应表面损伤区域的平均光谱信息,采集的区域为ROI感兴趣区域(大小为50像素×50像素)。对Day0的30个被测样品,每个样品在赤道附近分别选取3~4个ROI作为无损伤光谱曲线,共采集无损伤光谱曲线100个。采集Day1~Day7、Day11和Day14随时间变化的有机械损伤光谱曲线各30个,因此采集有损光谱数据270个,如图2。剔除首尾包含较大噪声部分的光谱,选取500~900 nm范围内的光谱数据进行分析。采用中心化方法对光谱信息进行预处理,图3为经过中心化预处理后的翠冠梨光谱曲线,光谱范围为500~900 nm。从图3中可见除了Day0和Day1两个光谱曲线相接近外,其余光谱曲线的反射值有较为明显的差别。
图2 光谱信息采集示意Fig.2 Schematic diagram of spectral information acquisition
图3 翠冠梨完好和损伤样本中心化处理后的光谱曲线Fig.3 Spectral curves of intact and damaged samples of Cuiguan pear after central processing
分别从Day0数据和Day1数据中随机挑选20个光谱,作为校正集数据,建立LDA判别模型,记为Day1_Amodel。然后再从剩余的Day0数据(剩余80条)中随机选择10个光谱数据与Day1数据中余下的10个光谱数据,组成验证集数据,用以评价Day1_Amodel的预测精度。用同样的方法分别建立Day2_Amodel-Day7_Amodel、Day11_Amodel和Day14_Amodel,具体的预测结果见表1。表1中的Total_model为应用所有10 d数据的预测模型,其中校正集数据包含Day0数据的90个光谱(随机选择)和Day1-Day7、Day11和Day14数据的180个(每天随机选择20个),余下的光谱数据为预测集,建模过程如图4所示。其预测集中完好果(intact prediction)和有机械损伤果(damage prediction)的判别结果如表1所示。
由表1可知,预测集中完好果的判别准确率均为100%,但是对机械损伤果的预测的判别准确率随着损伤时间的增加而增加,其中Day1_Amodel的判别准确率仅为80%。主要原因是损伤形成时间较短,损伤果光谱信息与完好果光谱信息相似难以区分。随着损伤时间的增加,碰伤部位逐渐变软直至发生褐变,直接反映在光谱值的变化,因此其预测精度也逐渐增加。通过本试验发现,当损伤天数5 d时,预测精度均为100%。
Totle_Amodel预测精度为84%,从预测结果中发现,多为Day1损伤数据误判为完好果。因此在不包含Day1数据的条件下,建立Total1_Amodel模型,其预测集中判别准确率达到了92.22%,预测精度大幅提高,因此本研究不包含Day1数据。
图4 基于全谱建模流程Fig.4 Flow chart based on full spectrum modeling
模型类别Model type校正集Calibration set准确率/%Accuracy预测集Prediction set完好预测Intact prediction 检测Detected未检测Undetected损伤预测Damage prediction检测Detected未检测Undetected预测精度/%AccuracyDay1_Amodel4082.501006480.00Day2_Amodel4097.501009195.00Day3_Amodel4095.001009195.00Day4_Amodel4095.001009195.00Day5_Amodel40100.00100100100.00Day6_Amodel40100.00100100100.00Day7_Amodel4097.50100100100.00Day11_Amodel40100.00100100100.00Day14_Amodel40100.00100100100.00Total_Amodel27087.78100741684.00Total1_Amodel25094.8010073792.22
对Total1_model模型的校正组数据分别应用CARS(14个特征波长)和SPA(15个特征波长)算法筛选的特征波长分别为:500,518,551,575,577,594,595,605,606,608,801,848,875,900 nm和503,518,529,550,560,594,608,647,683,703,709,715,803,823,848 nm。其中500~675 nm之间的特征波长主要与表皮颜色相关;647 nm主要是与表皮中叶绿素和胡萝卜素的吸收有关;715 nm与水分吸收有关[18-19];801 nm、803 nm与糖分有关[20]。随着损伤天数的增加,损伤区域水分流失,叶绿素减少。综合两种算法筛选出的相同特征波长,并且保持一定的波长间距,最终确定10个特征波长,分别为:500,518,551,575,594,608,647,703,801,848 nm。
基于CARS算法提取的14个特征波长建立PLS-LDA检测模型,识别结果如表2所示。
表2 基于CARS算法特征波长翠冠梨预测结果
基于SPA算法提取的15个特征波长建立PLS-LDA检测模型,识别结果见表3。基于特征波长翠冠梨预测结果见表4。
表3 基于SPA算法特征波长翠冠梨预测结果
表4 基于特征波长翠冠梨预测结果
由表2~表4可知,基于特征波长建立的预测模型与全谱预测模型的预测精度相比,其预测结果相近。基于CARS算法所选特征波长建立的预测模型,在Day2_Cmodel -Day4_Cmodel的预测率保持在90%以上,Day5_Cmodel以后的预测率为100%,所有损伤天数Total1_Cmodel的预测率为96.67%。基于SPA算法所选特征波长建立的预测模型,Day2_Smodel -Day4_Smodel的预测率均在95%以上,Day5_Smodel -Day14_Smodel的预测率达到100%,Total1_Smodel模型的预测率为97.78%。综合两种算法所选特征波长建立的预测模型,Day4_model的预测率最低为95%,其它损伤天数时预测率均为100%,Total1_model 模型的预测率为96.67%,并且该模型不仅包含全谱的关键信息,而且其特征光谱的数量也减少为10个,更有利于在线检测模型的优化。
通过观察,翠冠梨表皮颜色深且厚实,在形成机械损伤的两周时间内,肉眼都难以判断出损伤区域。利用挑选出的特征波长建立检测模型,在翠冠梨早期机械损伤形成的第2天就能识别,并且在机械损伤形成的第5天后可以做到100%的正确判断。
本研究利用偏最小二乘法和线性判别式分析结合高光谱成像技术,对翠冠梨完好果和不同损伤天数的碰压果建立PLS-LDA检测模型,通过光谱信息对翠冠梨的碰压伤进行无损检测。分别采用竞争性自适应重加权算法和连续投影算法分别挑选出14和15个特征波长,然后在选定特征波长的基础上优选10个特征波长建立翠冠梨机械损伤的判别模型,对比全谱所建立的模型不仅减少了数据量、缩短了处理时间,还提高了模型质量,有利于准确、快速的进行翠冠梨品质的高光谱在线无损检测。在今后的工作中,如何提高Day1识别模型的精度和翠冠梨其它多种表面缺陷特征(锈斑、褐腐及划伤)的识别是水果在线无损检测的下一步研究重点。