丁佳兴,吴龙国,2,何建国,*,刘贵珊,强 锋
(1.宁夏大学农学院,宁夏银川 750021;2.宁夏大学土木与水利工程学院,宁夏银川 750021)
高光谱成像技术对灵武长枣果皮强度的无损检测
丁佳兴1,吴龙国1,2,何建国1,*,刘贵珊1,强 锋1
(1.宁夏大学农学院,宁夏银川 750021;2.宁夏大学土木与水利工程学院,宁夏银川 750021)
利用高光谱技术对灵武长枣果皮强度检测进行研究,为灵武长枣外部品质无损检测提供科学方法。采集120个灵武长枣的400~1000 nm的高光谱图像,对光谱数据进行预处理;应用连续投影算法(SPA)、正自适应加权算法(CARS)和无信息变量消除法(UVE)对原始光谱数据提取特征波长;分别建立基于全光谱和特征波长的偏最小二乘回归(PLSR)和最小二乘支持向量机(LS-SVM)果皮强度预测模型。结果表明:采用标准正态变换(SNV)预处理算法效果最优,其PLSR模型的交叉验证相关系数(Rcv)为0.8207,交叉验证均方根误差(RMSECV)为9.9630;利用SPA、CARS和UVE法从全光谱的125个波长中分别选取出29个、31个和31个特征波长;而基于全光谱建立的LS-SVM模型效果最优,其预测相关系数(Rp)为0.9555,预测均方根误差(RMSEP)为3.8282;研究结果表明基于高光谱成像技术采集的灵武长枣漫反射光谱进行果皮强度无损检测具有可行性。
可见-近红外,高光谱成像,果皮强度,无损检测,最小二乘支持向量机
灵武长枣,产于宁夏回族自治区灵武市,栽培历史悠久,品种优良,鲜食果味鲜美,质地酥脆,液汁多富有较好的口感;且富含多种维生素,矿物质和氨基酸等,营养价值很高,深受消费者喜爱[1-2]。然而红枣在采摘、分级、加工以及运输等过程中,不可避免地会受到不同程度的擦伤、压伤、碰伤和摔伤,导致长枣果皮受到不同程度的损伤,从而加速长枣的腐烂变质,严重影响长枣品质及其销售。灵武长枣属鲜食枣类,带皮即食,果皮质地是鲜枣口感的重要因素。果皮强度又是质地的重要参数,与长枣的抗压性、内部品质以及口感有很大关系[3]。因此实现对果皮强度的快速无损检测对于完善长枣品质评价、指导红枣采摘、采后储藏、监测加工及运输过程中的长枣品质等方面意义重大。
目前,鲜枣果皮强度主要利用质构仪通过整果穿刺法获得,但此方法具有破坏性。因此有必要研究鲜枣果皮强度的无损检测方法。高光谱成像技术是融合光谱技术与图像技术的无损检测技术。近年来,高光谱成像技术广泛应用于农产品内部及外部品质检测。较传统近红外光谱技术,高光谱具有其独特的优越性。近红外光谱技术检测每次只能得到某个点或者几个点的光谱信息,检测部位较为局限且选择点的位置和数量较为随机和片面[4-5]。而高光谱成像技术克服这些缺点,且可以同时获得被测样本的光谱信息和图像信息,满足现代无损检测技术实时、快速、全面,可视等的要求。国内外学者们利用高光谱技术已经对苹果、梨、猕猴桃、蓝莓、甜柿等水果外部品质的无损检测[6-11]。在利用高光谱成像技术检测枣质地品质研究中,徐爽[12]等利用高光谱图像(970~1630 nm)对灵武长枣果肉硬度进行了无损检测,预测模型相关系数达0.9042,表明高光谱成像技术对枣肉强度的无损检测具有可行性,而采用高光谱成像技术预测枣果皮强度的研究尚未见报道。
本文以灵武长枣作为研究对象,利用高光谱成像技术获取样品可见光区400~1000 nm的光谱数据。首先通过多元散射校正(multiplicative scatter correction,MSC)、卷积平滑(Savitzky-Golay Smoothing,SGS)、标准正态变量变换(standardized normal variate,SNV)、归一化(Normalize)、基线校准(Baseline)等方法对原始光谱进行预处理,用PLSR建模,根据建模效果优选预处理方法。然后运用CARS、UVE、SPA算法提取特征波长,分别建立基于全光谱和特征波长的PLSR和LS-SVM的长枣果皮硬度模型;分析比较不同特征波长选取和建模方法对长枣果皮强度的预测效果;选出最优模型,进而为高光谱成像技术对灵武长枣果皮强度快速无损检测与分级提供技术支撑。
1.1 材料与仪器
灵武长枣 宁夏灵武某果园;可见-近红外(400~1000 nm)高光谱成像系统(光谱分辨率2.5nm,共125个波段) 如图1所示;高光谱成像光谱仪(V10E-QE型) 芬兰Spectral Imaging Ltd公司;CCD相机(C8484-05G型) 日本Hamamatsu公司;光纤卤素灯(DCRⅢ型,150W) 美国Schott公司;电控位移平台(SC300-1A型) 北京Zolix公司;质构仪(TA.XTPlus) 英国Stable Micro System公司。
图1 可视近红外高光谱成像系统Fig.1 Vis/NIR hyperspectral imaging system注:1.CCD摄像机;2.成像光谱仪;3.输送装置;4.计算机;5.光源。
1.2 实验方法
1.2.1 样本前处理 灵武长枣采摘后常温运输到实验室,从中选取120个大小均匀、无损伤的长枣作为样本。测试前,将样本清洗、晾干。对其进行编号,测量其形态尺寸,记录数据。
1.2.2 光谱数据采集 高光谱图像数据获取基于Spectral cube软件(Spectral Imaging Ltd.,Finland)。采集图像前,系统条件设置为:CCD相机曝光时间为30 ms,电控位移平台速度为0.42 mm/s,保证图像清晰不失真[13]。数据采集时,线阵探测器在光学焦平面的垂直方向作横向扫描,获取扫描空间中每个像素在各个波长处的图像信息,同时随着电控位移台的前进,线阵探测器扫出整个平面,完成整个样本图像采集。
由于各波段下光源强度分布不均匀及摄像头中暗电流存在都会导致图像中含有较大的噪声。因此要对高光谱图像进行黑白校正[14],以消除噪声的影响。
式(1)
其中:R-校正后的漫反射光谱图像;R0-样本原始的漫反射光谱图像;D-暗图像;W-白板的漫反射图像。
样本高光谱图像采集后,利用ENVI 4.6软件(Research Systems有限公司,美国)校正光谱和选取感兴趣区域(Region of Interest,ROI)。考虑到长枣的形状和表皮颜色不同,分别从每张枣光谱图像中长枣赤道部位且呈相同暗红颜色的部位提取30 pixel×30 pixel的ROI,计算出每张ROI的平均反射光谱,并将其作为该长枣的反射光谱。
1.2.3 果皮强度测量 根据马庆华等[15]检测冬枣质地的研究,结合长枣自身特点使用质构仪通过穿刺方法测量120个长枣样本的果皮强度。整果穿刺实验使用P/2n针状探头,采用质构仪自带软件Txture Exponent 32输出样品的特征曲线。从每个长枣的赤道且呈相同暗红颜色的部位取3个不同的点测定果皮强度值,取其平均值。
1.2.4 光谱数据处理方法 本文采用连续投影算法(Successie Projection Algorithm,SPA)、竞争性正自适应加权算法(Competitive Adaptive Reweighted Sampling,CARS)和无信息变量消除法(Uninformative Variable Elimination,UVE)对最优预处理后的光谱提取特征波长,分析不同提取特征波长方法对长枣果皮强度预测模型的影响。
1.2.5 建模方法 本文首先建立基于原始光谱和不同预处理光谱预测长枣果皮强度的PLSR模型,优选出预处理方法,然后建立基于最佳预处理的全光谱和上述3种特征波长提取方法得到的特征光谱预测长枣果皮强度的PLSR和LS-SVM模型。
1.2.6 模型评判 为了消除光谱曲线上的噪音与无关信息的干扰,提高信噪度,因此利用The Unscrambler X10.2软件对原始光谱进行预处理操作。不同预处理方法对原始光谱会产生的影响不同。光谱预处理后,应用SPA、CARS和PCA算法提取出特征波长作为模型输入变量,运用PLSR和PCR建立灵武长枣果皮强度预测模型。通过校正相关系数(Rc)、预测相关系数(Rp)、交互验证相关系数(Rcv)、校正均方根误差(root-mean-square error of calibration set,RMSEC)、交叉验证均方根误差(root-mean-square error of cross validation set,RMSECV)以及预测均方根误差(root-mean-square error of prediction set,RMSEP)对模型的性能进行评价。Rc、Rcv、Rp值越大相关性越好;RMSEC、RMSECV、RMSEP值越小说明模型预测能力越好。此外,利用Rc+Rp说明模型总体的果皮强度检测精度[16]。
1.3 软件
高光谱采集软件为Spectral cube(Spectral Imaging Ltd.,Finland),高光谱图像数据分析软件为ENV4.6(Research SystemInc.,USA),原始光谱预处理以及PLSR建模使用软件The Unscrambler X10.2,特征波长提取及LS-SVM建模使用Matlab(MatlabR2014a,Mathwork,Inc.,USA),质构图像分析软件采用Texture Exponent 32。
2.1 原始光谱及光谱预处理比较
在光谱采集中,由于仪器噪音、暗电流等因素的影响,导致光谱曲线产生不重复和基线漂移等现象[17-18],原始光谱如图2a,因此在建立预测模型之前需要对原始光谱进行预处理。本文选用以下几种常见的光谱预处理方法,包括S-G卷积平滑(Savitzky-Golay)、面积归一化法(Area-Normalization)、最大归一化法(Maximum-Normalization)、单位归一化法(Unit-Normalization)、距离归一化法(Range-Normalization)、平均归一化法(Mean-Normalization)、多元散射校正(MSC)、标准正态变量变换(SNV)、基线校准(Baseline)等。采用PLSR分别对原始光谱(Original Spectrum)、经不同预处理后的光谱建立长枣果皮强度校正模型,对其建模效果进行对比分析,建模结果统计如表1所示。
表1 基于不同预处理方法的长枣果皮强度PLSR校正模型
由表1可以看出,经上述预处理方法建立的PLSR校正模型中,原始光谱的PLSR校正模型的Rcv为0.7721,仅有Baseline、SNV、MSC法处理的PLSR校正模型的Rcv值均大于0.8,其中经过SNV处理的PLSR校正模型Rcv值(0.8207)最大,同时经过SNV处理的PLSR校正模型的RMSECV为9.9630,而原始光谱及其他预处理后建立的PLSR校正模型的RMSECV均大于10。综合以上,经过SNV预处理后的PLSR校正模型具有最大的Rcv和最小的RMSECV,说明经SNV预处理方法建立的PLSR校正模型的性能最好。图2b为经SNV预处理后的反射光谱,下面将使用该光谱数据进行分析。
图2 原始光谱和经过SNV处理后的反射光谱Fig.2 Original reflectance spectra and reflectance spectra after SNV
2.2 果皮强度统计及样本划分结果
利用质构仪测得长枣果皮强度后,将120个样本按照3∶1划分成校正集和预测集,得到校正集样本90个,预测集样本30个。长枣样本果皮强度的统计见表2。由表2可以看出,校正集样本中果皮强度的最小值小于预测集的最小值,而校正集样本中果皮强度最大值大于预测集的最大值,即校正集具有较大的果皮强度范围,进而说明样本划分合理。
表2 长枣果皮强度的统计数据
2.3 光谱数据降维
2.3.1 应用SPA选取特征波长 本文利用SPA算法对长枣果皮强度校正模型进行光谱特征波长的选择,经过变换波长范围,多次尝试后将RMSECV最小时的有效波长数定为最优。设定选取波长变量范围为5~38,步长为1,不同波数下的RMSECV变化情况如图3所示。由图3可以看出,当特征波长数为29时,RMSECV值最小,因此确定最优波长数为29。这29个特征波长分别为401、406、416、421、430、435、445、449、454、459、483、565、593、627、646、661、680、689、718、838、857、862、867、872、891、934、954、982、997 nm。利用SPA算法优选出的特征波长占总波长的23.2%。
图3 SPA中不同有效波长数下的RMSECVFig.3 Variation of RMSECV with number of effective wavelengths in SPA
2.3.2 应用CARS选取特征波长 本文利用CARS算法对长枣果皮强度校正模型进行光谱特征波长的选择时,设定蒙特卡洛抽样次数从5到50次,均采用5折交叉验证法计算,因为每次运行CARS结果不同,具有一定的随机性,所以在每个设定的蒙特卡洛抽样次数下,运行20次取所建立的PLS模型中最小的RMSECV,每个蒙特卡洛抽样次数下最小的RMSECV的情况如图4所示。由图4可以看出当抽样次数为28次时,RMSECV值最小(7.1756)。最后从125个波长中,共优选出31个特征波长,分别是406、416、435、440、445、449、454、473、478、497、531、560、569、589、613、632、651、689、718、747、766、790、809、833、896、901、906、925、939、949、997 nm。优选出的特征波长占全部波长的24.8%。这31个波长作为长枣果皮强度的特征波长变量组合,分布在光谱中。
图4 RMSECV随CARS中抽样次数变化Fig.4 Variation of RMSECV with number of sampling times in CARS
2.3.3 应用UVE选取特征波长 应用UVE提取特征波长时,首先根据PLS交互验证模型中RMSECV最小确定PLS的最佳主成分数,本研究中当主成分数为10时,RMSECV最小,因此将主成分确定为10。运行UVE计算125个输入变量的稳定性结果如图5所示。
图5 PLS主成分数为10时UVE的稳定性分布曲线Fig.5 Stability distribution of variables selected by UVE at ten principal components in PLS
图5中竖线左侧为125个波长变量,右边为125个随机变量。两条水平虚线为变量选择阈值(20.74),阈值的选择标准为随机变量稳定性最大绝对值的99%。两条虚线之内的信息被看作无用信息,两条虚线外的被看作是有用信息,其对应的波长作为特征波长被选择出来。应用UVE选取31个特征波长,这31个波长分别为401、416、430、435、445、454、459、473、478、483、541、545、550、555、560、565、569、598、603、608、718、723、733、800、809、819、925、958、963、968、997nm。利用UVE提取出的特征波长占总波长的24.8%。
2.4 建模算法的比较与分析
根据原始光谱和预处理基于PLSR的预测模型建模对比发现SNV法为最优预处理方法,分别建立全波段光谱(Full Spectrum,FS)和3种方法提取的特征波长基于PLSR和LS-SVM的长枣果皮强度预测模型,对其建模效果进行比较分析,结果如表3。
表3 不同建模方法下灵武长枣果皮强度真实值与预测值的比较
2.4.1 PLSR建模结果分析 在利用The Unscrambler X10.2所建立PLSR预测模型中,主要根据RMSECV值的大小以及Rc和Rp综合确定最佳主成分数,得到上述PLSR建模结果。其中利用全波长、CARS、SPA和UVE法提取的特征波长建立的预测模型的最佳主成分数分别是10、13、12、9。由表3可以看出,在PLSR预测模型中,虽然CARS-PLSR模型具有最大的Rc(0.9393)和最小的RMSEC(5.9173),但同时也有最小的Rp和最大的RMSEP,说明该模型具有较好的校正性能,但预测性能较差,故模型不稳定;SPA-PLSR的Rc(0.9127)和Rp(0.8900)均大于FS-PLSR,但其RMSEP略大于FS-PLSR,说明SPA-PLSR比FS-PLSR模型的校正能力强,而预测模型略逊于FS-PLSR,综合比较SPA-PLSR模型稳定性较好。而UVE-PLSR模型的Rc(0.8950)小于SAP-PLSR,且RMSEC(7.6905)略大于SAP-PLSR,但UVE-PLSR模型具有最低的RMSEP(8.1479),该模型表现出较强的预测性能,并且UVE-PLSR模型最佳主成分数(9)最少,说明该模型稳定性较好,而UVE-PLSR模型的Rc+Rp(1.7713)较FS-PLSR的Rc+Rp(1.7755)略小,说明利用UVE选取的特征波长代表全波段进行PLSR建模是可行的。故认定UVE-PLSR模型是所建立的PLSR模型中的最优模型。
2.4.2 LS-SVM建模结果分析 由表3可以看出,FS-LS-SVM和SPA-LSSVM具有较高的Rc和Rp,同时具有较低的RMSEC和RMSEP,说明两者的校正性能和预测性能均强于CARS-LSSVM和UVE-LS-SVM。但FS-LS-SVM模型的Rc(0.9571)和Rp(0.9555)大于SPA-LS-SVM模型的Rc(0.9430)和Rp(0.9376),且前者的RMSEC(5.1205)和RMSEP(3.8282)小于后者的RMSEC(5.8055)和RMSEP(4.5408),说明SPA-LSSVM模型较FS-LS-SVM模型效果略差,说明利用SPA提取特征波长时,剔除了部分有效信息,但优于其他两种方法。故基于全波段建立的LS-SVM模型最为稳定。
2.4.3 不同模型比较 对比相同波长下的PLSR和LS-SVM模型,基于全波段、CARS、SPA和UVE建立的LS-SVM模型的Rc+Rp均大于对应的PLSR模型,因此,就本研究果皮强度指标而言,LS-SVM模型的稳定性优于PLSR模型。
对比UVE-PLSR和FS-LS-SVM模型的建模效果,因为FS-LS-SVM模型具有最大的Rc和Rp以及最小的RMSEC和RMSEP,故本研究确定FS-LS-SVM为预测长枣果皮强度的最优模型,其建模结果如图6所示。
图6 FS-LS-SVM建模结果Fig.6 FS-LS-SVM modeling results
对获取的灵武长枣400~1000 nm的光谱进行不同方法的预处理,结果对比分析之后可知,经过SNV处理后的光谱PLSR建模效果较好。对SNV处理后的光谱数据用SPA、CARS和UVE进行降维处理,SPA、CARS、UVE算法提取的关键波长仅占原数据的一小部分,SPA、CARS、UVE算法提取的关键波长分别占原数据的23.2%、24.8%、24.8%;采用PLSR、LS-SVM方法对SPA、CARS、UVE算法提取的关键波长分别建模,结果表明,利用UVE提取的特征波长代替全波段建立PLSR模型是可行的;在LS-SVM模型中,利用SPA提取特征波长好于其他提取方法,但略于基于全波段建立的LS-SVM模型。比较不同建模方法,确定FS-LS-SVM方法建立的果皮强度模型为最优模型,其Rc为0.9571,RMSEC为5.1205;Rp为0.9555,RMSEP为3.8282。
[1]李丹. 基于高光谱成像技术的灵武长枣无损检测技术研究[D].银川:宁夏大学,2015.
[2]苟茜,王敏,冀晓龙,等.不同成熟度灵武长枣食用及营养品质研究[J]. 现代食品科技,2014,30(11):98-104.
[3]陈文涛,袁德义,张日清,等.鲜食枣品质的综合评价[J]. 湖南农业大学学报(自然科学版),2014,40(1):32-36.
[4]吴龙国,何建国,贺晓光,等.高光谱图像技术在水果无损检测中的研究进展[J]. 激光与红外,2013,9:990-996.
[5]Johnson Ⅲ Owen N,Slidell Mark,Kreishman Peter,et al. Hyperspectral imaging:an emerging technology as a potential novel adjunct in assessing peripheral perfusion deficits and success oflower extremity revascularizations[J]. Journal of the American College of Surgeons(S1072-7515),2008,207(3):S114.
[6]单佳佳,彭彦昆,王伟,等.基于高光谱成像技术的苹果内外品质同时检测[J]. 农业机械学报,2011,42(3):140-144.
[7]侯宝路,李柏承,周瑶,等. 基于可见-近红外高光谱成像技术的梨硬度和可溶性固体含量的预测[J]. 激光杂志,2015,10:70-74.
[8]刘卉,郭文川,岳绒.猕猴桃硬度近红外漫反射光谱无损检测[J]. 农业机械学报,2011,42(3):145-149.
[9]薛璐,刘小路,鲁晓翔,等.近红外漫反射无损检测蓝莓硬度的研究[J]. 浙江农业报,2015,27(9):1646-1651.
[10]王丹,鲁晓翔,张鹏,等.近红外无损检测甜柿果实质地和品质[J]. 食品工业科技,2013,34(24):53-56.
[11]郭文川,董金磊. 高光谱成像结合人工神经网络无损检测桃的硬度[J]. 光学精密工程,2015,6:1530-1537.
[12]徐爽,何建国,贺晓光,等.基于高光谱技术长枣内外品质同时检测[J]. 光电子·激光,2013,24(10):1972-1976.
[13]徐爽,何建国,易东,等.基于高光谱图像技术的长枣糖度无损检测[J]. 食品与机械,2012,28(6),168-170.
[14]ElMasry G,Wang N,ElSayed A. Hyperspectral imaging for nondestructive determination of some quality attributes for strawberry[J]. Journal of Food Engineering,2007,81:98-107.
[15]马庆华,王贵禧,梁丽松.质构仪穿刺实验检测冬枣质地品质方法的建立[J]. 中国农业科学,2011,6:1210-1217.
[16]董金磊,郭文川.采后猕猴桃可溶性固形物含量的高光谱无损检测[J]. 食品科学,2015,36(16),101-106.
[17]刘燕德,周延睿,彭彦颖.基于近红外漫反射光谱检测鸡蛋品质[J]. 光学精密工程,2013,1:40-45.
[18]蒋蘋,罗亚辉,胡文武,等.基于高光谱的油茶籽内部品质检测最优预测模型研究[J]. 农机化研究,2015,7:56-60.
Non-destructive determination of pericarp break force of lingwu long jujube by hyperspectral imaging technology
DING Jia-xing1,WU Long-guo1,2,HE Jian-guo1,*,LIU Gui-shan1,QIANG Feng1
(1.School of Agriculture,Ningxia University,Yinchuan 750021,China; 2.Institute of Civil and Hydraulic Engineering,Ningxia University,Yinchuan 750021,China)
Using hyperspectral imaging technology to measure pericarp break force of Lingwu Jujube could provide a scientific method for the non-destructive measurement of external quality of Lingwu Jujube. The Hyperspectral image of 120 Lingwu Long Jujubes were acquired from 400 nm to 1000nm,and pretreatment methods were used to process diffuse reflectance spectroscopy. The successive projections algorithm(SPA),competitive adaptive reweighed sampling(CARS)and principal uninformative variable elimination(UVE)were used to select characteristic wavelengths. A partial least squares regression(PLSR)and a least squares support vector machine(LS-SVM)model were established based on full spectra and selected characteristic wavelengths for predicting pericarp break force of Lingwu long Jujube. The result showed that standardized normal variate(SNV)pretreatment method was best,and the correlation coefficient of cross calibration(Rcv)of the PLSR model built was 0.8207,root mean square error of cross validation(RMSEP)reached 9.9630. The SPA,CARS and UVE method were used to select characteristic wavelengths with 29,31 and 31 from 125 wavelengths,respectively. LS-SVM model based on full spectra was the best,and correlation coefficient of prediction(Rp)and root-mean-square error of prediction(RMSEP)of the model was 0.9555 and 3.8282,respectively. The results indicated that the non-destructive measurement for pericarp break force of Lingwu Jujube based on hyperspectral imaging technology was feasible.
visible-near infrared;hyperspectral imaging technology;pericarp break force;nondestructive measurement;least squares support vector machine
2016-07-07
丁佳兴(1993-),男,在读硕士,研究方向:高光谱无损检测,E-mail:nxudjx@163.com。
*通讯作者:何建国(1960-),男,硕士,教授,研究方向:农产品无损检测,E-mail:hejg@nfcu.edu.cn。
国家自然科学基金(31560481)。
TS
A
1002-0306(2016)24-0000-00
10.13386/j.issn1002-0306.2016.24.000