耿红兰,刘亚平,王晓闻
(山西农业大学 食品科学与工程学院,山西 太谷 030801)
近红外光谱在砂糖橘果形指数分析中的应用
耿红兰,刘亚平,王晓闻
(山西农业大学 食品科学与工程学院,山西 太谷 030801)
基于小波变换的原理,分别利用阈值滤波、小波包、小波收缩3种常用的去噪方法,对砂糖橘样品的可见/近红外光谱信号进行去噪处理,探讨每种去噪方法的最优参数组合(小波函数、分解尺度、阈值)的同时选择最适去噪方法,并通过偏最小二乘法(PLS)对去噪后的重构光谱和砂糖橘果形指数建模。结果表明,小波包去噪有利于消除导数光谱中的噪声,提高建模精度,其最优参数组合为默认阈值条件下,小波函数Bior1.3、2尺度分解,去噪后的砂糖橘果形指数光谱建立的PLS模型的预测集R为0.9632,RMSEP为0.0779。
砂糖橘;可见/近红外光谱;去噪;果形指数
砂糖橘(CitrusreticulateBlanco,Shatangju)又名十月橘,其果径大小36.5~45.0 mm,果实色泽鲜艳,皮薄肉甜,汁液鲜美,是柑橘类的上品,深受广大消费者的喜爱。砂糖橘的果实大小不仅影响其贮藏性,而且影响果实风味,在消费市场上人们比较喜欢中果或小果[1]。传统的果品分级方法有人工分级和机械分级,不仅费时费力,而且容易造成机械伤;目前,利用机器视觉技术实现农产品内部品质无损检测是国际上研究的热点,可一次性完成水果果梗完整性、果形、水果尺寸、果面损伤、成熟度等的分级[2],国内研究人员已经将该技术应用于柑橘分类[3]、杏干品质检测[4]、山竹大小分级[5]等领域,并取得了较好的结果。
近红外光谱技术以快速、无损检测著称,利用该技术检测柑橘类果实总糖[6]、可溶性固形物[7]、维生素C[8~10]、总酸[11]、水分[12]等已得到广泛研究,但利用近红外光谱检测柑橘大小的研究甚少。由于柑橘类果实大小与果形指数呈显著正相关[13],故本文以砂糖橘为研究对象,探究可见/近红外光谱技术应用于砂糖橘果形指数的分析是否可行,旨在为砂糖橘的分级奠定基础。
由于可见/近红外光谱是通过计算机控制系统获得用于系统的模型辨识或实时控制,所以这些光谱数据不可避免地受到噪声污染,如何从这些受噪声污染的信号中过滤得到纯净信号是建立稳健、精确模型的关键。本文基于常用的小波去噪方法对砂糖橘一阶导数光谱数据进行去噪,通过偏最小二乘法(partial least square, PLS)[14,15]建立数学模型,寻找最适去噪方法,达到快速分析砂糖橘果形指数的目的。
1.1 材料
本试验所选砂糖橘购买于山西省太谷县农贸市场,选取个体均匀、无损伤的样本84个,在室温(15±2)℃下贮藏2 d后进行光谱测定。
1.2 光谱采集
光谱测定使用美国FieldSpec公司生产的ASD Document 600540 Rev. G近红外光谱仪进行,该仪器光谱测量范围为350~2500 nm,光谱采样间隔为1 nm。测定时在砂糖橘的赤道部位每隔120°取3点进行光谱测定,每个点扫描3次,取平均作为该点的光谱,然后将3个点的光谱平均作为整个砂糖橘的漫反射光谱。
1.3 纵径与横径的测量
用ETALON ROCH型数显游标卡尺测量采集完光谱的砂糖橘的纵径与横径,并计算其果形指数。
1.4 光谱预处理及数据统计分析
砂糖橘的可见/近红外光谱数据经一阶导处理后,分别采用阈值滤波、小波包、小波收缩3种方法去噪,通过对比PLS模型的性能来确定最优参数组合(小波函数、分解尺度、阈值),以上处理采用MATLAB 7.14统计软件自编程序进行分析。利用随机划分法将84个样品以接近3∶1的比例,划分为62个样品校正集与22个样品预测集,统计结果如表1所示,其中校正集样品果形指数值在0.7094 ~1.3586范围内,覆盖了预测集样品的果形指数值范围,保证了样品分布的合理性。
表1 样品校正集和预测集果形指数统计
1.5 近红外光谱PLS模型的建立与评价方法
采用PLS对砂糖橘果形指数建模和预测,模型性能以校正集和验证集的真实值与预测值相关系数R、校正集均方误差(Root Mean Square Error of Calibration, RMSEC)和预测集均方误差(Root Mean Square Error of Prediction, RMSEP)来判断。好的模型要求相关系数R高,RMSEC、RMSEP低,且相关系数间、均方根误差间差异小。试验中建立模型所采用的主成分数由校正集内部交互验证均方根误差(RMSECV)来确定,即当RMSECV达到最小时,该主成分数即为最佳。
2.1 波长选择
图1为84个砂糖橘样品可见/近红外漫反射光谱图。从图中可以看出,当光谱波长处于小于600 nm或者大于2250 nm时,探测器达到了边缘状态,产生了很大的噪声。一般利用该样品光谱进行建模时,不把此波长范围的光谱选入模型,但是为了对小波去噪效果进行比较,本研究对全光谱(350~2500 nm)进行去噪处理。
2.2 阈值滤波法去噪
阈值滤波法只对光谱低频部分进一步分解,不考虑高频部分。如表2所示,在分解尺度为3、程序软件自动生成的默认阈值的基础上,寻找最佳小波函数。DbN,SymN,BiorN小波基去噪后的光谱建立的模型共31个,表2是各小波基最优小波函数与原一阶导光谱建模结果,模型的性能并没有得到显著性的提高,校正集R有所降低,RMSEC有所增大,但处理后的光谱模型均方根误差差异变小,综合对比,确定Db9小波为采集光谱去噪的最优参数。
同一小波函数,去噪结果随分解层数的变化而变化,结果见表3。由表3可以看出,当Db9小波分解层数不同时,PLS建模效果各不相同,在分解层数为2时,去噪效果最好,其预测集R值为0.9596,RMSEP最小,为0.0794。综上所述,在默认阈值条件下,阈值滤波法去噪最优参数为Db9、2层分解。
2.3 小波包变换去噪
小波包变换是小波变换的推广,在同一尺度分解采用不同的小波函数去噪,建模后的效果如表4所示,光谱信号进行3尺度分解和默认阈值滤波。小波基函数不同时,PLS建模效果各不相同,从表4可以看出,Sym2,Bior1.3小波去噪后的光谱所建立的PLS模型的预测集R高于原一阶导预处理结果,其中以Bior1.3小波基函数略好,R为0.9608,RMSEP为0.0822。
图1 砂糖橘样品平均光谱图
表2 阈值滤波-分解尺度为3时不同的小波基函数PLS建模结果
表3 阈值滤波-Db9小波不同分解层数对PLS模型影响比较
表4 小波包-分解尺度为3时不同的小波基函数PLS建模结果
选择Bior1.3小波,并对Bior1.3小波进行2~6层分解去噪,结果见表5。当分解层数为2时,去噪效果最好,预测集R为0.9632,而且其RMSEP最小,为0.0795。因此,在默认阈值条件下,小波包去噪最优参数为Bior1.3、2层分解。
表5 小波包-Bior1.3小波不同分解层数对PLS模型影响比较
2.4 小波收缩去噪
利用Donoho和Johnstone的小波收缩去噪的关键是如何选择阈值与如何进行门限阈值处理。首先是小波函数的选取,在分解尺度为3时,采用Heursure阈值、软阈值策略处理的建模结果见表6。小波基DbN、SymN、BiorN预测能力基本相同,综合比较得出Db6去噪效果最好。
采用不同的分解尺度,一阶导数光谱的去噪建模结果见表7。由表7可见,当低分解尺度时,噪声没有完全被滤除,影响模型性能;然而随着分解尺度的增加,在噪声被滤除的同时,有用信息也被滤除,使重组信号失真,又降低了建模精度。通过比较各分解尺度下的去噪建模结果,发现分解尺度为6时,所建模型最优。
表6 小波收缩-分解尺度为3时不同的小波函数建模结果
表7 小波收缩-Db6小波不同分解层数对PLS模型影响比较
小波函数Db6、6尺度分解、软硬阈值策略用Sqtwolog、Heursure、Minimaxi、Rigrsure对砂糖橘一阶导光谱去噪的建模结果见表8。由表8可以看出,同一阈值条件下,软硬阈值去噪结果不同,无明显变化规律,其中以Heursure、软门限阈值去噪所建模型的精确度和稳定度最高。综上所述,小波收缩去噪最佳处理条件为Db6小波函数、6层分解、Heursure阈值估计方法、软阈值策略。经最佳预处理后的PLS模型预测效果,R从0.9556增加为0.9584,RMSEP从0.0823减少为0.0779,由此可知小波收缩不失为一种有效的去噪方法。
表8 小波收缩-4种阈值和2种门限阈值条件下的PLS建模结果
阈值滤波、小波包、小波收缩各有其优缺点,要想找到适合砂糖橘光谱去噪的方法,需要不断地试验与总结。将上述3种方法筛选出的最优参数组合用于去噪建模,结果见表9。3种去噪方法都能较好的去除噪音,但以小波包去噪效果最好。
表9 3种方法PLS建模结果
由以上分析可知,在光谱预处理部分引进小波变换去噪能得到很好的处理效果。小波包变换在处理信号时,高频部分和低频部分一样被分解,故去噪信号优于阈值滤波的处理结果。小波收缩去噪算法的关键是如何选择阈值和进行门限阈值处理,文中分别对四种阈值和两种门限阈值进行分析,得到最优参数组合为Db6小波函数、6层分解、Heursure阈值估计方法、软阈值策略。廖宜涛等[16]通过筛选比较得出新鲜猪肉pH值的光谱去噪最优参数为Db6小波、6层分解、Minimaxi阈值估计方法、软阈值策略去噪,与本文结果相似。马毅等[17]利用小波包对鲜冬枣近红外一阶导数光谱去噪处理,结果显示在默认阈值的情况下,采用Db4小波函数、3尺度,去噪效果最好;Lai等[18]利用离散小波变换对延胡索药材近红外光谱去噪,通过比较DbN、SymN、CoifN小波基得到Db6去噪效果最好;代芬等[19]利用Sym8小波的3层分解对砂糖橘可溶性总糖近红外光谱进行去噪预处理;Zhu等[20]利用离散小波变换对苹果的近红外光谱进行去噪,对影响模型预测的3个参数进行研究,结果表明当取默认软阈值,2层分解时,Bior3.3函数去噪效果最好。以上文献只讨论了一种去噪方法对光谱建模的影响,本文比较了3种不同的去噪方法,建立的模型更加精确。
(1)本研究结果表明,小波变换能有效消除砂糖橘近红外光谱噪声,用近红外光谱技术检测砂糖橘果形指数是可行的,为砂糖橘分级提供了一种新方法。
(2)比较了小波变换的3种去噪方法对建立砂糖橘果形指数PLS模型的影响,定量说明了小波包去噪光谱建立的模型较优,其最优参数组合为默认阈值条件下,小波函数Bior1.3、2尺度分解,校正模型的R为0.9213,预测模型的R为0.9632,RMSEC为0.0717,RMSEP为0.0779。
[1]王兆兵,李惠珍,林俊华,等.砂糖橘果实大小对其品质及贮藏性影响的研究[J].保鲜与加工,2012,12(1):6-11.
[2]沈从举,贾首星,郑炫,等.红枣分级机械的现状与发展[J].中国农机化学报,2013,34(1):26-30.
[3]曹乐平.基于周长面积分形维数的柑橘品种机器识别[J].农业工程学报,2010,26(2):351-355.
[4]黄星奕,钱媚,徐富斌.基于机器视觉和近红外光谱技术的杏干品质无损检测[J].农业工程学报,2012,28(7):260-265.
[5]张俊雄,荀一,李伟.山竹的计算机视觉分级方法[J].农业机械学报,2009,40(11):176-179.
[6]夏俊芳,李小昱,李培武,等.基于小波消噪柑橘内部品质近红外光谱的无损检测[J].华中农业大学学报,2007,26(1):120-123.
[7]代芬,黄冠勇,洪添胜.基于光谱技术的砂糖橘品质无损检测方法研究[C].重庆:中国农业工程学会,2011.
[8]刘燕德,陈兴苗,孙旭东.可见/近红外漫反射光谱无损检测南丰蜜桔维生素C的研究[J].光谱学与光谱分析,2008,28(10):2318-2320.
[9]XIA Junfang,LI Xiaoyu,LI Peiwu,et al.Application of wavelet transform in the prediction of navel orange vitaminC content by near-infrared spectroscopy[J].Agricultural Sciences in China,2007,6(9):1067-1073.
[10]Magwaza L S,Opara U L,Terry L A,et al.Evaluation of fourier transform-NIR spectroscopy for integrated external and internal quality assessment of Valencia oranges[J].Journal of Food Composition and Analysis,2013,31(5):144-154.
[11]洪涯,洪添胜,代芬,等.连续投影算法在砂糖橘总酸无损检测中的应用[J].农业工程学报,2010,26(S2):380-384.
[12]代芬,李岩,冯栋.小波去噪在基于近红外光谱的砂糖橘水分检测的应用[J].湖南科技学院学报,2011,32(8):36-39.
[13]黄雪燕,陈丹霞,王燕斌.温岭高橙果实大小与品质的相关性研究[J].浙江柑桔,2008,25(4):7-9.
[14]严衍禄,赵龙莲,韩东海.近红外光谱分析基础与应用[M].北京:中国轻工业出版社,2005:141-143.
[15]褚小立,许育鹏,陆婉珍.用于近红外光谱分析的化学计量学方法研究与应用进展[J].分析化学,2008,36(5):702-709.
[16]LIAO Yitao,FAN Yuxia,CHENG Fang,et al.On-line prediction of pH values in fresh pork using visible/near-infrared spectroscopy with wavelet de-noising and variable selection methods [J].Journal of Food Engineering,2012,109(4):668-675.
[17]马毅,汪西原,雍慧.小波变换去噪应用于鲜枣糖度近红外光谱检测的研究[J].计算机与应用化学,2011,28(3):303-306.
[18]Lai Yanhua,Ni Yongnian,Kokotc S.Discrimination of Rhizoma Corydalis from two sources by near-infrared spectroscopy supported by the wavelet transform and least-squares support vector machine methods [J].Vibrational Spectroscopy,2011,56(2):154-160.
[19]代芬,洪添胜,岳学军,等.砂糖橘可溶性总糖可见-近红外光谱无损检测[J].农业机械学报,2011,42(4):133-138.
[20]ZHU Dazhou,JI Baoping,MENG Chaoying,et al.Study of wavelet denoising in apple's charge-coupled device near-infrared spectroscopy[J].Journal of Agricultural and Food Chemistry,2007,55(14):5423-5428.
ApplicationofNearInfraredSpectroscopyinFruitShapeIndexAnalysisofCitrusShatangju
Geng Honglan, Liu Yaping, Wang Xiaowen
(CollegeofFoodScienceandEngineering,ShanxiAgriculturalUniversity,TaiguShanxi030801,China)
The visible/near infrared spectroscopy signals in citrus shatangju samples were de-noised by threshold filtering, wavelet packet, wavelet shrinkage, respectively, based on the principle of wavelet transform. The fruit shape index determination model was established by partial least squares (PLS) method. Results showed that wavelet packet can remove the noise effectively from the derivative spectrum, and improve the accuracy of the prediction model. The optimal parameter combination was the Bior 1.3 wavelet function, two levels of decomposition, with default threshold selection rule. The prediction correlation coefficient (R) of PLS model of the titled index was 0.9632, and the standard error of prediction (RMSEP) was 0.0779.
Citrus Shatangju; Visible/near infrared spectroscopy; De-noising; Fruit shape index
2014-06-12
2014-09-30
耿红兰(1986-),女(汉),河南驻马店人,在读硕士,研究方向:果品蔬菜贮藏和光谱检测技术。
刘亚平,副教授,博士。Tel:13834808348;E-mail:lyp0357@126.com
国家十二五科技支撑计划项目(2012BAD38B07)
TS255.3;S666.2
A
1671-8151(2014)06-0558-06
(编辑:马荣博)