刘燕德
吴明明
孙旭东
朱丹宁
(华东交通大学光机电技术及应用研究所,江西 南昌 330013)
柑橘浮皮果与可溶性固形物光谱同时在线检测
刘燕德
吴明明
孙旭东
朱丹宁
(华东交通大学光机电技术及应用研究所,江西 南昌 330013)
柑橘浮皮果和可溶性固形物是评价柑橘品质的重要指标,在运动速度5个/s、积分时间100 ms条件下,采集350~1 150 nm范围内的柑橘光谱,探讨在同一条生产线上同时在线检测浮皮果与可溶性固形物的可行性,同时探索柑橘正常果,轻度、重度浮皮果的光谱响应特征,建立柑橘浮皮果与正常果的定性判别模型,并对比分析两种判别模型,同时还建立柑橘可溶性固形物的定量检测模型,最终实现了柑橘浮皮果与可溶性固形物同时在线检测。采用未参与建模的35个样品对模型在线分选的准确性进行评价,其中柑橘浮皮果都被正确的推入预设的浮皮果出口,正确判别率为100%,而可溶性固形物正确分级率为97%。研究可为柑橘在线分选提供分选策略与理论依据。
浮皮果;漫透射;可溶性固形物;同时检测
柑橘因其口味清甜可口、无渣、营养丰富且口感细腻,深受消费者喜爱。但柑橘存在浮皮果这种生理病害,严重影响柑橘的出口。浮皮果是指果实在成熟过程中,果皮与果肉之间产生空隙分离,造成果皮鼓起的现象,易发生在薄皮柑橘类水果中。传统的柑橘浮皮果分选往往只能依靠人工进行分选,不仅耗时费力,且不能按照糖度的等级进行分选。因此急需研究一种能够将浮皮果与可溶性固形物同时在线检测的方法,对于增加果农收益、提高果品品质具有重大意义。
目前有较多柑橘类水果近红外检测的相关研究报道,但大多数都是针对柑橘类水果的糖酸度及尺寸等指标进行定量检测[1-3],且多为静态检测[4-6],动态实时在线检测的报道较少。也有对柑橘类水果成熟度及病害进行检测[7-10],但研究的指标较为单一,且目前没有在一条生产线上实现检测浮皮果与可溶性固形物快速分选的研究报道。本试验拟以柑橘为研究对象,采集浮皮果与正常果的光谱信息,建立浮皮果与正常果的判别模型,提出浮皮果与可溶性固形物同时在线检测的分选策略,并探讨浮皮果对可溶性固形物检测模型精度的影响,最终实现柑橘浮皮果及可溶性固形物同时在线检测,研究可为柑橘类水果在线分选提供分选策略及理论依据。
1.1 试验材料
试验样品选用成熟期的宽皮柑橘,采摘自湖北省宜昌市,样品运抵试验室后,置于实验室室温20 ℃,相对湿度40%~60%的条件下。试验前剔除果形畸形,表面碰伤刮擦、局部溃疡病等异常样品。所有样品均用湿抹布清理干净,自然晾干后,每个柑橘沿赤道部位间隔120°进行标号。标号后在实验室室温20 ℃,相对湿度40%~60%的条件下存放24 h,隔天采集光谱。试验所用样品的可溶性固形物含量统计结果见表1。为消除尺寸大小对浮皮果检测的影响,采用游标卡尺量取果横径65~72 mm的柑橘作为试验对象,共157个,其中正常果117个,浮皮果40个。采用K-S(Kennard-Stone)方法对样品进行划分,选用122个果作为校正集,其中正常柑橘92个,浮皮果柑橘30个,剩余35个柑橘作为预测集用于评价模型的稳定性和准确性。
1.2 在线检测装置与光谱采集
试验所采用的动态在线光谱采集装置见图1,包括三大系统,分别是近红外光谱检测系统、分选控制系统以及机械输送系统。该装置采用漫透射检测方式,光源四周照射,检测器与探头布置在样品两侧。光通过样品,最后被探头接收,并在样品底部形成一个5~10 mm的光斑,所以采集的光谱中包含了几乎整个样品的光谱信息,能够更好的反映样品内部的物理化学特征。试验采用Ocean Optics公司的QE65Pro型光谱仪,光源采用10个12 V、100 W的欧司朗卤钨灯,试验条件为:积分时间100 ms,运动速度5个/s,波长范围350~1 150 nm。
表1 柑橘可溶性固形物统计结果†Table 1 The statistical results of soluble solids content of citrus
† *表示为浮皮果样品。
1. 霍尔传感器 2. 编码盘 3. 链轮 4. 传送链 5. 探头 6. 光照箱 7. 光源系统 8. 水果 9. 计算机 10. PLC 11. 果盘 12. 旋转电磁铁 13. 分选口 14. 电动机 15. 减速器 16. 驱动链轮
图1 近红外漫透射在线检测装置
Figure 1 The device of NIR diffuse transmittance detection
在光谱采集前需要预热,每次开机预热30 min后,用白色特氟龙球作参比,校正可见近红外漫透射光谱在线检测装置,在光谱查看界面观察能量谱强度标准差变化,当变化范围在±1%时,电压稳定,可以开始光谱采集。每个柑橘沿赤道标号部位采集3条光谱,共157个样品。将样品依次进行编号,每个样品沿着赤道部位等间弧度的标记3个点,间隔约120°;试验时采用人工上果,将柑橘赤道部位放置到果杯凹槽内,保证柑橘果顶与果柄连线方向与传送带运动方向一致。传送链带动果杯移动,经过探头位置,通过硬件触发使光谱仪触发,采用自主开发的光谱采集软件采集并保存一条光谱。硬件触发过程:在线检测设备见图2,链轮与编码盘都安装在主轴上,链轮每4个齿对应编码盘1个齿,且链轮4个齿位置安装1个果杯。霍尔传感器位于编码盘下方2 mm处,编码盘每转1齿,使得链轮传动1个果杯的行程,并触发传感器发出一个高电位信号,触发光谱仪采集一条光谱,并在相应的软件中保存光谱。
1. 链轮 2. 编码盘 3. 光电开关 4. 果杯 5. 传动链条图2 检测设备触发原理Figure 2 The trigger theory of detection devices
1.3 样品化学值测定
可溶性固形物含量采用折射式数字糖度计(Atago, Co., Tokyo, Japan)进行测定,试验中所测定的可溶性固形物含量均为糖度计标定后测得,每个样品测量3次,取多次测量结果一致的为可溶性固形物含量真值。
浮皮果判别采用剖面观察法,将柑橘皮剥开,观擦柑橘囊衣与果皮评价浮皮果与否及浮皮果程度。健康柑橘囊衣与果皮,果皮与囊瓣儿膜之间无空隙症状;轻微浮皮果一般在果柄处发生囊衣与果皮,果皮与囊瓣儿膜分离,但未扩散到整个果肉;重度浮皮果囊衣与果皮,果皮与囊瓣儿膜完全分离,浮皮果和健康果的对照见图3。
1.4 数据处理
试验过程中光谱采集采用美国海洋公司的SpectraSuite软件,待光谱与可溶性固形物真值被采集后,将数据导入Unscrambler软件中进行数据处理与分析。偏最小二乘法常用浓度与光谱矩阵之间的关系,将矩阵分解及回归并为一步[11-13]。判别偏最小二乘法则是将定量的偏最小二乘法用于判别分析的一种策略。偏最小二乘法及判别偏最小二乘法预测原理见式(1):
图3 浮皮果与健康果Figure 3 Puffy fruit and healthy fruit
(1)
式中:
Y——模型预测值;
i——第i个波长点;
βi——第i个波长点对应的回归系数值;
λi——第i个波长点对应的光谱能量值;
n——波长点的个数;
B——模型的截距。
将所建立最优模型的参数导入分选软件中,实现浮皮果与可溶性固形物同时在线检测,其中浮皮果的判别模型采用正确判别率对模型进行评价,可溶性固形物定量检测模型采用相关系数及预测集均方根误差评价模型优劣。
2.1 浮皮果与健康果光谱对比
柑橘全波段能量谱范围为350~1 150 nm,考虑到杂散光和电噪声等的影响,光谱分析使用信噪比较高的波段,选择波段范围580~900 nm,共320个光谱变量进行浮皮果研究。图4给出了柑橘健康果、轻度浮皮果、重度浮皮果的光谱,通过吸收峰和光谱能量进行判别。
新鲜上市的柑橘,浮皮果和健康果差异不是很明显,但由于其在果皮与囊瓣儿间存在空隙,因此浮皮果和健康果在能量谱上存在较为明显的差异。健康果和浮皮果在光谱波长720 nm和780 nm附近均有两个明显的吸收峰,浮皮果的
图4 柑橘三类样品能量谱图Figure 4 The spectrum of citrus
光谱能量值在两个吸收峰处均强于健康果,且在580~900 nm时光谱能量值始终高于健康果。浮皮果由于果肉的囊瓣儿膜和果皮间失水剥离,二者之间的间隙充满空气,而空气吸收和漫反射可见/近红外光的能力相对较弱,光纤探头接收到的透射光比健康果多;健康果的果肉囊衣与果皮紧密结合,而近红外光谱吸收主要是由于含氢基团振动的倍频和合频带吸收位置吸收产生的,果肉细胞对可见/近红外光的吸收能力相对较强,探头接收到的正常柑橘的有效信息较少,所以呈现出图4中正常柑橘采集的能量谱比浮皮果柑橘低。
2.2 主成分分析
主成分分析采用线性正交的基来表示样品数据空间的特征,采用几个少量新变量的组合,同时保证新变量能尽可能少的丢失全谱变量的信息[14-15],提取尽量多的数据特征。来达到数据降维且不损失有效特征的目的。经过主成分分析处理后得到的新变量不具有相关性且相互正交,这样就消除了全谱变量混合在一起的信息共存部分,即消除原来变量之间可能存在的多重共线性。采用主成分分析前,首先对580~900 nm波长范围内进行预处理,采用标准归一化和多元散射校正来消除光谱中的噪声信息干扰,提高光谱的信噪比。前3个主成分得分散点图见图5,其贡献率分别97%,1%,1%。由图5可知,存在一定的聚类现象,但也存在较多重叠的部分,健康果与浮皮果依靠前3个主成分因子的散点图难以区分开来。因此需要一种高维度的能够将健康果与浮皮果区分的方法。
图5 主成分得分散点图Figure 5 Scores plots of principal component
2.3 最小二乘支持向量机
最小二乘支持向量机是一种遵循结构风险最小化原则的核函数机器学习方法,在高维度空间将优化问题转化为等式约束条件问题[16-18]。分别选择580~900 nm波长范围和20个主成分得分作为模型的输入变量,并讨论线性核函数(Lin_kernel)与径向基核函数(RBF_kernel)两种不同的核函数对模型误判率的影响,其中建模集122个,包含浮皮果30个,健康果92个,用于训练机器学习模型。预测集35个用于预测模型,包含浮皮果10个,正常果25个。其结果见表2。
表2 不同核函数对LS-SVM模型预测结果的影响†Table 2 Effect of different core function on prediction in LS-SVM model
†xi表示样本点,xj表示核函数中心,γ表示分布参数,σ2表示内核参数。
在表2中,非线性模型的RBF核函数所涉及的两个主要参数为γ和σ2,而Lin核函数所涉及的主要参数为γ,作为样品误判程度的评判参数,用来对预测样品类别的准确程度进行评判。在选用特征波段为输入的模型中,其中采用径向基核函数模型预测效果较好,在γ=0.050 197、σ2=0.625 64条件下,误判率为2.9%,将浮皮果误判为正常果,而采用线性核函数有3个被误判,其中γ=0.017 525,误判率较高为8.6%;当采用PCA压缩后的变量作为输入变量时,模型预测集判别率得到了逐步提升,当输入变量为前14个主成分时,模型预测均方根误差最低且误判率最低,效果最好。当采用线性核函数建模时,预测集得到的误判率降低到2.9%,采用 RBF核函数判别正确率100%,再增加主成分,模型判别效果变差。同时,在用到的输入变量为PC=14时,模型预测集均方根误差最低且误判率最低,RBF函数消耗的时间较长为1.890 6 s,而Lin核函数消耗的时间较短仅1.783 s,并且前者的参数γ=0.036 053,后者的参数γ=0.014 073。综合比较以上建模结果,其中采用14个主成分得分作为最小二乘支持向量机模型输入变量并结合径向基核函数效果最优,其输入变量少且误判率低。
2.4 偏最小二乘判别
偏最小二乘判别(PLS-DA)判别法是一种基于PLS回归模型的定性判别方法。通过多次建模可得,试验中分类向量设为[1,8],1为浮皮果,8为健康果。在试验中主要采用留一法进行交互验证,确定最优PLS-DA模型的最佳主成分因子数。图6(a)是预测集均方根误差(RMSEP)与主成份因子数的关系图,由图6(a)可知,RMSEP从第12个主成分开始,随着主成分数继续增加,RMSEP反而变大,故PLS-DA的最佳主成分因子数定为12。在PLS-DA建模模型中,不同波长处的光谱变量对应的权重由PLS-DA模型回归系数大小来表示。通过PLS-DA模型回归计算,赋予全谱范围内柑橘的光谱变量的权重见图6(b),根据偏最小二乘加权求和公式,加上截距b=3.35,实现了健康柑橘与浮皮果的定性判别。
取分类向量值之间的5作为阈值,样本阈值以下为浮皮果,样本阈值以上为健康果,此时,定性判别模型的误判率为0%。综合以上分析,采用PLS-DA建模模型建模及预测效果见图7,从中可以得到柑橘的相关系数RP为0.92,均方根误差(RMSEP)为1.16,在阈值附近,没有出现越过阈值线的现象,不存在误判。对比所建立的两种柑橘浮皮果判别模型,两种模型都得到很好的结果,其浮皮果正确判别率都为100%,但由于最小二乘支持向量及模型较为复杂,且不适用于动态分选模型,而偏最小二乘判别模型,不仅模型简单易操作、适用于动态分选模型,而且具有较高的浮皮果正确判别率。
图6 柑橘PLS-DA模型参数Figure 6 The parameter with PLS-DA model of citrus
2.5 偏最小二乘可溶性固形物模型
柑橘分别分为3组(表3),其中组1为浮皮果和健康果组合,组2为浮皮果,组3为健康果。探究柑橘浮皮果对可溶性固形物偏最小二乘回归模型预测能力的影响,直接采用波长范围为580~900 nm光谱能量建立偏最小二乘模型,在光谱试验中,一个最佳的主成分因子数往往对提高偏最小二乘回归模型预测能力尤为重要,选用主成分因子数需要综合考察模型的相关系数及均方根误差,一个好的模型不仅需要好的相关系数,而且还需要低的均方根误差。柑橘不同组合预测集和校正集均方根误差随主成分因子数变化曲线见图8。
图7 柑橘PLS-DA模型Figure 7 The PLS-DA model of citrus表3 不同样品组的偏最小二乘建模和模型预测结果Table 3 The model statistical results of different classes
组别因子数RCRMSEC/°BrixRPRMSEP/°Brix组1130.930.370.810.62组2120.881.930.862.06组3130.940.310.880.77
由表3可知,柑橘组1、2和3的最佳主成分因子数分别为13,12,13;柑橘健康果和浮皮果组合及健康果组合的偏最小二乘回归模型建模集和预测集结果见图9。健康果(组3)的偏最小二乘回归建模及模型预测结果均优于浮皮果(组2)和浮皮果健康果组合(组1)。浮皮果对柑橘主成分因子影响不大,但因其对光谱能量的吸收能力不同于健康果,会对偏最小二乘回归模型的预测能力造成一定的影响。
健康果(组3)的偏最小建模及模型预测散点见图9(b)。柑橘健康果最佳主成分因子数为12,建模集相关系数Rc为
0.94,建模集均方根误差为0.31 °Brix,模型预测相关系数Rp为0.88,预测集均方根误差RMSEC为0.77 °Brix。该模型回归系数曲线见图8(b)。回归系数绝对值表示该变量对模型的影响,正回归系数对应光谱变量相关性越好,光谱峰强越强,预示着可溶性固形物在该样品占的权重越大,负回归系数对应光谱变量相关性越好,试验中建立的剔除柑橘浮皮果后偏最小二乘回归模型的截距为11.84。
图8 柑橘PLS模型参数Figure 8 The parameter with PLS model of citrus
图9 柑橘偏最小二乘回归建模和模型预测散点图Figure 9 Scatter plots of PLS models in calibration and prediction sets of citrus
2.6 在线分选准确性评价
首先,将所建立的最优的定量与定性导入分选软件中,分选流程图见图10,柑橘先经浮皮果判别模型判定为浮皮果的,不进行分级而是进入异常果分级口,正常果则进行可溶性固形物分级。据研究[9]表明,水果存在2 °Brix的差异能够有口感差异。故将分级口定义为10~14 °Brix,每间隔2 °Brix设置一个分选等级,共4个等级。采用未参与建模的35个柑橘样品进行预测,其中包括25个正常样品和10个浮皮果。将上述样品依次编号,柑橘每隔120°标记一次,共标记3个点。将标记好的样品依次放在分选线分选,同一位置放置3次,观察这3次分选是否弹入同一分级口,试验中有2次弹入相邻的糖度分级口,分级准确率为97%。
图10 同时在线检测柑橘浮皮果和可溶性固形物
Figure 10 Flow diagram of simultaneous detection for peel puffy and soluble solids content of citrus by online visible/near infrared spectroscopy
采用近红漫透射检测方式,在同一条生产线上实现了柑橘浮皮果与可溶性固形物同时在线检测,并建立了柑橘浮皮果的定性判别模型,其中建立的偏最小二乘判别及最优的最小二乘支持向量机模型正确判别率均为100%,在采用未参与建模的样品进行分选试验中,能够将浮皮果与正常果很好地区分开来,浮皮果全部被推入预先设置的分选口中。另外探讨了浮皮果对柑橘可溶性固形物精度的影响,其中包含浮皮果建模效果较差。采用正常果建立的柑橘可溶性固形物的预测均方根误差为0.77 °Brix,模型实际分选试验在线分选精度为97%。研究可为柑橘在线分选提供分选策略与理论依据。
[1] 吕强, 何绍兰, 刘斌, 等. 班菲尔脐橙可溶性固形物近红外光谱特征谱区选择[J]. 农业机械学报, 2012(S1): 211-214.
[2] CAYUELA J A. Vis/NIR soluble solids prediction in intact oranges (Citrus sinensis L.) cv. Valencia Late by reflectance[J]. Postharvest Biology and Technology, 2008, 47(1): 75-80.
[3] TEWARI J C, DIXIT V, CHO B K, et al. Determination of origin and sugars of citrus fruits using genetic algorithm, correspondence analysis and partial least square combined with fiber optic NIR spectroscopy[J]. Spectrochimica Acta Part A: Molecular and Biomolecular Spectroscopy, 2008, 71(3): 1 119-1 127.
[4] CAYUELA J A, WEILAND C. Intact orange quality prediction with two portable NIR spectrometers[J]. Postharvest Biology and Technology, 2010, 58(2): 113-120.
[5] LIU Yan-de, SUN Xu-dong, OUYANG Ai-guo. Nondestructive measurement of soluble solid content of navel orange fruit by visible-NIR spectrometric technique with PLSR and PCA-BPNN[J]. LWT-Food Science and Technology, 2010, 43(5): 602-607.
[6] MAGWAZA L S, OPARA U L, TERRY L A, et al. Prediction of‘Nules Clementine’mandarin susceptibility to rind breakdown disorder using Vis/NIR spectroscopy[J]. Postharvest Biology and Technology, 2012, 74: 1-10.
[7] MAGWAZA L S, LANDAHL S, CRONJE P J R, et al. The use of Vis/NIRS and chemometric analysis to predict fruit defects and postharvest behaviour of ‘Nules Clementine’mandarin fruit[J]. Food Chemistry, 2014, 163: 267-274.
[8] 孙通, 许文丽, 胡田, 等. 基于UVE-ICA和支持向量机的南丰蜜桔可溶性固形物可见-近红外检测[J]. 光谱学与光谱分析, 2013, 33(12): 3 235-3 239.
[9] JAMSHIDI B, MINAEI S, MOHAJERANI E, et al. Reflectance Vis/NIR spectroscopy for nondestructive taste characterization of Valencia oranges[J]. Computers and Electronics in Agriculture, 2012, 85: 64-69.
[10] WANG Ai-chen, XIE Li-juan. Technology using near infrared spectroscopic and multivariate analysis to determine the soluble solids content of citrus fruit[J]. Journal of Food Engineering, 2014, 143: 17-24.
[11] LIU C, YANG S X, DENG L. Determination of internal qualities of newhall navel oranges based on nir spectroscopy using machine learning[J]. Journal of Food Engineering, 2015, 161: 16-23.[12] LORENTE D, ESCANDELL-MONTERO P, CUBERO S, et al. Visible-NIR reflectance spectroscopy and manifold learning methods applied to the detection of fungal infections on citrus fruit[J]. Journal of Food Engineering, 2015, 163: 17-24.
[13] SANKARAN S, EHSANI R. Visible-near infrared spectroscopy based citrus greening detection: Evaluation of spectral feature extraction techniques[J]. Crop Protection, 2011, 30(11): 1 508-1 513.
[14] JAMES P Reed, DESMOND Devlin, SANDRA R R Esteves, et al. Integration of NIRS and PCA techniques for the process monitoring of a sewage sludge anaerobic digester[J]. Bioresource Technology, 2013, 133(4): 398-404.
[15] NEJADGHOLI I, BOLIC M. A comparative study of PCA, SIMCA and Cole model for classification of bioimpedance spectroscopy measurements[J]. Computer in Biology and Medicine, 2015, 63: 42-51.
[16] CHAUCHARD F, COGDILL R, ROUSSEL S, et al. Application of LS-SVM to non-linear phenomena in NIR spectroscopy: development of a robust and portable sensor for acidity prediction in grapes[J]. Chemometrics and Intelligent Laboratory Systems, 2004, 71(2): 141-150.
[17] MARCO F Ferrão, SIMONE C Godoy, ANNELISE E Gerbase, et al. Non-destructive method for determination of hydroxyl value of soybean polyol by LS-SVM using HATR/FT-IR[J]. Analytica Chimica Acta, 2007, 9(6): 114-119.
[18] 郝勇, 孙旭东, 高荣杰. 基于可见/近红外光谱与SIMCA和PL S-DA的脐橙品种识别[J]. 农业工程学报, 2010, 26(12): 373-377.
[19] 孙旭东, 刘燕德, 李轶凡, 等. 鸭梨黑心病和可溶性固形物含量同时在线检测研究[J]. 农业机械学报, 2016, 47(1): 227-233.
Simultaneous detection of puffiness and soluble solids content for intact citrus by online spectroscopy
LIU Yan-de
WUMing-ming
SUNXu-dong
ZHUDan-ning
(SchoolofMechatronicsEngineering,EashChinaJiaotongUniversity,Nanchang,Jiangxi330013,China)
Puffy fruit and soluble solid content (SSC) are important indexes for evaluating the quality of citrus. The feasibility was discussed for detecting Puffing disease and SSC of intact citrus simultaneously by online visible-near infrared (visible-NIR) transmittance spectroscopy. The spectra were recorded with the integration time of 100 ms in the wavelength range of 350~1 150 nm when the samples were conveyed at the speed of five samples per second. The feasibility of simultaneous and online detection of puffiness fruit and SSC for intact citrus simultaneously was discussed by visible-near infrared transmittance spectroscopy. The response properties of visible-NIR spectra for normal fruit, mild and severe puffiness fruit were analyzed. Then least squares support vector machine (LSSVM) and discrimination partial least square (DPLS) were developed for discrimination of puffiness fruit and health citrus. At the same time, the optimal soluble solids content model of citrus was conducted by partial least squares regression methods. Other 35 samples without developing calibration models were applied to evaluate precision of online sorting. The classification rate was 100% for identifying puffiness fruit, and the accuracy of sorting SSC for health pears was 97%. The results showed that simultaneous detection of puffiness and SSC were feasible by visible-NIR transmittance spectroscopy.
puffiness fruit; diffuse transmittance; soluble solids content; simultaneous detection
“十二五”国家863计划课题(编号:SS2012AA101306);江西省优势科技创新团队建设计划项目(编号:20153BCB24002);南方山地果园智能化管理技术与装备协同创新中心(编号:赣教高字[2014]60号);江西省研究生创新资金项目(编号:YC2015-S238)
刘燕德(1967—),女,华东交通大学教授,博士,博士生导师。E-mail:jxliuyd@163.com
2016—06—29
10.13652/j.issn.1003-5788.2016.11.026