玉露香梨可溶性固形物近红外漫透射光谱在线检测

2016-12-05 08:27刘燕德朱丹宁吴明明孙旭东张智诚
食品与机械 2016年10期
关键词:玉露香梨方根

刘燕德 朱丹宁 吴明明 孙旭东 张智诚

(1. 华东交通大学,江西 南昌 330013;2. 光机电技术及应用研究所,江西 南昌 330013)



玉露香梨可溶性固形物近红外漫透射光谱在线检测

刘燕德1,2朱丹宁1,2吴明明1,2孙旭东1,2张智诚1,2

(1. 华东交通大学,江西 南昌 330013;2. 光机电技术及应用研究所,江西 南昌 330013)

应用近红外漫透射光谱技术探索玉露香梨可溶性固形物在线无损检测的可行性。358个试验样本被分成建模集和预测集(269∶89),分别用于建立模型和验证模型的预测能力。通过对玉露香梨样品近红外漫透射光谱分析发现,样品光谱在625,725,800 nm处存在3个波峰,在673,765,825 nm处存在3个波谷。通过对比不同预处理方法,发现漫透射近红外光谱分别经一阶微分、移动窗口平滑和多元散射校正组合预处理后建立的模型效果最好。结合组合预处理方法建立了偏最小二乘和偏最小二乘支持向量机预测模型,经比较,偏最小二乘支持向量机模型预测能力更强,模型预测均方根误差和相关系数分别为0.316%和0.949。对比发现主成分分析和径向基函数有利于提高最小二乘支持向量机模型的预测能力。试验结果表明采用近红外漫透射光谱技术结合最小二乘支持向量机算法,实现了玉露香梨可溶性固形物在线无损检测。

近红外光谱;漫透射;玉露香梨;可溶性固形物;最小二乘支持向量机

玉露香梨是库尔勒香梨与雪花梨杂交的新品种,克服了传统香梨果小核大、果形差、果肉少等缺点,具有口感好、无渣等优点,深受广大的消费者喜爱。可溶性固形物是单糖、双糖、多糖等可溶性糖类的总称,是衡量玉露香梨成熟度和口感品质的主要指标之一[1]。可溶性固形物通常采用破损后榨汁测量,该方法虽然准确,但需要破损物料且耗时费力,难以满足大宗水果采后分选的需求[2-3]。随着玉露香梨产量的不断增加,迫切需要研究玉露香梨可溶性固形物快速、无损检测方法,按照可溶性固形物含量分级,实现按质论价。

近红外光谱中包含被测对象含氢基团分子振动信息,在被测对象近红外光谱与目标组分真实值之间进行回归分析,建立定量分析模型,可实现未知样品目标组分的快速无损检测[4-5]。近红外光谱技术已被证明是农产品内部品质检测的有效方法之一,近红外光谱技术应用也从静态实验室检测逐步迈向在线动态检测[6]。王伟明等[7]采用平滑去噪处理后的近红外漫反射光谱,建立了梨的糖度含量数学模型,模型预测标准偏差为0.019%。徐惠荣等[8]建立了梨可溶性固形物的多种数学模型,结果表明多元散射校正算法结合最小二乘支持向量机模型效果最优。许文丽等[9]采用变量优选、快速独立成分分析和近红外漫透射光谱技术,检测黄花梨可溶性固形物,模型预测相关系数和均方根误差分别为0.918和0.518%。由于在在线检测中,梨和果杯紧密配合困难,造成生产线零部件反射的杂散光直接进入检测器,影响检测精度。试验中采用弹性遮光圈和透光孔组合结构,克服了绝大部分杂散光,提高了在线检测精度。本研究应用近红外漫透射光谱技术探索玉露香梨可溶性固形物在线快速无损检测的可行性,旨在为实现玉露香梨按照可溶性固形物含量分级,按质论价提供技术支撑和参考依据。

1 材料与方法

1.1 样品准备

玉露香梨样品由山西某果业公司提供,横径范围为73~88 mm,纵径范围为70~89 mm。清理掉表皮灰尘后依次编号,在果顶每间隔90°作1个标记,每个样品共标记4个点,在约25 ℃(±1 ℃)室温静置12 h后,每个点均采集一条近红外光谱。

1.2 近红外漫透射光谱在线检测装置

光谱采集和分选采用自行设计的在线检测装置完成。在线检测装置光谱仪选用QE65000型光谱仪(Ocean optics lNC.,USA),波长范围350~1 150 nm。光源为12 V、100 W的卤钨灯10盏,沿样品传送线两侧沿环形分布,每侧布置5盏,由直流稳压电源供电,且电压和电流可调。样品运动时,两侧各5盏光源均匀地照射至样品上。果杯上装有弹性避光圈,水果置于果杯上时依靠自重,实现水果与弹性避光圈的紧密配合。果杯底部为Φ5 mm的透光孔,弹性避光圈和透光孔的组合式结构,可以有效避免杂散光进入检测探头。检测探头安装在透光孔正下方,距离果杯底部约2 mm。光谱仪与检测探头间使用1 000 μm×2 m光纤连接。

1. 光源 2. 样品 3. 果杯避光圈 4. 果杯 5. 拨杆 6. 透光空 7. 探头 8. 弹跳爪

图1 近红外漫透射在线检测装置

Figure 1 The device of NIR diffuse transmittance detection

1. 驱动齿轮 2. 编码盘 3. 霍尔传感器 4. 果杯 5. 链条

Figure 2 Schematic diagram of spectral data acquisitionin on-line detection equipment

采用硬件触发方式采集光谱。如图2所示,检测装置驱动主轴上安装17齿的分度盘,分度盘将驱动齿轮的68齿分成17组,每组含4齿,每4齿对应安装1个果盘,从而实现分度盘齿和水果果盘位置一一对应。距分度盘齿顶2 mm,安装1个霍尔传感器,每转一齿,触发传感器,使后续电路发出3.5 V信号,触发光谱仪采集并保存一条光谱。

1.3 近红外漫透射光谱在线采集

在线检测装置预热30 min后,以PTFE球为参比,校正参比后采集光谱。积分时间设为100 ms,速度5 s-1,光谱范围350~1 150 nm,光照强度为1 000 W。每个玉露香梨标记的4个点均采集1条光谱,共用玉露香梨90个,剔除2条异常光谱,共358条,玉露香梨每个标记点均对应测量可溶性固形物含量真实值。数据处理中每条光谱均视为1个样品,按照3∶1随机划分,建模集样品269个,预测集样品89个。试验中将通过手动放果的方式将样品果柄方向与玉露香梨传送方向平行,并将标记点对应方向的赤道部位对准探头。光源照射在样品表面,透过样品进入检测探头。

1.4 可溶性固形物真实值测量

玉露香梨可溶性固形物含量真实值采用PR-101α糖度计(Atago,Co.,Tokyo,Japan)测量。所有光谱采集完成后,切下标记点果肉适量挤汁于糖度计测试窗口上,重复取样测量3次取平均值作为样品可溶性固形物含量的真实值。

1.5 算法原理

1.5.1 偏最小二乘法 偏最小二乘法(PLS)一般用于在光谱数据(X)和化学组分(Y)间进行回归分析,建立定量分析数学模型。PLS是一种双线性建模方法,Y的预测通过式(1)计算[10]:

Y=βX+b,

(1)

式中:

β——向量回归系数(p×1);

b——模型偏移量,%;

X——光强(光子数);

Y——可溶性固形物含量,%。

1.5.2 最小二乘支持向量机 最小二乘支持向量机(LS-SVM)采用不敏感损失函数取代经典的平方损失函数。调节惩罚因子和核函数,建立光谱数据(X)和化学组分(Y)间的定量分析数学模型:

(2)

式中:

K(x,xi)——核函数;

xi——输入向量;

αi——拉格朗日算子,也叫支持向量;

b——偏差;

N——样品数量。

线性[式(3)]和径向基函数[式(4)]是2个典型核函数。

K(xi,xj)=xixj,

(3)

K(xi,xj)=exp(-‖xi-xj‖2/2σ2),

(4)

式中:

σ2——内核参数,表示径向基函数的方差。

分析光谱时,径向基核函数通常用于光谱与化学组分间的非线性关系,而线性核函数适用于线性关系[11]。

1.5.3 预处理方法 光谱中除含有样品自身的化学信息外,还包含一些无用信息,例如噪声信息和杂散光等。因此,在建立模型时,通过预处理方法消除微无关信息是十分重要的[12]。微分可以消除基线漂移,放大细节和高频噪声信息,通常微分后要进行平滑处理,以消除高频噪声[13-15]。多元散射校正可以消除样品大小不均而产生的散射效应。试验中分别采用多元散射校正(MSC)、一阶微分(1D)、二阶微分(2D)、平滑及其组合方法处理光谱数据。不同预处理方法的参数设置:Savitzky Golay一阶微分窗口宽度5点2阶多项式、Savitzky Golay二阶微分7点2阶多项式、移动窗口平滑窗口3点。

2 结果与讨论

2.1 玉露香梨近红外漫透射光谱响应特性

图3为可溶性固形物含量高、中和低3个代表样品对应的光谱,光谱中存在3个波峰和3个波谷,波峰处于625,725,800 nm处,波谷处于673,765,825 nm处。从波形看,玉露香梨近红外漫透射光谱集中分布在500~950 nm。由于光谱两端存在一些噪声信号,建模选取500~950 nm波段。玉露香梨表皮呈黄绿色,含有较高的叶绿素,在680 nm附近存在明显波谷[16]。760 nm附近的波谷可能由O—H三倍频伸缩振动导致,825 nm可能由N—H三倍频伸缩振动导致[17]。试验所用样品的建模集和预测集的可溶性固形物真实值分布统计结果见表1。

2.2 光谱预处理方法比较

由图3可知,在500~700,700~800,800~950 nm 3个波段范围存在明显的基线漂移。由表2可知,一阶微分、平滑和多元散射校正的组合光谱预处理方法结果最优,建模相关系数为0.942,建模均方根误差为0.344%,模型预测相关系数为0.926,预测集均方根误差为0.382%。图4为可溶性固形物含量高、中和低3个代表样品对应一阶微分、平滑和多元散射校正组合处理后的光谱,结合组合预处理后的数据光谱与原光谱相比消除了基线漂移、降低了噪声信息同时消除了样品大小不均而产生的散射效应。主成分因子数是决定PLS模型性能的关键因素之一,最佳主成分因子数由留一法交互验证决定,交互验证均方根误差(RMSECV)最小值对应的主成分因子数即为PLS最佳主成分因子数。图5为光谱经不同光谱预处理后PLS建模的主成分因子数变化曲线,基于RMSECV最小值对应的PC数为最佳主成分因子数的原则,选择PLS模型的最佳主成分因子数。若建模时选择PC数过少,就可能因为一些有效信息被忽略导致模型精度降低,出现“欠拟合”现象;若建模时选择PC数过多,又会因为掺杂噪声信号等产生“过拟合”现象。

图3 玉露香梨近红外漫透射原始光谱

样品集数量最大值/%最小值/%平均值/%标准差/%变异系数/%建模集2698.5013.3011.003.250.295预测集898.8013.1010.953.040.278

表2 近红外漫透射检测方式结合不同的预处理方法下玉露香梨SSC的PLS建模结果

Table 2 PLS modeling results of pear SSC based on NIR diffuse transmission detection methods combining with different pretreatment methods

预处理方法主成分因子数建模集rcRSMEC预测集rpRMSEP无预处理110.9290.3790.9090.420MSC90.9330.3690.9120.4141Derivative90.9400.3610.9000.4132Derivative80.9500.3190.8460.5411D+Smothing+MSC80.9420.3440.9260.3822D+Smothing+MSC60.9290.3790.8940.451

图4 玉露香梨近红外漫透射经一阶微分、移动窗口平滑和多元散射校正组合预处理后的光谱

Figure 4 Vis-NIR transmission spectra of 'YuLuxiang' pears processed By the combination of first derivative (1D), smoothing and multiplicative scattering correction (MSC)

图5 玉露香梨的可溶性固形物中主成分因子决定图

2.3 可溶性固形物在线检测数学模型

2.3.1 偏最小二乘数学模型建模集和预测集光谱经一阶微分、平滑和多元散射校正组合处理后,用于后续建立可溶性固形物数学模型和模型预测。图6为建模均方根误差(RMSEC)和预测均方根误差(RMSEP)随主成分因子数的变化曲线。建模时所选主成分因子数(PC)过低,可能忽略部分有效光谱信息,导致模型精度降低,出现“欠拟合”现象,例如PC为6或7,模型预测精度尚未达到最优;而当所选PC过高时,易出现“过拟合”现象,例如建模PC为9或10,RMSEC值更低,但RMSEP值较PC为8时略高。因此,本试验PLS模型最佳主成分因子数为8。

图7为PLS建模和模型预测的测量值和真实值散点图。建模相关系数rc为0.942,建模均方根误差RMSEC为0.344%,预测相关系数rp为0.926,预测均方根误差RMSEP为0.382%。

2.3.2 最小二乘支持向量机数学模型 输入向量、核函数及其参数是影响最小二乘支持向量机(LS-SVM)性能的关键因素。输入向量数量维数影响LS-SVM模型的计算速度和复杂程度。试验中采用2种不同策略,将535个近红外光谱波长变量降维后作为LS-SVM的输入向量。

图6 玉露香梨的可溶性固形物中主成份因子决定图

图7 校正集和预测集玉露香梨可溶性固形物预测值与真值的关系

Figure 7 Correlation of predicted value and actual value of yulu pear sugar-acid ration in calibration set and validation

(1) 采用主成分分析(PCA)将近红外光谱数据压缩成若干个主成分得分向量,考察不同主成分得分向量对LS-SVM预测结果的影响。设PCA最大主成分因子数为20,由图8可知,随着输入LS-SVM主成分得分向量数量增加,预测均方根误差先减小后增大,当主成分得分向量数量为8时,预测均方根误差达到最小为0.316%。

(2) 采用连续投影算法(SPA),根据每个波长变量正交投影信息量的多少,从535个近红外光谱波长变量中,选取可溶性固形物敏感波长变量作为LS-SVM输入向量。设置SPA选取最大和最小变量数分别为30和10,选取结果见图9。共21个变量被选为LS-SVM的输入向量,预测均方根误差为0.371。全谱535个波长变量作为PCA和SPA的对比组,也被用作LS-SVM的输入向量,依据预测均方根误差最小原则,PCA的运行结果最优,主要8个主成分得分向量累计贡献率为99%,几乎完全包含了全光谱信息,而SPA可能在选择过程中损失了极少部分可溶性固形物相关的光谱信息。

图8 玉露香梨的可溶性固形物PCA-LS-SVM建模方法中输入变量PC决定图

Figure 8 The determination figure of the input variable PC number in ssc of yuluxiang pear with method of PCA-LS-SVM

径向基核函数(RBF_kernel)和线性核函数(Lin_kernel)是LS-SVM的两种典型核函数。由表3可知,依据模型相关系数越大、预测均方根误差越小,模型预测能力越强的原则,径向基核函数运行结果优于线性核函数。原因可能是径向基核函数泛化能力强,可以逼近任意非线性函数,收敛速度快,可成功地处理可溶性固形物含量与光谱数据间的非线性关系。采用二步法优化LS-SVM核函数参数,首先以较大步长搜索最佳核函数参数范围,然后以较小步长在初步定位的范围内,进一步确定最优参数,结果见表3。

图9 玉露香梨的可溶性固形物SPA-LS-SVM建模方法中输入变量选择的决定图

Figure 9 The determination figure of the input variable in ssc of yuluxiang pear with method of SPA-LS-SVM

对比PLS和LS-SVM模型,可以发现:一阶微分、移动窗口平滑和多元散射校正组合预处理后建立的PCA-LS-SVM数学模型预测结果最优,预测均方根误差为0.316%。

表3 近红外漫透射检测方式结合不同核函数的玉露香梨SSC的LS-SVM建模结果

3 结论

结果表明应用可见近红外漫透射光谱技术结合主成分分析、最小二乘支持向量机,实现了玉露香梨可溶性固形物在线无损检测。一阶微分、移动窗口平滑和多元散射校正组合预处理方法有效地消除了基线漂移和光散射效应。最小二乘支持向量机数学模型预测能力优于偏最小二乘数学模型,模型预测均方根误差和相关系数分别为0.316%和0.949。与连续投影算法相比,主成分分析更适于选取最小二乘支持机的输入向量。径向基核函数比线性核函数更适用于本试验数据。本研究可为其它农产品品质近红外漫透射光谱在线检测提供参考依据。

[1] WANG Ai-chen, XIE Li-juan. Technology using near infrared spectroscopic and multivariate analysis to determine the soluble solids content of citrus fruit [J]. Journal of Food Engineering, 2014, 143: 17-24.

[2] 王蒙, 冯晓元. 梨果实近红外光谱无损检测技术研究进展[J]. 食品质量安全检测学报, 2014, 5(3): 681-690.

[3] LEMBE S Magwaza, UMEZURUIKE Linus Opara, HÉLNE Nieuwoudt, et al. NIR spectroscopy applications for internal and external quality analysis of citrus fruit: a review[J]. Food Bioprocess Technol, 2012, 5(2): 425-444.

[4] 朱丽伟, 马文广, 胡晋. 近红外光谱技术检测种子质量的应用研究进展[J]. 光谱学光谱分析, 2015, 35(2): 346-349.

[5] 孙通, 江水泉. 基于可见近红外光谱和变量优选的南水梨糖度在线检测[J]. 食品与机械, 2016, 32(3): 69-72.

[6] VIEGAS T R, MATA A L M L, DUARTEM M L, et al. Determination of quality attributes in wax jambu fruit using NIRS and PLS[J]. Food Chemistry, 2016, 190: 1-4.[7] 王伟明, 董大明, 郑文刚, 等. 梨果糖浓度近红外漫反射光谱检测的预处理方法研究[J]. 光谱学光谱分析, 2013, 33(2): 359-362

[8] 徐惠荣, 陈晓伟, 应义斌. 基于多元校正法的香梨糖度可见/近红外光谱检测[J]. 农业机械学报, 2010, 41(12): 1 000-1 298.

[9] 许文丽, 孙通, 胡田, 等. 基于变量优选和快速独立成分分析的黄花梨可溶性固形物可见/近红外光谱检测[J]. 光谱学光谱分析, 2014, 34(12): 3 253-3 256.

[10] 许禄, 邵学广. 化学计量学方法[M]. 2版. 北京: 科学出版社, 2004: 10-38.

[11] 刘雪梅, 章海亮. 基于DPLS 和LS-SVM 的梨品种近红外光谱识别[J]. 农业机械学报, 2012, 43(9): 1 000-1 298.

[12] 褚小立. 化学计量学方法与分子光谱分析技术[M]. 北京: 化学工业出版社, 2011: 41-53.

[13] 尼珍, 胡昌勤, 冯芳. 近红外光谱分析中光谱预处理方法的作用及其发展[J]. 药物分析杂志, 2008, 28(5): 824-829

[14] 张欣, 单杨, 李水芳. 基于多元散射校正和偏最小二乘 (MSC/PLS) 的傅里叶变换近红外光谱检测蜂蜜中还原糖[J]. 食品与机械, 2009, 25(6): 109-112.

[15] 陆辉山, 陈鹏强, 闫宏伟, 等. 基于近红外光谱漫透射技术的苹果可溶性固形物含量在线检测[J]. 食品与机械, 2015, 31(3): 40-42.

[16] 王加华, 韩东海. 便携式近红外水果糖度分析模型简化研究[J]. 食品安全质量检测技术, 2009, 1(1): 32-38.

[17] 严衍禄. 近红外光谱分析基础与应用[M]. 北京: 中国轻工业出版社, 2005: 8-39.

Online detection of soluble solids contents for “Yuluxiang” pear by visible-near infrared diffuse transmission spectroscopy

LIUYan-de1,2ZHUDan-ning1,2WUMing-ming1,2SUNXu-dong1,2ZHANGZhi-cheng1,2

(1.EastChinaJiaotongUniversity,Nanchang,Jiangxi330013,China;2.InstituteofOpticalandElectricalMachineryTechnologyandApplication,Nanchang,Jiangxi330013,China)

The feasibility was investigated for online detection of soluble solids content (SSC) of “Yuluxiang” pear by visible-near infrared (visible-NIR) diffuse transmittance spectroscopy. 358 samples were divided into the calibration and prediction sets (269∶89) for developing calibration models and assessing their performance. By analyzing, the Vis-NIR transmission spectra of 'YuLuxiang' pears have three peaks at 625 nm, 725 nm and 800 nm and three troughs at 625 nm, 725 nm and 800 nm, respectively. Different preprocessing approaches were tested, it was found that the best approaches were the combination of first derivative (1D), smoothing and multiplicative scattering correction (MSC) preprocessing methods. The partial least square (PLS) regression and least square support vector machine (LS-SVM) models were developed with the pretreatment methods by the combination of first derivative (1D), smoothing and multiplicative scattering correction (MSC). The new samples of the prediction set were applied to evaluate the performance of the models. Compared with PLS model, the performance of LS-SVM model was better with the root mean square error of prediction (RMSEP) of 0.316% and the correlation coefficient of prediction of 0.949. And the spectral dimension reduction method of principal component analysis (PCA) and the kernel function of radial basis function (RBF) were suitable to improve the predictive ability of the LS-SVM model. The results suggested that it was feasible for online detection of SSC of ‘Yuluxiang’ pear by visible-NIR diffuse transmission spectroscopy combined with LS-SVM algorithm. The online detection of soluble solids content (SSC) of “Yuluxiang” pear by visible-near infrared (visible-NIR) diffuse transmittance spectroscopy was demonstrated.

near infrared spectroscopy; diffuse transmittance; “Yuluxiang” pear; soluble solids content; least squares support vector machine

“十二五”国家863计划课题(编号:SS2012AA101306);江西省优势科技创新团队建设计划项目(编号:20153BCB24002);南方山地果园智能化管理技术与装备协同创新中心(编号:赣教高字[2014]60号)

刘燕德(1967—),女,华东交通大学教授,博士,博士生导师。E-mail: jxliuyd@163.com

2016—06—04

10.13652/j.issn.1003-5788.2016.10.027

猜你喜欢
玉露香梨方根
方根拓展探究
玉露香梨“赛美人”
寒露感怀
“隰县玉露香梨”品牌建设
我们爱把马鲛鱼叫鰆鯃
冰灯玉露烂根怎么办
转变生产方式,促进库尔勒香梨提质增效
香梨:瀚海的果实
均方根嵌入式容积粒子PHD 多目标跟踪方法
数学魔术