在线检测无花果中可溶性固形物的近红外漫透射技术研究

2018-05-23 00:59梁梦醒江明珠贾俊强吴琼英
关键词:波长校正宽度

郭 成, 梁梦醒, 江明珠, 贾俊强, 吴琼英, 颜 辉

(江苏科技大学 生物技术学院,镇江 212000)

无花果营养丰富、口感好,越来越受到人们的喜爱.研究表明,无花果在提高免疫力、抗氧化以及抗肿瘤中具有重要的作用[1-3],被称为“21世纪人类健康的守护神”[4].目前中国无花果产地主要分布在新疆、山东、江苏、上海、浙江等省市,年产量约为16万吨,发展前景十分广阔.可溶性固形物(soluble solids content, SSC)是指果汁中可被水溶解的糖、维生素、酸、矿物质等.通常SSC是评价水果品质的重要指标之一[5],其含量的高低影响着水果的口感.随着人们生活水平的提高,不同的人群对水果口感的要求也不一样,对无花果进行分级筛选与销售,符合消费者与销售者的利益需求,因此有必要开展无花果SSC的在线无损检测的研究.

近红外光谱(near infrared spectroscopy, NIRS)技术是利用物质对光的吸收、散射、反射和透射等特性来进行定性定量分析的一种无损检测技术,在农产品在线无损检测中有着广泛的应用.文献[6]研制了水果品质在线近红外分光检测装置,并以柑橘和苹果为试验对象,进行糖度、酸度及内部褐变的在线检测,其中糖度的相关系数R在0.95以上,酸度的R在0.85以上并且能够检测内部缺陷.文献[7]建立了南疆红枣糖度近红外光谱在线检测系统,糖度的R在0.90以上.文献[8]采用USB4000光谱仪,以漫透射方式实现了在线检测脐橙SSC,并使用波长优选方法提高检测精度.文献[9-10]采用近红外技术实现了西瓜SSC、坚实度[11]的在线检测,确定了最佳检测模型.上述研究的顺利开展,说明将NIRS技术应用到水果在线无损检测上是完全可行的.但文献中报道的均为对硬质果皮水果的研究,对于软质果皮水果研究的报道很少,特别是目前使用NIRS技术预测无花果SSC的研究国内外尚未见报道,因此本研究的开展具有重要的现实意义.

本研究应用近红外漫透射技术对无花果SSC进行在线检测研究,使用偏最小二乘回归(partial least squares, PLS)建立在线无损检测无花果SSC的预测模型,探讨一阶求导的窗口宽度对模型的影响.并采用无信息变量消除法(uninformative variable elimination, UVE)对无花果的近红外光谱进行波长优选,以期提高检测精度,为无花果的品质在线检测奠定基础.

1 材料与仪器

1.1 实验材料

供试样品(无花果)摘自江苏省镇江市丹徒区江心洲,品种为麦斯衣陶芬,摘取目视成熟度不同的果子,共采摘203颗无花果.

1.2 实验仪器

近红外光谱仪为QE65 Pro型,购于美国Ocean Optics有限公司,分辨率0.238 nm,测量范围780.423~1 005.232 nm;折光仪为WZ-103型,购于浙江托普云农科技股份有限公司.

1.3 在线检测系统

自主设计的在线检测系统如图1,主要包括光源、托盘、测试箱、光源开关、转速调节器、准直镜、光纤、光谱仪、计算机9个部分.

1.光源;2.托盘;3.测试箱;4.光源开关;5.转速调节器; 6.准直镜;7.光纤;8.光谱仪;9.计算机图1 无花果品质在线检测系统示意图Fig.1 Diagram of on-line system fortesting the quality of fig

光源发射出的光线进入无花果内部漫射,从无花果内部漫射出的光谱信号经准直镜和光纤传送到光谱仪,透射模式光谱信号经数据线存储于计算机,最后在计算机上显示检测结果.

2 实验方法

2.1 光谱采集

确保所有线路正确连接,打开光谱仪,进行暗电流校正,打开光源,预热5 min然后以空气为参比校正背景光谱,将无花果放置于托盘的凹槽中,打开马达并调节转速至0.33 r/s,使用近红外光谱仪以漫透射方式采集203颗无花果的光谱数据,光谱积分时间10 ms,平均次数10次.本实验获得的透射光谱,计算公式为:

(1)

式中:Sλ为波长λ时样品的光谱强度,Dλ为波长λ时暗电流的强度,Rλ为波长λ时参照光谱的强度.

2.2 SSC测量方法

采集光谱后立即使用折光仪测量无花果SSC,共获得203个SSC数据,按文献[12]的分层筛选方法划分校正集、预测集,SSC从高到低排序,按照3 ∶1的比例划分校正集与预测集,最终152个样本作为校正集,51个样本作为预测集.

2.3 光谱预处理

通常采用的预处理方法包括均值中心化(Mean Centering)、标准化、不同点移动平滑、一阶导数(1stD)、标准正态变量变换(standard normal variable transformation, SNV)、多元散射校正等[13,14].本研究所用光谱仪分辨率较高,为0.238 nm,对分辨率较高的光谱进行1stD求导时需要探讨所用窗口宽度的不同对模型的影响[15],用以提高模型的预测精度.文中将探讨1stD的窗口宽度对模型精度的影响.

2.4 偏最小二乘回归模型

运用PLS建立模型.PLS是建立在成分提取的方法之上,在提取成分的过程中,同时考虑到预测变量数据和因变量数据中的信息,使得从两者中提取的信息之间的相关性达到最大,然后用所获得的成分建立多元回归分析模型.

在PLS分析中,潜变量(latent variables, LVs)影响了预测模型的精度,需要选取最佳LVs.通常潜变量由交叉验证获得,交叉验证的方法有留一法(leave one out, LOO),连续块,随机子集等[13],文中采用LOO进行交叉验证.

2.5 无信息变量消除法

在PLS模型中,光谱矩阵X和实测值矩阵Y之间关系为Y=Xb+e(式中:b为系数向量,e为误差向量).UVE是建立在分析PLS回归系数b基础上的算法,目的是消除那些不提供有用信息的波长变量[16].该方法首先将校正集光谱矩阵X与实测值矩阵Y进行PLS回归,根据PLS结果来确定最佳LVs,然后产生噪声变量R,组合X与R为新的矩阵XR,将XR与Y再进行PLS回归,采用LOO交叉验证,得到PLS回归系数矩阵B.最后根据b的平均值和标准偏差的商的稳定性来确定光谱变量是否被最终的PLS模型选取[17].

2.6 模型评价

模型的评价则采用交叉验证均方根误差(RMSECV)、预测均方根误差(RMSEP)以及相关系数R来进行,一般要求RMSECV与RMSEP较低并且数值相近,相关系数则越接近1越好.

2.7 软件

近红外光谱预处理与PLS模型建立均在MATLAB R2009b的PLS Toolbox 6.21工具箱上实现,UVE波长优选使用ChemoAC工具箱实现;光谱采集软件由本课题组自主设计.

3 结果与讨论

3.1 样品的近红外光谱

无花果的近红外漫透射模式原始光谱如图2,可以看出利用本系统能够采到质量较好的光谱,噪声相对较小.其中925 nm是-OH键2nd倍频振动峰位[18],820 nm处是N-H键2nd倍频振动.无花果含有糖、有机酸、黄酮和氨基酸等物质,图谱中峰位吸收可能与这些物质有关.

图2 无花果近红外原始光谱Fig.2 Raw NIRS of figs

3.2 样品SSC测量结果

表1为203个无花果样本SSC统计结果.由表1可得,校正集和预测集的SSC值范围相近,分别为10.30~17.80 °Brix和9.80~17.05 °Brix,平均值分别为14.14 °Brix和14.07 °Brix,并且校正集和预测集样品的标准差相近,分别为1.41°Brix和1.48°Brix.因此校正集和预测划分合理,为建立可靠的模型奠定了基础.

表1 无花果SSC的统计分析Table 1 Statistics of SSC of fig

3.3 模型与评价

为了探讨一阶求导的窗口宽度对模型的影响,分别设置了宽度为7,11,21,31,41,51,61,71,81,共9个宽度.采用1stD、SNV、Mean Center的组合方法预处理原始光谱,每个窗口宽度对应的模型结果如表2.分析不同窗口宽度下模型的RMSEC、RMSECV、RMSEP和RC、RCV、RP的变化趋势,结果如图3.当一阶求导窗口宽度为61时,RMSEC、RMSECV和RMSEP分别为0.66 °Brix、0.86 °Brix和0.88 °Brix,三者最接近且数值较小,说明该窗口宽度下的模型稳定性较好,RC、RCV和RP分别为0.88、0.79和0.80,在该窗口宽度下达到了较好的线性关系.

表2 不同一阶导数窗口宽度的模型结果Table 2 Result of models with different 1st D width

图3一阶导数窗口宽度对模型的影响

Fig.3Influenceof1stDwidthonmodel

根据无花果样本的SSC与相应的近红外光谱数据建立PLS模型,图4为模型的潜变量与均方根误差的关系图,潜变量数的选取要使得RMSEC、RMSECV和RMSEP处于较低的数值并且相对接近,另外为了防止数据的过拟合,潜变量数不宜取过大的数值,经过比较分析,PLS模型潜变量数取7.

图4 潜变量数对RMSE的影响Fig.4 Influence of latent variable number on RMSE

潜变量数为7时的PLS模型结果如表3,RC为0.89,接近0.9,具有较好的线性关系,RCV与RP分别为0.79和0.80,RMSEC、RMSECV与RMSEP分别为0.66 °Brix、0.86 °Brix和0.88 °Brix.为了研究波长变量对PLS模型的重要性,对全光谱进行了权重、变量投影重要性的研究.

表3 模型结果Table 3 Result of models

首先探讨不同波长在潜变量上的权重分布.一般认为光谱主要信息包含在潜变量累积贡献率大于85%的潜变量中[19].经计算,前3个潜变量累积贡献率为95.52%,提取光谱前3个潜变量在不同波长上的权重分布,如图5,前3个潜变量在780~840 nm和920~970 nm权重分布较大,说明信息主要集中在该范围内的波长变量上.

图5 前3个潜变量在不同波长上的权重分布曲线Fig.5 Weighted distribution of the first three latentvariable number on different range of wavelength

变量投影重要性(variable importance in projection, VIP)是评价自变量在解释因变量时作用的重要性,变量的VIP值可以用来筛选出对模型贡献较大的变量,通常选择VIP值大于1的自变量建立模型[13].各波长变量的VIP得分如图6,同样全光谱在780~840 nm、920~970 nm范围内得分较高,说明这部分的波长变量对PLS模型的贡献最大.该结论与图5中前3个潜变量在不同波长上的权重分布曲线是一致的.

由前3个潜变量在不同波长上的权重分布与VIP分析可知,全光谱中存在一些无信息的变量,影响了模型的预测能力,因此需要对全光谱变量进行评价,波长优选,筛选出携带有效信息的变量.

图6 各波长变量VIP得分Fig.6 VIP scores on each wavelength

全光谱经UVE筛选过程如图7,经过波长优选,模型的特征波长由全光谱1 010个变量降低到211个变量,大大简化了模型,同时模型的精度也得到了很大的提升,筛选出的波长变量如图8.

图7 无信息变量消除法选择变量Fig.7 Variable selection by UVE

图8 UVE波长优选结果Fig.8 Result of wavelength selection by UVE

可以看出,除了在780~840 nm与920~970范围内优选出较多的波长变量,同样在840~920 nm范围内也筛选出一部分波长变量,这说明该部分的光谱也携带了一定的信息,对模型的建立具有一定的贡献.由表3可知,UVE-PLS模型的RMSEC、RMSECV、RMSEP分别为0.63 °Brix、0.78 °Brix、0.83 °Brix,与PLS模型相比分别降低了4.35%、8.44%、5.75%,RC、RCV、RP分别为0.89、0.88、0.83,比PLS模型分别提高了1.18%、4.51%、2.87%.

无花果SSC测量值与预测值的关系如图9,UVE-PLS模型中SSC测量值与预测值的关系更加准确.结果显示,UVE-PLS模型更适合无花果SSC的在线检测.文献[20]研制出用于测量西瓜SSC的漫透射近红外在线检测装置,取得较好的结果,最佳PLS模型的RC为0.95,RMSEC、RMSEP分别为0.34 °Brix、0.58 °Brix,优于本研究的结果,可能的原因是无花果的表皮存在淀粉层,淀粉的存在对SSC的测量具有一定的影响,最终影响了模型的结果[21].根据江苏省无花果分级标准及流通技术[22],对于麦斯衣陶芬品种无花果,SSC大于14 °Brix的为一级品,在12~14 °Brix之间的为二级品,在10~12 °Brix之间的为三级品.本研究校正相对误差(RMSEC/均值×100%)为4.5%,验证相对误差(RMSEP/均值×100%)为5.9%,本研究所建模型已基本满足无花果SSC的在线检测分级的需要.

图9 无花果SSC测量值与预测值关系Fig.9 Correlation of SSC measured andSSC predicted in fig

4 结论

本研究建立了评价花果品质的在线检测系统,利用该系统可以快速无损的预测无花果的SSC.确定了光谱预处理一阶导数最佳窗口宽度为61,UVE适合本在线检测系统的工作,有效简化了模型,光谱变量由1 010个降低到了211,并且精度更高,误差更低.UVE-PLS模型的RMSEC、RMSECV、RMSEP与PLS模型相比分别降低了4.35%、8.44%、5.75%.本研究的顺利开展为无花果品质的在线检测提供了理论依据与实践经验.

参考文献(References)

[ 1 ] 刘军, 张百江. 无花果提取物对肺癌细胞增殖及凋亡影响的初步观察[J]. 中华肿瘤防治杂志, 2008,15(9): 665-667.

LIU Jun, ZHANG Baijiang. Proliferation inhibition and apoptosis induction of fig extract on human lung cancer cells[J]. Chinese Journal of Cancer Prevention and Treatment,2008,15(9):665-667. (in Chinese)

[ 2 ] 王振斌, 马海乐, 马晓珂, 等. 无花果渣脂溶性物质的化学成分和体外抗肿瘤的活性研究[J]. 林产化学与工业, 2010,30(4): 48-52.

WANG Zhenbin, MA Haile, MA Xiaoke, et al. Lipid-soluble components from fig residue and its anti-tumor activities in vitro[J]. Chemistry and Industry of Forest Products, 2010,30(4): 48-52. (in Chinese)

[ 3 ] 周宁, 陈江涛, 于文燕. 无花果水提取液对抑制肿瘤细胞增殖作用的初步研究[J]. 新疆医科大学学报, 2016,39(1):42-47.

ZHOU Ning,CHEN Jiangtao,YU Wenyan.Antiproliferation activity of water extract from Ficuscarica L. fruit on cervical cancer cell line[J].Journal of Xinjiang Medical University,2016,39(1):42-47.(in Chinese)

[ 4 ] 曹尚银, 杨福兰, 吴顺. 无花果抗癌作用研究新进展[J]. 林业科技开发, 2004,18(2): 13-15.

CAO Shangyin, YANG Fulan, WU Shun. The review of anti-cancer effect of fig[J]. Forest Technology Development, 2004,18(2): 13-15. (in Chinese)

[ 5 ] 孙通, 应义斌, 刘魁武, 等. 梨可溶性固形物含量的在线近红外光谱检测[J]. 光谱学与光谱分析, 2008,28(11): 2536-2539.

SUN Tong, YING Yibin, LIU Kuiwu, et al. Online detection of soluble solids content of pear by near infrared transmission spectrum[J]. Spectrosc Spect Anal, 2008,28(11): 2536-2539. (in Chinese)

[ 6 ] 何东健, 前川孝昭, 森岛博. 水果内部品质在线近红外分光检测装置及试验[J]. 农业工程学报, 2001,17(1): 146-148.

HE Dongjian, TAKAAKI Maekawa, Hiroshi Morishima. Detecting device for on-line detection of internal quality of fruits using near-infrared spectroscopy and the related experiments[J]. Transactions of the CSAE, 2001,17(1): 146-148. (in Chinese)

[ 7 ] 罗华平, 卢启鹏, 丁海泉, 等. 南疆红枣品质近红外光谱在线模型参数的实验研究[J]. 光谱学与光谱分析, 2012,32(5): 1225-1229.

LUO Huaping, LU Qipeng, DING Haiquan, et al. Study on online detection modeling parameters of jujube internal quality of Southern Xinjiang with near infrared spectrometric techniques[J]. Spectrosc Spect Anal, 2012,32(5): 1225-1229. (in Chinese)

[ 8 ] 孙通, 林金龙, 许文丽, 等. 可见/近红外半透射结合CARS方法在线检测脐橙SSC[J]. 江苏大学学报(自然科学版), 2013,34(6): 663-668.

SUN Tong,LIN Jinlong,XU Wenli,et al.On-line detection of SSC of navel oranges by Vis/NIR spectra and CARS method[J].Journal of Jiangsu University(Natural Science Edition),2013,34(6):663-668.(in Chinese)

[ 9 ] JIE D, XIE L, RAO X, et al. Using visible and near infrared diffuse transmittance technique to predict soluble solids content of watermelon in an on-line detection system[J]. Postharvest Biology and Technology, 2014, 90: 1-6. DOI:10.1016/j.postharvbio.2013.11.009.

[10] 田海清, 应义斌, 徐惠荣, 等. 西瓜可溶性固形物含量近红外透射检测技术[J]. 农业机械学报, 2007(5): 111-113.

TIAN Haiqing, YING Yibin, XU Huirong, et al. Near-infrared transmittance measuring technique for soluble solids content of watermelon[J]. T Chin Soc Agric Mach, 2007(5): 111-113. (in Chinese)

[11] 田海清, 应义斌, 陆辉山, 等. 可见/近红外光谱漫透射技术检测西瓜坚实度的研究[J]. 光谱学与光谱分析, 2007(6): 1113-1117.

TIAN Haiqing, YING Yibin, LU Huishan, et al. Study on predicting firmness of watermelon by vis/NIR diffuse transmittance technique[J]. Spectrosc Spect Anal, 2007(6): 1113-1117. (in Chinese)

[12] CHEN Q, DING J, CAI J, et al. Rapid measurement of total acid content (TAC) in vinegar using near infrared spectroscopy based on efficient variables selection algorithm and nonlinear regression tools[J]. Food Chem, 2012, 135(2): 590-595. DOI:10.1016/j.foodchem.2012.05.011.

[13] YAN H, HAN B X, WU Q Y, et al. Rapid detection of rosa laevigata polysaccharide content by near-infrared spectroscopy[J]. Spectrochim Acta A Mol Biomol Spectrosc, 2011, 79(1): 179-184. DOI:10.1016/j.saa.2011.02.032.

[14] YAN H, LU D L, CHEN B, et al. Development of a hand-held near infrared system based on an android OS and microNIR, and its application in measuring soluble solids content in fuji apples[J]. NIR News, 2014, 25(4): 16-19. DOI:10.1255/nirn.1446.

[15] 耿响, 陈斌, 朱文静, 等. 积分光谱与近红外光谱分析精度关系的研究[J]. 光学学报, 2009(12): 3551-3555.

GENG Xiang, CHEN Bin, ZHU Wenjing, et al. Study on the relation between integration spectrum and accuracy of near infrared spectroscopic analysis[J]. Acta Optica Sinica, 2009(12): 3551-3555. (in Chinese)

[16] 黄凌霞, 吴迪, 金航峰, 等. 基于变量选择的蚕茧茧层量可见-近红外光谱无损检测[J]. 农业工程学报, 2010,26(2): 231-236.

HUANG Ningxia, WU Di, JIN Hangfeng, et al. Non-destructive detection of cocoon shell weight based on variable selection by visible and near infrared spectroscopy[J]. Transactions of the Chinese Society of Agricultural Engineering,2010,26(2): 231-236. (in Chinese)

[17] 褚小立, 袁洪福, 陆婉珍. 近红外分析中光谱预处理及波长选择方法进展与应用[J]. 化学进展, 2004, 16(4): 528-542.

CHU Xiaoli, YUAN Hongfu, LU Wanzhen. Progress and application of spectral data pretreatment and wavelength selection methods in NIR analytical technique[J]. Progress in Chemistry, 2004,16(4): 528-542. (in Chinese)

[18] BAO Y,LIU F,KONG W,et al.Measurement of soluble solid contents and pH of white vinegars using VIS/NIR spectroscopy and least squares support vector machine[J].Food and Bioprocess Technology,2013,7(1):54-61.DOI:10.1007/s11947-013-1065-0.

[19] 颜辉, 陈斌, 朱文静. 基于近红外光谱分析法的奶粉品质快速检测[J]. 农业机械学报, 2009,40(7): 149-152,137.

YAN Hui, CHEN Bin, ZHU Wenjing. Quick determination method of milk powder quality by near-infrared spectroscopy[J]. Transactions of the Chinese Society for Agricultural Machinery,2009,40(7): 149-152,137. (in Chinese)

[20] TIAN Haiqing, YING Yibin, LU Huishan, et al. Measurement of soluble solids content in watermelon by Vis/NIR diffuse transmittance technique[J]. Journal of Zhejiang University(Science B:An International Biomedicine & Biotechnology Journal), 2007(2):105-110.DOI:10.1631/jzus.2007.B0105.

[21] LIN C A, AYVAZ H, RODRIGUEZ-SAONA L E. Application of portable and handheld infrared spectrometers for determination of sucrose levels in infant cereals[J]. Food Analytical Methods, 2013, 7(7): 1407-1414. DOI:10.1007/s12161-013-9763-9.

[22] 糜林. 无花果分级标准及流通技术[J]. 农家致富, 2003 (18):25.

MI Lin. Fig classification standard and circulation technology[J]. Farmers to Get Rich, 2003(18): 25.(in Chinese)

猜你喜欢
波长校正宽度
杯中“日出”
劉光第《南旋記》校正
基于MR衰减校正出现的PET/MR常见伪影类型
在Lightroom中校正镜头与透视畸变
机内校正
基于频域分析方法的轨道高低不平顺敏感波长的研究
日本研发出可完全覆盖可见光波长的LED光源
红细胞分布宽度与血栓的关系
RP—HPLC波长切换法同时测定坤泰胶囊中6个成分的含量
孩子成长中,对宽度的追求更重要