王 斌,薛建新,张淑娟
(山西农业大学工学院,山西太谷030801)
壶瓶枣是山西十大名枣之一,以其果大、皮薄、肉厚、味美和极具滋补功能而享誉神州,且有极其丰富的营养价值和药用价值[1]。目前,壶瓶枣的分级还是主要采用传统方式,即依据果皮颜色、果实大小、形状等进行分级、包装,存在误差大、果实的品质口感得不到保证、有效利用率低等问题。
近红外光谱分析技术具有自身独特的优点:分析速度快,可以同时测定多种组分、实现非破坏性和无污染性的测试,费用较低,应用范围较广等。近红外光谱分析已经被广泛应用于农产品品质、品种的检测以及农业、生物化学和工业流程检测等方面,并取得了较大的进展[2]。然而,近红外光谱分析技术是一种间接分析方法,其依赖于复杂的化学计量学校准算法的间接定性定量分析技术,分析过程中受到很多因素(来自样品、仪器、操作)的影响[3]。样品扫描时样品状态、仪器的稳定性和分辨率、扫描的次数和方式等扫描条件都会影响近红外数学模型的预测能力。张璐等[4]在应用近红外漫反射光谱技术研究了研磨粒度、样品送进程度和平行扫描次数等因素对预测豆粕中常规化学成分含量的影响,王一兵等[5]、谢丽娟等[6]分别研究了光谱分辨率对乙酰氨基苯酚和杨梅汁有效酸度的定量分析模型的影响,王竹云等[7]分析了不同扫描次数对油菜种子含油量测定值及其生活力的影响,赵巧丽等[8]分析了基于冠层反射光谱的玉米LAI和地上干物质量估测研究,高玉龙等[9]研究了新鲜烟叶不同处理对质体色素含量的影响,赵丽丽等[10]以小麦粉为样品,研究了在傅里叶变换近红外光谱仪上扫描条件(包括He-Ne激光频率、分辨率、样品粒度)对近红外数学模型预测精度的影响,李军会等[11-12]研究了样品装样、样品状态和测试条件等因素对近红外检测结果的影响。但不同扫描次数、扫描位置对鲜枣近红外光谱稳定性和模型建立的影响研究尚未见报道。
本试验以壶瓶枣为研究对象,在其他条件不变的情况下,研究不同扫描次数、不同位置对模型的建立及预测能力的影响,旨在为建立实际模型时选择最佳的测量条件提供可靠的依据。
试验设备由微机、光谱仪、卤光灯、校正白板等组成,其中,光谱仪为美国ASD(Analytical Spectral Device)公司生产的Field Spec 3,光谱数据间隔为1 nm,采样范围为350~2 500 nm,探头视场角为10°,光源采用14.5 V卤素灯。试验采用漫反射方式进行样品光谱采集。样品硬度真实值测定采用TMS-PRO型食品物性分析仪(美国FTC公司)。
供试样品产自太谷县有机栽培枣园,无外部缺陷,外表全部呈红色、形状均一。采摘当天运至实验室,选取无伤病及大小、颜色和成熟度基本一致的120个代表性鲜枣,并置于(0±0.5)℃冷库中贮藏,试验前取出于常温放置1~2 h使之恢复常温。将样品按照1~120的顺序依次编号,供光谱的采集、硬度的测定。
1.3.1 近红外光谱的测定 对每一个样品在其赤道上按120°的间隔选取3个部位采集光谱,各扫描1,3,6次,以减少随机误差。试验样品全光谱采集。在近红外光谱分析技术的过程中,光谱采集方式的准确性、可靠性是影响光谱所建模型性能好坏的主要因素。本研究结合Field Spec 3型近红外光谱仪的光谱采集特点,探究了样品在不同扫描次数下不同位置的光谱模型的稳定性及所建硬度预测模型的精度。不同扫描方式的设定列于表1。
表1 不同扫描次数和扫描位置的设定
1.3.2 样品硬度的测定 采用TMS-PRO型食品物性分析仪(美国FTC公司),用直径为2 mm的圆平头,测试模式为压缩测试力,操作为返回开始;测前速率为5 mm/s,测试速率和测后速率均为2 mm/s;测试距离为15 mm,触发力为5 g。探头插入点与光谱采集位点相对应,每个样品测定3次。硬度的统计结果列于表2。
表2 校正样品和预测样品硬度统计分析结果
1.3.3 近红外光谱数据预处理 为了消除高频随机噪声、基线漂移、样本不均匀、光散射等对光谱质量的影响,在此采用9点平滑法(moveaverage)进行光谱预处理,能很好滤除各种因素产生的高频噪声;随后再进行标准正态变量校正(SNV)处理;然后利用偏最小二乘法(PLS)建立壶瓶枣硬度的预测模型,并进行预测[13]。偏最小二乘法是一种新型的多元统计数据分析方法,它是多因变量对多自变量的回归建模方法,在普通多元回归无法解决的问题上能达到良好的效果,在建模方面有很明显的优越性。
数据采用ASD View Spec Pro V5.0,Unscramble V9.8和SPSSStatistics17.0软件进行分析。
从图1可以看出,壶瓶枣样品的光谱图都在波长为875,1 090,1 625,1 820,2 100,2 200 nm处出现吸收峰。壶瓶枣在光谱图中的吸收峰主要是由于水的吸收所导致的。
以90个壶瓶枣样品为校正集,30个壶瓶枣样品为预测集,对样品的不同位置进行不同次数的扫描,从而得到样品的全光谱数据,对其光谱数据进行预处理。采用PLS方法建立了9个硬度值预测模型。理论上好的检测模型具有的RMSEC值和RMSEP值应该越小越好,且二者的值应非常接近,且有较高的决定系数R2值,这样才能说明该模型稳定性好。关于样品3个位置的1,3,6次所建预测模型的决定系数、校正集均方根误差和预测集均方根误差列于表3。
表3 不同扫描次数扫描不同位置的样品模型参数
由表3可以得出,当对样品的位置一进行1,3,6次扫描时,扫描1次的决定系数较高,但RMSEC值和RMSEP值相差较大;扫描3次的决定系数相对较低,但RMSEC值和RMSEP值较接近,表明扫描3次的模型较稳定。对样品的位置二进行1,3,6次扫描时,扫描3次的决定系数较高,但RMSEC值和RMSEP值相差较大;扫描6次的决定系数相对较低,但RMSEC值和RMSEP值较接近,表明扫描6次的模型较稳定。对样品的位置三进行1,3,6次扫描时,扫描1次的决定系数较高,且RMSEC值和RMSEP值较接近,表明扫描1次的模型较稳定。
当对样品的3个位置进行1次扫描时,位置一的决定系数较高,但RMSEC值和RMSEP值相差较大;位置二的决定系数相对较低,但RMSEC值和RMSEP值较接近,表明位置二的模型稳定。当对样品的3个位置进行3次扫描时,位置二的决定系数较高,但RMSEC值和RMSEP值相差较大;位置一的决定系数相对较低,但RMSEC值和RMSEP值较接近,表明位置一的模型稳定。当对样品的3个位置进行6次扫描时,位置二的决定系数较高,但RMSEC值和RMSEP值相差较大;位置三的决定系数相对较低,但RMSEC值和RMSEP值较接近,表明位置三的模型稳定。其可作为以后检测所选择参数的参考。
校正集具有较高的决定系数和较低的标准均方根误差,对一个模型的可靠性是十分必要的,但一个模型的优劣不仅取决于此,还要求有较高的预测能力,预测均方根误差RMSEP值也应较低,在实际应用中后者往往尤为重要。本试验应用所建模型对30个已知硬度值的样品进行预测,分析模型预测能力的差异性,利用SPSS数据处理软件对30个样品的预测值进行方差分析,其结果列于表4。
表4 不同位置扫描1,3,6 次模型预测能力方差分析
由表4可知,不同位置扫描1,3次模型预测能力差异不显著(P>0.05),显著性检验概率分别为0.213,0.206,不必再进行Tukey检验的比较;不同位置扫描6次模型预测能力差异显著(P<0.05),显著性检验概率为0.037,需进一步进行均值多重比较(表5)。
由表5可知,模型预测能力按位置的不同从大到小依次排序为位置一、位置二、位置三;0.05水平上Tukey检验的比较显示,3个位置的均值两两差异均显著。
表5 Tukey 检验结果
本试验研究了扫描次数对鲜枣近红外光谱和模型精度的影响,结果表明,不同扫描次数下不同位置的扫描光谱所建立的硬度定标模型,其决定系数均达到0.8以上,校正均方根误差都在0.65以下;对分别建立的1,3,6次不同位置硬度模型的预测结果进行方差分析,结果表明,不同位置进行1,3次所建的模型为较佳扫描方式,不同位置进行6次扫描时模型间有显著差异性,显著性检验概率为0.037。在采集光谱建立模型时,应考虑综合因素选择合适的扫描次数。
在实际的测定中,本试验所考虑的影响因素还不够全面,其对样品所采集的光谱和近红外模型的建立都有影响。下一步试验将围绕几点进行更加完善的研究分析:对样品的扫描次数将增加2,4,5次,进而对样品所采集的光谱稳定性进行更加全面的分析;研究多测点扫描样品的光谱对可溶性固形物含量(SSC)、有效酸度(pH值)模型建立的影响。
[1]樊军,吕磊,尚宏伟.大枣的研究与开发进展[J].食品科学,2003,43(4):161-163.
[2]Krivoshiev G P,Chalucova R P,Moukarev M I.A Possibility for elimination of theinterferenceform the peel in non linn on destructive determination of the internal quality of fruit and vegetables by VIS/NIR spectroscopy[J].Postharvest Biology and Technology,2000,33(2):344-353.
[3]Peirs A,Schenk A,Nicolai B M.Effect of natural variability among apples on the accuracy of VIS-NIR calibration models for optimal harvest date predictions[J].Postharvest Biology and Technology,2005,35:1-13.
[4]张璐,郝永忱,刘桂宾,等.近红外光谱法测定豆粕中常规化学成分的研究[J].检验检疫科学,2003,13(1):25.
[5]王一兵,王红宇,翟宏菊,等.近红外光谱分辨率对定量分析的影响[J].分析化学,2006,34(5):699.
[6]谢丽娟,刘东红,张宇环,等.分辨率对近红外光谱和定量分析的影响研究[J].光谱学与光谱分析,2007,27(8):1489.
[7]王竹云,杨翠玲.油菜种子含油量NMR法测定的条件优化[J].西部粮油科技,2001,26(2):46.
[8]赵巧丽,郑国清,段韶芬,等.基于冠层反射光谱的玉米LAI和地上干物重估测研究[J].华北农学报,2008,23(1):219-222.
[9]高玉龙,吴兴富,宋春满,等.新鲜烟叶不同处理对质体色素含量的影响[J].内蒙古农业科技,2008(1):25-27.
[10]赵丽丽,赵龙莲,李军会,等.傅里叶变换近红外光谱仪扫描条件对数学模型预测精度的影响 [J].光谱学与光谱分析,2004,24(1):41-44.
[11]李军会,秦西云,张文娟,等.样品装样、测试条件等因素对近红外检测结果的影响与分析误差源比较研究[J].光谱学与光谱分析,2007,27(9):1751.
[12]吴静珠,王一鸣,张小超,等.样品状态与装样条件对近红外光谱测定的影响研究[J].现代科学仪器,2006(2):69.
[13] 张淑娟,张海红,赵艳茹,等.鲜枣可溶性固形物可见/近红外光谱检测建模方法比较 [J].农业机械学报,2012,43(3):108-112.