基于可见/近红外透射光谱的番茄红素含量无损检测方法研究

2018-09-17 09:43:40李永玉彭彦昆孙宏伟
分析化学 2018年9期
关键词:番茄红素波长预处理

王 凡 李永玉 彭彦昆 孙宏伟 李 龙

(中国农业大学工学院,北京100083)

1 引言

番茄红素(Lycopene)是一种类胡萝卜素,它具有较强的抗氧化性[1],对人类内皮细胞的凋亡有抑制作用,并被证实可以降低癌症和心血管疾病的患病率[2]。番茄红素广泛存在于自然界中,在番茄果实中的含量最为丰富,是天然番茄红素的主要来源。番茄红素是番茄最重要的营养品质指标之一[3,4],因此生鲜番茄中番茄红素的快速无损检测对鲜食番茄以及加工番茄的品质分级均有着重要的意义。

传统番茄红素的检测方法主要有分光光度计法和高效液相色谱法[5,6],这两种方法均需要对样品进行前处理,对样品有破坏性且耗时较长,难以满足现场实时检测及分级需求。近红外光谱技术是一种快速、无损、可在线检测的技术,操作简单、稳定性好,现已成为果蔬品质快速无损检测的有效方法[7~11]。番茄红素是一种不饱和烯烃化合物,由11个不饱和共轭双键和2个非共轭不饱和双键组成的长链脂肪烃,而650~950 nm范围内包含CH的三级和四级倍频[12,13],因此,可见/近红外光谱可以反映番茄中番茄红素的含量。目前,基于可见近红外光谱的果蔬品质的快速无损检测研究报告很多,也有一些有关番茄红素的相关研究报道。如利用可见/近红外漫反射光谱对番茄中番茄红素含量进行定量检测[14~16],也有针对生鲜番茄总糖、总酸、硬度等品质进行无损检测研究[17]的报道,但此前的研究方法并不能直接应用于预测番茄红素含量,首先是因为相比于总糖、总酸这类品质,番茄红素在番茄中含量较低,检测难度较高,使用简单的建模分析难以达到检测精度要求;其次,之前的研究为单点漫透射检测,但番茄红素的分布常不均匀,当更换检测位置时,检测结果差异较大,难以反映样品整体番茄红素的含量。现阶段的商化漫透射近红外检测装置,大部分以环形光导为光源,探头位于光源中心,仅能获取部分的样品信息。

针对番茄内外部结构特征,本研究选择透射检测方式,通过获取生鲜番茄整体透射光谱信息,对番茄红素含量进行无损伤快速检测研究,旨在建立一种可靠的番茄红素含量快速无损检测方法,为番茄分级加工提供技术支撑。

2 实验部分

2.1 番茄样品

番茄样品采自北京市延庆县某蔬菜种植基地,由于番茄红素主要影响番茄的颜色,为扩大样品区间,摘取不同成熟度的西红柿:红熟前期番茄18个,红熟中期番茄22个,红熟后期番茄24个[18],共78个中果(100~149 g),代表性样品如图1所示。所有番茄采摘后运回实验室,置于温度为6℃、相对湿度为20%的环境下贮藏24 h后进行实验。

图1 红熟前期番茄(A)、红熟中期番茄(B)、红熟后期番茄(C)的图片和(D)红熟中期番茄剖面图

Fig.1 Illustration of turning tomato(A),light red tomato(B),red tomato(C)and section of light red tomato(D)

2.2 可见/近红外透射光谱系统的搭建与光谱采集

为采集完整番茄的透射光谱,搭建了番茄可见/近红外无损检测系统,包括光源、光谱仪、光纤、电脑和电源等,如图2所示,光源系统主要分为3部分:环形光源、灯架内壁和环形胶垫。环形光源由8个 5 W的卤素灯珠(1206-U,Welch Allyn,America)组成。灯架内壁可以将番茄果梗与检测光源分隔,防止果梗部分对检测的影响。环形胶垫安装在灯架外壁,保护番茄样品表面不受热损伤的同时避免光源的外漏。由于透射光谱信号较弱,因此在光纤前端安装了具有聚焦功能的聚焦透镜,起到对信号的放大作用,同时扩大了信号接收面积,从而获得番茄的整体信息。因短波近红外部分(700~1100 nm)比长波近红外(1100~2526nm)在水果内部有更深的穿透深度[19],光谱仪选用美国海洋光学公司的STS微型光谱仪(STS-NIR,Ocean Optics,America),它的波段响应范围为650~1100 nm,在此区间内包含CH键的三倍频和四倍频吸收的信息,而番茄红素是由11个不饱和共轭双键和2个非共轭不饱和双键组成的长链脂肪烃,因此该波段可以用于预测番茄红素的含量。

采集番茄透射光谱时,将番茄果梗向下放置于环形胶垫上,调整光纤的高度,使聚焦透镜与番茄表面接触,设置积分时间为100 ms,平均次数为5次,光谱仪的设置由海洋光学的Spectrasuite软件完成。为了消除光源波动带来的干扰,检测时使用5 mm厚的聚四氟乙烯板作为光学参考标准。

2.3 番茄红素理化标准值的检测

每个番茄样品采集完光谱信息后,基于分光光度法方法[20]对样品的番茄红素标准理化值进行测定。首先称取番茄红素(YY91604-20 mg,上海源叶生物科技有限公司),用少量无水乙醇溶解稀释,配制相当于2、5、10、15、20、25和30 mg/kg的标准溶液,然后依次测得其在485 nm下的吸光度,以测得的浓度作为纵坐标,番茄红素浓度作为横坐标,绘制标准曲线。

图2 可见/近红外透射光谱检测系统示意图(A)和光源结构图(B)

Fig.2 Diagramofvisible/nearinfrareddiffuse transmission spectrum detection system(A)and Focus lens(B)

将番茄在高速组织离心机中搅拌60 s,经甲醇脱水并去除其中的黄色素后,用甲苯提取番茄红素,最后用分光光度法测量提取液的吸光度值,根据标准曲线测得番茄红素的含量。经测量,本次实验中,番茄红素含量范围为6.1~24.0 mg/kg,平均值为14.1 mg/kg。

3 结果与讨论

3.1 样品理化值分析

在建立模型过程中,校正集的选取十分重要,常用的划分方法有随机法(Random stone,RS)、KS法(Kennard-stone)[21,22]、SPXY法(Sample set partitioning based on joint x-y distances)[23]等。RS法随机性较大,所选取出的样品缺乏代表。KS法根据光谱差异划分,忽略了化学值的重要性。SPXY算法综合考虑光谱值和化学值对数据进行划分,因此该方法划分出的训练集更具有代表性,泛化能力更强。本研究选择SPXY算法将85个样品分为校正集和验证集,各品质参数的统计信息如表1所示。

3.2 光谱与光谱预处理

番茄红素在番茄中主要以红色素的形式存在,随着成熟度的提高,番茄表皮由绿色变为红色,同时其内部化学成分与结构也发生一定变化,为了对比不同番茄红素含量的番茄透过率光谱曲线的差异,按照番茄成熟度分为变色期、浅红色和红色3个等级,3种不同成熟度番茄的平均吸光度光谱如图3所示。3种成熟度的番茄光谱趋势较为一致,受678 nm处的叶绿素吸收峰影响,光谱在650~710 nm区间内吸光度逐渐下降,在710~820 nm区间内呈稳定趋势,在760 nm处有明显的OH拉伸第三泛音引起的吸收带。对比3种成熟度的光谱可知,番茄成熟度越高,吸光度越低,这是由于成熟的过程中果胶不断降解,水分含量逐渐增多导致的[24]。

表1校正集和验证集中各品质参考值Table 1Reference measurements of quality attributes in calibration and verification sets

图3 番茄不同成熟度吸光度光谱对比:a.红熟前期番茄光谱;b.红熟中期番茄光谱;c.红熟后期番茄光谱

Fig.3 Comparison of absorbance spectra of different ripeness tomatoes.a.Turning phase tomato;b.Light red phase tomato;c.Red phase tomato

为减少番茄透射光谱中非目标信息的干扰,提高光谱与待测组分的相关性,对原始光谱进行了预处理,以优化或消除其它因素对图谱信息的影响[25~27]。本研究利用MATLAB分析软件,用去趋势(Detrend,DT)、标准正态变量变换(Standard normal variable transformation,SNV)、多元散射校正(Muliplication scattering correction,MSC)、归一化(Normalize,NOR)、一阶导数(First derivative,FD)对原始光谱进行了预处理,处理结果如图4所示。其中,DT、SNV、MSC原理为通过不同参考标准,对样品进行校正,从而将光散射信号与化学吸收信息进行分离,NOR主要实现数据缩放功能,使分布复杂的数据限制在一定范围内,FD通过对光谱的导数处理,能有效消除基线漂移,但同时会使光谱的信噪比降低。

3.3 番茄红素预测模型的建立

本研究选择偏最小二乘(Partial least squares,PLS)作为建模方法,对预处理后的光谱分别建立PLS模型,利用校正集相关系数(Correlation coefficient of calibration,Rc)、校正集均方根误差(Root mean square error of calibration,RMSEC)、验证集相关系数(Correlation coefficient of validation,Rv)、验证集均方根误差(Root mean square error of validation,RMSEV)、交叉验证均方根误差(Root mean square error of cross validation,RMSECV)判定模型的精度和稳定性。

图4 原始光谱(A)、去趋势(B)、标准正态变量变换(C)、多元散射校正(D)、归一化(E)、一阶导数(F)、去趋势+一阶导数(G)、去趋势+标准正态变量变换(H)、标准正态变量变换+一阶导数(I)后的番茄吸光度光谱

Fig.4 Tomato raw absorbance spectra(A)and spectra after detrend(B),standard normal variable transformation(C),muliplication scattering correction(D),normalized(E),first derivative(FD(F),Detrend(DT)+FD(G),DT+standard normal variable transformation(SNV)(H)and SNV+FD(I)

PLS模型主因子数是模型的重要参数,因子数过低时模型精度不足,因子数过高易出现过拟合的现象,因此本研究利用RMSECV选择最优因子数,不同预处理方法的RMSECV变化如图5所示,随着主因子数的增加,RMSECV呈现先下降后保持相对稳定的趋势,当获得较小RMSECV同时RMSEV与RMSECV无明显大小差异时,判定为最优主因子数。最优主因子数下的建模结果如表2所示。与原始光谱相比,经不同预处理后的PLS模型效果均有提高,其中SNV预处理的模型效果最好,Rc和Rv别为0.9771和0.9504,RMSEC和RMSEV分别为0.9711和1.0496 mg/kg。

3.4 变量波长的筛选

在全光谱建模中,虽然番茄红素与光谱表现出较强的相关性,但光谱共有942个变量,其中包含了大量无关信息和共线性变量,这些无意义的波长不但会增加模型的复杂度,而且会对模型造成干扰降低模型的精度[28]。变量选择是近红外光谱分析中的一个重要部分,本研究选择无信息变量消除法(Uninformative variable elimination,UVE)[29,30]、连续投影算法(Successive projections algorithm,SPA)[31]、竞争性自适应重加权算法(Competitive adaptive reweighted sampling,CARS)[32,33]对全光谱进行变量优选。

表2不同预处理方法的校正结果Table 2Results of calibration and validation with different pretreatments

Note:Rc:correlation coefficient of calibration;Rv:correlation coefficient of validation;RMSEC:Root mean square error of calibration; RMSEV:Root mean square error of validation.

UVE是一种基于回归系数建立的变量选取方法。首先人为添加一个随机噪声矩阵,以噪声值作为阈值,剔除不提供信息的变量,减少模型中包含的变量数,降低模型的复杂性。图6显示了每个光谱波长与250个叠加噪声相比的稳定性,其中稳定性值越大的变量对模型的贡献率越高,而稳定性值低于阈值的变量则被剔除。由于添加的噪声具有随机性,因此连续执行30次,并最终获得了294个波长变量。

图5 不同预处理交叉验证均方根误差变化

Fig.5 Variation of root mean square error of cross validation(RMSECV)with different pretreatments

MSC:muliplication scattering correction;NOR:normalize.

图6 UVE-PLS变量筛选方法的光谱稳定性分布

Fig.6 Stability of spectral variables by uninformative variable elimination-partial least square(UVE-PLS) method

SPA是一种向前变量筛选方法,通过选定一个初始波长,每一次迭代时加入新的波长,直至达到指定的波长数量,通过这种投影分析,从光谱矩阵提取有效信息,并使光谱变量共线性达到最小。图7显示了SPA-PLS方法用不同数量变量进行交叉验证的RMSECV趋势结果。随着选定波长数量的增加,PLS模型的RMSECV值趋于变小,然后大致不变。当选择变量为33个时,RMSECV最小,为0.9748 mg/kg。

CARS方法是另一种变量选择方法,该算法模仿达尔文进化理论中“适者生存”的原则,对不适应模型的波长进行淘汰。图8A为波长变量筛选过程中被选中波长变量数量的变化趋势,图8B为波长变量筛选过程中RMSECV的变化趋势;图8C为波长变量筛选过程中各波长变量回归系数的变化趋势。由图8可知,在1~22次采样过程中,与番茄红素无关的变量被剔除,RMSECV的值不断降低;随着采样次数增加,RMSECV逐渐上升,这是因为在变量筛选的过程中剔除掉了与番茄红素相关的变量。根据RMSECV最小原则,最终选择的采样次数为22次,波长变量数为67个。以上3种不同的变量选择方法均能够起到对模型的优化作用。其中UVE侧重于对不稳定变量的删除,在避免过度拟合的同时提高模型的精度,但稳定变量不等于有用变量,经过UVE后的变量数过多,仍然需要进一步筛选。而SPA和CARS均侧重于有用信息的保留,虽然最终选择的变量数较少,但并不能避免大量不稳定变量对筛选过程的干扰,因此,将UVE选择后的变量分别进行SPA和CARS处理(处理过程同上),并分别得到了35和67个波长。将5种方法得到的波长输入PLS,建模结果如表3所示。相比于全光谱建模,5种变量选择后的模型精度都有了一定的提升,其中,UVE-SPA保留了最少的变量数(33个),但相应的模型的精度最差,UVE-CARS保留了67个变量数,其模型精度最好,RMSEV为0.7680 mg/kg。

图7 SPA-PLS变量筛选方法的RMSECV趋势

Fig.7 RMSECV tendency of variable selection by successive projections algorithm(SPA)-PLS method

图8 CARS-PLS变量筛选图波长变量数量的变化趋势(A)、RMSECV的变化趋势(B)和回归系数的变化趋势(C)

Fig.8 Plot of variable selection by competitive adaptive reweighted sampling(CARS)-PLS:(A)trends in the numberofwavelengthvariables,(B)changesin RMSECV and(C)trends in the regression coefficients

表3不同预处理方法的校正结果Table 3Results of calibration and validation by variable selection methods

3.5 番茄红素预测模型验证

选择未参与建模的25个样品作为预测集,通过PLS模型和UVE-CARS-PLS模型对25个样品进行了番茄红素含量的预测,并根据分光光度法测定了其番茄红素含量,预测值与测量值散点图如图9所示。UVE-CARS-PLS模型的预测集相关系数为0.9812,预测集均方根误差为0.7071 mg/kg,平均相对误差为4.3%。而作为比较的PLS模型的预测集相关系数为0.951,均方根误差为1.0610,平均相对误差6.0%。相比于简单PLS模型,UVE-CARS可以很大程度地简化模型,提高模型精度,降低检测的误差限。

图9 UVE-CARS-PLS和PLS模型的番茄红素预测集散点图

Fig.9 Scattered plot of predicted value versus measured value of lycopene by UVE-CARS-PLS and PLS

4 结论

基于自行搭建的番茄可见/近红外透射光谱检测系统,采集了完整番茄的透射光谱并进行了分析。在85个样本的PLS模型中,SNV预处理结合UVE-CARS筛选特征波长获得了较好的预测精度,其校正集和验证集相关系数分别为0.9830和0.9741,均方根误差分别为0.6919 mg/kg和0.7680 mg/kg。在25个样本的独立验证中,预测值和实测值相关系数为0.9812,预测集均方根误差为0.7071 mg/kg,平均相对误差为4.3%。结果表明,可见/近红外光谱与番茄红素之间相关性较高,可以通过自行搭建的番茄可见/近红外透射检测系统实现对番茄红素含量的预测,且通过特征波长提取能够有效的简化模型并提高预测精度。相比于传统检测方法,本方法耗时短,无需对番茄进行破碎处理,因此也避免了传统试验中易出现的番茄红素氧化引起的误差,但其预测模型是建立在传统检测方法的基础上,因此精度略低于化学方法,因此研究仍有提高的空间。

猜你喜欢
番茄红素波长预处理
HPLC-PDA双波长法同时测定四季草片中没食子酸和槲皮苷的含量
特产研究(2022年6期)2023-01-17 05:06:16
番茄红素生物活性及提取研究进展
基于预处理MUSIC算法的分布式阵列DOA估计
制导与引信(2017年3期)2017-11-02 05:16:56
双波长激光治疗慢性牙周炎的疗效观察
加工番茄番茄红素与其他性状相关性研究
日本研发出可完全覆盖可见光波长的LED光源
中国照明(2016年4期)2016-05-17 06:16:15
浅谈PLC在预处理生产线自动化改造中的应用
工业设计(2016年11期)2016-04-16 02:50:19
络合萃取法预处理H酸废水
环境科技(2015年6期)2015-11-08 11:14:26
便携式多用途光波波长测量仪
物理实验(2015年9期)2015-02-28 17:36:46
基于自适应预处理的改进CPF-GMRES算法