彭 丹,李林青,刘亚丽,毕艳兰,杨国龙
河南工业大学粮油食品学院,河南 郑州 450001
食用植物油是膳食中重要组成部分,为人体提供能量和必需脂肪酸,也是脂溶性维生素的重要载体。然而,油脂在加工、储运过程中易发生氧化酸败,使其风味、色泽等劣变,造成品质下降,产生的氧化产物会危害人体健康[1-2],如促进人体衰老、肿瘤和心脑血管疾病等的发生。因此,对油脂的品质评价和氧化程度的监测十分重要。
过氧化值是衡量油脂品质和新鲜度的重要指标之一,也是评价油脂氧化程度的一个安全指标。目前,过氧化值的测量多采用国标中的滴定法(碘量法),具有检测精度高、技术成熟等优点,但费时费力,消耗大量有机溶剂,结果易受外界因素的影响,无法对油脂进行实时检测。近年来,有学者运用中红外光谱法[3]、紫外法[4]、电化学方法[5]等对油脂过氧化值进行测量,然而这些方法还不够成熟。近红外光谱技术是一种快速、无损、可在线分析的绿色技术,已广泛应用于粮油、食品等领域,国内外也有学者采用近红外光谱对油脂氧化程度进行分析。Krzysztof等[6]采用近红外光谱结合多元数据分析分别建立橄榄油、菜籽油和葵花籽油的过氧化值模型,其相关系数均在0.97以上。Murean等[7]应用近红外光谱检测向日葵果仁酱中油脂的过氧化值。蒋琦等[8]建立了山茶籽油过氧化值定量模型,其预测结果小于化学分析值所允许的误差范围。这些研究表明近红外光谱可以实现油脂及含油食品氧化情况的快速检测,但大多研究仅对单一种类和等级的油脂进行分析。近红外光谱作为一种间接分析技术,必须通过校正模型来实现定性或定量分析,构建一个稳定可靠的校正模型是一项复杂的工作,需要耗费大量时间和人力,若能建立通用性模型,则能节约资源,扩大其在油脂加工、储运中的应用。现有的近红外通用模型主要针对药品的研究,也有学者尝试构建三种木本油料植物种子含油率的近红外光谱通用模型[9],但在油脂品质的分析中却未见相关报道。本研究以大豆油(一级、三级)和菜籽油(一级、三级和四级)为研究对象,考察通用模型的最佳检测条件,研究不同植物油以及不同等级同种植物油通用模型的可行性,以期为食用油脂品质的快速检测及其食品安全控制提供技术支持。
不同等级的大豆油(15种)、菜籽油(16种)分别购于生产厂家及超市。为了使油脂样品更具有代表性,采用烘箱加速氧化的方法,称取一定量的油样放置于60 ℃的烘箱中,共获得432个样本。采用Kennard-Stone算法选择2/3的样本为建模集,其余的1/3样本为预测集。油脂的过氧化值按照GB 5009.227—2016中的滴定法测定。其中,大豆油、菜籽油的过氧化值范围分别为1.00~13.44和0.58~13.63 mmol·kg-1。
采用FOSS公司的XDS 型近红外光谱仪,在780~2 500 nm波长范围内对样品的吸收光谱进行测试,检测器为硅和硫化铅,光源为卤钨灯,操作温度25 ℃,扫描次数32次,分辨率2 nm,每个样品重复测定3次,取平均光谱。
采用二维相关光谱寻找与过氧化物相关的敏感波段。以过氧化值浓度为外部微扰,进行二维相关同步谱和自相关谱分析,具体过程参考文献[10],利用Matlab R2018a软件计算。
采用间隔偏最小二乘法进行波段选择,运用正交信号校正(OSC)、标准正态变量变换(SNV)、二阶导数(SD)对原始光谱进行预处理,通过主成分回归(PCR)、偏最小二乘法(PLS)和支持向量机回归(SVR)建立过氧化值的校正模型,以决定系数(R2)、交互验证均方根误差(RMSECV)和预测均方根误差(RMSEP)为指标评价模型的性能,以上数据处理均采用CAMO公司的Unscrambler 10.4软件完成。
图1 两种植物油近红外光谱(a)及二维同步相关光谱立体图(b)Fig.1 (a) Near infrared spectra;(b) Two-dimensional synchronous correlation spectra
图1(b)为大豆油二维相关同步光谱的立体图,X轴、Y轴均为波长,Z轴为相对强度,反映光谱信号随外部扰动发生变化的协同程度,植物油中过氧化值浓度增大时,其光谱变化主要分布于1 700~2 200 nm区域,在对角线1 724,1 900和2 140 nm处出现了3个较强的自相关峰,说明这三个波长点所对应的基团随着油脂氧化进程的变化较明显,即为与过氧化值密切相关的光谱波长。同时,在对角线两侧(1 724,1 760),(1 704,2 140),(1 724,1 900)出现了3个正交叉峰及一些相对较弱的正交叉峰,表明这些波长下的光谱信号也与油脂中的过氧化物有关。同理,通过二维相关光谱对菜籽油的一维近红外光谱进行分析,所得结果与此相同。可见,近红外光谱能够鉴别植物油中过氧化值的变化情况。
2.2.1 波段
通用性模型建立需要大量光谱数据,这些数据中,除了待测成分外还有许多无用信息,而且相邻波段间也存在信息冗余,即使利用光谱预处理方法也很难完全消除,导致模型不稳定、准确性较差。故采用间隔偏最小二乘法进行波段选择,在波长780~2 200 nm范围内将油样光谱分割成10个区域,对未经预处理的样本数据建模,结果如图2所示。
由图可知,植物油的等级、种类对过氧化值的检测波段选择具有一定的影响;以过氧化值模型RMSECV平均值为标准,两种植物油同等级(一级或三级)低于标准值的波长区域相同,而对于同种油脂不同等级的波长区域却不完全相同,如一级菜籽油与三级、四级菜籽油的波长区域不同。这可能是因为一级油的精炼程度高,具有无味、色浅、烟点高等特点;而三、四级油脂间的组成更为相似,仅经过了简单脱胶、脱酸等过程,杂质的含量较高,同时保留相对较多的维生素E、胡萝卜素等物质。此外,一级、三级大豆油和一级菜籽油的最佳波段数均为9,而三级、四级菜籽油的最佳波段为10;与波段选择前相比,两种植物油最佳波段下模型的预测准确度平均提高了25%左右。结合两种植物油的RMSECV值(图2)和二维相关光谱[图1(b)],选择8,9和10三个波长区域,即1 700~2 200 nm范围作为建立过氧化值通用模型的波段。
图2 两种植物油不同波段模型的预测结果(a):大豆油;(b):菜籽油Fig.2 Prediction results of two vegetable oils in different bands(a):Soybean oil;(b):Rapeseed oil
2.2.2 预处理方法
为避免操作、仪器性能、样品物理特性变化等对光谱的干扰,采用不同预处理方法对光谱数据进行处理,在波长1 700~2 200 nm范围内建立两种植物油的PLS模型,结果如表1所示。
由表可知,通过SD处理后的模型效果最佳,与预处理前相比,大豆油、菜籽油模型的RMSEP分别降低了14.0%~26.9%和2.3%~49.9%,这是因为SD法能有效增强光谱差异性,消除基线和其他背景的干扰,提高其分辨率、灵敏度以及有效信息率;OSC法去除了与被测物质无关的信号,经OSC处理的一级油(大豆油和菜籽油)模型的R2分别升高了5.6%和3.8%,RMSEP分别降低了15.8%和31.3%;SNV主要是消除样品表面散射等的影响,使被掩蔽掉的某些光谱信息显示出来,对于四级菜籽油光谱的作用显著,模型的RMSEP不高于0.35。可见预处理方法能够提高过氧化值模型的准确性,本研究选择SD法作为通用模型的预处理方法。
表1 不同光谱预处理后PLS模型的预测结果Table 1 Prediction results of PLS models with different spectral pretreatment methods
2.2.3 建模方法
在最佳波段范围内,经SD处理后分别采用PCR,PLS和SVR建立两种植物油过氧化值的定量分析模型,结果如图3所示。PLS,PCR和SVR三种模型的平均预测准确性分别为0.304,0.639和0.499,除一级菜籽油PCR模型外,其他模型的R2均大于0.85,PLS的预测效果明显好于PCR和SVR,能够更准确预测油样的过氧化值。其原因可能是PLS模型将被测组分浓度信息引入到光谱矩阵的分解过程中,计算每一个主成分前都将光谱矩阵的得分与浓度矩阵的得分进行交换,使得光谱矩阵主成分与被测组分浓度关联[13];而PCR模型通过对光谱数据的分解来消除无用的噪声信息,在分解光谱矩阵时没有考虑到被测组分浓度的影响;SVR模型是一种非线性建模方法,其主要思想是将原问题通过非线性变换转化为高维空间的线性问题并求解,然而油样的过氧化值与光谱数据间具有较好的线性关系,采用SVR法不仅增加计算量,而且可能引起“维数灾难”,导致模型的预测效果不佳。综上,采用PLS法建立两种植物油的通用模型更为合适。
图3 不同建模方法预测结果的比较Fig.3 Comparison of prediction results of different modeling methods
建立四种过氧化值检测的通用模型,混合样本集分别为大豆油(一级+三级)、菜籽油(一级+三级+四级)、一级油(大豆油+菜籽油)、三级油(大豆油+菜籽油),结果如图4所示。
由图可知,一级油通用型模型的预测效果最佳,RMSEP,R2分别为0.412和0.920,与单一油脂(一级大豆油和一级菜籽油)模型结果相差不大;而三级油通用模型的预测精度较低,即RMSEP值大于1.5,R2低于0.7,这说明三级大豆油和三级菜籽油并不适合建立同一模型。对于同一种植物油,如大豆油的通用模型相比于一级、三级大豆油模型的准确性至少降低了82%,菜籽油通用模型的RMSEP增加了84%以上。这表明油脂等级对过氧化值通用模型建立有较大影响。综上,建立一级油脂(大豆油和菜籽油)的通用模型是可行的。但是,通用模型本身也具有一定的局限性,就是对原料或生产工艺变化相对较大的新产品难以得到理想的预测结果,需要用新产品及时对模型进行更新,同时扩展通用模型的性能。
图4 不同通用模型的预测结果Fig.4 Prediction results of different general models
不同种类、等级的植物油,生产工艺、油脂自身特性等方面的不同,造成其近红外光谱存在差异,建立能同时检测不同种类、等级植物油通用模型具有一定难度。以大豆油和菜籽油为研究对象,考察了通用模型的最佳建模条件,研究了大豆油、菜籽油、一级油、三级油四种通用模型的可行性。通过比较得到了通用模型的最佳波段、预处理方法和建模方法分别为1 700~2 200 nm、二阶导数和PLS法,四种通用模型中一级植物油(大豆油和菜籽油)的过氧化值通用模型预测结果最佳,与单一模型相比,预测准确度相差不大。此外,由于样品数量的局限,两种一级植物油的通用模型还需进一步更新和维护。