杜 馨,孙晓荣,刘翠玲,李敬琪,李睿雯
(北京工商大学 计算机与信息工程学院 食品安全大数据技术北京市重点实验室,北京 100048)
食用油是三分子脂肪与一分子甘油酸化成的甘油酯,许多食用油都含有不饱和脂肪酸,油脂中的过氧化物是油脂在加工、运输和储藏的过程中与空气中的氧发生氧化作用所得的产物,其具有高度的活性,能够迅速的反应,分解为醛、酮类和氧化物等物质,再加上外界的影响,如受到光、热、水、微生物以及油脂中些许杂质的影响,就会造成油脂酸败变质[1-3]。如果过期变质的食用油被人们长期食用,将会直接损害人体健康,如引发发育障碍、细胞功能衰竭、肾脏肿大、肠炎以及脂肪肝等疾病。通过对食用油过氧化值的检测,可以了解油脂酸败的程度,衡量食用油是否超过保质期限,是了解油脂的品质情况的重要指标[4]。
国家对油品安全的检测标准正在不断地完善,而对于食用油过氧化值的检测,虽然我国一直在不断加大对食用油的监管力度,但是控制效果并不理想,其中主要原因是食用油成分复杂,不易检测。长期以来,油品的质量检测主要依靠化学检测手段,传统的油品过氧化值检测方法是滴定法,虽精确度较高,但是过程繁琐,需要耗费大量的时间和人力,还需使用大量的有机溶剂。随着科学技术的革新和新检测方法的建立,有关食用油领域的质量检测方法也趋于多样化,传统的食用油检测方法被科学的、现代化的检测技术逐渐替代。目前较先进的油类检测技术主要包括:电导检测法、质谱检测法、薄层色谱检测技术、地磁场核磁共振检测法等方法[5-6]。但对于食用油过氧化值的检测,仍亟需一种更先进、更准确、更快速的无损检测方法。
拉曼光谱又称为“指纹光谱”,可以直接对样本进行无损定性定量分析,鉴定出物质的类型并确定其所含化学成分以及各组成成分的相对含量[7-8]。拉曼光谱检测技术的主要优点有快速准确、多组分可同时检测、无污染、便于推广[9-11]。因此采用拉曼光谱技术对食用油过氧化值进行建模分析的快速检测,探索其可行性和准确性具有重大意义。
本次实验样本采用了由北京市粮食科学研究院提供的包括大豆油、花生油、玉米油、菜籽油、葵花籽油、芝麻香油等不同批次、不同氧化程度的84种油品样本,食用油样本经北京市粮食科学研究院置于老化箱中进行老化处理,并提供氧化时间及过氧化值真实值,油品置于老化箱老化1h相当于自然环境放置18d左右。食用油样本信息见表1。
表1 食用油样本信息Table 1 Information of edible oil sample
Thermo Fisher DXR型显微拉曼成像光谱:美国赛默飞世尔科技公司;光谱采集配套软件:OMNIC软件。
将少量样本倒在液体槽内置于光谱仪载玻片上,在显微拉曼光谱仪物镜下进行扫描,样本温度为室温,通过调节OMNIC软件设置实验参数,参数设置见表2。
表2 仪器参数设置Table 2 Parameter setting of instrument
调节拉曼光谱仪粗调转钮使光谱仪物镜聚焦于样本,观察屏幕成像,运用OMNIC软件工作台观察光谱图峰值,并进行细调,待光谱稳定且噪声较小时进行最终的扫描,最终得到84个样本的拉曼光谱图。本研究算法类型最终采用了偏最小二乘回归法(partial least squares regression,PLS),并采用“一阶导数+SNV”法对光谱进行预处理。
1.3.1 偏最小二乘回归法
偏最小二乘回归法是一种新型多元统计数据的分析方法,它有机地结合了认识性的方法和模型式的方法,在这一个算法下,可以同时实现回归建模、数据结构简化以及两组变量之间的相关性分析,因而多用于研究多个因变量关于多个自变量的建模方法,计算光谱数据X及目标分析物性质Y之间的最大方差,在对光谱和数据矩阵解析的过程中,剖析数据和目标分析物的性质之间的关系。尤其当各个变量呈现高度线性相关时,偏最小二乘回归法可以解决以往普通多元回归无法解决的问题[12-14]。
其评价指标可选择相关系数R来表示,通常也用校正模型的决定系数R2来表示,以及用校正均方根误差(root mean square error of calibration,RMSEC)和预测均方根误差(root mean square error of prediction,RMSEP)来表示模型的预测能力。当RMSEC越小,R2越趋近于1时,模型的建模效果越好[15-17]。
1.3.2 光谱预处理方法
标准正态变量变换(standard normal variate transformation,SNV)主要是用以消除固体颗粒大小、表面散射以及光程变化对光谱的影响。SNV算法主要是基于光谱阵的行对一条光谱进行处理,便于进一步研究[18]。
一阶导数(firstderivative)和二阶导数(secondderivative)是光谱分析中非常常见的预处理方式。导数光谱可以很好的消除基线的平移和漂移以及其他背景的干扰,可以有效地提高分辨率和灵敏度,并且能分辨出重叠峰,增强样本光谱特征。通常,采取直接差分法或S-G卷积法对光谱求导。对于求导法,选择差分宽度是非常重要的,若差分宽度过小,则噪声就会大,进而影响建模的预测能力;若差分宽度过大,就会出现平滑过度,导致很多细节内容信息丢失[19-20]。
食用油的拉曼光谱谱图信息非常丰富,对于食用油拉曼光谱图峰值信息如图1所示。拉曼光谱可以从分子振动的水平上体现物质的分子结构,谱图中有几处明显的主要特征峰,对其所对应的分子结构官能团进行分析。拉曼位移为2 850 cm-1左右的谱带主要体现对称的次甲基(-CH2)伸缩;拉曼位移为1 656 cm-1左右处的特征峰对应不饱和双键的伸缩振动峰,它体现了不饱和烯烃键(C=C)的含量;拉曼位移为1 439 cm-1处的特征峰对应于烃基碳氢键(C-H)剪式振动峰;拉曼位移1 301cm-1处的特征峰对应于烃基的变形振动峰,同时1 260 cm-1处的特征峰反映了不饱和烯烃键所在碳原子碳氢键(=C-H)[21-22]。
图1 食用油样本拉曼光谱峰值信息Fig.1 Peak information of Raman spectrum of oil sample
碳-碳双键在油脂结构中对于拉曼光谱中的分子振动起主要作用,在拉曼光谱中,碳-碳双键通常以很强的特征峰出现,且在一定范围的浓度内,特征峰的强度与碳-碳双键的浓度成正比,而当油脂发生氧化酸败反应时,双键发生降解,浓度降低,进而特征峰的强度下降。并且由于拉曼光谱是具有高度分子特征性的指纹光谱,谱峰重叠少,因此碳-碳双键特征峰可以体现食用油的不饱和程度,故可将位于1 656 cm-1的特征峰值强度信息作为食用油的氧化酸败检测分析的重要参考依据,从而通过此处特征峰的信息来检测碳-碳双键的降解程度,进而对食用油的过氧化值进行分析,检测食用油的品质。
本研究采用偏最小二乘法(PLS)对84个食用油样本的过氧化值进行定量分析,数据分析与处理采用TQ Analyst软件完成。采集到的食用油样本拉曼光谱图如图2所示,其中横坐标为拉曼位移,纵坐标为拉曼强度。
图2 食用油样本拉曼光谱Fig.2 Raman spectroscopy of edible oil samples
食用油的成分非常复杂,当发生氧化酸败反应时,除碳-碳双键之外,食用油中许多其它成分会发生一定的反应和变化,因而本研究在不同光谱预处理组合方式与波长筛选做了大量实验,提取与成分含量相关的信息,旨在优化食用油过氧化值拉曼光谱定量分析模型,使模型具备良好的预测准确性与稳健性[23]。经过多次波长筛选,最终选择拉曼位移范围为848.25~1 800 cm-1和2 600~3 299.34 cm-1两段,此范围谱峰信息丰富且清晰,能最有效地提取光谱中的信息。
定义待测组分过氧化值,并定义分析值范围为0~10 mmol/kg;导入84个标准样本光谱,对应输入每个样本光谱的过氧化值标准含量,选定建模样本(calibration)和预测样本(validation)[24]。本研究按照食用油样本过氧化值梯度选择实验样本,尽量保证实验样本过氧化值均匀分布且具有代表性,对采集的84个油品样本,选取60份样本作为建模样本,14份样本作为预测样本,10份样本作为范围扩展样本。基于PLS的食用油过氧化值含量在导数、标准正态变量变换(SNV)、多元散射校正(multiplicative scatter correction,MSC)、Savitzky-Golay(SG)卷积平滑四种不同组合的预处理法下的校正集决定系数R12及校正均方根误差RMSEC、预测集相关系数R22以及预测均方根误差RMSEP如表3所示。
表3 不同组合预处理方法的PLS定量模型结果对比Table 3 Comparison of PLS quantitative model results for different combination pretreatment methods
从表3中过氧化值PLS定量分析模型的评价指标结果可以看出,当采用“一阶导数+SNV”方法进行预处理时,建模效果最好,校正集相关系数R12达到了0.952 8,校正标准偏差(RMSEC)为0.572,预测相关系数R22为0.921 9,相对预测均方差(RMSEP)为0.698,模型相关系数较大,误差在允许范围内,所建模型稳定性和准确性可靠。所建食用油样本过氧化值分析模型拟合值与标准值之间的相关图如图3所示,误差分布图如图4所示。
图3 食用油过氧化值PLS校正集和预测集定量模型Fig.3 Quantitative model of PLS calibration set and prediction set of edible oil peroxide value
图4 食用油过氧化值PLS校正集和预测集误差分布图Fig.4 Error distribution of PLS calibration set and prediction set of edible oil peroxide value
本研究用拉曼光谱技术对食用油的过氧化值进行了定量分析,进而对食用油的品质进行检测。在模型建立及预测环节,所选的方法、所设的参数以及所选择的建模样本和预测样本都经过了不断的校正和改善,最终选择“一阶导数+SNV法”对光谱进行预处理并用偏最小二乘法进行建模,校正集相关系数达到了0.952 8,模型准确性高,误差小,可以满足日常检测的要求。研究结果表明,在现有样本中,利用拉曼光谱技术结合偏最小二乘法分析光谱数据,能够快速、有效地无损检测食用油的过氧化值,具有可行性和准确性,为拉曼光谱技术应用于食用油品质快速检测奠定了基础。而未来,拉曼光谱技术在此领域发展具有很好的前景,在本研究基础上还可扩充样本数量、选择更多的光谱预处理方法及引进新的建模算法等,提高模型的准确性和可靠性,进一步推进拉曼光谱技术应用于日常生活中的食用油品质快速检测,为食用油品质检测提供一种新的便捷高效的途径。