杨雪萍,刘宝林,王 欣*,卢海燕,赵婷婷
(上海理工大学食品质量与安全研究所,上海 2000 93)
基于LF-NMR弛豫特性的煎炸油总极性化合物含量定量建模方法
杨雪萍,刘宝林,王 欣*,卢海燕,赵婷婷
(上海理工大学食品质量与安全研究所,上海 2000 93)
将低场核磁共振(low field nuclear magnetic resonance,LF-NMR)分析技术应 用于 煎炸油脂总极性化合物(total polar compounds,TPC)含量的预测。采用柱层析方法测定油脂样品的TPC含量作为测定值,采集油脂样品的LF-NMR弛豫特性(峰起始时间T21、T22、T23相应的峰面积比例S21、S22、S23、单组分弛豫时 间T2W),分别利用向后筛选多元回归分析、主成分回归分析和偏最小二乘回归分析建立LF-N MR弛豫特性与TPC含量的回归方程,比较3 种模型的校正集和预测集的决定系数与均方根误差,最终确定最优模型为偏最小二乘回归模型。应用此模型预测预测集样品TPC含量,决定系数R2可达0.928,预测集均方根误差为0.568%,模型稳定。
低场核磁共振;总极性化合物含量;向后多元回归;主成分回归;偏最小二乘回归
油脂在煎炸食品的过程中,自身亦发生了一系列氧化反应、聚合反应、氧化聚合反应、裂解反应和水解反应,这些反应的产物对油脂本身的品质产生了不良的影响,给广大消费者带来了食品安全隐患问题。总极性化合物(total polar co mpounds,TPC)含量是衡量煎炸油脂品质的重要指标,煎炸油使用终点的判断标准一般定义TPC含量达24%~27%,超过该值的油脂必须强制性的废除使用[1]。食用煎炸油极性组分指标检测的传统方法是柱层析法,操作过程繁琐、耗时费力,且需要使用大量的有机溶剂,而低场核磁共振(low field nuclear magnetic reso nance,LF-NMR)分析技术[2]在食品安全领域的应用越来越广泛,是一种快速、无损、绿色分析检测技术。
Hein等[3]的研究表明,利用煎炸油油脂的LF-NMR弛豫时间随其TPC含量的增加而缩短的关系,可以评判煎炸油的品质。王永巍等[4]应用LF-NMR对大豆油的无物料煎炸过程进行了研究,发现随着TPC含量的增加,S21峰面积比例线性增大,而单组分弛豫时间T2W呈良好的线性减小关系,因此可以利用S21或T2W预测大豆煎炸油TPC含量随煎炸时间的变化规律。史然等[5]发现,大豆油在薯条煎炸过程中,其TPC含量与煎炸时间呈良好线性关系,并利用多元回归分析建立了大豆油无料/薯条煎炸过程TPC含量与T2W、T21之间良好的相关性模型。以上的研究表明,油脂样品的LF-NMR弛豫特性与TPC含量之间存在着一定的联系,但是对于前期模型分析的研究较少,因此本实验首先利用学生化残差和杠杆值分析LF-NMR弛豫特性数据,去除异常样品,然后通过向后筛选多元回归(backward multiple linear regression,BMLR)分析、主成分回归(principal component regression,PCR)分析和偏最小二乘回归(partial least squares regression,PLSR)分析3种回归方法[6-7],建立LF-NMR弛豫特性与TPC含量的数学模型,比较决定系数和均方根误差,确定PLSR模型对预测集样品的TPC含量的预测更准确、更稳定。
1.1 材料与仪器
棕榈油 益海嘉里食品工业有限公司。
09款流线型5.5 L电炸炉 广州汇利有限公司;PQ-001型核磁共振分析仪(氢谱、磁场强度0.52 T、共振频率23 MHz、配套T-invfit反演拟合软件和Φ15 mm核磁共振专用测试管) 上海纽迈电子科技有限公司;层析柱上海市崇明建设玻璃仪器厂。
1.2 方法
1.2.1 煎炸油样的制备
将10 L的棕榈油倒入电炸炉中,控温在(182±2)℃进行煎炸,每天连续煎炸12 h,在油温相同的条件下,每小时煎炸一个鸡排(鸡排质量为100~200 g),每3 h取150 mL油样冷却至室温,滤去沉淀后贮于样品瓶中,-20 ℃存放备用。
1.2.2 TPC含量测定值
参照GB/T 5009.202—2003《食用植物油煎炸过程中的极性组分(PC)测定》[8]的测定方法,获取33 个棕榈油样品的TPC含量的测定值。
1.2.3 LF-NMR弛豫特性数据
LF-NMR横向弛豫时间(T2)测量:利用CPMG脉冲序列测定样品的T2。将2.5 mL样品移入核磁共振试管,先在32 ℃恒温10 min,再置于核磁探头中稳定1 min后采样,采样完毕后将样品重新置于32 ℃恒温5 min,以便进行下次采样,结果取3 次测量平均值。
利用T-invfit软件对LF-NMR测量得到的自由诱导指数衰减曲线进行反演拟合,可得到油脂样品的多组分弛豫特性数据。当将样品看作一个整体组分分析时,可反演得到样品的单组分弛豫时间(T2W)。
1.2.4 学生化残差和杠杆值
剔除异常样本的准则有基于标准化残差、学生化残差、剔除残差(杠杆值、库克距离、标准化回归系数的变化和标准化预测值的变化)。本实验选择学生化标准残差和杠杆值结合的方法[9]。
由于残差是服从标准正态分布,因此可以根据2σ准则进行判断,考虑到普通残差e1,e2,...,en的方差不等,由于学生化残差进一步解决了此问题,因此首先对残差进行学生化,然后观察学生化残差绝对值大于2对应的观测值为异常值。
式中:hii为第i个样品的杠杆值,而杠杆值实质反应了解释变量x的第i个值与x平均值之间的差异。当xi接近时,hii接近0;当xi远离时,hii接近1;因此,某个杠杆值hii较高意味着对应的xi远离平均值,它会强烈地影响回归方程的拟合,是一个异常点。通常如果hii大于2或3倍的,就可认为该杠杆值较高,对应的观测值为异常点。
1.2.5 多元回归分析(multiple linear regression,MLR)、PCR、PLSR模型
MLR用于展现因变量与多个自变量之间的线性关系。而选择合适的自变量是MLR分析的重点。SPSS 18.0中,自变量的筛选一般有向前筛选、向后筛选、逐步筛选3 种基本策略。本实验采用BMLR,依次剔除不显著的自变量,检验回归系数,直到回归方程能更好地解释因变量的信息为止。
PCR是主成分分析和回归分析的结合,通过一种降维的思想,在损失很少信息的前提下把多个指标利用正交旋转变换转化为几个综合指标,然后对综合指标进行线性回归分析。
PLSR集主成分分析、典型相关分析和线性回归方法的特点,解决回归分析中自变量多重共线性的问题,是一种多因变量对多自变量线性回归建模方法。
2.1 TPC含量
棕榈油在煎炸过程中,发生分解和聚合反应而产生各种极性较大的化合物,因此TPC含量在油脂的品质监测中,是一个比较重要的指标。本实验测定的33 个棕榈油样品的TPC含量与时间的变化规律如图1所示。
图1 棕榈油煎炸过程中TPC含量随时间的变化Fig.1 Correlation between TPC content and frying time for 33 palm oil samples
由图1可知,棕榈油在煎炸鸡排的过程中,随着煎炸时间的延长,TPC含量呈线性增加[10]。主要是因为油脂在煎炸过程中产生越来越多的极性化合物所导致的[11]。TPC含量随煎炸时间的线性变化这一数学关系为下面的建立LF-NMR弛豫特性与TPC含量的模型提供基础。
2.2 剔除异常样品
对棕榈油炸鸡排的33 个油脂样品的LF-NMR弛豫特性与TPC含量,进行逐步多元回归模型分析,TPC含量分析的杠杆值和学生化残差分布见图2。
图2 油脂样品的杠杆值与学生化残差分布图Fig.2 Distribution of leverage and studentized residual values
学生化残差大于2的样品定义为样品A,杠杆值大于0.6的样品定义为样品B。由图2可知,样品A的学生化残差明显大于其他样品,因而定义为嫌疑异常样品。样品B的杠杆值远大于其他样品的杠杆值,可能会对回归方程产生显著的影响,因此也定义为嫌疑异常样品。这里将采用逐一剔除嫌疑异常样品的方法建立逐步多元回归模型。所有样品均作为校正集样品,通过比较决定系数R2与校正集均方根误差(root mean square error of calibration,RMSEC)来判断模型的准确性。
表1 逐一剔除异常样品后的TPC含量模型性能对比分析表Table 1 Performance of BMLR models developed using samples excluding suspected abnormal samples reclaimed one by one
如表1所示,逐一剔除异常样品的逐步多元回归模型的性能。剔除嫌疑异常样品后,RMSEC与决定系数R2均发生变化,因此是否剔除嫌疑异常样品对回归模型预测结果有影响。由残差分析可知,对于TPC含量预测来说,残差的大小决定了预测的精确性,因此应以RMSEC为主要参数,R2作为参考参数来选择较优的模型。表1表明:同时剔除样品A和B后,RMSEC减小至最小值0.732%,较无剔除样品、分别剔除样品A和样品B的,R2差异不大。据此选择剔除样品A和B后的样品集建立回归方程的最优模型。
2.3 TPC含量的定量分析
剔除异常样品A和样品B后,将剩余的31 个棕榈油样品用作建立LF-NMR弛豫特性与TPC含量的回归模型。随机抽取预测集样品7 个,校正集样品24 个。对校正集样品分别通过BMLR、PCR和PLSR分析,建立油脂煎炸过程中TPC含量与LF-NMR弛豫特性之间的回归模型,利用此回归方程对预测集样品进行TPC含量预测,将决定系数和预测集均方根误差(root mean square error of prediction,RMSEP)作为模型准确性的判定依据确定最优模型。
2.3.1 BMLR分析
利用向后筛选策略进行多元回归分析[12],就是自变量不断剔除出回归方程的过程。首先,所有的自变量全部进入回归方程,并对回归方程进行各种检验。然后在回归系数显著性检验不显著的一个或多个变量中,剔除t检验值最小的自变量,并重新建立回归方程和进行各种检验。按照上述的方法再依次剔除最不显著的自变量,直到再也没有可剔除的自变量,所有的自变量的回归系数显著为止。将TPC含量作为因变量,LF-NMR弛豫特性作为自变量,对校正集的24个油脂样品进行向后筛选多元回归分析。
表2 基于BMLR分析的TPC含量模型Table 2 BMLR results for TPC contents
由表2可知,利用BMLR建立模型,最终确定为第3个模型。从方程建立的过程来看,依次剔除出方程的自变量是T22、S22,这些被剔除的变量的偏F检验均大于显著性水平?(0.05),因此它们对因变量的线性解释没有显著贡献,不应该保留在方程中,最终保留在方程中的变量是T2W、S23、S21、T21、T23。最终确定的回归方程为:TPC=13.055+6.271S21-0.407T21+1.016S23+ 0.171T23-0.412T2W(决定系数R2=0.991)。
2.3.2 PCR分析
PCR分析[13-16]先运用主成分分析方法,将多个变量通过线性变换选出较少的综合变量,排除众多信息共存中互相重叠的信息,然后利用回归分析方法建立TPC含量与低场弛豫特性数据的回归方程。
利用SPSS 18.0软件对校正集的24个样品进行PCR分析,为使结果不受量纲的影响,采用SPSS 18.0默认的Z-Score标准化方法把低场弛豫特性数据(T21、T22、T23、S21、S22、S23、T2W)和TPC含量进行标准化。
表3 因子载荷及方差贡献率Table 3 Load factors and variance contribution rate
对标准化后的自变量进行因子分析后,表3中显示各自变量在主成分中的载荷及方差贡献率的情况,其中,T2W在PC1方向具有最大的正载荷,S21在PC1方向具有最大的负载荷,而3 个主成分PC1、PC2、PC3的累积贡献率已高达97.622%,几乎概括了绝大部分原始变量中的信息,因此选取PC1、PC2、PC3 3 个主成分为新的自变量。TPC含量作为因变量,按照上述的向后筛选多元回归分析方法进行回归方程的建立,最终数据反标准化得到回归方程:TPC=0.329S21-0.324T21-0.021S22-0.317T22-0.297S23-0.039T23-0.326T2W+106.595(决定系数R2=0.963)。
2.3.3 PLSR分析
PLSR[17-22]根据因变量个数划分为单因变量和多因变量偏最小二乘,因本实验的因变量只有TPC含量一个,因此属于前者。首先在自变量与因变量中提取成分PCx和PCy,然后分别实施自变量对PCx的回归以及因变量对PCx的回归,如果回归方程已达到满意的精度,则算法中止。否则将利用自变量被PCx解释后的残余信息以及因变量被PCx解释后的残余信息进行第2轮的成分提取,直到回归方程能达到满意的精度为止。最终转化成原因变量与原自变量的回归方程。
利用软件The Unscrambler建立校正集的PLSR模型,首先定义自变量为低场弛豫特性数据(T21、T22、T23、S21、S22、S23、T2W),因变量为TPC含量。然后设定校正集样品进行PLSR分析,建立回归方程。最终得到回归方程:TPC=0.0313S21-0.123T21+0.050S22-0.181T22-0.123S23+0.008T23-0.471T2W+98.195(决定系数R2=0.931)。
2.3.4 模型比较
在油脂的总极性化合物的定量分析中,分别使用
图3 BMLR模型的测定值与预测值关系曲线Fig.3 Correlation between predicted and standard values by the BMLR model
图4 PCR模型的测定值与预测值关系曲线Fig.4 Correlation between predicted and standard values by the PCR model
图5 PLSR模型的测定值与预测值关系曲线Fig.5 Correlation between predicted and standard values by the PLSR model
由图3~5对比可知,PLSR模型得到的TPC含量预测值和测定值均匀地分布在直线两侧,而BMLR模型和PCR模型得到的TPC含量预测值与测定值之间相差较大。因此选用PLSR模型预测TPC含量较准确。BMLR、PCR和PLSR分析建立的回归方程来预测7 个预测集样品的TPC含量。
表4 BMLR、PCR和PLSR模型性能比较Table 4 Comparison of the reliability of the BMLR, PCR and PLSR models in predicting peroxide value of palm oil
表4显示:3 种模型中PLSR建立的模型预测未知样品TPC含量时,RMSEP为最小,决定系数R2为最大,由此可以确定,对于油脂TPC含量的LF-NMR弛豫特性分析,最优的模型为PLSR模型。因此使用PLSR模型测定油脂TPC含量的性能结果为:校正集决定系数为0.931,预测集的决定系数为0.928,PLSR的校正集和预测集的决定系数均高于0.900,TPC含量RMSEC为0.276%,RMSEP为0.568%。这些性能参数说明可以采用PLSR进行TPC含量预测的误差在可接受范围。
采用LF-NMR分析仪对油脂的TPC含量进行了定量分析,先利用杠杆值与学生化残差进行初步的筛选,通过逐一剔除嫌疑样品建立逐步多元回归模型的性能比较中得出结论,学生化残差差异显著和杠杆值较大的样品可以直接剔除;建立LF-NMR弛豫特性与TPC含量的3 种预测模型中,通过BMLR、PCR和PLSR模型的对比结果显示,PLSR模型预测集决定系数最大,均方根误差最小,因此可以认为,对于油脂总极性化合物的低场核磁弛豫特性的分析中,PLSR的模型最优;油脂的TPC含量预测值的结果表明:使用LF-NMR分析仪测量油脂的TPC含量是可行的,且与化学方法测量结果RMSEP为0.568%,在实际应用的可接受范围,因此该测量方法可以在实践中进一步应用和发展。
[1] SAGUY I S, DANA D. Integr ated approach to deep fat frying: engineering, nutrition, health and consumer aspects[J]. Journal of Food Engineering, 2003, 56(2/3): 143-152.
[2] 曹文明, 薛斌, 杨波涛, 等. 地沟油检测技术的发展与研究[J]. 粮食科技与经济, 2011, 36(1): 41-44.
[3] HEIN M, HENNING H, ISENGARD H D. Determination of total polar with new met hods for the quality survey of frying fats and oils[J]. Talanta, 1998, 47(2): 447-454.
[4] 王永巍, 王欣, 刘宝林, 等. 低场核磁共振技术检测煎炸油品质[J].食品科学, 2012, 33(6): 171-175.
[5] 史然, 王欣, 刘宝林, 等. 大豆油煎炸过程理化指标与L F-NMR弛豫特性的相关性研究[J]. 分析测试学报, 2013, 32(6): 653-660.
[6] 王立琦, 张礼勇, 朱秀超. 大豆油脂过氧化值的近红外光谱分析[J].食品科学, 2010, 31(6): 205-207.
[7] 田永超, 张娟娟, 姚霞, 等. 基于近红外光声光谱的土壤有机质含量定量建模方法[J]. 农业工程学报, 2012, 28(1): 145-152.
[8] GB/T 5009. 202—2003 食用植物油煎炸过程中的极性组分(PC)测定[S]. [9] 薛薇. 基于SPSS的数据分析[M]. 2版. 北京: 中国人民大学出版社, 2011: 230-234.
[10] 邓云, 吴颖, 杨铭铎, 等. 煎炸油中产生的极性成分对食品微观结构和质构的影响[J]. 农业工程学报, 2004, 20(6): 160-164.
[11] 邓云, 杨铭铎, 李健, 等. 油炸中油脂极性成分的产生对食品品质的影响[J]. 华南理工大学学报: 自然科学版, 2004, 32(6): 49-54 .
[12] 方开泰. 实用多元统计方法[M]. 上海: 华东师范大学出版社, 1989: 247.
[13] 张静亚, 张建新, 于修烛, 等. 基于近红外透射光谱的食用油氧化定性分析[J]. 食品科学, 2012, 33(4): 200-203.
[14] 郭呈全, 陈希镇. 主成分回归的SPSS实现[J]. 统计与决策, 2011(5): 157-159.
[15] 李小胜, 陈珍珍. 如何正确应用SPSS软件做主成分分析[J]. 统计研究, 2010, 27(8): 105-108.
[16] KUMAGAI M, KARUBE K, SATO T, et al. A near infrared spectroscopic discrimination of noodle flours using a principal component analysis coupled with chemical information[J]. Analytical Sciences, 2002, 18(10): 1145-1150.
[17] ARMENTA S, GARRIGUES S, de la GUARDIA M. Determination of edible oil parameters by near infrared spectrometry[J]. Analytica Chimic a Acta, 2007, 595(2): 330-337.
[18] WANG Li, LEE F S C, WANG Xiaoru, et al. Feasibility study of quantifying and discriminating soybean oil adulteration in camellia oils by attenuated total reflectance MIR and fiber optic diffuse reflectance NIR[J]. Food Chemistry, 2006, 95(3): 529-536.
[19] RAO Yulan, XIANG Bingren, ZHOU Xiaohua, et al. Quantitative and qualitative determination of acid value of peanut oil using near-infrared spectrometry[J]. Journal of Food Engineering, 2009, 93(2): 249-252.
[20] 毕艳兰, 鲍丹青, 田原, 等. 利用傅里叶近红外技术快速测定食用植物油的过氧化值[J]. 中国油脂, 2009, 34(3): 71-74.
[21] 张国文, 倪永年, 涂北平. 食用植物油的分类和质量鉴别的模式识别研究[J]. 食品科学, 2005, 26(1): 71-75.
[22] 王慧文. 偏最小二乘回归方法及其应用[M]. 北京: 国防工业出版社, 2000: 28-110.
Quantitative Modeling Method for Predicting Total Polar Compound Contents in Frying Oil Based on LF-NMR Relaxation Parameters
YANG Xue-ping, LIU Bao-lin, WANG Xin*, LU Hai-yan, ZHAO Ting-ting
(Institute of Food Quality and Safety, University of Shanghai for Science and Technology, Shanghai 200093, China)
The contents of total polar compounds (TPC) in frying oils were predicted by using low field nuclear magnetic resonance (LF-NMR). LF-NMR T2relaxation parameters (the relaxation time: T21, T22, and T23, the corresponding peak areas: S21, S22, S23and the single component time T2W) of the samples were collected. The TPC contents of frying oil were also determined by column chromatography method as a reference standard. Three mathematic models were established to quantitatively analyze TPC contents, using backward multiple linear regression (BMLR), principal component regression (PCR) and partial least squares regression (PLSR), respectively. Comparing the correlation coefficients and root mean square errors of calibration set and prediction set, the BMLR model showed the best reliability in predicting TPC contents, with a correlation coefficient of prediction sets of 0.928, root mean square error of prediction (RMSEP) of 0.568%.
low field nuclear magnetic resonance (LF-NMR); total polar compounds (TPC) content; multiple linear regression (BMLR); principal component regression (PCR); partial least squares regression (PLSR)
TS207.3
A
1002-6630(2014)24-0110-05
10.7506/spkx1002-6630-201424021
2014-02-13
国家自然科学基金青年科学基金项目(NSFC31201365);上海市科委重点攻关项目(11142200403);上海市教委科研创新项目(11YZ109)
杨雪萍(1989—),女,硕士研究生,研究方向为食品安全快速检测。E-mail:alapingping@sina.cn
*通信作者:王欣(1975—),女,副教授,博士,研究方向为食品安全与检测。E-mail:wx0426951@126.com