原姣姣 王成章,2 陈虹霞
(中国林业科学研究院林产化学工业研究所国家林业局林产化学工程重点开放性实验室国家油茶科学中心加工重点实验室1,南京 210042)
(中国林业科学研究院林业新技术研究所2,北京 100091)
近红外透射光谱分析油茶籽油掺入豆油的研究
原姣姣1王成章1,2陈虹霞1
(中国林业科学研究院林产化学工业研究所国家林业局林产化学工程重点开放性实验室国家油茶科学中心加工重点实验室1,南京 210042)
(中国林业科学研究院林业新技术研究所2,北京 100091)
采用傅里叶近红外透射光谱技术,应用于不同比例(0%~50%)的豆油和油茶籽油的二元体系样品,通过各种光谱预处理方法和回归方法的优化,建立了检测油茶籽油中掺杂豆油含量的近红外光谱的定量模型。以“二阶导数+Norris derivative filter”的最佳预处理方法和PLS的回归方法所建模型最佳,其校正相关系数(Rc)和校正标准误差(RMSEC)分别为0.999 99、0.057 70;交叉检验相关系数(Rcv)和交叉检验校准误差(RMSECV)分别为 0.999 99、0.071 9;最优波段为 5 037.16 ~ 4 728.60 cm-1、7 852.72 ~7 089.04 cm-1、8 577.82~8 323.26 cm-1;最佳主因子数为6。另外,经外部验证15份随机样品的化学值和NITS预测值的相关系数(R2)为0.998。表明近红外透射光谱法能够快速、准确地定量分析掺假油茶籽油中豆油的含量(范围为0%~50%)。
近红外透射光谱 油茶籽油 掺假 豆油 偏最小二乘法
油茶籽油,其组成类似于被称为“植物油皇后”的橄榄油[1],被誉为“东方橄榄油”。其脂肪酸组成主要有油酸、亚油酸、软脂酸和硬脂酸等[2],其中油酸质量分数达75%以上,不饱和脂肪酸质量分数可达90%。脂肪酸比例符合国际营养标准,且不皂化物含量少,易于人体营养吸收[3],是一种高品质的食用油。不饱和脂肪酸可以防止动脉硬化,抑制和预防冠心病、高血压等心脑血管疾病[4],加强人类对各种疾病的抵抗能力。所含的角鲨烯、VE等也有很好的抗氧化作用。由于油茶籽油的营养和医学双重价值,使得油茶籽油在市场上的价格远远高于日常食用油。随着人们生活水平的提高及保健意识的加强,油茶籽油需求量不断增长。然而,部分厂家为了眼前的利益,在市场上出现了油茶籽油掺假现象,如将大豆油、菜籽油、玉米油等低价油掺入油茶籽油,进而影响油茶籽油的特有品质和营养特征。
目前,油脂的掺伪方法主要有理化检测和仪器分析方法,比如显色法[5]、分光光度法[6]、气相[7]、液相[8]、红外光谱法[9]、电子鼻法[10-11]、近红外光谱法[12]等方法。常用的物理化学方法操作简便,适合现场检测,但只能对食用油是否掺假进行简单判断,而不能确定掺入的成分或实际掺伪量。气相色谱、液相色谱等大型仪器对掺伪检测具有较高的准确率,但前处理复杂、检测周期长、仪器设备昂贵。近红外光谱技术(包括透射和反射)是20世纪90年代以来发展最快、最引人注目的绿色分析技术之一,已被广泛应用于农业和食品[13]、油脂[14]等的品质分析检测,被国际农业分析界认为是“具有解决全球农业分析潜力”的方法。冯利辉等[15]采用偏最小二乘法建立了芝麻油中掺杂菜籽油含量的近红外定量检测模型。所得模型的校正相关系数为0.998 39,经外部验证认为该模型可准确预测芝麻油含量为10%~70%。Wang等[12]利用衰减全反射红外光谱和光纤漫反射近红外光谱对油茶籽油中掺入大豆油的掺假(比例为5%~25%)进行了比较分析,认为两种方法都可行。且采用偏最小二乘法建立的近红外光谱模型相关系数为0.992,校正标准误差(RMSEC)、交叉检验标准误差(RMSECV)分别为 0.70、1.79,其模型结果很好。
本试验是采用傅里叶近红外透射光谱技术,对不同比例的豆油和油茶籽油的二元体系样品建立线性关系,通过各种光谱预处理方法和回归方法的优化,建立了快速、精准地检测油茶籽油中掺杂豆油含量的近红外光谱定量模型,以期为市场上快速检测掺假油茶籽油提供一定的方法及理论依据。
1.1 材料与主要仪器
纯油茶籽油:上海嘉里食品工业有限公司,加工工艺为压榨;豆油:中粮食品营销有限公司,工工艺为浸出。
EL-204型电子天平:梅特勒-托利多仪器(上海)有限公司;Nicolet Antaris FT-NIR Analyzer光谱仪:美国Thermo Nicolet公司。
1.2 方法
1.2.1 掺入不同比例豆油的油茶籽油样品的配制
配制掺入不同比例(质量比)豆油的油茶籽油,范围在0%~50%梯度内,共66个样品。
1.2.2 油茶籽油的近红外透射光谱采集
样品准备:将样品放入样品瓶2/3处即可,待扫描光谱。
开机1 h使仪器预热。采集光谱前,先使用RESULT-Integration软件编写光谱采集程序,设置仪器工作参数:测量光谱范围4 000~12 000 cm-1,扫描次数为64次,分辨率为16 cm-1,2倍增益。采样方式为透射(tranmittance);数据采集形式为吸收率(absorbance)。编好采集程序后直接对样品进行近红外光谱的采集。每个样品扫描3次(从不同角度),每次均扫描背景,计算其平均光谱,保存,待分析。
1.2.3 模型的建立及建模效果评价
首先采用校正样品集建立近红外透射光谱(NITS)模型,运用各种光谱预处理方法和回归方法对模型优化,并且选择最优光谱范围。预处理方法有一阶导数(First derivative,1stDeriv.)、二阶导数(Second derivative,2ndDeriv.)、Savitzky - Golay 平滑处理和Norris平滑处理等;回归统计方法有多元线性回归法(multiple linear regression,MLR)、主成分回归法(principal component regression,PCR)、偏最小二乘法(partial least square,PLS)、人工神经网(artificial neural network,ANN)和拓扑(topology,TP)等方法[16]。再者,应用内部交叉验证和外部验证对模型的预测能力进行检验。优化模型时以模型的校正相关系数(Rc)、交叉检验相关系数(Rcv)、校正标准误差(RMSEC)、交叉检验标准误差(RMSECV)、外部检验相关系数(R2)等作为衡量模型优劣的重要指标。试验利用TQ Analyst 8光谱处理软件进行光谱预处理、谱区选择和回归统计分析。
1.3 数据处理
首先运用RESULT-Integration软件收集校正集和验证集样品光谱,再者使用TQ Analyst 8对校正集样品光谱进行分析,整理,进而建立最佳的近红外光谱模型。为了说明所建立模型的预测性能,使用SPSS11.0对对 NITS模型的预测值和真实值进行Paired Samples Test。根据t值来说明两者的显著性问题。
2.1 掺入不同比例豆油的茶油样品的配制结果
配制掺入不同比例(质量比)豆油的茶油,范围在0-50%梯度内,共66个样品。全部样品分为两部分,校正集51个和检验集15个。
表1 掺假油茶籽油的统计结果/%
2.2 油茶籽油和豆油的近红外光谱图
近红外光是指波长介于可见光区与中红外区之间的电磁波,其波长范围为780~2 526 nm(对应的波数范围为12 000~4 000 cm-1)。该光谱是由于分子振动能级的跃迁(同时伴随转动能级跃迁)而产生的,它反映的是含氢基团X—H(X为C、O、S、N等)振动的倍频和合频吸收[17]。油茶籽油、豆油中都有油酸、亚油酸、棕榈酸、硬脂酸等脂肪酸成分,这些物质都有常见的C—H、O—H等基团,故在近红外光谱区域会有吸收。
由于油茶籽油和豆油的化学组成及其含量有些差异,且油中甘三酯结构不同,使得光能量吸收使原子间引起震动、摆动,致使光能变化,因此在近红外光谱区域有着不同的图谱。
图1显示出它们各自的吸收图谱。由图1可看出,油茶籽油和豆油均在 4 500、4 700、5 700、5 800、7 100、8 250 cm-1等处有强烈的吸收[18]。4 500、4 700 cm-1左右是—CH3、—CH2和C—H 的伸缩振动的合频吸收。5 700、5 800 cm-1左右是—CH3、—CH2、HC == C H —中的C—H伸缩振动的一级倍频,在8 250cm-1波数附近是C—H伸缩振动的二级倍频吸收,7 100 cm-1为O—H伸缩振动的一级倍频吸收。但是,油茶籽油和豆油在4 700、8 250 cm-1处稍有不同,在5 800 cm-1处有着很大的不同,豆油比油茶籽油的吸收峰形宽且钝。掺有不同比例豆油的油茶籽油的近红外光谱图吸收峰强度不同,即含量不同,这是掺假油茶籽油的近红外光谱法能够作为定量分析的依据。
图1 油茶籽油和豆油的近红外光谱图
2.3 最佳光谱预处理方法的确定
样品物理性质的不同会引起光谱基线和斜率的变化,一般在建立校正模型前需要采用化学计量学方法对近红外光谱图进行预处理以消除这些影响。一阶导数及二阶导数方法可以最大程度地降低光谱峰的偏移和漂移,Savitzky-Golay平滑处理和 Norris平滑处理方法可以对光谱进行平滑处理。一个好的模型应该有较高的 Rc、Rcv和较低的 RMSEC、RMSECV。本研究以此作为建模效果的评判依据。
表2 不同的光谱预处理方法对掺有豆油的油茶籽油近红外模型的影响
由表2可看出,通过各种预处理方法所建的模型都有着很好的相关系数和预测效果,之间的差别并不大,Rc、Rcv并没有很大的变幅。但相比之下,各个模型还是有优劣之分。由一阶导数预处理得到的模型是最差的,一阶导数与各种平滑处理结合所得模型都优于仅用一阶导数处理得到的模型,可能是由于光谱经一阶导数处理中放大了所有信号,既包括有效信号,也含有噪音信号,从而影响到模型效果。而且二阶导数、二阶导数与各种平滑处理的模型也有此规律。这同时又可说明平滑处理可提高信噪比,减少随机噪音。因此,单纯地使用一阶或者二阶导数并不能很高效地得到很好的预测模型,每种方法都有缺点,可结合其他的预处理方式互相弥补不足,或许能得到意想不到的结果。再者,比较使用SG、Nd的模型,不管是一阶导数还是二阶导数,都呈现出Nd平滑处理优于SG平滑法。按照建模效果的评判依据,二阶导数+Nd为模型的最佳光谱预处理方式。
2.4 最优波段、最佳主因子数的确定
建模波段过宽,含有特征信息之余必然也包含冗余信息,且各方法得到的谱图也存在差异,使得各自对应的最优建模波段并不相同。因此,波段的选择有利于提高模型预测精度。在“二阶导数+Nd”的最优预处理方法下,软件自动优化的最优波段为5 037.16~4 728.60 cm-1、7 852.72 ~7 089.04 cm-1、8 577.82~8 323.26 cm-1。
主因子数使用过多或过少,会出现“过拟合”或者“欠拟合”现象,故需要确定最佳主因子数。采用交叉验证的RMSECV来确定,其值越小,模型的预测能力越好。依据TQ软件的功能PRESS,选取最小的RMSECV来确定。图2显示的是模型的RMSECV随主因子数的变化图。主因子数为6时,RMSECV最小,所以最佳的主因子数为6。
图2 RMSECV随主因子数的变化图
表3 RMSECV随主因子数的变化统计
2.5 最佳回归方法的确定
分别采用PCR、PLS两种回归方法来建立模型,并仍使用 Rc、RMSEC、Rcv、RMSECV 这4个指标评价所建模型的预测结果。由表3看出,PLS法所建模型的预测效果优于PCR法。因此选PLS法为最佳回归方法。
表4 不同的回归方法对掺有豆油的油茶籽油近红外模型的影响
2.6 模型的建立
通过各种光谱预处理方法和回归方法的优化,建立了掺伪油茶籽油的最优近红外光谱模型。以“二阶导数+Nd”的最佳预处理方法和PLS的回归方法的选择下,最优波段为 5 037.16 ~4 728.60 cm-1、7 852.72 ~ 7 089.04 cm-1、8 577.82 ~ 8 323.26 cm-1;最佳主因子数为 6。其 Rc、RMSEC、Rcv、RMSECV 分别为 0.999 99、0.057 7、0.999 99、0.071 9。
图3 NITS模型的校正图和交叉验证图
2.7 NITS的重现性试验
为了考察近红外光谱法的重现性,对61号样品进行4次光谱扫描,使用本试验所建立的模型进行预测,4次预测结果分别为 36.596%、36.559%、36.548%、36.568%,而真实值是 36.463%。经计算标准偏差为0.021,RSD为0.1%,所以该方法有很好的重现性。
2.8 NITS模型的外部验证
随机对15个未知样品进行模型的外部检验。将真实值和NITS值进行线性回归,由图4可知,其R2高达0.999 8,具有很好的线性关系,意味着该NITS有很好的预测效果。
图4 掺有豆油的油茶籽油近红外光谱模型的外部验证
经统计学分析,对NITS模型的预测值和真实值进行 Paired Samples Test,t值为0.659,P=0.521 >0.05,说明这两者没有显著性差异。所以可使用该光谱法对油茶籽油中掺入的豆油含量进行定量分析。
本试验成功地论证了运用近红外透射光谱法来定量分析掺入不同比例(0%~50%)豆油的掺伪油茶籽油二元体系的可行性。通过各种光谱预处理方法和回归方法的优化,建立了掺伪油茶籽油的近红外光谱的模型。以“二阶导数+Nd”的最佳预处理方法和PLS的回归方法的前提下,其 Rc、RMSEC、Rcv、RMSECV 分别为 0.999 99、0.057 7、0.999 99、0.071 9;最优波段为 5 037.16 ~ 4 728.60 cm-1、7 852.72~7 089.04 cm-1、8 577.82 ~8 323.26 cm-1;最佳主因子数为6。经外部验证,掺有豆油的伪油茶籽油的近红外光谱法测定值与真实值之间有着很好的线性关系,R2达到0.998,且经统计学T检验,二者没有显著性差异。所以该方法能很好地运用于定量分析掺伪油茶籽油中豆油的含量。
[1]柏云爱,宋大海,张富强,等.油茶籽油与橄榄油营养价值的比较[J].中国油脂,2008,33(3):39 -41
[2]王湘南,陈永忠,伍利奇,等.油茶种子含油率和脂肪酸组成研究[J].中南林业科技大学学报,2008,28(3):11-17
[3]廖书娟,吉当玲,童华荣.茶油脂肪酸组成及其营养保健功能[J].粮食与油脂,2005(6):7-9
[4]吴雪辉,黄永芳,谢治芳.油茶籽油的保健功能作用及开发前景[J].食品科技,2005(8):94-96
[5]周祥德.掺伪芝麻油中芝麻油含量分析方法的比较[J].粮食与食品工业,2004,12(2):53-55
[6]朱杏冬,王凯雄,臧荣春,等.芝麻油掺伪检测的紫外分光光度法研究[J].中国油脂,2000,25(1):50 -51
[7]邹洁,赵维佳,汪海峰,等.大豆油中掺伪棕榈油的检测方法研究[J].中国油脂,2009,34(4):73 -76
[8]Kapoulas V M,Andrikopoulos N K.Detection of olive oil adulteration with linoleic acid-rich oils by reversed-phase high - performance liquid chromatography[J].Chromatography,1986,366:311 -320
[9]Gurdeniz G,Ozen B.Detection of adulteration of extra-virgin olive oil by chemometric analysis of mid-infrared spectral data[J].Food chemistry,2009,116(2):519 -525
[10]Hai Z,Wang J.Detection of adulteration in camellia seed oil and sesame oil using an electronic nose[J].European Journal Lipid Science Technology,2006,108:116 -124
[11]Oliveros C C,Perez- Pavon J L,Pinto C G,et al.Elecronic nose base on metal oxide semiconductor sensors as a fast alternative for the detection of adulteration of virgin olive oils[J].Analytica Chimica Acta,2002,459(2):219 -228
[12]Wang L,Lee Frank S C,Wang X R,et al.Feasibility study of quantifying and discriminating soybean oil adulteration in camellia oils by attenuated total reflectance MIR and fiber optic diffuse reflectance NIR[J].Food chemistry,2006,95:529-536
[13]王多加,周向阳,金同铭,等.近红外光谱检测技术在农业和食品分析上的应用[J].光谱学与光谱分析,2004,24(4):447-450
[14]刘娅,赵国华,陈宗道,等.近红外光谱技术及其在油脂检测中应用[J].粮食与油脂,2002(11):35-37
[15]冯利辉,刘波平,张国文,等.芝麻油中掺入菜籽油的近红外光谱研究[J].食品科学,2009,30(18):296-299
[16]陆婉珍,袁洪福,徐广通.现代近红外光谱分析技术[M].北京:中国石化出版社,2004
[17]徐广通,袁洪福,陆婉珍.现代近红外光谱技术及应用进展[J].光谱学与光谱分析,2000,20(2):134-142
[18]杰尔.沃克曼,洛伊斯.文依.近红外光谱解析实用指南[M];褚小立,许育鹏,田高友译.北京:化学工业出版社,2009.
Study on the Quantitative Analysis of Camellia Oil Adulterated with Soybean Oil by Near Infrared Transmittance Spectroscopy(NITS)
Yuan Jiaojiao1Wang Chengzhang1,2Chen Hongxia1
(Institute of Chemical Industry of Forestry Products,CAF;Key and Open Lab.on Forest Chemical Engineering,SFA;Key Laboratory on National Science Center for Processing of Camellia oleifera1,Nanjing 210042)
(Institute New Technology of Forest2,CAF,Beijing 100091)
The quantitative model of camellia oil adulterated with mixed different proportions(0%~50%)soybean oil was well developed by the near infrared transmittance spectroscopy with different spectral pretreatment methods and regression analysis.The results demonstrated that,the best model was established with second derivative and Norris derivative filter pretreatment methods and PLS regression analysis.Meanwhile,the correlation coefficients of calibration(Rc)and the root mean square errors of calibration(RMSEC)were 0.999 99 and 0.057 7;the correlation coefficients of cross-validation(Rcv)and the root mean square errors of cross-validation(RMSECV)were 0.999 99 and 0.071 9 respectively;the best spectral ranges were 5 037.16 ~4 728.60 cm-1,7 852.72 ~7 089.04 cm-1,8 577.82 ~ 8 323.26 cm-1;the best factor was 6.Furthermore,the correlation coefficients(R2)of chemical values and NITS values in external validation was 0.999 8.Therefore,the near infrared spectroscopy methods will broad application in detection of camellia oil adulterated with soybean oil(range from 0%~50%).
near infrared transmittance spectroscopy,camellia oil,adulteration,soybean oil,partial least square
O657.3
A
1003-0174(2012)03-0110-05
国家科技支撑计划(2009BADB1B03)
2011-07-07
原姣姣,女,1988年出生,硕士,天然产物化学研究
王成章,男,1966年出生,研究员,博士生导师,天然产物研究与开发