周小华,张 玫,相秉仁
(1.江苏省食品药品监督检验研究院,江苏南京 210008;2.中国药科大学,江苏南京 210009)
近红外光谱结合区间偏最小二乘法应用于花生油酸价的测定
周小华1,张 玫1,相秉仁2
(1.江苏省食品药品监督检验研究院,江苏南京 210008;2.中国药科大学,江苏南京 210009)
采用近红外光谱法结合不同区间偏最小二乘波长筛选法建立花生油酸价的定量分析模型。采用酸碱滴定法测定花生油样本的酸价同时采集近红外光谱数据;采用区间偏最小二乘法(iPLS)、向后区间偏最小二乘法(BiPLS)、移动窗口偏最小二乘法(mwPLS)优选光谱特征区间;采用偏最小二乘法(PLS)对优选出来的谱段建立酸价的定量模型。结果表明,采用mwPLS选择的谱段建立的模型预测效果最佳,RMSECV和RMSEP分别为0.247 76和0.131 5,校正相关系数和预测相关系数分别为0.993 2和0.996 9。因此,近红外光谱结合移动窗口偏最小二乘法可以快速准确测定花生油的酸价。
近红外;区间偏最小二乘;花生油;酸价;定量分析
食用油中游离脂肪酸含量的多少,反映了食用油质量、精炼程度和储藏品质变化,它是食用油品质评定的重要指标,常用酸价来表示。酸价以中和1 g油脂中的游离脂肪酸所需氢氧化钾的毫克数表示。国家标准中,食用油的检测是利用酸碱滴定的方法测定酸价。这种方法过程繁琐,需要消耗很多有机试剂,不便于现场检测。近红外光谱法具有快速、无损、环保等特点[1],近年来在食用油有关成分的检测应用方面有一定的报道[2-5],Yulan Rao等[5]首次将近红外光谱法应用于花生油酸价的测定,结果较佳,校正相关系数为0.972 5,校正均方根误差为0.308,预测相关系数为0.937 9,预测均方根误差为0.333。本实验采用近红外光谱法结合不同区间偏最小二乘波长筛选法建立花生油中的酸价的定量分析模型,旨在利用改进偏最小二乘法可以有效提取复杂体系中目标光谱信息的优点,提高花生油中酸价定量模型的预测精度及稳定性。
1.1 材料
花生油:市售,一共采集117个样品。
1.2 仪器
MPA型傅立叶变换近红外光谱仪:德国Bruker公司,配有液体光纤探头和InGaAs检测器,以及
OPUSTM近红外操作软件包。
1.3 方法
1.3.1 花生油酸价测定[6]。
按照国标GB 2716—2005规定的酸碱滴定法对117个样品的酸价进行测定。
1.3.2 近红外光谱采集
液体光纤漫反射测样:量取样品15 mL装于20 mL烧杯中。扫描次数:64次,分辨率:8 cm-1,扫描范围:4 000~12 000 cm-1。每个样品重复测定6次,取其平均光谱。测样温度:25℃。花生油样品的近红外原始图谱如图1。
图1 花生油样品的近红外原始图谱
1.4 数据处理
考察了区间偏最小二乘法(iPLS)、向后区间偏最小二乘法(BiPLS)以及移动窗口偏最小二乘法(mwPLS)这三种波长筛选法对花生油中酸价检测的影响。用内部交叉验证均方根误差(RMSECV)和校正相关系数(Rc)评估校正模型的质量,用预测均方根误差(RMSEP)和预测相关系数Rp检验所建立模型的预测效果。所有的数据分析都在MATLABⓒ7.0上实现。
实验选用市售花生油117个,根据Kennard-Stone算法[7]选取78个样品作为训练集,39个作为预测集。
2.1 iPLS模型
将整个光谱区域划分为10、11、12、……、19、20个子区间,以考察不同数目的子区间划分对模型性能以及最佳波长区间的影响。表1列出了不同子区间划分的最佳局部模型的结果。由表1可以看出,在不同的区间划分中,最佳局部模型的子区间主要集中在4 500~5 500 cm-1这一光谱区域内。建立在第18个子区间上的模型是所有模型中预测能力最强的一个,其交互验证均方根误差(RMSECV)值为0.222 1,因此,采用这一光谱区域(4 886.9~4 443.4cm-1)建模,并对验证集样品进行预测,其校正相关系数(Rc)为0.991 8,预测相关系数(Rp)和预测均方根误差(RMSEP)分别为0.996 7和0.184 1。
表1 不同区间划分时各部分的最佳模型
2.2 BiPLS模型
将光谱划分为20个子区间进行BiPLS运算,从表2可以看出,根据最小RMSECV的原则,建立在2个子区间上的PLS模型为最佳模型。该PLS模型校正时的相关系数(Rc)和校正均方根误差(RMSECV)分别为0.991 5和0.226 9,预测时的相关系数(Rp)和预测均方根误差(RMSEP)分别为0.995 3和0.192 9。
表2 向后区间偏最小二乘法(BiPLS)优化结果
2.3 mwPLS模型
将窗口的宽度设置为95个波长通道跨度,窗口从左向右以每次一个波数点的速度移动,图2给出了所建立的一系列宽度为95个波长的窗口偏最小二乘模型的性能谱RMSECV曲线,图中的虚线表示基于全谱含有11个潜变量的最优全局偏最小二乘模型的交互验证均方根误差,RMSECV=0.853 7。图中的光谱图为样本集的均值谱,进行了比例调节,以便对应和确定最优的建模窗口,图中以椭圆示出了较优区域。并在此区域建立PLS模型,以含有6个潜变量的模型的性能最好,RMSECV=0.247 76。为了比较特征谱段建模与全谱建模的差异,采用PLS法对全谱进行了建模,结果见表3。可见mw-PLS模型的预测精度最好,表4列出了mwPLS模型预测集中39个样品酸价的真实值与预测值。
图2 mwPLS建模区间
表3 不同区间偏最小二乘法模型结果比较
表4 mwPLS模型预测集样品酸价预测值与真实值的比较 mgKOH/g
采用区间偏最小二乘法及其改进算法筛选波段,3种方法都能有效选择有用信息,从而提高模型的预测能力。全光谱模型的偏最小二乘模型精度并不高,区间偏最小二乘法处理所得的最佳模型,不论对校正集还是预测集模型的预测能力都好于全光谱模型,由于游离脂肪酸的含量小,花生油的近红外光谱图中大部分信息是与游离脂肪酸无关的干扰物质,用全谱进行建模时,引进了无关信息,不仅使得到的模型复杂化,而且降低了模型的稳定性与预测能力。用区间偏最小二乘法进行建模谱段的选择,能有效地去除无关信息,从而提高模型的稳定性和预测能力。采用的3种方法即常规区间偏最小二乘法、向后区间偏最小二乘法以及移动窗口偏最小二乘法所得到的模型精度均好于全光谱模型。由于4 600 cm-1附近是顺式不饱和脂肪酸中C=C和C-H的的合频振动吸收,游离脂肪酸的吸收主要在这一波段,而5 500 cm-1附近是O-H伸缩振动的一级倍频吸收,主要包含有水等非目标成分的信息,因此包括这一波段的BiPLS模型精度比iPLS和mwPLS的模型精度低。mwPLS模型的预测能力比iPLS模型的预测能力稍强(RMSEP较小),这可能是由于区间偏最小二乘法的区间固定,有效信息提取不完全的缘故。
近红外光谱法结合移动窗口偏最小二乘法建立的花生油酸价定量模型预测准确度比现有的文献方法高,可以实现花生油酸价的快速测定,可以用于花生油质量控制的现场检测。
[1]陆婉珍.现代近红外光谱分析技术[M].北京:中国石化出版社,2007.
[2]于修烛,张静亚,李清华,等.基于近红外光谱的食用油酸价和过氧化值自动化检测[J].农业机械学报,2012,43(9):150-154.
[3]李书国,陈辉,李雪梅,等.食用油酸价分析检测技术研究进展[J].粮油食品科技,2008,16(3):31-33.
[4]吴静珠,石瑞杰,陈岩,等.食用油油酸的近红外特征谱区优选[J].中国粮油学报,2015,30(2):118-121.
[5]Yulan Rao,Bingren Xiang,Xiaohua zhou,et al.Quantitative and qualitative determination of acid value of peanut oil using near-infrared spectrometry[J].Journal of Food Engineering,2009(93):249-252.
[6]GB 2716—2005,食用植物油卫生标准[S].
[7]Groot P J de,Postma G J,Melssen W J,Buydens L M C.Selecting a representative training set for the classification of demolition waste using remote NIR sensing[J].Anal.Chim.Acta.1999,392(1):67-75.
Determination of acid value of peanut oil by near-infrared spectrometry combined with interval partial least squares
ZHOU Xiao-hua1,ZHANG Mei1,XIANG Bing-ren2
(1.Jiangsu Food and Drug Supervision&Inspection Research Institute,Nanjing Jiangsu 210008;2.China Pharmaceutical University,Nanjing Jiangsu 210009)
Quantitative analysis model of acid value of peanut oil was performed using near-infrared spectrometry combined with different interval partial least squares(iPLS).Acid value of peanut oil were determined by acid-base titration while NIR spectra data were recorded;three improved partial least squares(PLS)methods,including interval partial least squares(iPLS),backward interval partial least-squares(BiPLS)and moving window partial least-squares(mwPLS),were used to find the most informative ranges;PLS regression models of acid value were built based on the optimal ranges.The results showed that the model by mw PLS method had the best predictive ability,the RMSECV and RMSEP were 0.247 76 and 0.131 5,and the calibration and prediction coefficient were 0.993 2 and 0.996 9.Rapidly and accurately determination of acid value of peanut oil can be achieved by NIR combined with mwPLS.
near-infrared;interval partial least squares(iPLS);peanut oil;acid value;quantitative analysis
O 657.3;TS 227
A
1007-7561(2017)02-0062-03
2016-10-27
周小华,女,江苏南京,硕士研究生.