井银成 范 璐 张欣欣 杨国龙 毕艳兰 周亚利 王宪周 杜淑丹
9种植物油脂Fisher判别函数的表征研究
井银成1范 璐1张欣欣1杨国龙2毕艳兰2周亚利1王宪周1杜淑丹1
(河南工业大学化学化工学院1,郑州 450001)
(河南工业大学粮油食品学院2,郑州 450001)
本研究为了建立不同植物油脂的识别方法,针对9种植物油脂采用气相色谱法分析其脂肪酸组成,用面积归一化法定量各脂肪酸甲酯的含量。以豆蔻酸、棕榈酸、硬脂酸、油酸、亚油酸、亚麻酸、花生酸、花生烯酸和芥酸等9种脂肪酸为变量,应用Fisher判别法,建立8个判别函数,以第一和第二个判别函数得分绘制判别得分二维散点图,9种油脂聚成9类,并且原始判别和交叉验证的准确率均为100%。另外,比较不同判别函数下各类植物油脂的重心坐标可知,判别函数Y1下的重心坐标两两具有明显差别,故选取判别函数Y1作为外部验证判别函数。通过外部数据的验证显示,使用判别函数Y1能够准确判定未知样的归属,方法选择9种主要脂肪酸作为变量,具有一定的可行性。
脂肪酸 Fisher判别法 识别 植物油脂
植物油脂是由脂肪酸和甘油化合而成的天然高分子化合物,广泛分布于自然界中。其主要成分为三酰甘油,而脂肪酸又是构成甘三酯的主要成分,故脂肪酸对油脂的理化性质影响较大[1]。不同植物油脂的脂肪酸的组成和含量有一定的差异,因此在油脂检验中常被作为检验指标。
气相色谱法是分析脂肪酸的常用方法。近几年,国内外油脂鉴别方法在数据处理方面研究较多:通过化学计量学方法从结果中提取脂肪酸组成特征信息,建立二维或三维分布图,使其表征油脂特征信息更简单直观,如主成分分析(PCA)、偏最小二乘法(PLS)和聚类分析等。Voncˇina等[2]采用气相色谱测定植物油脂中的脂肪酸种类和组成,以棕榈酸、硬脂酸、油酸、亚油酸、亚麻酸、花生酸和花生烯酸的百分含量作为特征参数,使用主成分分析和基于神经网络的聚类分析实现了植物油的分类,其交互验证准确率为95%,线性判别分析的判别准确率为96.84%,表明了脂肪酸结合化学计量学方法分析鉴别油脂是可行的。Hajimahmoodi等[3]用气相色谱脂肪酸指纹图谱法结合统计学中的最小二乘法模型,对含有棉籽油、橄榄油、豆油和葵花籽油这四种油的混合植物油脂进行了测定,相对标准偏差低于10%,方法可以检测这四种油脂中可能的掺杂物。Dourtoglou等[4]用气相色谱法提取了橄榄油和其它植物油的全部脂肪酸信息和1,3位脂肪酸信息,采用主成分分析鉴别橄榄油的掺伪,研究表明,主成分分析三维图用于区分橄榄油和其它植物油是可行的。本课题组通过脂肪酸分析结合主成分分析识别花生油、大豆油、米糠油、棕榈油和菜籽油,并对花生油中调和棕榈油进行识别[5],另外通过气相色谱法结合簇类的独立软模式(Soft Independent Modeling of ClassAnalogy,SIMCA)识别方法区分9种植物油脂,结果显示,除了芝麻油的识别率为75%外,其余均为100%[6]。
Fisher判别法是一种把高维数据压缩为一维数据的多元分析方法,基本思路就是从N个总体中抽取具有p个指标的样品观测数据,通过方差分析构造一个一维判别函数或判别式,然后应用这个线性函数把P维空间中的已知类别总体以及求知类别归属的样本都变换为一维数据,再根据其间的亲疏程度把未知归属的样本点判定其归属。这个线性函数应该能够在把P维空间中的所有点转化为一维数值之后,既能最大限度地缩小同类中各个样本点之间的差异,又能最大限度地扩大不同类别中各个样本点之间的差异,这样才可能获得较高的判别效率[7]。本方法可以最大限度的提取不同油脂的脂肪酸特征信息,更有利于聚类识别。本研究采用气相色谱法分析花生油、大豆油、棉籽油、芝麻油、菜籽油、亚麻籽油、葵花籽油、米糠油和棕榈油等9种植物油脂的脂肪酸组成,借助于Fisher判别法提取特征,建立不同油脂的判别函数,以此表达每种油脂特征信息。
1.1 试剂和仪器
石油醚(30~60℃):天津市凯通化学试剂有限公司;正己烷:天津市科密欧化学试剂有限公司;三氟化硼-乙醚溶液:国药集团化学试剂有限公司;甲醇:西陇化工股份有限公司;氢氧化钠:北京化工厂;以上试剂均为分析纯。
气相色谱仪9790,配备FID检测器:温岭福立分析仪器有限公司;HP-88脂肪酸柱(0.25 mm×0.2 μm×30 m):美国Agilent科技公司。
1.2 样品制备
材料:收集不同品种的油料种子:花生24种,大豆24种,棉籽13种,芝麻15种,菜籽28种;从不同的油脂公司收集不同品种的油样:亚麻籽油7种、葵花籽油4种、米糠油13种和棕榈油30种。
油样制备:取适量油料种子,粉碎后,用石油醚(30~60℃)浸泡24 h,抽滤后,滤液用旋转蒸发仪除去溶剂,110℃干燥1 h。装入棕色试剂瓶中备用。
1.3 脂肪酸分析
油脂脂肪酸甲酯化方法:GB/T 17376—2008:动植物油脂脂肪酸甲酯制备。气相色谱条件:进样口温度260℃;柱温150℃,以5℃/min的速率升至168℃,再以3℃/min的速率升至210℃;氮气压力0.06 MPa;检测器温度250℃;进样量:1μL。
1.4 统计分析方法
本文采用PASW Statistics 18软件包中的Fisher判别分析。Fisher判别分析首先根据选取的若干变量建立判别函数,计算各判别函数下的各类重心坐标,然后把观测值带入判别函数计算其判别得分,最后将判别得分与各自的重心坐标对比,最近的就是其归属。
2.1 9种植物油脂的脂肪酸组成
针对9种植物油脂样品采用1.3方法分析脂肪酸组成。9种植物油脂的脂肪酸组成范围见表1。从表1可知,植物油脂的饱和脂肪酸质量分数在6.14%~49.26%,其中棕榈油最多,平均为43.29%,而其他植物油脂为6.14%~25.73%,因此可以根据饱和脂肪酸含量鉴别棕榈油;不饱和脂肪酸质量分数在50.74%~49.26%,其中菜籽油的最多,平均为88.49%,而棕榈油最低,平均为56.71%;另外,除高芥酸的菜籽油外,其他植物油脂的不饱和脂肪酸中油酸和亚油酸的含量是最高的。同时从表中数据还可以看出,花生油在亚麻酸和花生酸组分上有别于其他油脂:亚麻酸含量很小,甚至没有,而花生酸的含量却又是9种油脂中最高的一个。对于菜籽油来说,芥酸可以说是其特征脂肪酸。然而,对于同时识别这9种植物油脂,人为观测和对比单一或两个或三个变量是远远不够的,因此需要借助于化学计量学方法来对多个变量进行分析,从中找到各种油脂的差异性,使结果分析更客观。
2.2 Fisher判别分析
选取9种植物油脂脂肪酸组分作为判别变量,采用Fisher判别法建立判别函数,同时根据各油脂的判别得分绘制二维判别散点图。比较不同判别函数下各类植物油脂重心坐标,确定哪个判别函数下的重心坐标具有明显差别,将其作为外部验证判别函数。
2.2.1 建立Fisher判别函数
以表1中的9种脂肪酸为变量,使用PASW Statistics 18软件的Fisher判别分析程序建立9种植物油脂的判别函数,判别函数的系数如表2所示,各类植物油脂在不同判别函数下重心坐标,见表3(容差检验时芥酸容差为0,为缺失变量,故变量芥酸不在分析中使用)。因为判别函数的数目为变量数和(类别数-1)的较小值[8],故本文共有8个Fisher判别函数。例如,判别函数Y1为:Y1=-0.122X1+0.094X2-0.941X3+0.087X4-0.437X5+0.767X6+0.919X7+0.247X8+10.417。
2.2.2 检验Fisher判别函数的显著性水平
假设各类中同一变量均值相等的前提下对这8个变量进行单因素方差分析,见表4。统计量Wilks’Lambda是类内距离平方和和总平方和之比,其值在0和1之间,值越小就表示在此变量下类间差异显著,而值越接近1则在此变量下类间差异不显著,从表中可知,变量豆蔻酸、棕榈酸和亚油酸变量对类间差异贡献最大,这和类内距离平方和F的值是一致的。另外,8个变量的置信水平Sig.均为0.000,小于0.05,说明拒绝原假设,不同类中的8个变量的均值都不相等,各个变量对类间的判别均产生影响。
表1 9种植物油脂的脂肪酸组成及含量范围/%
表2 以脂肪酸为变量的9种植物油脂的8个Fisher判别函数系数
表3 9种植物油脂分别在8个判别函数下的重心坐标
表4 单因素方差分析
针对由这8个变量组成的8个判别方程进行有效性检验,如表5所示。Wilk’s Lambda表示类内离差交叉乘积矩阵行列式与总离差交叉乘积矩阵行列式的比值,间接地检验判别函数的显著性水平,其值越小判别能力越强。从表4中Sig.栏中可以看出,判别函数1和8联合,2和8联合,4和8联合以及5和8联合的显著性水平均为0.000,说明前5个判别函数的判别能力是显著的。
表5 判别方程有效性检验
2.2.3 判别效果的检验
根据Fisher判别得到的各组原始判别率均为100%。采用交叉验证法对四种植物油脂进行回判,见表6。这里的交叉验证仅对分析中的试样进行的,并且在交叉验证中,每个试样是按照从该试样以外的所有其他试样派生的函数来分类的。表5显示为原始判别和交叉验证后的每类的样品数以及正确聚类率。由表可知,原始判别和交叉验证的准确率均为100%,无误判或错判现象,说明这8个变量的选择对于判别分析此9种油脂是有效的,方法是可行的。
表6 交叉验证和原始判别数据的比较
2.2.4 9种植物油脂的Fisher判别得分散点图
为了直观醒目的观察类内聚类情况和类间距离大小,试验以前两个判别函数得分绘制二维散点图,以前三个判别函数得分绘制三维散点图,如图1所示。由图1可知,在二维空间中,花生油和米糠油距离较近,芝麻油和亚麻籽油距离较近,在函数表达上差异较小,其他油脂分布均距离较大;在三维空间中,9种植物油脂各自分布集中,聚成一类,可以被清楚的识别。
图1 9种植物油脂的Fisher判别二维和三维散点图
表7 根据判别函数Y1的Fisher判别外部验证
2.3 Fisher判别分析应用即外部数据验证
根据Fisher判别法的基本思想,其判别效果的外部验证就是要用观测值带入判别函数中计算各样品坐标值,然后和各类重心距离对比,最近的就是其归属。实验取葵花籽油1种,其他8种植物油样各2种,共19个样品带入Fisher判别函数,验证其真实归属。样品脂肪酸组成见表7。选择判别函数Y1作为外部数据验证函数,因为,由表3可知,只有在判别函数Y1下,各类的重心差别较大。计算结果和判别结果见表7。结果显示,利用判别函数Y1计算外部样品的重心坐标,与表3比较可以准确判别样品归属,方法具有一定的可行性。
研究针对一定数量的9种植物油脂以8种脂肪酸的含量作为变量,通过Fisher判别分析建立判别方程,绘制二维和三维判别得分散点图进行聚类分析。在二维散点图中,花生油和米糠油以及芝麻油和亚麻籽油距离较近,不能直观准确判别,而在三维散点图中,9种油脂聚成九类,类间距离明显。另外,通过判别函数Y1判别未知样品的真实归属是可行的。
[1]韩国麒.油脂化学[M].河南:河南科学出版社,1995:35-49
[2]Voncina D B,Kodba Z C,NovicM.Multivariate data analysis in classification of vegetable oils characterized by the content of fatty acids[J].Chemometrics and Intelligent Laboratory Systems,2005,75:31-43
[3]Hajimahmoodi M,Vander Heyden Y,Sadeghi N,et al.Gaschromatographic fatty-acid fingerprints and partial leastsquares modeling as a basis for the simultaneous determination of edible oil mixtures[J].Talanta 2005(66):1108 -1116
[4]Doutoglou V G,Doutoglou Th,Antonopoulos A.,et al.Detection of olive oil adulteration using principal component analysis applied on total and regio FA Content[J].Journal of A-merican Oil Chemists'Society,2003(80):203-208
[5]范璐,吴娜娜,霍权恭,等.模式识别法分析5种植物油脂[J].分析化学,2008,36(8):1133-1137
[6]黄月华,范璐,李娟.气相色谱法SIMCA模式识别9种植物油脂的可行性研[J].河南工业大学学报:自然科学版,2009,30(5):13-17
[7]于秀林,任雪松.多元统计分析[M].北京:中国统计出版社,1999:115-128
[8]朱红兵.应用统计与SPSSS应用[M].北京:电子工业出版社,2011:642-650.
Study on the Characterization of 9 Kinds of Vegetable Oils Fisher Discriminant Function
Jing Yincheng1Fan Lu1Zhang Xinxin1Yang Guolong2Bi Yanlan2Zhou Yali1Wang Xianzhou1Du Shudan1
(College of Chemistry and Chemical Engineering,Henan University of Technology1,Zhengzhou 450001)
(College of Food Science and Technology,Henan University of Technology2,Zhengzhou 450001)
For establishing identification methods of different vegetable oils,gas chromatogram is applied to analyze fatty acid methyl esters of 9 kinds of vegetable oils,and the content of which is quantified by peak-area normalization method.Myristic acid,palmitic acid,stearic acid,oleic acid,linoleic acid,linolenic acid,arachidic acid,arachidonic acid,erucic acid are chosen as variables,and Fisher discriminant is used to estabilish 8 discriminant functions.Draw 2D scatterplot chart about discriminant score based on the scores of the first and second discriminant function.9 kinds of oils accumulate to 9 classes and the precision of original discrimination and cross validation is 100%respectively.Besides,comparing group centroids of vegetable oils from different functions,the ones of the first function is obviously odds from each other,therefore the first function is chosen as discriminant function for external authentication.The fatty acids of some unknown samples are brought into the first function.The result shows that the first function can distinguish validation samples with belongings exactly.The method is certain feasible to discriminate 9 kinds of vegetable oils and fats with 9 kinds of fatty acids as variables for functions.
fatty acids,fisher discriminance idenfication,vegetable oils and fats
TS202
A
1003-0174(2012)07-0115-05
河南工业大学校科研基金重点项目(09XZD005)
2012-02-15
井银成,男,1985年出生,硕士,分析化学
范璐,女,1962年出生,教授,粮油食品分析