近红外光谱法对食用植物油品种的快速鉴别

2011-11-18 05:50梁丹李小昱李培武等
湖北农业科学 2011年16期
关键词:近红外光谱主成分分析法

梁丹 李小昱 李培武等

摘要:以食用植物油为研究对象,建立了一种用近红外光谱技术鉴别食用植物油品种的方法。分别采用系统聚类法、主成分分析法、BP人工神经网络法进行了4个常用品种食用植物油的鉴别研究。结果表明,系统聚类法和主成分分析法均只能鉴别出4种植物油中的大豆油和花生油,不能识别玉米油和芝麻油,鉴别率仅为31.2%;利用BP人工神经网络法将60个校正集样品的11个主成分数据作为BP网络输入变量,建立的3层BP人工神经网络鉴别模型对4种植物油品种的鉴别效果最优,鉴别率为100%,表明BP人工神经网络法具有很好的分类和鉴别常用食用植物油品种的效果。

关键词:食用植物油;近红外光谱;系统聚类法;主成分分析法;BP人工神经网络法

中图分类号:TS225.1文献标识码:A文章编号:0439-8114(2011)16-3383-03

Discrimination of Edible Vegetable Oil by Near Infrared Spectroscopy

LIANG Dan1,2,LI Xiao-yu1,LI Pei-wu3,WANG Wei1

(1.College of Engineering & Technology, Huazhong Agricultural University,Wuhan 430070,China;2. Telecommunications Institute,Wuhan Institute of Technology,Wuhan 430074,China;3.Oil Crops Research Institute, the Chinese Academy of Agricultural Science,Wuhan 430062,China)

Abstract: A new method for the discrimination of varieties of edible vegetable oil by means of near infrared spectroscopy (NIRS) was developed. Using hierarchical clustering method, principal component analysis, BP artificial neural network method(ANN-BP) to identify the four different varieties of edible vegetable oil. The results showed that the hierarchical clustering method and principal component analysis could only identify soybean oil and peanut oil, their recognition rates just reached 31.2%. With ANN-BP, the 11 principal components data of 60 calibrated samples were used as the inputs of ANN-BP, then the three layers ANN-BP discrimination model was built, and it was the best method to identify the four different varieties of vegetable oil,and the recognition rate for the four different varieties of edible vegetable oil was 100%. So it was reliable and practicable to use ANN-BP to identify the different varieties of edible vegetable oil effectively.

Key words: edible vegetable oil; near-infrared spectroscopy; hierarchical clustering method; principal component analysis; BP artificial neural network

食用植物油是人們膳食结构中不可缺少的重要组成部分。由于各种植物油所用油料作物不同,其所含脂肪酸的种类及含量也各不相同,其营养价值、市场价格亦存在差异。少数不法商家为追求利润,以廉价的植物油,如:棕榈油、棉子油、菜子油等掺兑优质油品,以降低生产成本,从中牟取暴利。因此开展食用植物油品种的快速鉴定分析,可为鉴别掺混廉价油提供技术手段。近红外光谱(Near infrared spectroscopy,NIRS)分析方法具有快速、高效、无污染、无需前处理、无损分析、在线检测及多组分同时测定等优点[1,2],利用近红外及相关技术检测农产品及食品等均有报道[3-6]。但运用近红外技术对食用植物油的品种开展鉴别分析目前研究较少。由于近红外区吸收的光谱强度弱、灵敏度较低及噪音等因素影响,要使用近红外光谱技术对食用植物油进行快速、准确的品种鉴别,需要选择最优的预处理方法和相匹配的最优建模方法[1,2]。因此本研究采用了系统聚类法、主成分分析法、BP人工神经网络法这3种方法对食用植物油品种进行鉴别分析,并用主成分分析结合BP人工神经网络法建立植物油品种鉴别定性分析模型。

1材料与方法

1.1材料与仪器

在武汉各大超市购买了不同品牌的5种玉米油、3种大豆油、3种花生油、7种纯芝麻油。每个品牌的玉米油选取5个样本,每个品牌的大豆油、花生油、纯芝麻油各选取4个样本,共分成77个试验样品油。试验采用Bruker VECTOR 33N型FT-NIR近红外光谱仪,配置漫反射镀金积分球、Pbs检测器、样品旋转器、12 mm石英样品池、OPUS软件、MATLAB R2007a。

1.2试验方法

根据样品特点,采用透反射进行样品的光谱采集。测量时油样放入石英样品杯中,然后再将此样品杯置于样品池,盖上镀金的样品池盖(标准漫反射体)。为保证所有样品光谱采集条件的一致性,测量时油样均取2 mL,仪器分辨率为8 cm-1,扫描次数为64,光谱采集范围在10 000~4 000 cm-1。

试验分别采用系统聚类法、主成分分析法、BP人工神经网络法对77个样品油进行品种鉴别。

2结果与分析

2.1食用植物油近红外谱图

测得的植物油的近红外光谱如图1所示。从图1可以看出,不同种类植物油在整个光谱区的近红外图谱很相似,波峰、波形都没有明显差异,不能直接从图谱中鉴别植物油类别。因此需要利用化学计量学方法将原始光谱进行数学处理,才可能突出样品之间化学成分的细小差异,从而进行鉴别。

2.2基于系统聚类法的食用植物油品种鉴别

将77个原始油样的原始光谱及分别经过FD+VN、FD、SD、SD+VN和VN处理后得到的光谱,利用OPUS中的标准聚类分析方法在10 000~4 000 cm-1全谱范围内分别建立聚类分析模型。结果表明,未经处理光谱的鉴别效果最差,而光谱分别经SD和SD+VN处理后的聚类分析,均能把77个样品油分成4个类别,具体结果见表1。从表中能看出系统聚类法能准确鉴别出4种植物油中的12个花生油和12个大豆油,但无法区分玉米油和芝麻油,因此系统聚类法的鉴别率仅为31.2%。

从分析结果来看,不同种类的食用油虽然化学成分不完全相同,但它们相似的组成基本掩盖了化学成分的差异,使得近红外透反射光谱的峰位、峰数以及峰强差别不大。仅仅借助聚类分析方法,还不能有效实现鉴别分类植物油的目的。

2.3基于主成分分析法的食用植物油品种鉴别

对77个样品进行主成分分析,前11个主成分的特征值及累计可信度如表2所示。从表2可以看出,前11个主成分的累计可信度已经达到99.94%,因此选取前11个主成分来表示原始可见-近红外光谱的主要信息。每个样本对应每个主成分有一个得分值,主成分的得分能够反映样本间的相似性和独特性。基于样本的主成分得分图能够揭示样本的内部特征和聚类信息。如果把每个样本的第m和第n个主成分的得分值在图中表达出来,就得到了这两个主成分的二维得分图。试验比较了不同主成分组合的二维得分图,发现以PC5为横坐标和PC6为纵坐标的二维得分图(图2)对这4种植物油有一定的聚类作用,能定性区别不同品种植物油。从图2可以看出,玉米油、大豆油、花生油、芝麻油较明显分成4个区域,其中玉米油主要聚集在中间区域,芝麻油在中间偏上区域,这两片区域交叉明显,但12个大豆油样本和12个花生油样品聚合度较好,大豆油紧密地分布在图中的第四象限,花生油紧密地分布在图中的第三象限。因此主成分分析法也只能鉴别出12个花生油和12个大豆油,但对于玉米油和芝麻油不能完全的区分,鉴别率也是31.2%。

2.4基于BP人工神经网络法的植物油品種鉴别

虽然主成分分析法的鉴别率低,但可以选取前11个主成分来表示原始可见-近红外光谱的主要信息,且人工神经网络法可实现输入与输出之间的高度非线性映射,为此,可利用主成分分析结合人工神经网络建立4种植物油的鉴别模型。把11个主成分得分值作为输入,建立一个三层的BP网络模型,用于鉴别食用植物油的品种。77个样品油中,随机选择60个样品(玉米油20个,大豆油9个,花生油9个,芝麻油22个)组成校正集,其余17个样品(玉米油5个,大豆油3个,花生油3个,芝麻油6个)为测试集。将60个校正集样品的11个主成分得分值作为模型的输入,输出节点数设为4(因为有4种不同品种的植物油,且“0 0 0 1”代表玉米油、“0 0 1 0”代表芝麻油、“0 1 0 0”代表大豆油、“1 0 0 0”代表花生油),隐含层的传递函数采用双曲正切S型传递函数tan sig,输出层采用S型对数函数log sig,多次试验确定隐含节点数为24,选用训练函数TRAINLM、学习函数LEARNGOM,设定最小均方误差为0.001,训练次数为500,进行网络的训练。所设计的用于鉴别不同品种植物油的BP神经网络,训练仅达8步就达到设定的误差要求。将17个验证集样品作为测试集输入模型,得到检验结果,见表3。

上述结果表明,模型对于不同种类的植物油的鉴别率为100%,即:用BP人工神经网络法可以准确识别植物油的品种。

3结论

通过试验获得了4个品种77个植物油样品的光谱特征曲线,结果表明系统聚类法和主成分分析法都不能实现4个品种植物油的准确分类。系统聚类法只能辨别出4个品种植物油中的花生油和大豆油,主成分分析法也只能辨别出花生油和大豆油,而玉米油和芝麻油中间有交集,无法有效判别,因此系统聚类法和主成分分析方法的鉴别率均为31.2%。而采用主成分分析结合BP人工神经网络法建立的植物油品种鉴别定性判别模型的鉴别率达到100%。说明BP人工神经网络法可提取食用植物油近红外光谱信息中的微弱差异,表明了本研究提出的主成分分析结合人工神经网络方法用于鉴别常用植物油品种是有效的,为植物油品种的快速准确无损检测提供了一种有效的方法。

参考文献:

[1] 陆婉珍,袁洪福,徐广通. 现代近红外光谱分析技术[M]. 北京: 中国石化出版社,2006.

[2] 严衍禄,赵龙莲,韩东海,等. 近红外光谱分析基础与应用[M]. 北京:中国轻工业出版社,2005.

[3] 柴玉华,潭克竹. 基于近红外分析技术检测大豆脂肪酸含量的研究[J]. 农业工程学报,2007,23(1):238-241.

[4] 王云,徐可欣,常敏. 近红外光谱技术检测牛奶中脂肪及蛋白质含量校正模型的建立[J]. 光学仪器,2006,28(3):3-7.

[5] 陈全胜,赵杰文,张海东,等. 基于支持向量机的近红外光谱鉴别茶叶的真伪[J]. 光学学报,2006,26(6):933-937.

[6] 陈永明,林萍,何勇. 基于遗传算法的近红外光谱橄榄油产地鉴别方法研究[J]. 光谱学与光谱分析,2009,29(3):671-673.

猜你喜欢
近红外光谱主成分分析法
中国装备制造业阶段竞争力研究
陕西省各地区人力资本水平综合评价与分析
利用油水稳定化和支持向量回归增强近红外光谱测定油中水分的方法
基于一元线性回归的近红外光谱模型传递研究