激光近红外结合SVM的花生油掺伪定性定量分析

2016-01-03 10:49曾路路宋志强何东平亓培实
中国粮油学报 2016年8期
关键词:花生油波段波长

曾路路 涂 斌 尹 成 郑 晓 宋志强 何东平 亓培实

激光近红外结合SVM的花生油掺伪定性定量分析

曾路路1涂 斌1尹 成1郑 晓1宋志强1何东平2亓培实3

(武汉轻工大学机械工程学院1,武汉 430023)
(武汉轻工大学食品科学与工程学院2,武汉 430023)
(武汉百信环保能源科技有限公司3,武汉 430023)

利用激光近红外技术结合支持向量机(support vector machines,SVM)对花生油掺伪进行定性和定量分析。使用激光近红外光谱仪采集188个掺入餐饮废弃油、大豆油、玉米油以及菜籽油的花生油样品光谱图。结果表明,建立的SVC分类模型均能实现100%的预测准确率,但经提取波长后的模型的变量变少,由全波段的451个波长数减少为136个。建立的SVR回归模型也能准确预测花生油中掺伪油的含量,其中非全波段模型参与建模变量变少,由451个降低到66个,预测精度也更高,校正集和测试集相关系数分别达到99.88%、99.90%,均方根误差都低于6.99E-4。由此可知,特征波长提取方法不仅可以减少建模变量,提高建模效率,也能够提高模型的预测能力。结果表明,运用激光近红外结合SVM可以实现花生油掺伪油脂的定性和定量分析。

激光近红外 花生油 支持向量机 定性和定量 后向偏最小二乘法

花生油是我国主要的食用油之一,营养价值高。目前有不少不法商贩为了牟取暴利对食用植物油进行掺假[1]。如在花生油中加入大豆油、菜籽油等价值稍低的食用油,有的甚至在花生油中掺入蓖麻油、餐饮废弃油等对人体有危害的非食用油[2-3]。为了杜绝不法掺假行为,目前的常规检测方法有感官检测、理化检测等。但常规检测方法很难检测混合油的掺入成分及掺伪量,因此越来越多的学者开始重视仪器分析法[4]。目前利用近红外光谱(Near Infrared,NIR)来检测橄榄油的掺伪,其准确率可达到98%[5]。而激光近红外技术因其以新型的超辐射发光二极管(super luminescent Light Emitting Diode,SLED)作为光源,有着低噪声、宽光谱以及高能量等特点,并且线性度、单色性较卤钨灯更好,比近红外技术更有优势[6]。近红外光谱技术是利用近红外谱区内包含的物质信息,实现对有机物定性和定量分析[7]。目前,近红外光谱技术已在石油化工、农业、食品、高分子、医学制药等许多领域中发挥着积极作用[8]。近红外分析技术在油脂检测方面的应用主要体现在油脂种类分类检测、油脂品质分析以及油脂掺伪鉴别[9-11]。

本试验采用激光近红外技术对花生油掺伪进行掺伪种类的定性分析和掺伪量的定量分析。采用支持向量机分类(Support Vector Machine Classifier,SVC)和支持向量机回归(Support Vector Machine Regression,SVR)建立食用植物油定性和定量判别模型。对激光近红外图谱进行3种不同的预处理,采用后向偏最小二乘法(Backward interval Partial Least Squares,BiPLS)提取特征波长。旨在提出一种有效的定性、定量判别模型,实现对花生油掺伪种类和浓度快速、准确的鉴别。

1 试验与方法

1.1 样品配制与选择

样品主要是从一些地区分批次收集的餐饮废弃油脂和从超市购买的不同品牌、不同品种的合格食用植物油(13种大豆油、12种菜籽油、4种玉米油、7种花生油)。随机抽取收集到的植物油品牌(大豆油:锦麟、福临门;玉米油:长寿花金胚玉米油、福临门;菜籽油:金龙鱼外婆乡小榨、鲁花)和餐饮废弃油按一定比例掺入纯花生油。以2%的等差梯度,配制掺伪油脂质量分数为3%~95%的二元体系花生油掺伪样品。每份为10 g,置于离心管中混合均匀。共获得188份掺伪食用植物油样品。

试验采用光谱-理化值共生距离算法(sample set partitioning based on joint X-Y distances algorithm,SPXY)[12]以3∶1 的比例将样品划分成校正集和测试集,其中校正集样品用于建立模型,测试集样品用于检测模型预测性能的优劣。样品实际种类、编号和校正集及预测集样品数量如表1所示。

表1 样本种类、编号以及数量

1.2 试验仪器和软件

试验仪器为实验室研发的激光近红外植物油品质快速检测仪采集光谱,其中XL410型激光近红外光谱仪:光谱测定范围为1 350~1 800 nm,扫描次数32次,分辨率为3.5 cm-1美国AXSUN公司;试验采用激光近红外光谱仪自带的软件对样品进行图谱采集,用CAMO公司Unscramble 10.2化学计量学软件和美国Math Works公司的MATLAB_R2012a对所采集的数据进行预处理和建模。

1.3 激光近红外光谱图采集

图谱采集:将装有样品的试剂瓶放入水浴锅中加热至40℃,恒温静置10 min,取光程为5 mm的比色皿,用移液管将样品注入比色皿至3/4处,将装有样品的比色皿放入样品池,采集图谱。每个样品采集3次,取平均值作为最终的图谱数据。每测量一次,将比色皿用有机溶剂洗涤并干燥后再进行下一次测量。试验期间尽量保证室温(25℃)、光线、湿度基本一致。所采集的近红外光谱原始数据图如图1所示。

图1 188份原始图谱

2 结果与分析

2.1 掺伪的定性判别分析

2.1.1 图谱预处理

近红外光谱仪在对样品进行采集时,除了可以得到分析样品所必需的信息外,还会有其他无关信息。为了得到试验所需信息,必须对所采集的光谱数据进行预处理[13]。对校正集和测试集样本采用:标准正态变量变换(standard normal variate,SNV)来消除光谱的基线漂移;背景趋势去除技术(De-trending,DT)消除光程的影响;多元散射校正(multiplicative scatter correction,MSC)消除散射的影响。图2为DT预处理后的光谱图。

图2 DT预处理光谱图

2.1.2 特征波长的提取

建立模型时,波段的选择对模型的测试精度有着一定的影响。波段选取过宽,会导致信息冗余,对建模造成干扰;波段选取过窄,可能会丢失分析时所必需的信息[14]。为了得到精度较高的测试结果,需要选取适当的波长范围。间隔偏最小二乘法(iPLS)是一种有效的特征波长提取方法,其原理是将整个光谱图分成若干个子区间,在每个子区间上进行偏最小二乘法回归,建立局部模型。以交互验证均方差(RMSECV)为标准,分别比较全谱模型和局部模型的RMSECV值,取RMSECV值最小的模型所在区间为最佳区间[15]。后向偏最小二乘法(BiPLS)是iPLS的改进和延伸[16]。预处理后的数据经过BiPLS选择后的特征波长数量及对应的位置见图3。

图3 DT-BiPLS特征波长

2.1.3 全波段和BiPLS特征波长建模

由近红外光谱扫描所得光谱图可以看出,所有的原始图谱相差不大,需要通过建立花生油掺伪品种的判别模型才能区分它们之间的差异[17]。支持向量机(support vector machines,SVM)是Vapnik 等[18]根据统计学理论提出的一类新型机器学习方法,用于模式识别分类,函数逼近和非线性回归等实际问题,可细分为支持向量机分类(SVC)和支持向量机回归(SVR)2种方法。SVM用于模式识别时,需要对核函数及其参数进行选择,本试验采用具有较宽收敛域的RBF 核函数[19]。

分别将3种不同预处理的全波段变量和经Bi-PLS提取的特征波长变量作为SVM的输入量,选用RBF核函数,采用网格搜索算法对组合参数(C,g)进行寻优,分别在全波段和特征波长变量建立SVC鉴别模型,根据样品预测集的准确率来评价模型的好坏[20]。表2为3种预处理的定性模型评价指标。

表2 全波段与BiPLS特征波长SVC模型的测试结果

原始数据在全波段和特征波长建模的测试准确率低于预处理后的准确率,说明预处理对模型的结果有很大影响。3种预处理在全波段建模和特征波长建模的测试准确率均高达91.49%以上,均能很好地实现对花生油掺伪种类地判别。采用MSC预处理方法在全波段与特征波长建模的测试集和校正集准确率均为100%,且在全波段建模的参数小,效果最好。而采用SNV预处理方法在特征波长建模的测试准确率高于全波段建模的准确率,波长数也由原来的451减少到了136,大大缩短了建模时间,说明特征波长提取对模型的结果也是有一定影响的。图4为MSC-SVC结果图。综上所述,原始数据与采用3种预处理方法在全波段与特征波长建模都可以实现对花生油掺伪种类的判别,且采用预处理方法可以提高模型的准确率。在考虑建模时间的影响时,运用特征波长建模方法可减少建模时间。

图4 MSC-SVC模型预测结果

2.2 掺伪的定量判别分析

2.2.1 特征波长提取

对光谱图进行SNV、MSC、DT预处理后,采用Bi-PLS将其划分成20个子区间,不同预处理后的数据经过BiPLS选择后的特征波长数量图及对应的位置图如图5所示,原始数据和经3种不同预处理方法预处理后的数据,经过BiPLS提取后的波长数目以及对应的测试均方根误差(RMSE)如表3所示。

图5 SNV-BiPLS特征波长

表3 不同预处理光谱经BiPLS提取的特征波长

2.2.2 全波段和特征波长建模

采用SVR方法,将3种不同预处理数据的全波段变量和经BiPLS提取的特征变量作为输入量,采用网格搜索算法对组合参数(C,g)进行参数寻优,建立掺伪油脂定量预测模型[21],结果如表4所示。3种不同预处理方法建立的SVR模型测试相关系数均在99.04%以上,均方根误差低于6.99E-4,均能很好地判断花生油的掺伪量。预处理方法能够提升模型的测试效果,对建模结果有一定的影响。全波段和特征波长建模的测试结果相差不大,但经特征波长提取的模型可以剔除许多无关信息,建模变量可以由原来的451个降低到66个,缩短了建模时间。试验表明,MCS-BiPLS-SVR模型的波长数少,参数小,稳定性好。图6为MSC-BiPLS-SVR模型预测结果。综上所述,原始数据与采用3种预处理方法后在全波段与特征波长建模均能实现对花生油的定量分析,预处理方法可提高模型的测试能力,运用特征波长建模可缩短建模所需时间。

图6 MSC-BiPLS-SVR模型预测结果

表4 全波段和BiPLS优选波长SVR模型评价指标

3 结论

运用激光近红外技术结合支持向量机算法可以实现花生油掺伪的定性定量分析。结果表明,对于定性分析,建立的SVC和BiPLS-SVC模型均能实现掺伪油种类鉴别;对于定量分析,建立的SVR和BiPLS-SVR模型都可以实现掺伪油含量预测;预处理方法能够提高模型的预测能力,减小参数组合(C,g)值;特征波长提取方法在保证模型预测效果的前提下,减少了建模变量,缩短了建模时间。本研究为其他食用植物油掺伪检测提供方法。试验的不足之处在于掺伪样本数量有限,且掺伪种类少,在以后的研究中要加大食用植物油掺伪样本的搜集和配置。

[1]李娜.食用油安全问题浅析[J].中国粮食经济,2008(3):17-18

Li Na.Oil security analysis[J].China Grain Economy,2008(3):17 -18

[2]潘红红,梁润,万渝平.问题食用油仪器分析方法研究进展[J].农业工程,2013,3(5):76 -80

Pan Honghong,Liang Run,Wan Yuping.Research advance in instrument method for edible oil[J].Agricultural Engineering,2013,3(5):76 -80

[3]邹洁,赵维佳,汪海峰,等.大豆油中掺伪棕榈油的检测方法研究[J],中国油脂,2009,34(4):73 -76

Zou Jie,Zhao Weijia,Wang Haifeng,et al.Determination of palm oil adulterated in soybean oil[J].China Oils and Fats,2009,34(4):73 -76

[4]沈雄,郑晓,何东平.餐饮业废弃油脂鉴别检测方法研究进展[J].中国油脂,2011,36(11):49 -51

Shen Xiong,Zheng Xiao,He Dongping.Advance in differential detection method of waste cooking oil[J].China Oils and Fats,2011,36(11):49 -51

[5]薛雅琳,王雪莲,张蕊,等.食用植物油掺伪鉴别快速检验方法研究[J].中国粮油学报,2010,25(10):116 -118

Xue Yalin,Wang Xuelian,Zhang Rui,et al.An authentication method of edible vegetable oils[J].Journal of the Chinese Cereals and Oils Association,2010,25(10):116 -118

[6]刘燕德,万常斓.芝麻油掺伪的近红外透射光谱检测技术[J].农业机械学报,2012,43(7):136 -140

Liu Yande,Wan Changlan.Analysis of sesame oil adulteration using near infrared transmission spectroscopy[J].Transactions of the Chinese Society for Agricultural Machinery,2012,43(7):136 -140

[7]张勇,丛茜,谢云飞,等.NIRS分析技术在农业中的应用进展[J].农业工程学报,2007,23(10):285 -290

Zhang Yong,Cong Qian,XieYunfei,et al.Progress in application of near infrared spectroscopy technology in agriculture[J].Transactions of the Chinese Society of Agricultural Engineering,2007,23(10):285 -290

[8]王菊香,邢志娜,申刚,等.光谱预处理和波长选择对混胺燃料各指标近外光谱定量分析结果的影响比较[J].计算机与应用化学,2013,30(1):39 -42

Wang Juxiang,Xing Zhina,Shen Gang,et al.Effects of spectral preprocessing and wavelength selection on content determination in mixed - amine by NIR spectroscopy[J].Computers and Applied Chemistry,2013,30(1):39 -42

[9]黄富荣,罗云瀚,郑仕富,等.全血胆固醇、甘油三酯近红外光谱分析与模型优化[J].光学学报,2011,31(10):267-272

Huang Furong,Luo Yunhan,Zheng Shifu,et al.Near- infrared spectroscopic analysis and model optimization on cholesterol and triglyceride in whole blood[J].Acta Optica Sinica,2011,31(10):267 -272

[10]王铭义,郭建英,张佳宁,等.三级大豆油酸价的近红外光谱检测[J].食品科学,2011,32(22):171 -174

Wang Mingyi,Guo Jianying,Zhang Jianing,et al.Determination of acid value in third grade soybean oil by near infrared spectroscopy[J].Food Science,2011,32(22):171 -174

[11]宋鹏,张明,曹刘霞,等.食用油脂掺入异种油脂检测方法研究进展[J].粮食与油脂,2009(11):4 -8

Song Peng,Zhang Ming,Cao Liuxia,et al.Current advances in detection of mixed different edible oils and fats[J].Cereals & Oils,2009(11):4 -8.

[12]刘善梅,李小昱,钟雄斌.考虑品种差异的冷鲜猪肉含水率高光谱信号补正算法[J].农业工程学报,2014,30(4):272 -278

Liu Shanmei,Li Xiaoyu,Zhong Xiongbin.Hyperspectral signal correction algorithm for water content of cold fresh pork with considering difference between varieties[J].Transactions of the Chinese Society of Agricultural Engineering,2014,30(4):272 -278

[13]宋志强,沈雄,郑晓,等.应用近红外光谱对低碳数脂肪酸含量预测[J].光谱学与光谱分析,2013,33(8):2079 -2082

Song Zhiqiang,Shen Xiong,Zheng Xiao,et al.Low carbon number fatty acid content prediction based on near-infrared spectroscopy [J].Spectroscopy and Spectral Analysis,2013,33(8):2079 -2082

[14]杨仁杰,刘蓉,徐可欣.二维相关光谱结合偏最小二乘法测定牛奶中的掺杂尿素[J].农业工程学报,2012,28(8):259 -263

Yang Renjie,Liu Rong,Xu Kexin.Detection of urea in milk using two-dimensional correlation spectroscopy and partial least square method[J].Transactions of the Chinese Society of Agricultural Engineering,2012,28(8):259 -263

[15]黄富荣,李仕萍,余健辉,等.基于iPLS的血清胆固醇、甘油三酯近红外定量分析[J].光谱实验室,2011,28(8):2774-2778

Huang Furong,Li Shiping,Yu Jianhui,et al.Determination of cholesterol and triglyceride in serum based on interval partial least squares by near- infrared spectrum[J].Chinese Journal of Spectroscopy Laboratory,2011,28(8):2774-2778

[16]石吉勇,邹小波,赵杰文,等.BiPLS结合模拟退火算法的近红外光谱特征波长选择研究[J].红外与毫米波学报,2011,30(5):458 -462

Shi Jiyong,Zou Xiaobo,Zhao Jiewen,et al.Selection of wavelength for strawberry NIR spectroscopy based on BiPLS combined with SAA[J].Journal of Infrared and Millimeter Waves,2011,30(5):458 -462

[17]蒋雪松,陆辉山,张林,等.基于近红外光谱对老陈醋的pH值和可溶性固形物定量与定性的检测研究[J].红外技术,2013,35(11):737 -740

Jiang Xuesong,Lu Huishan,Zhang Lin,et al.Qualitative and quantitative detection research of mature vinegar’s pH and SSC based on near infrared spectroscopy[J].Infrared Technology,2013,35(11):737 -740

[18]方慧文,曾爱民,江小明,等.近红外光谱结合化学计量学技术在食品掺假分析中的应用[J].食品安全质量检测学报,2012,3(5):427 -431

Fang Huiwen,Zeng Aimin,Jiang Xiaoming,et al.Application of near-infrared spectroscopy combined with chemometrics in food adulteration detection[J].Journal of Food Safety & Quality,2012,3(5):427 -431

[19]付元元,任东.支持向量机中核函数及其参数选择研究[J].科技创新导报,2010(9):6 -7

Fu Yuanyuan,Ren Dong.Approach to SVM kernel functions parameters selection[J].Science and Technology Innovation Herald,2010(9):6 -7

[20]钟燕萍,钟振声,陈兰珍,等.近红外光谱技术定性鉴别蜂蜜品种及真伪的研究[J].现代食品技术,2010,26(11):1280 -1283

Zhong Yanping,Zhong Zhensheng,Chen Lanzhen,et al.Qualitative identification of floral origin and adulteration of honey by near- infrared spectroscopy[J].Modern Food Science &Technology,2010,26(11):1280 -1283

[21]Shen Xiong,Zheng Xiao,Song Zhiqiang,et al.Rapid identification of waste cooking oil with near infrared spectroscopy based on support vector machine[J].Computer and Computing Technologies in Agriculture,2012,(10):11 -18.

Qualitative and Quantitative Analysis of Peanut Oil Adulteration by Laser Near Infrared Spectroscopy with SVM

Zeng Lulu1Tu Bin1Yin Cheng1Zheng Xiao1Song Zhiqiang1He Dongping2Qi Peishi3
(School of Mechanical Engineering,Wuhan Polytechnic University1,Wuhan 430023)
(College of Food Science and Engineering,Wuhan Polytechnic University2,Wuhan 430023)
(Pashun Group3,Wuhan 430023)

Qualitative and quantitative analyses of peanut oils adulteration were performed by combining near infrared(NIR)spectroscopy with support vector machines(SVM).With NIR spectrometer,the spectra of 188 peanut oil samples adulterated with waste oil,soybean oil,corn oil and canola oil were collected.Experiments demonstrated that with the SVC models,the accuracy of prediction reached to 100%.Upon wavelengths extraction,the wavelength number of full spectrum was reduced from 451 to 136.With the SVR regression models,the adulterated content of peanut oil could be predicted accurately,of which,the number of modeling variables for the non - full spectrum models was reduced from 451 to 66 with higher accuracy of prediction.Correlation coefficients of calibration and test sets reached to 99.88%and 99.90%,respectively.All the root-mean-square errors were lower than 6.99E-4.On this basis,the characteristic wavelengths extraction not only reduced modeling variables and improved the modeling efficiency,but improved the modeling predictive capability.It was validated by results that the combination of NIR spectroscopy with SVM could realize the qualitative and quantitative analyses of adulteration of peanut oil.

NIR,peanut oil,support vector machines,qualitative and quantitative,BiPLS

O657.3

A

1003-0174(2016)08-0126-06

“十一五”国家科技支撑计划(2009BADB9B08),武汉市科技攻关计划(2013010501010147),武汉工业学院食品营养与安全重大项目培育专项(2011Z06),武汉轻工大学2014年研究生创新基金(2014cx005)

2014-12-04

曾路路,女,1991年出生,硕士,智能检测技术

郑晓,男,1958年出生,教授,油脂压榨原理与智能检测

猜你喜欢
花生油波段波长
最佳波段组合的典型地物信息提取
杯中“日出”
不同方法提取的花生油品质分析研究
基于PLL的Ku波段频率源设计与测试
小型化Ka波段65W脉冲功放模块
L波段kw级固态功放测试技术
基于频域分析方法的轨道高低不平顺敏感波长的研究
日本研发出可完全覆盖可见光波长的LED光源
RP—HPLC波长切换法同时测定坤泰胶囊中6个成分的含量
肉豆蔻挥发油抑菌及抗花生油氧化作用研究