位丽娜,刘翠玲,赵琦,戴月(北京工商大学,北京10048)
基于光谱技术的芝麻油掺伪定性分析研究
位丽娜,刘翠玲,赵琦,戴月
(北京工商大学,北京10048)
摘要:采用近红外光谱和中红外光谱技术结合极限学习机算法建立芝麻油中掺入大豆油的定性分析模型。选取不同品牌、批次的芝麻油、大豆油配置90个掺伪样本与40个芝麻油样本做定性分析。设定极限学习机算法相关网络参数,比较近红外光谱和中红外光谱的定性模型识别结果,研究光谱检测方法的可行性和分类识别的准确率,为实现基于光谱检测技术的芝麻油掺伪快速辨别分析奠定理论和实践检验基础,抑制芝麻油掺伪情况的发生。
关键词:光谱技术;芝麻油掺伪;极限学习机算法
芝麻油以其香浓特别的味道、丰富的营养价值而深受中国人的喜爱,是人们餐桌上必不可少的烹调佐食佳品。由于芝麻油的营养丰富,售价也较其他的食用油偏高,于是在经济利益的驱动下,芝麻油掺伪行为时有发生。许多不法商贩在纯芝麻油中掺入廉价的大豆油、菜籽油、花生油等以次充好并从中谋取暴利,因此亟需快速高效的芝麻油掺伪检测技术来有力打击这种非法行为。
本文采用近红外光谱和中红外光谱技术,结合极限学习机的模式识别算法对芝麻油中掺入大豆油进行定性分析建模,有效地将纯正芝麻油和掺伪芝麻油进行区分,为实现基于光谱检测技术的芝麻油掺伪快速辨别分析奠定理论和实践检验基础,抑制芝麻油掺伪情况的发生。
芝麻油常规检测技术有理化分析方法(酸价、碘值、皂化值、水分、挥发物等)、显色法(威勒迈志法、波多因法、硫酸显色法)以及色谱法(气相色谱法、高效液相色谱法、气质联用法等)。刘馨[1]等利用芝麻油中的芝麻素成分,采用波多因法判定是否为纯芝麻油。唐晓丹[2]等采用气相色谱法分析了不同香型(不香型、淡香型、浓香型)的51个芝麻油样品,检测不同香型芝麻油中脂肪酸的组成。吴广臣[3]等利用近红外光谱技术对芝麻油中掺入玉米油和棉花籽油进行了研究。刘燕德[4]等采用近红外光谱技术结合间隔偏最小二乘法分别建立芝麻油中掺入大豆油、玉米油和花生油的定量检测模型。潘磊庆[5]等使用电子鼻系统PEN3对芝麻油中掺入大豆油、玉米油、葵花籽油进行检测分析,并采用主成分分析(PCA)和线性判别式分析(linear dis-criminant analysis LDA)2种方法分析。N.Vlachos[6]等用傅里叶红外光谱分析掺假橄榄油,在3 009 cm-1下,能分别检测出掺有9 %的玉米油或芝麻油和掺有6 %葵花籽油或大豆油的橄榄油。Goodac[7]等根据特征吸收光谱的不同,利用傅里叶变换红外光谱与化学计量学技术法结合来测定分析可可脂掺伪,取得了不错的试验效果。但是采用上述常规方法进行样本的检测需要进行前处理、检测耗时长、操作复杂、不能进行批量分析,具有一定的局限性。
近几年来光谱检测技术得到了迅速的发展,并广泛的应用于食品检测研究领域[8-10]。吴静珠[11]等针对花生油掺伪的问题,采用近红外光谱技术区分花生油与按照10个梯度的体积比掺入大豆油、棕榈油、菜籽油以及调和油的掺伪花生油。将40个掺伪样本与5个花生油样本结合支持向量算法建立了花生油的掺伪鉴别模型,识别和预测的结果正确率均能达到100 %,模型具有一定的可行性与实用性。Luna A S[12]等采用近红外光谱法对转基因和非转基因大豆油进行了分类识别,应用主成分分析算法提取特征光谱并剔除了异常样本,然后分别用支持向量机算法和偏最小二乘算法对结果进行了分析,分类结果的正确率约为90 %。Vincent Baeten[13]等采用傅里叶变换的红外光谱方法检测橄榄油掺入榛子油的比例,对油品及其皂化物质采集中红外光谱,结果表明该方法对于橄榄油中掺入榛子油的鉴别是完全可行的,且对于榛子油掺杂量的检出限为不低于8 %。Yoke W.Lai[14]等应用傅里叶变换的红外光谱技术,结合主成分分析与判别分析算法检测玉米油、葵花油、菜籽油等8个种类食用油,并利用3100cm-1~2800cm-1和1800cm-1~100 cm-1范围内的光谱信息进行食用油的聚类分析,根据橄榄油与其他种类油的明显差异实现掺假橄榄油的定性鉴别分析。Hong Yang[15]等利用FT-IR、FT-NIR和Raman检测方法对食用油和脂肪酸分别进行分类辨别,并应用LDA (linear discriminant analysis)和CVA(canonical variate analysis)的分析方法对光谱数据进行分析处理。结果表明,采用FT-IR检测方法得到的分类结果是最好,准确率为98 %,而另外两种方法分类的准确率略低于FT-IR的检测方法,但是3种方法都是可行的。JunLuo[16]等使用拉曼光谱法检验掺入体积比为5 %~20 %的大豆油、玉米油和花生油的掺假芝麻油,应用主成分分析法与偏最小二乘法分别对光谱进行定性建模,分类结果正确率可达100 %,表明拉曼光谱技术能够实现检测芝麻油是否掺伪。
1.1材料
为模拟掺伪芝麻油,本试验的样本均为光谱技术与品质检测研究室配制的样本,各种类的食用油均采购自北京市各大超市,均为正品保质的食用油。通过前期的分析调研结果表明参与芝麻油掺伪的食用油多为价格相对廉价的大豆油和菜籽油,因此选购了不同品牌不同批次的芝麻油3种[分别为品种一100 %纯芝麻油(一级压榨)400 mL、品种二100 %纯芝麻香油(一级压榨)245 mL、品种三(一级压榨)350 mL]、大豆油3种(品种四一级大豆油1.8 L、品种五一级豆油1.8 L、品种六大豆油1.8 L)进行芝麻油的掺伪样本配制。
1.2仪器
本试验采用德国Bruker VERTEX 70傅里叶红外光谱仪采集光谱,仪器主要技术指标如下:
1)光谱检测范围为25 000 cm-1~20 cm-1,覆盖近红外、中红外、远红外3种谱区;
2)信噪比45 000∶1(峰—峰值,1 min测试);
3)分辨率为0.4 cm-1,可选0.15 cm-1;
4)采样速率为80张谱/s;
5)步进扫描—时间分辨率为5 ns。
1.3方法
1.3.1试验样品制备
为了增加定性模型的可靠性,掺伪样本按每50 mL芝麻油中掺入体积比为50 %、45 %、40 %、35 %、30 %、25 %、20 %、15 %、10 %、5 %的10个梯度进行配,共计3×3×10=90个掺伪样本。配制好的的芝麻油掺伪样本与纯芝麻油样本40个共计130个样本进行定性建模分析。
1.3.2仪器参数设定
本试验近红外光谱采集试验参数:分辨率8 cm-1,样本扫描次数32次,光谱采集范围12 000 cm-1~ 4 000 cm-1,光阑设置6 mm,扫描速度10 kHz。中红外光谱采集试验参数:分辨率8cm-1,样本扫描次数32次,光谱采集范围4 500 cm-1~600 cm-1,光阑设置6 mm,扫描速度10 kHz。
1.3.3极限学习机
极限学习机算法(Extreme Learning Machine)是由新加坡南洋理工大学的副教授黄广斌先生在2004年提出的一种单隐层前馈网络训练方法[17-18],该算法具有很强的学习能力并广泛应用于众多领域[19-20]。传统的人工神经网络算法如BP、RBF等在设置网络相关训练参数时一般经人为操作而无法确定最优隐层节点数,训练时间长而且易得到局部最优解,而极限学习机算法可以较好的解决上述问题,是一种学习训练速度快、泛化能力较强、能够获得全局最优解的训练算法。
极限学习机算法在设置输入层跟隐层之间的权重连接值和隐层节点阈值时是随机生成的,并且在训练过程中无需调节输入层跟隐层间的权重连接值和隐层节点的阈值,只要人为设定隐层节点的数量便可以得到最优的唯一解。极限学习机算法不仅适用于回归、拟合问题,同样也可以适用于分类、模式识别等领域问题。
极限学习机算法如下:
给定N个不同的样本(xj,tj)∈Rn×Rm,g(x)代表激活函数,表示隐层节点数量,数学模型表达式(1)表示单隐层前馈神经网络:
式中:ωi、bi表示随机生成的隐层各节点的参数;βi是连接隐层第i个节点的权重值;j=1,2,…,N。当网络的实际输出跟期望输出相等时则有式(2),简写成式(3)。
极限学习机算法依照如下几个步骤来实现:
1)确定隐层节点的个数,输入层跟隐层之间的权重连接值ω和隐层节点阈值b均为随机设定。
2)从S型函数、正弦函数、不可微函数等函数中选择一个作为隐层节点的激活函数来计算隐层输出矩阵H。
3)计算输出层权值β赞= H+T,其中H+为隐层输出矩阵H的Moore-Penrose广义逆。
2.1基于近红外光谱的芝麻油掺伪定性建模分析
选取芝麻油掺入大豆油的90个掺伪样本与从古船采样获得的40个纯芝麻油样本进行近红外的定性建模分析。
食用油的主要构成是脂肪酸甘油三酯的混合物,因此在芝麻油中掺入其他种类的食用油不会明显改变芝麻油的成分,掺入大豆油的芝麻油和大豆油、纯芝麻油的主要成分大致相同[21]。基于近红外光谱的大豆油、芝麻油掺入大豆油和纯芝麻油谱图见图1。
图1 基于近红外光谱的大豆油、芝麻油掺入大豆油和纯芝麻油谱图Fig.1 The near infrared spectrum of soybean oil,sesame oil mixed with soybean oil and pure sesame oil
对比图1所示的大豆油、芝麻油掺入大豆油和纯芝麻油的近红外光谱图,可以发现它们的近红外光谱图的吸收峰位置基本相同,都在6 000 cm-1~4 000 cm-1范围内有明显的吸收峰,分别在5 800、5 680、4 665、4 345、4 265 cm-1附近出现相似的近红外光谱吸收峰,无法直观地区别出3条光谱有什么明显差异,因此需要结合模式识别算法进行定性分析来区别芝麻油中是否掺伪。
将90个芝麻油掺入大豆油的掺伪样本和40个纯芝麻油样本的近红外光谱图转为光谱数据表,每张光谱有2 074个数据点,形成130个试验样本的数据表。通过MATLAB软件实现极限学习机(ELM)分类算法,建立鉴别芝麻油掺入大豆油与纯芝麻油的定性分析模型,经过多次计算比较,设定隐层节点个数为45个,激活函数选择S函数时定性结果最佳。随机分配90个样本作为训练集样本,40个样本作为测试集样本,设置类别1表示纯正芝麻油的类别,类别2表示芝麻油中掺入大豆油的类别。
建模分析结果训练集分类正确率为98.89 %(89/ 90),测试集预测分类正确率为97.5 %(39/40)。测试集预测结果见图2。
图2 基于近红外光谱的芝麻油掺入大豆油和纯芝麻油的预测分类结果Fig.2 The forecasting result of pure sesame oila,sesame oil mixed with soybean based on near infrared spectrum
其中圆圈符号表示样本的真实类别,星星符号表示通过ELM算法进行预测的分类。结果表明有1个掺伪的芝麻油样本分类有误,预测准确率为97.5 %。
2.2基于中红外光谱的芝麻油掺伪定性建模与分析
选取芝麻油掺入大豆油的90个掺伪样本与从古船采样获得的40个纯芝麻油样本进行中红外的定性建模分析。
同2.1,在芝麻油中掺入大豆油不会明显改变芝麻油成分,因此掺入大豆油的芝麻油与大豆油、纯芝麻油的主成分大致相同。基于中红外光谱的大豆油、芝麻油掺入大豆油和纯芝麻油谱图见图3。
图3 基于中红外光谱的大豆油、芝麻油掺入大豆油和纯芝麻油谱图Fig.3 The infrared spectrum of soybean oil,sesame oil mixed with soybean oil and pure sesame oil
对比图3所示大豆油、芝麻油掺入大豆油和纯芝麻油的中红外光谱图,发现它们的中红外光谱图的吸收峰位置基本相同,在3 200 cm-1~6 00 cm-1范围内有明显的吸收峰,分别在3 011、2 926、2 857、1 747、1 467、1 378、1 240、1 161、1 100、720 cm-1附近出现相似的中红外光谱吸收峰,无法直观地区别3条光谱有何明显差异,因此需要结合模式识别算法进行定性分析来区别芝麻油中是否掺伪。
将90个芝麻油掺入大豆油的掺伪样本和40个纯芝麻油样本的中红外光谱图转为光谱数据表,每张光谱图有2 021个数据点,形成130个试验样本的数据表。通过MATLAB软件实现极限学习机(ELM)分类算法建立芝麻油掺入大豆油的定性分析模型,经过多次计算比较,隐层节点个数可以设定为2以上的任意数值,激活函数可任意选择S函数、正弦函数。随机分配90个训练集样本和40个测试集样本,类别1表示纯正芝麻油的类别,类别2表示芝麻油中掺入大豆油的类别。
建模分析结果训练集分类正确率为100 %(90/ 90),测试集预测分类正确率为100 %(40/40)。测试集预测结果见图4所示。
图4 基于中红外光谱的芝麻油掺入大豆油和纯芝麻油的预测分类结果Fig.4 The forecasting result of pure sesame oila,sesame oil mixed with soybean based on infrared spectrum
其中圆圈符号表示样本的真实类别,星星符号表示通过ELM算法进行预测的分类。改变极限学习机算法隐层节点个数和激活函数类型不会改变模型的训练和预测结果,得到纯正芝麻油样本和掺入大豆油的芝麻油样本分类正确率均为100 %,预测模型具有较高稳定性。
2.3结论
根据上述的建模结果可以发现,采用近红外光谱法建立的芝麻油掺入大豆油的定性分析模型的预测结果没有采用中红外光谱法建立的芝麻油掺入大豆油的定性分析模型的预测结果好。采用近红外光谱法建立的芝麻油掺入大豆油的定性分析模型的训练集样本分类结果正确率分别为98.89 %(89/90)和98.89 % (89/90),测试集样本的预测分类结果正确率分别是97.5 %(39/40)和90 %(36/40)。采用中红外光谱法建立的芝麻油掺入大豆油的定性分析模型的训练集样本分类结果正确率分别为100 %(90/90)和100 %(90/ 90),测试集样本的预测分类结果正确率分别是100 % (40/40)和100 %(40/40)。
通过比较近红外光谱法和中红外光谱法建立的定性分析模型分类正确率结果。近红外光谱法的分类结果正确率均能达到90 %以上,具有一定的分类识别能力,但是结果精度不算高,需要提高模型的准确度和预测能力,模型有待改进。中红外光谱具有较好的指纹特性,中红外光谱数据中包含着大量的物质结构及成分信息,更适用于定性分析,得到的分类结果准确率能够达到100 %,而且改变极限学习机算法隐层节点个数和激活函数类型都不会改变模型的训练和预测结果精度,分类结果全部正确,预测准确率均为100 %,模型稳定性较高,能够较好地应用于芝麻油掺伪的定性识别建模分析中。
参考文献:
[1]刘馨.芝麻油纯度检测方法的探讨[J]食品与发酵科技,2010,46 (1):105-106
[2]唐晓丹,杨冉,陈晓岚,等.不同香型芝麻油中脂肪酸组成的研究[J].河南工业大学(自然科学版),2012,33 (6): 62-67
[3]吴广臣,李红莲,赵志磊,等.近红外光谱技术在快速鉴别真伪小磨香油中的应用[J]食品安全质量检测学报,2010,27(2) : 90-93
[4]刘燕德,万常斓.芝麻油掺伪的近红外透射光谱检测技术[[J].农业机械学报,2012,43(7):136-140
[5]潘磊庆,唐琳,詹歌,等.电子鼻对芝麻油掺假的检测[J]食品科学, 2010,31(20):318-321
[6] N Vlachos,Y Skopelitis, M Psaroudaki, et al. Applications of Fourier transform-infrared spectroscopy to edible oils[J].Analytica Chimica Acta, 2006(573/574):459-465
[7] G oodacre R, Anklam E. Fourier transform infrared spectroscopy and chemometrics as a tool for the rapid detection of other vegetable fats mixed in cocoabutter[J].JAM oil chem Soc, 2001,78(10):993-1000
[8]索少增,刘翠玲,吴静珠,等.微量农药溶液近红外光谱PLS模型的不同预处理方法对比研究[J].食品工业科技, 2010(11): 330-337
[9]徐一茹,刘翠玲,孙晓荣,等.基于近红外和中红外光谱技术的小麦粉品质检测及掺杂鉴别方法[J].食品科学, 2014, 35(12):128-132
[10] Lee H, Cho B K, Kim M S, et al. Prediction of crude protein and oil content of soybeans using Raman spectroscopy[J]. Sensors and Actuators B: Chemical, 2013, 185: 694-700
[11]吴静珠,刘翠玲,李慧,等.基于近红外光谱的纯花生油掺伪快速鉴别方法研究[J].北京工商大学学报(自然科学版), 2011, 29 (1): 75-78
[12] Luna A S, da Silva A P, Pinho J S A, et al. Rapid characterization of transgenic and non-transgenic soybean oils by chemometric methods using NIR spectroscopy[J]. Spectrochimica Acta Part A: Molecular and Biomolecular Spectroscopy, 2013, 100: 115-119
[13] Vincent Baeten, Juan Antonio Fernadez Pierna, Pierre Dardenne. Detection of the Presence of Hazelnut Oil in Olive by FT-Raman and FT-MIR Spectroscopy[J]. Agricultural and Food Chemistry, 2005, 53: 6201-6206
[14] Lai Y W, Kemsley E K, Wilson R H. Potential of Fourier transform infrared spectroscopy for the authentication of vegetable oils [J]. Journal of Agricultural and Food Chemistry, 1994, 42(5): 1154-1159
[15] Hong Yang, Joseph Irudayaraj, Manish M.Paradkar. Discriminant analysis of edible oils and fats by FTIR,FT-NIR and FT-Raman spectroscopy[J]. Food Chemistry,2005,93:25-32
[16] Luo Jun, Liu Tao, Liu Yande. FT-NIR and Confocal Microscope Raman Spectroscopic Studies of Sesame Oil Adulteration[C]. Beijing:IFIP Advances in Information and Communication Technology, 2012, 369: 24-31
[17] Huang, Guang -Bin, Qin -Yu Zhu, Chee -Kheong Siew. Extreme learning machine: a new learning scheme of feedforward neural networks [C]. Budapest, Hungary:Proceedings of International Joint Conference on Neural Networks, 2004, 2: 985-990
[18] Huang, Guang-Bin, Qin-Yu Zhu,et al. Extreme learning machine: theory and applications[J]. Neurocomputing, 2006, 70(1):489-501
[19]陆慧娟,张金伟,马小平,等.极限学习机集成在肿瘤分类中的应用[J].数学的实践与认识, 2012, 24(17): 148-154
[20]李若诚,许文方,华英杰.基于近红外光谱和极限学习机的普洱茶中游离氨基酸总量检测[J].长春工业大学学报(自然科学版), 2012, 33(3): 269-273
[21]丁轻针,刘玲玲,武彦文,等.基于FTIR的芝麻油真伪鉴别和掺伪定量分析模型[J].光谱学与光谱分析, 2014, 34(10): 2690-2695
Research on Qualitative Analysis Methods of Sesame Oil Adulteration Based on Spectroscopy
WEI Li-na,LIU Cui-ling,ZHAO Qi,DAI Yue
(Beijing Technology and Business University,Beijing 10048,China)
Abstract:Qualitative analysis with near-infrared and mid-infrared spectroscopy and extreme learning machine algorithm were used for discriminate sesame oil from adulterated sesame oil with soybean oil. Analyzing 90 adulterated samples which were prepared with sesame oil,soybean oil of different brands and batches and 40 sesame oil samples detected the adulteration.Set network parameters a limit of extreme learning machine algorithms,and compared the result of near-infrared and mid-infrared spectroscopy,and studied the feasibility of the spectrum detection method and classification accuracy,in order to make basis of theory and practical for the sesame oil adulteration of spectrum detection technology fast discrimination analysis,inhibition of sesame oil adulteration happening.
Key words:spectrum technology;sesame oil adulteration;extreme learning machine algorithm
收稿日期:2015-07-13
作者简介:位丽娜(1989—),女(汉),硕士研究生,研究方向:食用油品质检测。
基金项目:北京市教委科技发展重点项目(KZ201310011012);北京市自然科学基金(4132008);北京市教委科技创新平台(PXM_2012_ 014213_000023)
DOI:10.3969/j.issn.1005-6521.2016.08.035