基于FT-IR结合PCA-LDA的白酒真伪鉴别方法

2016-09-12 00:48梁俊发吴文林陈代伟万渝平涂松林罗曼妮王志雄区硕俊
食品工业科技 2016年15期
关键词:水井坊井台导数

梁俊发,吴文林,陈代伟,万渝平,涂松林,陈 然,罗曼妮,曾 苑,叶 玲,王志雄,区硕俊

(1.广州质量监督检测研究院食品检验部,广东广州 511447;2.成都市食品药品检验研究院,四川成都 610100)



基于FT-IR结合PCA-LDA的白酒真伪鉴别方法

基于FT-IR结合PCA-LDA的白酒真伪鉴别方法

梁俊发1,2,吴文林2,*,陈代伟2,万渝平2,涂松林2,陈然1,罗曼妮1,曾苑1,叶玲1,王志雄1,区硕俊1

(1.广州质量监督检测研究院食品检验部,广东广州 511447;2.成都市食品药品检验研究院,四川成都 610100)

运用傅里叶变换红外光谱法(FT-IR)采集白酒的红外光谱图,并采用主成分分析法(Principal Component Analysis,PCA)对白酒红外光谱数据进行降维处理,提取累积方差贡献率达到99%以上的主成分作为建模参数,结合线性判别分析法(Linear Discriminant Analysis,LDA)建立基于白酒红外光谱全波段、指纹区和一阶导数谱的白酒真伪鉴别模型。结果显示,采用白酒红外光谱全波段数据所建立的白酒真伪鉴别模型的精度更高,其初始判别准确率为95.6%,交叉验证实验中的判别准确率为91.4%,对测试集中30组样本的判别正确率为86.7%。本研究可以为白酒的真伪鉴别提供技术参考。

白酒,真伪鉴别,主成分分析法,线性判别分析法,FT-IR

传统的白酒真伪鉴别方法主要依靠品酒师凭借感官品评或者识别码、防伪标识等方式防伪[1]。但近年来,随着分析技术的发展和对白酒微量香味成分的深入研究,一些现代分析技术,特别是光谱技术[2-4]、色谱技术[5-6]、质谱技术[7-8]、阵列传感器[9]和同位素方法[10]等已经广泛应用于白酒的生产,质量控制,安全监督等环节当中。

物质的红外光谱图能够体现复杂混合的特征性,同时,具有快速分析、无损检测等特点[11],在食品与中药等行业的相关检测中得到广泛的运用[12-14]。因此,本文以水井坊井台装白酒作为研究对象,运用FT-IR对白酒样品的干燥物进行分析,采用主成分分析法对其红外光谱数据进行降维处理,结合线性判别分析法,研究基于FT-IR的白酒真伪鉴别方法。

1 材料与方法

1.1材料与仪器

水井坊井台装白酒、五粮液白酒、郎酒、泸州老窖及剑南春白酒、五津醇白酒一共100个样品生产企业。具体样品信息见表1。

表1 白酒样品信息Table 1 Samples information

傅里叶变换红外光谱仪美国Thermo Fisher Nicolet 6700;溴化钾盐窗,DTGS检测器,扫描次数为32次,光谱分辨率4 cm-1,波数范围400~4000 cm-1;YP-2压片机天津天光光学仪器有限公司。

1.2样品制备

取10 mL白酒样品与500 mg光谱纯溴化钾晶体置于蒸发皿中混匀干燥,将白酒干燥物转移至称样瓶中,用封口胶密封,待测。

取2 mg处理好的白酒干燥物与纯溴化钾晶体200 mg放入玛瑙研钵中进行研磨,压片,进行FT-IR测定。

1.3红外光谱数据处理

在采集白酒样品的红外光谱图过程中,由于仪器本身的稳定情况、溴化钾颗粒的大小、测定环境等因素的干扰,红外光谱图上会出现基线漂移、噪声大、光散射现象等[14-15]。如果直接采用白酒样品的原始数据去建立鉴别模型,势必会很大程度上影响模型的判别精度,因此,有必要采用适当的方法对白酒的红外光谱图进行前处理。在本文中,对白酒红外光谱数据进行基线校正、平滑及归一化处理,并在OMNIC中生成一阶导数谱。

1.4数据分析

将白酒样品的红外光谱相关数据直接作为建模基础数据,计算量会非常大,且会稀释模型的精度。因此,本文采用PCA法对其进行降维处理,消除信息重叠问题。另外,提取累计方差达到99%以上的主成分作为建模参数,随机抽取21组水井坊井台装白酒和49组其他白酒作为鉴别模型的训练集,其余的30组白酒作为测试集,取水井坊井台装白酒的分类变量值为1,其他品牌白酒的分类变量值为2,运用线性判别分析法建立相关真伪鉴别模型。

2 结果与分析

2.1白酒的红外光谱图分析

综上,在不同白酒中,由于特征风味物质种类的不同或其含量的差异,在红外光谱上得到了体现。因此,基于红外光谱的白酒真伪鉴别具有了理论上的可行性。

图1 不同品牌白酒红外光谱图比较Fig.1 The comparison of infrared spectrogram in difference brand liquor

2.2白酒真伪鉴别模型

2.2.1基于白酒红外光谱全波段鉴别模型将前处理后的白酒红外光谱全波段数据作为建模基础数据,按照1.4节的数据分析方法,建立基于白酒红外光谱全波段的真伪鉴别模型。该模型对建模样本的分类结果见表2。

表2 分类结果Table 2 Classification results

在初始分类中,20组水井坊井台装白酒都被正确分类,1组样品被误判;在49组其他品牌白酒中,有2组样本被误判,总的初始正确判别率达到了95.6%。在交叉验证实验中,只有6组其他白酒被误判,交叉验证实验的总正确判别率达到91.4%。

运用测试集样品对该模型的准确性进行验证,由组质心处函数可知,类别1的投影中心点为2.573,类别2的投影中心点为-0.284,根据投影距离的判别规则,对30组新样本进行判别,结果显示,有4组白酒样本被误判,正确判别率为86.7%。

2.2.2基于白酒红外光谱指纹区鉴别模型由于不同白酒干燥物的红外光谱在2000~4000 cm-1差别不大,其差异主要集中在400~1330 cm-1指纹区,另外400~500 cm-1也没有明显的差异。因此,本节只截取500~1330 cm-1的数据作为基础样本数据,按照1.4节的数据分析方法,建立基于白酒红外光谱指纹区数据的鉴别模型,该模型对建模样本的分类结果见表3。

表3 分类结果Table 3 Classification results

在初始分类中,有1组水井坊井台装白酒及3组其他品牌白酒样品被误判,总初始正确判别率为94.2%。在交叉验证实验中,有2组水井坊井台装白酒及5组其他品牌白酒样本被误判,交叉验证实验的总正确判别率只有90.2%,低于全波段鉴别模型,说明白酒红外光谱的指纹区对白酒的真伪鉴别贡献更大。

由组质心处的函数可知,基于白酒红外光谱指纹区的鉴别模型中,类别1的投影中心点为2.683,类别2的投影中心点为-0.512。根据新样本的判别得分与类别的投影中心距离最小原则,对30组测试集样品进行鉴别,结果有5组样本被误判,正确判别率为83.3%。

2.2.3基于白酒红外光谱一阶导数谱的鉴别模型一阶导数谱可以增强原始光谱的特征。在本文中,采用OMNIC软件把归一化处理后的100组白酒红外光谱图转化为一阶导数谱图,图2展示了6种不同白酒红外光谱一阶导数谱图。从中可以发现,1800~4000 cm-1之间,不同白酒的差异较小,而在1800~500 cm-1的特征性较强。因此,本文采用白酒1800~500 cm-1一阶导数光谱数据用于白酒的真伪鉴别研究,按照1.4节的数据分析方法,建立基于白酒红外光谱一阶导数光谱数据的鉴别模型,该模型对建模样本的分类结果见表4。

图2 白酒样品的一阶导数光谱Fig.2 The first derivative spectroscopy of liquor samples

类别预测组成员12合计初始计数%119221224749190.59.5100.024.195.9100.0交叉验证计数%1201212113849195.24.8100.0222.477.6100.0

在初始的分类中,水井坊井台装白酒和其他品白酒中各有2组样本被误判,总的初始正确判别率达到96.0%;但在交叉验证实验中,有1水井坊井台装白酒和11组其他品牌白酒被误判,总的交叉验证正确判别率只有86.4%。比较全波段模型和指纹区模型,一阶导数谱模型的判别精度最差,说明对白酒红外光谱图进行一阶导数处理之后,不同类别白酒的红外特征性不显著。

由组质心处的函数可知,基于白酒红外谱一阶导数谱的鉴别模型中,类别1的投影中心点为2.486,类别2的投影中心点为-0.979,根据待判样本的投影点与中心投影点距离最小原则,对30组测试集样本进行鉴别,结果有7组样本被误判,正确判别率只有76.7%。

3 总结

本文运用FT-IR结合线性判别分析法,建立基于白酒红外光谱全波段、指纹区和一阶导数谱的白酒真伪鉴别模型。比较了以上3种模型的判别效果,采用白酒红外光谱的全波段数据所建立的水井坊井台装白酒真伪鉴别模型的精度最高;白酒红外光谱的指纹区信息对鉴别模型的贡献不及全波段模型;而一阶导数处理之后,白酒特征性降低。本研究可以为白酒的真伪鉴别提供技术参考。

[1]袁洁,尹京苑,高海燕. 指纹图谱在白酒中的应用研究进展[J]. 食品科学,2009,29(11):680-684.

[2]Friedel M,Patz C D,Dietrich H. Comparison of different measurement techniques and variable selection methods for FT-MIR in wine analysis.[J]. Food Chemistry,2013,141(4):4200-4207.

[3]Wu Z,Xu E,Long J,et al. Monitoring of fermentation process parameters of Chinese rice wine using attenuated total reflectance mid-infrared spectroscopy[J]. Food Control,2015,50:405-412.

[4]Cozzolino D,Smyth H E,Gishen M. Feasibility Study on the Use of Visible and Near-Infrared Spectroscopy Together with Chemometrics To Discriminate between Commercial White Wines of Different Varietal Origins[J]. J.agric.food Chem,2003,51(26):7703-7708.

[5]Fernández P L,Pablos F,MartíN M J,et al. Multi-element analysis of tea beverages by inductively coupled plasma atomic emission spectrometry. Food Chem[J]. Food Chemistry,2002,76(4):483-489.

[6]王忠彦,尹昌树. 白酒色谱骨架成分的含量及比例关系对香型和质量的影响[J]. 酿酒科技,2000(6):93-96.

[7]Nagy K,Bongiorno D,Avellone G,et al. High performance liquid chromatography-mass spectrometry based chemometric characterization of olive oils[J]. Journal of Chromatography A,2005,1078(1-2):90-97.

[8]Almeida C M,Vasconcelos M T S D. ICP-MS determination of strontium isotope ratio in wine in order to be used as a fingerprint of its regional origin[J]. Journal of Analytical Atomic Spectrometry,2001,16(6):607-611.

[9]Qin O,Zhao J,Chen Q,et al. Classification of rice wine according to different marked ages using a novel artificial olfactory technique based on colorimetric sensor array[J]. Food Chemistry,2013,138(2-3):1320-1324.

[10]Bot B L,Oulhote Y,Deguen S,et al. Using and interpreting isotope data for source identification[J]. Trac Trends in Analytical Chemistry,2011,30(2):302-312.

[11]Quansheng C,Jiao D,Jianrong C,et al. Rapid measurement of total acid content (TAC) in vinegar using near infrared spectroscopy based on efficient variables selection algorithm and nonlinear regression tools[J]. Food Chemistry,2012,135(2):590-595.

[12]刘景旺,张博洋,李树峰,等. 近红外吸收光谱技术快速检测奶制品中添加三聚氰胺[J]. 光散射学报,2010,22(3):291-297.

[13]武晓丹,金哲雄,孙素琴,等. 七种不同产地仙鹤草原药材及提取物的红外光谱与二维相关红外光谱的分析与鉴定[J]. 光谱学与光谱分析,2010,30(12):3222-3227.

[14]Shi J Y,Zou X B,Huang X W,et al. Rapid detecting total acid content and classifying different types of vinegar based on near infrared spectroscopy and least-squares support vector machine[J]. Food Chemistry,2013,138(1):192-199.

[15]Shen F,Yang D,Ying Y,et al. Discrimination Between Shaoxing Wines and Other Chinese Rice Wines by Near-Infrared Spectroscopy and Chemometrics[J]. Food & Bioprocess Technology,2012,5(2):786-795.

[16]Sun S Q,Li C W,Wei J P,et al. Discrimination of Chinese Sauce liquor using FT-IR and two-dimensional correlation IR spectroscopy[J]. Journal of Molecular Structure,2006,799(1):72-76.

[17]邓月娥,孙素琴. FTIR法用于白酒的区分及真伪鉴定[J]. 现代仪器,2005,11(5):29-30.

Identification of liquor authenticity based on FTIR with PCA-LDA

LIANG Jun-fa1,WU Wen-lin2,*,CHEN Dai-wei2,WAN Yu-ping2,TU Song-lin2,CHEN Ran1,LUO Man-ni1,ZENG Yuan1,YE Ling1,WANG Zhi-xiong1,OU Shuo-jun1

(1.Guangzhou Quality Supervision and Testing Institute,Guangzhou 511447,China;2.Chengdu food and Drug Inspection Institute,Chengdu 610100,China)

The infrared spectrograms of liquor samples were gathered by FT-IR and principal component analysis was used for datas dimension-reduced processing. The principal components which cumulative variance contribution rate exceed 99% were extracted as the modeling parameters,combined with the discriminant analysis,the liquor authenticity identification model was established based on all wavelengths,fingerprint region and first derivative spectrum of liquors infrared spectroscopy,respectively. The results showed that the discriminant rate of identification model which was established by the all wavelengths data was the highest,the initial discrimination rate was 95.6% and the cross validation test of discriminant rate was 91.4%. The correct discrimination rate of this identification model for the 38 samples in validation set was 86.7%. This study could provide theoretical reference for liquor identification.

liquor authenticity;principal component analysis;linear discriminant analysis;FT-IR

TS207.3

A

1002-0306(2016)15-0309-04

10.13386/j.issn1002-0306.2016.15.051

猜你喜欢
水井坊井台导数
解导数题的几种构造妙招
有一种感觉叫怀乡
水井坊加码高端致营销费用激增 与头部酒企仍有差距
关于导数解法
欲与五粮液比肩 水井坊急寻出路的底牌
凌晨
从井台到广场
导数在圆锥曲线中的应用
小蜗牛爬井台
函数与导数