杨春兰,薛大为,鲍俊宏
(蚌埠学院 电子与电气工程系,安徽 蚌埠 233030)
黄山毛峰茶贮藏时间电子鼻检测方法研究
杨春兰,薛大为*,鲍俊宏
(蚌埠学院 电子与电气工程系,安徽 蚌埠 233030)
利用电子鼻对6个贮藏时间5个等级的黄山毛峰茶进行检测,首先获取反映茶叶香气的原始特征向量,再通过主成分分析法(PCA)提取出前5个主成分作为主特征向量,然后以主特征向量作为BP神经网络(BPNN)的输入,建立黄山毛峰茶贮藏时间预测模型(PCA-BPNN)。结果表明:PCA-BPNN对于贮藏0 d的茶叶,最大预测误差为11 d,5个(6.67%)样本预测误差超过13 d;对于贮藏60 d的茶叶,最大预测误差为13 d,4个(5.33%)样本预测误差超过10 d;对于贮藏120 d的茶叶,最大预测误差为16 d,7个(9.33%)样本预测误差超过10 d;对于贮藏180 d的茶叶,最大预测误差为19 d,8个(10.67%)样本预测误差超过10 d;对于贮藏240 d的茶叶,最大预测误差为21 d,8个(10.67%)样本预测误差超过10 d;对于贮藏300 d的茶叶,最大预测误差为14 d,6个(8.00%)样本预测误差超过10 d。该研究所建立的PCA-BPNN预测模型可用于检测黄山毛峰茶贮藏时间,且与以原始特征变量作为输入的BPNN模型相比,性能更好。
电子鼻;PCA;BPNN;预测模型
茶叶香气与茶叶品质密切相关,是反映茶叶品质的重要因素。茶叶香气是由上百种挥发性物质共同作用而形成的整体信息反映[1],构成复杂,因而少数几个传感器难以对其进行有效检测。电子鼻技术的出现为复杂气味检测提供了一种有效的途径。电子鼻[2]是一种仿生物嗅觉功能的检测仪器,主要由传感器阵列和模式识别方法组成,可以对气味的整体信息进行识别。电子鼻技术在水果[3-4]、酒类[5-6]、肉类[7-8]等食品工业领域已经有着广泛的应用。根据文献检索结果,电子鼻技术在茶叶品质检测方面也有一定报道,但大都集中于对不同等级茶叶品质的检测方面[9-10],对于不同贮藏时间茶叶品质检测方面研究报道很少。众所周知,茶叶的品质不仅取决于茶叶的等级,而且与茶叶贮藏时间的长短有关,等级越高品质越好,贮藏时间越长品质越差。
黄山毛峰茶因盛产于安徽黄山地区而得名,是中国的名茶之一,但对其品质检测的研究报道不多,尤其是对于不同贮藏时间其品质检测方面的研究在检索范围内尚未见报道。因此,本文拟利用电子鼻技术对不同贮藏时间的黄山毛峰茶品质进行检测,并尝试建立起一种可以预测茶叶贮藏时间的有效方法。模式识别是电子鼻重要的组成部分。BP神经网络[11](back propagation neural network,BPNN)具有非线性映射能力强、结构简单、泛化能力强等优点,是模式识别中广泛使用的方法。由于茶叶香气构成复杂,为了全面获取茶叶的香气信息,通常需要选择较多的特征变量来构成原始特征向量,而这些变量之间往往会存在一定的相关性,如果以这些变量作为神经网络的输入,不但建模的效率低,且准确度也会下降。因此,本研究将主成分分析法(principal component analysis,PCA)与BPNN结合(以下简称为PCA-BPNN),建立黄山毛峰茶贮藏时间的预测模型。首先,通过电子鼻传感器阵列获取各等级不同贮藏时间茶叶香气的原始特征向量,再通过主成分分析法提取出能够反映香气整体信息的主特征向量,最后以主特征向量作为神经网络的输入建立茶叶贮藏时间预测模型。
1.1茶叶样品
试验用茶叶样品是从某黄山毛峰茶厂专门订购的。为了保证试验结果的可靠性,要求各等级新鲜茶叶均采自同一茶园且加工工艺统一,这样可以尽量保持客观条件一致,以减少随机因素的影响。茶叶样品共有5个等级,分别为R100,R200,R400,R1000,R2000,其中,数字表示价格(元·kg-1)。从2014年6月1日开始,各等级茶叶样品每50 g分别采用锡纸袋加干燥剂独立密封包装,放入温度为5 ℃的冰柜中保存。
1.2仪器设备
仪器采用PEN3型便携式电子鼻,该电子鼻由德国Airsense公司生产,系统主要组成部分包括:传感器阵列、数据采集软件、辅助功能单元(采样/清洗通道、吸附/解附单元)。传感器阵列包含10个金属氧化物传感器,各传感器特性如表1所示。传感器输出为G/G0,其中G为传感器接触挥发性气体的电导率,G0为传感器在经过活性炭过滤之后的纯净空气中的电导率。
1.3试验方法
从2014年6月1日至2015年3月30日,对不同等级茶叶样品每隔60 d做一次检测,连续检测300 d,即0,60,120,180,240,300 d各检测一次。每次试验时,室温保持在26 ℃,从冰柜中取出5种不同等级的干茶叶并分别准备45个重复样品,每个样品5 g,放入250 mL烧杯中双层薄膜密封,静置45 min。电子鼻每隔1 s采样一次,连续采样60 s,清洗时间50 s。
表1各传感器特性
Table 1The properties of the sensors
传感器响应特性检测范围(mL·m-3)W1C(S1)对芳香成分灵敏10W5S(S2)灵敏度大,对氨氧化合物很灵敏1W3C(S3)对氨水、芳香成分灵敏10W6S(S4)对氢气有选择性100W5C(S5)对烷烃、芳香成分灵敏1W1S(S6)对甲烷灵敏100W1W(S7)对硫化成分灵敏,对烃和硫的有机成分较灵敏1W2S(S8)对乙醇灵敏100W2W(S9)对芳香成分、有机硫化物灵敏1W3S(S10)对烷烃灵敏100
1.4数据分析及建模方法
茶叶香气成分构成复杂,各个传感器对于同一香气都有响应,存在信息交叉。而为了尽可能全面地反映原始数据包含的信息,选择的原始特征变量较多。因此,对原始特征向量采用PCA进行降维处理,消除冗余信息[12],提取出主特征向量。
神经网络可以任意精度逼近非线性函数,且泛化能力强,是模式识别中经常采用的方法。BPNN是神经网络中最常用的一种,具有结构简单、设计方便等优点。因此,本研究采用BPNN建立茶叶贮藏时间的预测模型。
2.1原始特征向量的选择
电子鼻典型响应曲线如图1所示。从响应曲线可以看出,各传感器在60 s以后响应趋于稳态。根据各传感器响应曲线的变化特点,选择各传感器最大响应值、第60 s时的响应值(即稳态值)、60 s内响应的均值、60 s内响应曲线积分值作为原始特征变量。则由特征变量构成40维的特征向量:
X=(x1,x2,……,x39,x40)
(1)
图1 电子鼻典型响应曲线Fig.1 Typical response curve of electronic nose
式(1)中:x1,……,x10分别为10个传感器最大响应值;x11,……,x20分别为10个传感器第60 s时响应值x21,……,x30分别为10个传感器响应60 s内的平均值;x31,……,x40分别为10个传感器响应60 s内的积分值。
2.2相关性分析
对各等级不同贮藏时间茶叶样本原始特征向量进行相关性分析,其中相关系数采用Pearson相关,显著性检验采用Two-tailed检验。根据相关性分析的结果,部分变量之间的相关系数值较大,存在明显的相关性。如果以这些变量作为神经网络的输入,将会降低模型的预测精度。因此,有必要通过主成分分析消除原始特征向量中包含的重叠和冗余信息。不同贮藏时间R200茶叶部分变量相关系数矩阵如表2所示。
2.3PCA分析
为了克服原始数据量级的大小对主成分分析的影响,在主成分分析前对原始特征向量进行如下标准化处理:
(2)
表2不同贮藏时间R200茶叶部分变量相关系数矩阵
Table 2Correlation coefficient matrix of partial variables of R200 under different storage time
变量x1x2x11x12x21x22x31x32x11.000x20.1631.000x110.4940.3901.000x120.4760.322-0.2081.000x210.776-0.3980.7590.1861.000x220.0360.6790.3470.7020.2331.000x310.4260.1920.529-0.1300.6730.1001.000x320.2680.5670.2510.4600.2810.3270.8051.000
通过主成分分析,发现各等级不同贮藏时间茶叶原始特征向量前5个主成分方差都大于1,且累计方差贡献率均超过90%。因此,选择前5个主成分作为主特征变量可以概况原始变量的主要信息,原始特征向量由40维降为5维。5个等级6个不同贮藏时间前5个主成分方差及贡献率如表3所示。
2.4PCA-BPNN预测模型设计
BPNN由输入层、中间层和输出层组成,网络的学习过程中通过误差反向传播不断修正连接权和阈值,直到误差达到设定精度或学习次数达到最大设定次数学习结束。设计中采用单中间层的3层网络结构。输入层节点数等于输入变量(即主成分)个数,为5个;网络输出为茶叶贮藏时间预测值,输出层节点数为1个。中间层节点数选择没有统一的有效方法,设计过程中依靠经验法在一定的单元数范围内经过多次试验确定。中间层激励函数选择Tansig函数,输出层激励函数选择Purelin函数,学习率为0.1,动量因子为0.5,误差精度设定为0.01。将各等级每个不同贮藏时间45个茶叶样品分成2部分,其中30个样本作为学习样本,15个样本作为预测样本。PCA-BPNN不同中间层节点数学习结果如表4所示。可以看出,当中间层为10个节点时,平均学习次数最少,为2 223次,性能较好。因此,PCA-BPNN结构设计为5-10-1。同时,为了比较网络性能,还设计了以原始特征变量为输入的BPNN(以下称为BPNN),设计方法、参数设置与前面相同,经过反复试验确定最佳网络结构为40-18-1,平均学习次数为3 431次。R400等级茶叶两种网络的学习曲线如图2所示,由图2可以看出,PCA-BPNN相比BPNN学习效率明显提高。
表3茶叶不同贮藏时间前5个主成分方差及贡献率
Table3Thevarianceandcontributionrateofthefirstfiveprincipalcomponentsofteaunderdifferentstoragetime
等级主成分方差贡献率/%累计贡献率/%R100F145.5648.5548.55F222.4723.9472.49F39.7210.3682.85F48.288.8291.67F51.691.8093.47R200F147.1646.3446.34F232.4731.9078.24F36.526.4084.64F45.315.2289.86F52.692.6492.50R400F145.8944.6244.62F237.1036.0780.69F36.025.8586.54F45.114.9791.51F53.012.9394.44R1000F150.7653.1753.17F224.3225.4778.64F37.357.7086.34F44.134.3390.67F51.011.0691.73R2000F149.2449.2849.28F227.4627.4876.76F311.3111.3288.08F43.093.0991.17F52.312.3193.48
2.5PCA-BPNN模型预测结果
利用PCA-BPNN和BPNN对5个等级不同贮藏时间的15个测试样本进行预测。两个网络模型对各等级茶叶贮藏时间预测结果如表5所示。
表4PCA-BPNN不同中间层节点数学习结果
Table 4Learning results of PCA-BPNN with different node numbers in middle layer
隐层单元数学习次数误差445640.01641320.01736850.01823450.011022230.011228510.011541070.012039810.01
表5两个网络模型对各等级茶叶贮藏时间的预测结果
Table 5Predicted storage time of each level by 2 networks
从分析结果看,PCA-BPNN最大预测误差为21 d,BPNN为35 d;PCA-BPNN预测误差超过10 d的样本数及比例均小于BPNN。说明PCA-BPNN的预测精度优于BPNN。PCA-BPNN对各等级茶叶不同贮藏时间预测平均值如图3所示。
图2 R400等级茶叶2种网络的学习曲线Fig.2 Learning curves of 2 networks for R400
图3 PCA-BPNN对各等级茶叶不同贮藏时间预测平均值Fig.3 Predicted average value of each level of tea under different storage time using PCA-BPNN
本文利用电子鼻对5个等级6个贮藏时间下的黄山毛峰茶进行检测。通过PCA提取出不同贮藏时间各等级茶叶前5个主成分,以5个主成分作为BPNN的输入建立了茶叶贮藏时间预测模型。从预测结果分析,PCA-BPNN对于5个等级6个贮藏时间的茶叶样本最大预测误差为21 d。对于贮藏0 d的茶叶,最大预测误差为11 d,5个(6.67%)样本预测误差超过10 d;对于贮藏60 d的茶叶,最大预测误差为13 d,4个(5.33%)样本预测误差超过10 d;对于贮藏120 d的茶叶,最大预测误差为16 d,7个(9.33%)样本预测误差超过10 d;对于贮藏180 d的茶叶,最大预测误差为19 d,8个(10.67%)样本预测误差超过10 d;对于贮藏240 d的茶叶,最大预测误差为21 d,8个(10.67%)样本预测误差超过10 d;对于贮藏300 d的茶叶,最大预测误差为14 d,6个(8.00%)样本预测误差超过10 d。与以原始特征向量作为输入量建立的BPNN的预测模型相比,PCA-BPNN建模效率和预测精度更高,性能更好。因此,PCA与BPNN结合的方法可用于黄山毛峰茶不同贮藏时间的检测,且更有效,对于其他种类茶叶品质检测亦具有一定的借鉴意义。
[1]赵菁. 绿茶特征香气成分及与品质的关系研究[D].杭州:浙江大学,2002.
[2]杨俊. 电子鼻识别中的预处理与模糊神经网络算法[D].大连:大连理工大学,2007.
[3]尹芳缘,曾小燕,徐薇薇,等.基于电子鼻的芒果储存时间预测方法研究[J].传感技术学报,2012,25(9):1199-1203.
[4]HUI G H, WU Y L, YE D D, et al. Study of peach freshness predictive method based on electronic nose[J].FoodControl, 2012, 28(1):25-32.
[5]LIU M, HAN X, TU K, et al. Application of electronic nose in Chinese spirits quality control and flavour assessment[J].FoodControl, 2012, 26(2):564-570.
[6]ZHOU Q, ZHANG S, LI Y, et al. A Chinese liquor classification method based on liquid evaporation with one unmodulated metal oxide gas sensor[J].Sensors&ActuatorsBChemical, 2011, 160(1):483-489.
[7]洪雪珍,韦真博,海铮,等.基于电子鼻和神经网络的牛肉新鲜度的检测[J].现代食品科技, 2014,30(4):279-285.
[8]BALASUBRAMANIAN S, PANIGRAHI S, LOGUE C M, et al. Neural networks-integrated metal oxide-based artificial olfactory system for meat spoilage identification[J].JournalofFoodEngineering, 2009, 91(1):91-98.
[9]于慧春,王俊.电子鼻技术在茶叶品质检测中的应用研究[J].传感技术学报, 2008, 21(5):748-752.
[10]陈哲,赵杰文.基于电子鼻技术的碧螺春茶叶品质等级检测研究[J].农机化研究,2012,34(11):133-137.
[11]唐万梅. BP神经网络结构优化问题的研究[J].系统工程理论与实践,2005 (10): 95-100.
[12]ZHENG L, LUKAC R, WU X, et al. PCA-based spatially adaptive denoising of CFA images for single-sensor digital cameras.[J].IEEETransactionsonImageProcessing, 2009, 18(4):797-812.
(责任编辑高峻)
Study on analysis method of storage time of Huangshanmaofeng tea by electronic nose
YANG Chun-lan, XUE Da-wei*, BAO Jun-hong
(DepartmentofElectronicandElectricalEngineering,BengbuUniversity,Bengbu233030,China)
Five levels of Huangshanmaofeng tea with 6 varied storage time were detected by electronic nose. Firstly, the original feature vectors presenting the tea odor were acquired. Then, the first 5 principal components were extracted as the principal feature vectors by principal component analysis (PCA). With the principal feature vectors used as BPNN input, a new model called PCA-BPNN for storage time analysis of Huangshanmaofeng tea was built. After experimental test, it was shown that for the tea of 0 d storage, the maximum prediction error (MPE) was 11 d, and the samples of prediction error exceeding 10 d was 5 (6.67%); for the tea of 60 d storage, MPE was 13 d, and the samples of prediction error exceeding 10 d was 4 (5.33%); for the tea of 120 d storage, MPE was 16 d, and the samples of prediction error exceeding 10 d was 7 (9.33%); for the tea of 180 d storage, MPE was 19 d, and the samples of prediction error exceeding 10 d was 8 (10.67%); for the tea of 240 d storage, MPE was 21 d, and the samples of prediction error exceeding 10 d was 8 (10.67%); for the tea of 300 d storage, MPE was 14 d, and the samples of prediction error exceeding 10 d was 6 (8.00%). In conclusion, PCA-BPNN model could be used to analyze the storage time of Huangshanmaofeng tea, and the proposed model was better than BPNN, which used original feature vectors as the input.
electronic nose; PCA; BPNN; prediction model
10.3969/j.issn.1004-1524.2016.04.21
2015-12-15
安徽省高等学校省级自然科学研究项目(KJ2013Z195);安徽省高等学校优秀青年人才基金项目(2012SQRL218);国家级大学生创新创业训练计划项目(201511305023)
杨春兰(1980—),女,安徽固镇人,硕士,讲师,研究方向为仪器仪表与智能检测、食品品质检测。E-mail: chlyang1981@126.com
,薛大为,E-mail: bbxuedawei@163.com
TP29
A
1004-1524(2016)04-0676-06
杨春兰,薛大为,鲍俊宏. 黄山毛峰茶贮藏时间电子鼻检测方法研究[J]. 浙江农业学报,2016,28(4): 676-681.