张红梅,邹光宇,王淼森,肖焱中,田 辉,王万章
(河南农业大学机电工程学院,郑州 450002)
信阳毛尖又称豫毛峰,属绿茶类,是中国十大名茶之一,河南省著名特产,素来以细、圆、紧、直、多白毫,香高、味浓和色绿的独特风格而饮誉中外[1-2]。目前茶叶品质评判主要依靠专业人员感官评审,易受到人为因素的影响[3]。至今为止对茶叶品质的科学检测方法报道,主要有Dong CW等[4]通过计算机视觉和图像处理技术,提取不同茶叶的纹理和色泽图像特征,采用偏最小二乘法和Ada-ELM,分别建立针芽形绿茶外形感官品质的线性和非线性预测模型,实现对不同品质绿茶的区分;Jiang H等[5]采用近红外光谱技术,通过建立BP_AdaBoost模型与BPNN模型,对比发现近红外光谱技术可以成功地应用于绿茶感官品质评价,BP_AdaBoost模型可更好对碧螺春茶品质进行区分;Guo H等[6]采用气相色谱质谱联用技术对苦荞茶进行研究,结果表明全株茶蛋白质和脂肪含量高于全麦茶,而氨基酸和脂肪酸含量低于全麦茶;王梦馨等[7]采用电子舌技术对不同防冻措施的茶园茶叶进行检测,结果显示电子舌可对3种不同环境的茶叶进行良好的区分。
电子鼻是一种仿生物嗅觉的新型检测仪器,具有检测时间短,样品预处理简单,检测结果可靠等优点,可从宏观上对样品品质进行检测,在肉类[8-10]、果蔬[11-13]、酒类[14-15]等食品行业有着广泛的应用。电子鼻在茶叶方面也有一定的报道研究,史波林等[16]研究西湖龙井茶香气特征电子鼻检测方法,利用软独立建模分类法(SIMCA)建立不同等级西湖龙井茶判别模型,等级分类正确率高达95%以上。陈婷等[17]采用电子鼻对云南普洱熟茶进行研究,结果表明电子鼻技术可用于云南普洱熟茶香气品质判别,对于不同年份的普洱熟茶有非常好的区分度;张红梅等[18]对信阳毛尖挥发性气味进行研究,建立电子鼻传感器信号与茶多酚含量预测模型,结果表明电子鼻技术结合有效地模式识别方法可以用于茶叶理化成分的快速检测;于慧春等[19]通过电子鼻对4个等级的西湖龙井进行区分,结果表明LDA分析与BP神经网络对茶叶有良好的区分效果。于慧春[20]研究不同贮藏时间的茶叶香气成分同电子鼻响应的关系。结果表明电子鼻响应信号随茶叶贮藏时间有明显的变化。迄今为止基于电子鼻的茶叶研究,大多只提取单一特征值,单一特征的表征不能全面准确的反映出各传感器响应的特性差异,从而会降低电子鼻判别的准确率。
本研究提取电子鼻响应信号的总体平均值、上升阶段斜率平均值和相对稳态平均值作为特征值,组成一30维的特征矩阵,进行多特征数据优化融合。对原始数据信息进行归一化处理,采用因子载荷分析、单因素方差分析对归一化后数据信息进行降维处理。通过PCA无监督模式算法和LDA有监督模式算法,对比观察优化前后茶叶分类效果变化,以达到减少冗余信息、减小计算复杂度的目的,在实现毛尖等级识别的基础上,对多特征矩阵优化融合。
实验选用茶叶样品为2017年4月河南信阳地区所摘采的信阳毛尖明前茶,选取3种不同品质的信阳毛尖(信阳群体种),品质由高到低分别为特级(T1,特级一芽一叶初展)、一级(Y1,一级一芽一、二叶占90%以上)和二级(Y2,二级一芽一、二、三叶占85%以上),实验前各等级茶叶采用锡纸袋密封包装,置于-4 ℃下贮藏。
本次试验选用由德国AIRSENSE公司生产的PEN3型便携式电子鼻,该电子鼻具有自动调整、自动校准及系统自动富集的功能。仪器主要包含传感器通道、采样通道、计算机。其10个金属氧化物气敏传感器分别为:W1C(S1)对芳香成分灵敏,W5S(S2)对氨氧化合物灵敏,W3S(S3)对氨水、芳香成分灵敏,W6S(S4)对氢气有选择性,W5C(S5)对烷烃、芳香成分灵敏,W1S(S6)对甲烷灵敏,W1W(S7)对硫化成分及烃和硫的有机成分较灵敏,W2S(S8)对乙醇灵敏,W2W(S9)对芳香成分和有机硫化物灵敏,W3S(S10)对烷烃灵敏。传感器输出为G/G0,其中G为传感器接触到挥发性气体的电导率,G0为经标准活性炭过滤后的气体的电导率。电子鼻自带WinMuster软件,对数据进行采集、测量和分析,将采集到的数据保存到计算机。
对3个等级茶叶各准备15个重复样品,每个样品5 g,放入250 mL烧杯中双层薄膜密封静置45 min。电子鼻每隔1 s采样一次,连续采样60 s,清洗时间50 s,可以基本使传感器响应恢复初始状态。试验在室温25 ℃下完成。
提取测试信号的总体平均值、上升阶段斜率平均值和相对稳态平均值作为原始特征值,共提取10×3个特征参数,组成一30维特征矩阵,各特征参数分别记为V1、V2、V3、…、V29、V30,采用SPSS 21对原始特征矩阵依次进行归一化处理、载荷因子分析和单因素方差分析,利用MATLAB 2014a进行PCA和LDA分析,对比分析优化前后茶叶分类效果。
10个传感器对茶叶香气的响应如图1所示,从图中可知10个传感器随着响应时间增加,电导比逐渐增大,在20 s时逐渐趋于稳定,到60 s时测量结束。当传感器处于稳态时,S7、S9响应值较大,说明是对检测结果起重要作用的传感器,而S1、S3、S4、S5响应值极低,说明这些传感器对茶叶气味敏感度低。香气是决定茶叶品质的重要因素之一,为综合考虑各类型气味对茶叶品质的影响,本研究保留响应值低的传感器,对所提取的全部特征信息进行归一化处理。归一化处理是一种无量纲的处理手段,可消除数据属性间差别,平滑数据的波动性,同时归一化将数据转换为0至1之间小数,减小了计算量,方便数据的处理[21]。本研究采用最值归一化方法,归一化的计算方法如下:
(1)
V′为归一化后特征值,V为原始数据特征值,Vmax为原始特征最大值,Vmin为原始特征最小值。
图1 信阳毛尖传感器响应曲线
图2 数据归一化处理后PCA分析图
采用PCA、LDA对归一化处理的数据进行鉴别分析,结果如图2、图3所示。通过PCA降维,前两个主成分的贡献率分别为74.37%、16.70%,累计解释了方差的91.07%,T1、Y1、Y23个不同等级的信阳毛尖可以被初步区分,但Y1组内间距较大,其内部样品分布较为分散,原始特征矩阵中包含大量冗余信息,需要对特征矩阵进行进一步的优化融合。经LDA降维T1、Y1、Y2组间间距极大,3个不同等级的信阳毛尖已可良好区分。归一化后结果显示LDA分析能更好的将3个不同品质茶叶进行区分,LDA分析法分类效果优于PCA分析法。这可能是由于PCA算法降维原理是力求样本在第一、二主成分坐标轴投影方差最大,避免一、二主轴包含信息的重叠,尽可能多的保留原始变量信息;LDA算法降维是为保证样本分类后有最大的类间距离和最小的类内距离,使降维后样品具有最佳的分离性。
图3 数据归一化处理后LDA分析图
因子载荷是主成分分析应用的一个重要方面[22],其将每个传感器提取的特征值当做一个因子变量,通过比较各因子在主成分一与主成分二轴的投影大小,选择出影响较大的因子,可有效剔除冗余的特征信息,提高后续分析效率,因子分析结果如图4所示。
图4 因子载荷分布图
由图4可知不同传感器提取的特征值所对应的因子载荷分布较为分散,相同传感器提取的3个特征值对应的因子载荷有明显重叠现象。有明显重叠的特征值信号相似度极高,因此可以考虑对在一、二主轴上投影较大的重合点剔除一个特征因子,投影较小的重合点剔除两个特征因子或全部剔除。最终选出在一、二主轴上投影大的因子,剔除部分重合因子,尽可能保证提取的三类特征值在优化后分布均匀。因子载荷优化后保留特征V3、V4、V5、V8、V16、V17、V19、V20、V21、V24、V25、V29,对茶叶品质进行分类。优化后的新矩阵阵列进行PCA、LDA分析,结果如图5、图6所示。与因子载荷优化前相比,大量特征值在优化后去除,对加快分类速度起到重要作用。PCA分析前两个主成分的贡献率分别为71.54%、20.83%,解释了总方差的92.37%。T1、Y1、Y23个不同等级的信阳毛尖组内间距相对经归一化处理后明显减小,各类信阳毛尖茶聚集效果显著提高,有利于对茶叶等级的划分。但Y1与Y2的组间间距相对减小,这将造成一定程度上Y1、Y2分类的误判,仍需要进一步的优化处理。LDA分析显示经因子载荷分析优化,三类茶叶的组间和组内间距发生变化,区分效果依旧保持良好。
图5 因子载荷分析优化后PCA分析图
图6 因子载荷分析优化后LDA分析图
采用单因素方差分析,将因子载荷优化后的各特征值当作一个因素,3个等级茶叶的响应作为水平,进行方差齐性检验。表1为单因素方差分析结果,各特征组间平方和与均方越大,组内平方和与均方越小,重复性越好,其中F值越大表明该特征向量对样品的区分度越高[23]。综合对比各特征向量组间平方和与均方、组内平方和与均方、F值可发现,特征向量V4、V5、V21的F值最小,组间平方和与均方较小,组内平方和与均方较大,可能影响毛尖茶品质的区分应予以剔除。剔除后保留V3、V8、V16、V17、V19、V20、V24、V25、V29,对9个特征值组成的新矩阵进行PCA、LDA分析,结果如图7、图8所示。PCA分析显示前两个主成分的贡献率分别为73.54%、21.29%,解释了总方差的94.83%,相比经归一化处理PCA分析解释总方差略微增大。同因子载荷优化后相比,各等级茶叶组内间距进一步缩小,3个等级茶叶各自的聚集效果有所增强。Y1、Y2组间间距增大分类效果更加明显,3个等级的茶叶可得到明显区分。LDA分析表明单因素方差优化前后分类结果依旧保持良好,佐证说明特征向量V4、V5、V21存在大量冗余信息,单因素方差分析优化可进一步减少3组特征值,优化后会减小计算量,有助于加快分类速度。
表1 各特征值响应程度单因素方差分析结果
图7 单因素方差分析优化后PCA分析图
图8 单因素方差分析优化后LDA分析图
对电子鼻传感器阵列进行优化,进一步对九维的新特征矩阵进行数据融合,去除上述提及响应值低的传感器S3、S4、S5所对应的特征值V3、V24、V25,PCA与LDA分析结果如图9、图10所示。与优化前相比PCA图显示,3个等级茶叶的组间距离显著减小:LDA图显示Y1茶叶的组内距离明显增大,3个等级茶叶的组间距离也略微缩小。优化后整体分类效果与优化前相比有所下降,因此需要保留特征值V3、V24、V25。同时这也反映出,虽然传感器S3、S4、S5对茶叶香气的响应值低,但是这3个传感器对于评判茶叶的整体品质也发挥着一定的作用。茶叶的气味是由多种化学成分组合而成的,一些含量较低的成分也可能会对茶叶品质造成影响。因而评判茶叶品质不应仅从传感器的响应状态入手,而要多角度、多层次的考量。
图9 传感器优化后PCA分析图
图10 传感器优化后LDA分析图
本研究针对提取的三类特征值所组成的30维特征矩阵进行优化融合,分别对原始特征矩阵通过归一化处理、因子载荷分析、单因素方差分析,实现多特征优化融合。结果显示,最终得到的特征向量V3、V8、V16、V17、V19、V20、V24、V25、V29所组成的9维矩阵,保留了大量原始信息特征,剔除了冗余特征。通过主成分分析显示,优化后各等级茶叶组内聚集效果显著提高,组间间距也得到良好的区分。线性判别分析显示,优化后3个类别茶叶组间间距增大,分类效果更明显,且分类结果优于主成分分析。研究结果表明,基于传感器阵列多特征数据融合鉴别信阳毛尖品质是可行的,本研究提出的优化方法可降低数据的维度,通过对各特征分析去除冗余信息后,能有效优化多特征向量组成的矩阵阵列,分类结果更加清晰明朗,实现了对传感器阵列多特征的优化融合。另外需要指明,本研究给出的特征矩阵阵列可能不是最佳阵列,所提取的3类特征值也并非最适合毛尖品质的鉴别,这些工作还有待进一步的研究。
[1] 张巧萍,聂胜委,张玉亭,等. 信阳毛尖春茶、夏茶的品质现状及标准浅析[J]. 西南农业学报,2015,28(1):94-98.
[2] 宛晓春,龚淑英,龚正礼. 中国茶谱[M]. 北京:中国林业出版社,2007.
[3] 周小芬,叶阳,陈芃,等. 近红外光谱技术在茶叶品质评价中的研究与应用[J]. 食品工业科技,2012,33(5):413-417.
[4] Dong C W,Zhu H K,Zhao J W,et al. Sensory Quality Evaluation for Appearance of Needle-Shaped Green Tea Based on Computer Vision and Nonlinear Tools[J]. J Zhejiang Univ Sci B,2017,18(6):544-548.
[5] Jiang H,Chen Q. Chemometric Models for the Quantitative Descriptive Sensory Properties of Green Tea(Camellia sinensis,L.)Using Fourier Transform Near Infrared(FT-NIR)Spectroscopy[J]. Food Analytical Methods,2015,8(4):954-962.
[6] Guo H,Yang X,Zhou H,et al. Comparison of Nutritional Composition,Aroma Compounds,and Biological Activities of Two Kinds of Tartary Buckwheat Tea.[J]. Journal of Food Science,2017,82(7):1735-1741.
[7] 王梦馨,薄晓培,韩善捷,等. 不同防冻措施茶园茶汤滋味差异的电子舌检测[J]. 农业工程学报,2016,32(16):300-306.
[8] 贾洪锋,卢一,何江红,等. 电子鼻在牦牛肉和牛肉猪肉识别中的应用[J]. 农业工程学报,2011,27(5):358-363.
[9] 汤旭翔,刘伟,韩圆圆,等. 基于电子鼻和非线性数据特征分析的鸡肉鲜度检测方法[J]. 传感技术学报,2014,27(10):1443-1446.
[10] 洪雪珍,王俊. 基于逐步判别分析和BP神经网络的电子鼻猪肉储藏时间预测[J]. 传感技术学报,2010,23(10):1376-1380.
[11] 傅 均,黄灿钦,章铁飞. 便携式智能电子鼻系统及其葡萄货架期评价研究[J]. 传感技术学报,2017,30(5):782-788.
[12] 王虎玄,胡仲秋,龙芳羽,等. 苹果汁中鲁氏接合酵母早期污染的电子鼻识别研究[J]. 农业机械学报,2016,47(1):209-214,220.
[13] 吴莉莉,郑丹,郑宝周,等. 基于电子鼻技术的花椒品种鉴别方法研究[J]. 传感技术学报,2013,26(11):1473-1477.
[14] 周宇,孟庆浩,亓培锋,等. 基于单类支持向量机的电子鼻在白酒真假识别中的应用[J]. 传感技术学报,2015,28(12):1741-1746.
[15] 惠国华,陈裕泉. 基于电子鼻系统的不同风味绍兴黄酒区分方法研究[J]. 传感技术学报,2011,24(12):1799-1803.
[16] 史波林,赵镭,支瑞聪,等. 应用电子鼻判别西湖龙井茶香气品质[J]. 农业工程学报,2011,27(S2):302-306.
[17] 陈婷,蒋明忠,彭文,等. 基于电子鼻技术对云南普洱熟茶的香气品质判别[J]. 西南农业学报,2017,30(2):339-344.
[18] 张红梅,田辉,何玉静,等. 茶叶中茶多酚含量电子鼻技术检测模型研究[J]. 河南农业大学学报,2012,46(3):302-306.
[19] 于慧春,王俊,张红梅,等. 龙井茶叶品质的电子鼻检测方法[J]. 农业机械学报,2007,38(7):103-106.
[20] 于慧春. 基于电子鼻技术的茶叶品质研究[D]. 浙江大学,2007,6.
[21] 汤荣志,段会川,孙海涛. SVM训练数据归一化研究[J]. 山东师范大学学报(自然科学版),2016,31(4):60-65.
[22] 亓培锋,孟庆浩,井雅琪,等. 电子鼻中预处理算法选择及阵列优化[J]. 数据采集与处理,2015,30(5):1099-1108.
[23] 赵镭,史波林,汪厚银,等. 电子鼻传感器筛选的组合优化法研究[J]. 食品科学,2009,30(20):367-370.