基于近红外光谱的普洱茶产地识别研究

2020-07-14 02:29李余进李超李家华施伟李哲姚应方张艳诚
湖北农业科学 2020年5期
关键词:近红外光谱聚类分析普洱茶

李余进 李超 李家华 施伟 李哲 姚应方 张艳诚

摘要:以81份来自西双版纳、普洱市、临沧市3个不同产地的普洱茶样本为研究对象,其中校正集54份,验证集27份,利用近红外光谱采集单个普洱茶样本在1 100~2 498 nm的光谱数据,分别采用主成分聚类分析法和判别分析法建立普洱茶产地识别定性分析模型。结果表明,2种分析模型的校正集正确识别率均大于90%,可用于普洱茶产地的识别。其中,基于判别分析方法建立的判别分析模型效果更好,其校正集和验证集的识别正确率达到98.15%和100%,更适用于普洱茶产地的识别。应用近红外光谱技术可快速、无损识别普洱茶产地,为普洱茶产地检测提供参考。

关键词:近红外光谱;普洱茶;聚类分析;判别分析;产地识别

中图分类号:O657.33         文献标识码:A

文章编号:0439-8114(2020)05-0138-04

Abstract: 81 Pu'er tea samples from three different producing areas, such as Xishuangbanna, Pu'er City and Linyi City, were studied. Among them, 54 were corrected and 27 were verified. A single Pu'er tea sample was collected by near-infrared spectroscopy at 1100- The spectral data in the range of 2498 nm was established by principal component cluster analysis and discriminant analysis to establish a qualitative analysis model for Pu'er tea production. The test results show that the correct recognition rate of the correction set of the two analytical models is greater than 90%, which can be used for the identification of Pu'er tea origin. Among them, the discriminant analysis model based on the discriminant analysis method is better, and the correctness rate of the calibration set and the verification set is 98.15% and 100%, which is more suitable for the identification of Pu'er tea origin. Therefore, the application of near-infrared spectroscopy technology can quickly and non-destructively identify the origin of Pu'er tea, providing a new method for the detection of Pu'er tea production.

Key words: near-infrared spectroscopy; Pu'er tea; cluster analysis; discriminant analysis; origin identification

普洱茶是云南省“十三五”規划中明确提出重点发展的十大产业之一,也是一种极具云南地方特色的茶类饮品,具有多种保健功效,深受国内外消费者喜爱[1]。普洱茶是以云南特定区域的大叶种晒青毛茶为原料,具有强烈的地域特性,其产地归属直接影响品质优劣、口感以及市场价格。但近年来,随着茶叶销量的日益增加,也带来了茶叶市场质量参差不齐、弄虚作假、夸大宣传等一系列不规范现象,并且市场上的普洱茶产地难以保证其真实性[2]。传统的感官评定法易受外界环境因素的干扰,而化学检测法步骤繁琐、费用高昂,因此,需要一种快速、简便、准确的方法来溯源普洱茶的产地。

近红外光谱分析技术具有快速、无污染、操作简便等特点[3],已经被广泛的应用于产品的分级分类、真伪鉴别等方面,并已经成为国内外学者认可的高效检测方法[4-7],因其可与不同形式的光纤测量附件搭配,利于从室内研究转向田地、工厂、海洋等室外实时和在线检测研究的发展[8-10]。目前国内赵杰文等[11]、周健等[12]、陈波等[13]分别利用近红外光谱技术结合不同的数据分析方法,实现了不同名类茶叶的鉴别;任广鑫等[14,15]利用主成分因子法建立了国内外7个产地红茶的产地识别模型,其准确识别率达92.8%,有效证明了茶叶产地的可识别性。但目前基于近红外光谱技术的普洱茶研究还只是进行了基础性探索,仅有唐林等[16]对其年份进行检测鉴别,对产地未见具体研究。

本研究对不同产地的普洱茶样本进行近红外光谱分析,利用主成分分析法对不同产地的普洱茶样本进行定性聚类分析,三维图展示马氏距离得分结果;再比较不同预处理方法和不确定因子系数下,建立的回归定性判别模型的产地鉴别效果。最后得到效果较优的普洱茶产地识别模型,从而为构建普洱茶近红外光谱数据库、产地溯源模型以及为普洱茶产地鉴别提供理论依据。

1  材料与方法

1.1  材料

普洱茶样本产地分别为西双版纳、普洱市、临沧市,3个不同产地的普洱茶样品共81份。分成校正集(54份),验证集(27份),其中校正集的西双版纳市27份、普洱市12份、临沧市15份;验证集西双版纳市9份、普洱市9份、临沧市9份,每份样品50 g,装入自封袋中进行编号。

1.2  仪器与设备

NIRSystems 5000近红光谱分析仪,波长范围1 100~2 500 nm;扫描速度1.8次/s,工作温度为15~32 ℃;配套有光谱分析软件WinISI Ⅲ。

1.3  方法

1.3.1  光谱采集  NIRSystems 5000近红外快速品质分析仪的工作温度为15~32 ℃,温度控制在25 ℃,并严格控制室内湿度。在样品扫描前,仪器需预热1 h。采集光谱时先用镊子将样品装入托盘中,保持样品表面平整,将样品托盘放在载物台中,盖好载物台外盖,检查无误后按下电源开关,在1 100~2 500 nm进行扫描,每份样品重复扫描3次,每次扫描结束在电脑中进行编号。

1.3.2  光谱预处理  近红外光谱不仅能反应物质的化学组成与浓度,还能体现物质的表面纹理、密度等物理性质以及受采集环境的影响。因此在光谱分析各样品的特征信息前需要对光谱进行一定的预处理去除来自高频随机噪音和基线漂移等影响,以便提高光谱图与化学组成的相关性,消除与样品组成无关的外部环境信息的影响。由FOSS公司提供的定标手册可知,预处理的方法包括散射校正处理、导数处理、标准正交变换处理等。回归建模的最大主成数、平滑处理数的设定需要经过不断试验和优化来选择最适合于所建模型的数值。

1.3.3  识别方法  主成分分析常用于减少数据集的维数,同时保持数据集中对方差贡献率最大的特征。利用数理统计方法找出样本中主要因素和各因素之间的相互关系,把样本中的多个变量转化为较少的几个综合指标(即主成分)问题。本研究采用主成分分析来统计不同产地样本之间的特征差异。

聚类分析是指将研究或处理的样本按照一定的条件或属性进行分类。利用光谱采集软件配套的WinISI Ⅲ软件中的聚类分析技术对不同产地的普洱茶样本进行鉴别。聚类方式选择主成分分析(PCA),来统计不同产地样本间的差异,聚类度量选择马氏距离进行。计算马氏距离选择平均点,即利用样本得分与文件中所有样本的得分平均值进行比较来计算马氏距离。将马氏距离设置为2.0(GH=2.0),其意义为三维得分图中,每个样品距离中心样品点的距离为标准变异单位的2倍,数学处理方式选择二阶导数处理,平滑处理为9点。如果一类样品的预测值在2.00内,表明其属于目标样品。

判别分析是一种统计判别和分组技术,在分类确定的条件下,根据某一研究对象的各种特征值判别其类型归属问题。其基本原理为按照一定的判别准则,建立一个或多个判别函数,用研究样本的大量数据资料确定判别函数中的待定系数,并计算判别指标,由此对验证样本进行分类。判别分析法被用来鉴别各种产品,本研究在WinISI软件中选择开发方程,选择目标文件进行处理,多次试验确定最大主成分数、不确定因子数以及交叉验证分组数来进行定标建立模型,得到最优判别定标模型。

2  结果与分析

2.1  近红外光谱分析

将54份校正集的普洱茶原始光谱图进行平均,得到平均光谱数据如图1所示。由于采集的光谱数据难免受其采集环境与样本外观纹理等影响,需对原始光谱数据进行预处理,以消除噪声的影响。

从图2至图4可以看出,3个产地的普洱茶样本在1 100~2 498 nm均能表现出丰富的信息。由于相同产地的普洱茶样本的主要化学成分基本相同,表现为样本间图谱差异较小,具有很强的一致性,说明样本具有一定的代表性。不同产地的普洱茶树生长环境不同,导致普洱茶的化学成分在含量和類别上存在一定的差异,因此茶样之间峰位、峰型、吸收峰数、吸收度的差异都是定性识别茶叶产地的有效光谱信息,也使得不同样本有了独特的光谱曲线。

2.2  特征波长筛选

由该设备练习手册可知,超过2 200 nm后的光谱噪音较高,一般不适用此波长后的光谱信息。观察光谱图,比较分析不同产地预处理后的光谱图,选择在1 212~1 518、1 592~1 802、1 860~1 976 nm三段光谱数据参数进行建模。

2.3  预处理方法选择

根据光谱预处理结果,为了能表现光谱中大量的信息,体现不同产地之间的光谱特征差异,选择标准正交变换+二阶导数预处理方法进行光谱预处理,平滑数为9。光谱预处理结果如图2、图3、图4所示。

图5为普洱茶样本聚类得分空间,其中有3份样品的马氏距离大于2.000,被认为是非目标样本。从图5可以明显看出,不同产地的普洱茶样本间有很好的聚类效果。1、2轴的后方3个产地的样本基本分别聚类在一起,1、2轴的前方西双版纳样本和其他样本相距较远,但也自行聚集在一处,可能因为不同品牌普洱茶样本的加工工艺和储存方式不同造成。在临沧市的普洱茶样本中有3个样本由于GH值大于2.00被鉴别为非目标样本。

从表1鉴别结果可以看出,临沧市的普洱茶样本中有3个样本的马氏距离超过了2.00,因此被剔除。54份普洱茶样本中共剔除3份,得到普洱茶产地溯源模型识别率为94.44%。

2.4  判别模型建立

经过软件的多次试验对比和计算得出,最大主成分数、交叉验证分组数分别为15和4;光谱的预处理方式为标准正交变量变换+二阶导数处理结合平滑处理(9点)时的定标效果最好。从表2可以看出,定标模型在UF=0.5时定标效果最好,模型识别准确率达到98.15%。

2.5  模型的适用性检验

为了进一步确定定性模型的准确定和适用性,需要用外部验证的方法对模型进行检验。利用27份样本的验证集数据对判别定标的普洱产地模型进行独立验证。3个产地的普洱茶样本识别准确率为100%,验证结果的三维展示如图6所示,3个产地的普洱茶样本各自聚集在一起,且没有明显的重合现象。

3  结论

使用近红外光谱技术对西双版纳、普洱市、临沧市3个地区的普洱茶样本进行了产地定性分析,并建立了聚类和判别定性分析模型,对普洱茶原产地识别问题开展了快速识别研究。通过试验,构建了普洱茶产地识别模型。结果表明,3个不同产地的普洱茶光谱吸光度曲线变化趋势基本一致,表现出波动性衰减,光谱的吸收峰主要在1 212~1 518、1 592~  1 802、1 860~1 976 nm,因此采用此波段的光谱数据进行模型的建立。采用不同光谱预处理方法对模型的预测结果进行比较,得出标准正交变量变换+二阶导数结合平滑(9点)预处理方法得到的模型预测性能最好,聚类分析模型正确识别率为94.44%;对判别分析模型的参数进行选择比较,得到其最大主成分数为15,交叉验证分组数为4,不确定因子数为0.5时,模型的识别率最佳,达到98.15%,验证集的正确识别率为100%。

对比上述模型的识别效果,得出判别定标分析方法的普洱茶产地识别效果优于聚类模型,该方法在不需要化学试剂和复杂的样本前处理便可以用于快速准确的识别普洱茶产地。说明这种有监督的判别模型更适于普洱茶产地的识别。因此近红外光谱技术结合判别分析定性识别模型能更准确地识别普洱茶产地,可为其产地识别提供一种快速鉴别方法。

参考文献:

[1] 钱  和,宁  炜,顾林平,等.茶叶溯源技术研究进展[J].现代农业科技,2009(14):23-25.

[2] 赵  雅,王博思,赵明富.基于光谱技术的茶叶品质参数茶多酚含量快速检测方法研究[J].半导体光电,2018,39(4):591-594.

[3] 张  民.近红外光谱在线分析鲜茶叶品质的研究[D].长沙:湖南农业大学,2015.

[4] LYU LT,GAO Q H,XU J J,et al. A new interaction between proximal and distal C-terminus of Cav1.2 channels[J].Journal of pharmacological sciences,2017,133(4):312-317.

[5] MOHAMED J,BESSEM S. An optimization problem involving proximal quasi-contraction mappings[J].Fixed point theory and applications,2014(10):141-159.

[6] 李志刚,贾  策,王晓闻,等.牛肉质构特性的近红外光谱无损检测[J].农业工程学报,2016,32(16):286-292.

[7] 古丽君,林振华,吴世玉,等.近红外光谱结合线性判别分析在食醋品牌鉴别中的研究[J/OL].食品与发酵工业,1-6[2019-07-12].

[8] 彭彦昆,赵  芳,李  龙,等.利用近红外光谱与PCA-SVM识别热损伤番茄种子[J].农业工程学报,2018,34(5):159-165.

[9] 文  韬,郑立章,龚中良,等.基于近红外光谱技术的茶油原产地快速鉴别[J].农业工程学报,2016,32(16):293-299.

[10] 褚小立,史云颖,陈  瀑,等.近五年我国近红外光谱分析技术研究与应用进展[J].分析测试学报,2019,38(5):603-611.

[11] 赵杰文,陈全胜,张海东,等.近红外光谱分析技术在茶叶鉴别中的应用研究[J].光谱学与光谱分析,2006(9):1601-1604.

[12] 周  健,成  浩,叶  阳,等.基于近红外的Fisher分类法识别茶叶原料品种的研究[J].光学学报,2009,29(4):1117-1121.

[13] 陈  波,靳保辉,梁  宏,等.近红外光谱技术与聚类分析鉴别中国名茶[J].光谱实验室,2012,29(5):2901-2905.

[14] 任广鑫,范起业,何  鑫,等.近红外光谱(NIRS)技术在茶叶领域研究中的应用与展望[J].中国茶叶加工,2013(1):20-24,29.

[15] 任广鑫.基于近红外分析技术的红茶成分分析与产地识别的研究[D].合肥:安徽农业大学,2012.

[16] 唐  林,张艷诚,李家华,等.基于近红外光谱的普洱茶年份检测研究[J].广东农业科学,2014,41(17):93-96.

猜你喜欢
近红外光谱聚类分析普洱茶
收藏普洱茶对市场供需量的影响
普洱茶怎么泡
普洱茶叶加工大赛
普洱茶膏抗小鼠衰老的保健作用