基于近红外光谱技术结合遗传算法的安溪铁观音品质评价

2016-12-21 10:29夏金梅孙威江曾兆华王冰玉
武夷科学 2016年0期
关键词:茶样安溪铁观音

夏金梅, 孙威江, 林 涛, 游 泳, 曾兆华, 王冰玉

(1.福建省农业科学院植物保护研究所农药环境安全评价中心, 福建 福州 350002;2.福建农林大学园艺学院, 福建 福州 350002)



基于近红外光谱技术结合遗传算法的安溪铁观音品质评价

夏金梅1,2, 孙威江2, 林 涛1, 游 泳1, 曾兆华1, 王冰玉2

(1.福建省农业科学院植物保护研究所农药环境安全评价中心, 福建 福州 350002;2.福建农林大学园艺学院, 福建 福州 350002)

以清香型铁观音茶叶为试验原料,基于近红外光谱技术结合遗传算法,建立相关的数学分析模型,用于安溪铁观音综合品质得分的测定,完善茶叶检测体系,进一步推动我国茶产业的标准化进程。实验结果表明,经二阶导数+平滑+归一化方法对光谱进行预处理后,得到综合品质得分PLS测定模型最优,验证集相关系数为0.913,均方根偏差为0.665。选用近红外光谱6 670-4 000 cm-1谱区,经遗传算法筛选特征波长后,建立茶样综合品质得分GA-PLS测定模型,校正集相关系数为0.959,均方根偏差为0.413;验证集相关系数为0.940,均方根偏差为0.587,GA-PLS模型的预测能力和精度更高。

近红外光谱技术; 遗传算法; 偏最小二乘法; 安溪铁观音; 品质评价

安溪铁观音作为我国的十大名茶之一,以其独特的“观音韵”闻名,随着铁观音消费量的提高,人们对茶叶品质的要求也随之提高。当前市场上的安溪铁观音外观多为颗粒状,消费者很难直接从外观上辨别其品质优劣。感官审评和理化分析是目前茶叶品质检测最主要的两种方法,但二者在判别安溪铁观音品质方面都具有不同程度的局限性。传统的感官审评方法主要依靠专业审评人员的感觉器官对茶叶的外形(权重20%)、汤色(权重5%)、香气(权重30%)、滋味(权重35%)和叶底(权重10%)5项单因子进行审评得出分数,计算5项因子的加权总分,以分数的高低来判断其品质优劣,虽然简便、快捷,但其易受到主观因素和生理因素的影响,评审缺乏说服力。理化分析是利用化学分析方法检测茶叶中咖啡碱、茶多酚等理化指标来评判茶叶品质的一种方法,得到的结果虽然较为准确,但因其操作步骤繁琐、费时、成本高等缺点,难以推广与运用(傅志明,2005)因此,快捷、准确新型的检测方法的开发研究受到普遍关注。

20世纪70年代日本最早运用近红外光谱技术快速检测茶叶组分。中国在20世纪90年代才开始就近红外光谱技术开展相关研究(许琼等,2007)。王胜鹏等(2011)验证偏最小二乘法,建立了茶叶在近红外波段光谱与含水量、全氮量的相关模型,这为茶叶的品质研究提供了一个新的突破。李艳肖等(2015)利用蚁群算法和遗传算法进行优化谱区,建立花茶花青素近红外光谱预测模型,具有较高精度,可有效选择特征光谱信息。近红外光谱技术作为一种具有绿色、无损、快速等优势的新兴技术,被认为是有望替代传统的化学分析的无损检测方法(刘发龙等,2008)。

因此,本文以安溪铁观音为试验原料,尝试利用遗传算法选取波段,结合偏最小二乘法,最后建立综合品质得分模型,并对其进行评价与优化。研究结果有助于更好地规范乌龙茶销售市场,防止出现外观相似的假冒伪劣产品,并探索出一种能够快速、准确地评判安溪铁观音品质优劣的方法。

1 材料与方法

1.1 材料

1.1.1 试验材料 选取安溪各地茶农或者茶叶生产厂家未包装的清香型安溪铁观音毛茶,根据收购价格的高低,将茶样初步划分为高中低3个档次,共130个茶样。其中95个茶样作为校正集;35个茶样作为验证集。

1.1.2 仪器和软件 采用Antaris II傅立叶近红外光谱仪,基于Workflow光谱采集工作流获取茶样近红外光谱信息;使用红外处理软件OPUS进行数据格式转换和近红外光谱预处理;利用Matlab R2010a软件进行数据分析和数学建模(段焰青等,2011)。

1.2 试验方法

1.2.1 感官审评 根据《茶叶感官审评方法》(冯花等,2010),由3位专业审评人员在福建省茶叶质量监督检验站对茶叶进行了感官审评,得出茶样品质得分,以此作为建模依据。

1.2.2 样品前处理 将茶样放入中药粉碎机研磨,粉碎1 min呈粉末状,过80目筛,取筛下茶粉,称取10-15 g茶粉进行编号、封装,作为近红外光谱采集的样品。

1.2.3 近红外光谱数据的采集 利用Antaris II傅立叶近红外光谱仪采集,基于Workflow设置茶粉光谱采集工作流,设置参数为:光谱扫描次数64 次,分辨率8 cm-1,光谱范围10 000-4 000 cm-1,光谱数据点为1 557个(邹小波等,2007),保持室内温湿度稳定。

1.2.4 近红外光谱预处理 近红外光谱图除了携带茶样的自身信息外,还包含了一系列无关信息和噪声。因此,在结合化学计量学方法建立模型时,利用谱图预处理方式消除光谱数据中无关信息与噪声,提取与化学组成相关的信息对提高模型的准确率十分关键。

本试验采用6种光谱预处理方式:平滑;平滑+归一化;一阶导数+平滑;一阶导数+平滑+归一化;二阶导数+平滑;二阶导数+平滑+归一(“+”表示光谱预处理方式结合),分别形成6组数据矩阵,再代入试验模型中进行调试和筛选。

1.2.5 利用遗传算法进行建模波段的筛选 遗传算法(GeneticAlgorithm,简称GA)是一种自适应的全局的概率搜索算法,通过选择、交换和突变等遗传操作,模拟生物界的遗传机制和自然选择,使目标函数值中较好的变量被保留下来,从而使结果达到最优。在近红外光谱技术分析领域,遗传算法常作用于分析对象特征波长的优选和组合(刘辉军等,2008)。

本试验在光谱预处理后进行遗传算法筛选特征波长。将光谱总区间平均分为30个子区间进行二进制随机编码,每个子区间包含24个数据点,设置参数:种群大小为50,基因数为30,变异概率为0.01,交叉概率为0.6,迭代次数为15代。以预测值与真实值的相关系数(Correlation Coefficient,简称R)、预测均方根偏差(Root Mean Squared Errorof Prediction,简称RMSEP)作为模型结果的评价指标。以F=R/RMSEP最大作为优化指标,重复遗传操作至最大繁殖代数时停止,F越大代表模型的预测能力越强,以F最大时的基因编码解码后得到的谱线组合作为最优谱线组合(任广鑫,2012;周明等,1999)。

1.2.6 引入偏最小二乘法建立模型 偏最小二乘法是一种多因变量对多自变量的回归建模方法,有机结合了模式型和认识型的方法,使以往用普通多元回归无法解决的问题得到有效的解决。

本试验使用Matlab数学软件,以茶样的感官审评得分作为建模依据,引入偏最小二乘法,将其与遗传算法优选后的光谱波段信息进行关联性分析,建立近红外光谱信息与茶样感官审评得分之间的GA-PLS数学模型(PLS,Partial Least Squares)。

1.2.7 模型的验证与优化 采集验证集样品的近红外光谱数据作为模型验证的输入量,通过模型预测茶样的品质加权总分,将预测值与感官审评的结果值进行比较分析,来确定茶叶品质的优劣。如果PMSEP值越小,R值越大,说明校正模型的预测准确度越高(任广鑫,2012)。

2 结果与分析

2.1 近红外光谱预处理方法的确定与分析

经平滑、平滑+归一化、一阶导数+平滑、一阶导数+平滑+归一化、二阶导数+平滑、二阶导数+平滑+归一化6种预处理后的谱图见图1、PLS模型数据结果见表1。结果表明,在二阶导数+平滑+归一化条件下,茶样综合品质的校正集的相关系数RC为0.921,预测均方根偏差RMSEC为0.543;验证集的相关系数RP为0.913,验证均方根偏差RMSEP为0.665,其效果优于其它预处理方法。因此本试验采用二阶导数法+平滑+归一化的光谱预处理方式。

2.2 近红外光谱波段的选择

为避免搜索空间过大而影响寻优效果,本试验拟选取部分光谱区间进行波长筛选。图1表明,在6 670-4 000 cm-1光谱区域吸收峰与光谱特征信息较明显。因此,本试验选用近红外光谱数据6 670-4 000 cm-1作为特征筛选范围。

表1 不同光谱预处理条件下的安溪铁观音茶样综合品质得分PLS模型

Table 1 The PLS model of AXTGY tea based on different kinds of spectral pretreatment

光谱预处理校正集RCRMSEC验证集RPRMSEP平滑0.1851.4350.3881.505平滑+归一化0.3411.3730.5121.402一阶导数+平滑0.6141.2230.8660.818二阶导数+平滑0.8120.8530.9070.688一阶导数+平滑+归一化0.9040.6260.9220.636二阶导数+平滑+归一化0.9210.5430.9130.665

(a)平滑 (b)平滑+归一化 (c)一阶导数+平滑

(d)一阶导数+平滑+归一化 (e)二阶导数+平滑 (f)二阶导数+平滑+归一化

图1 不同光谱预处理方式处理后的安溪铁观音茶样光谱图

Figure 1 The spectra of AXTGY tea sample after different spectral pretreatment process

2.3 PLS模型和GA-PLS模型对比分析

试验中GA-PLS模型将全部谱区平均分为30个子区间进行随机编码,试验结果表明(表2),经过遗传算法优选出最佳的谱区编码为:101010110111011101010110010010,其中编码为“1”的基因个数为17个,表示平均分割的30个子区间中有17段谱区被选择参与GA-PLS模型的建立,每个子区间包含24个数据点,即建模点数为24×17=408(表2)。

经二阶导数+平滑+归一化处理后,得到茶叶综合品质得分的PLS模型与GA-PLS模型(表2),PLS模型和GA-PLS模型的RC和RP均在0.9以上,预测均方根偏差RMSEC均小于0.6,模型预测效果好,可用于预测茶叶综合品质得分。其中PLS模型的校正集的相关系数RC为0.959、预测均方根偏差RMSEC为0.413、验证集的相关系数RP为0.940、验证均方根偏差RMSEP为0.587。GA-PLS模型的校正集的相关系数RC为0.959、预测均方根偏差RMSEC为0.413、验证集的相关系数RP为0.940、验证均方根偏差RMSEP为0.587,对比可知GA-PLS模型结果较优。其中PLS模型建模波段为1 557,经遗传算法波段优化后的模型GA-PLS建模波段仅为408,建模波段减少,缩小建模运行时间,GA-PLS模型验证集的相关系数RP达到0.940,RMSEP为0.587(表2),优于PLS模型,精度更高预测效果更佳。

表2 安溪铁观音茶样综合品质得分PLS和GA-PLS模型

Table 2 The comprehensive quality score PLS and GA-PLS model of AXTGY tea sample

建模方法建模波段最佳染色体校正集RCRMSECF验证集RPRMSEPFPLS1557全谱段0.9210.5431.6970.9130.6651.375GA-PLS4081010101101110111010101100100100.9590.4132.3220.9400.5871.601

(a) 偏最小二乘模型 (b) 遗传算法-偏最小二乘模型

图2 安溪铁观音茶样综合品质得分PLS和GA-PLS模型的线性回归散点图

Figure 2 The linear regression scatterplot of comprehensive quality score PLS and GA-PLS model of AXTGY tea sample

3 小结与讨论

近红外光谱会受到其他外界因素的影响。在具体运用中,应根据不同目的和样品体系选择不同的预处理方式,由于所测得的光谱曲线图往往伴随一定的噪声,本试验通过平滑预处理改善光谱形状,提高信噪比(尼珍等,2008)。导数法能够有效的消除其他背景的干扰,但是会引入噪音,所以将平滑法与导数法结合使用,同时运用归一化法,进一步校正样品因颗粒散射和样品稀疏而引起的光谱信息误差。将平滑法、导数法和归一化法结合使用,能够有效的对近红外光谱进行预处理,满足其适用性。

在建立近红外光谱校正模型时,对于样品的选择应具有一定的代表性和广泛性。为了提高模型的校正效果和应用范围,应充分考虑茶样的产地范围、品质等级等因素。本试验将茶样根据品质高中低进行排序,选取茶样数量,以含量梯度法划分训练集和预测集。但是茶样收集存在一定难度,无法收集全部样品,使得所建模型存在局限性。

本试验结果表明,综合品质得分GA-PLS模型相关系数R达到0.959,预测均方根偏差RMSEP为0.413,能够较准确评判安溪铁观音品质。但该方法仍存在样品收集复杂、参数设定凭经验等问题。因此,在今后的科研工作中,需要我们进一步研究和优化近红外光谱模型,完善茶叶快速无损检测体系,促进我国茶产业的标准化进程。

段焰青,陶鹰,者为,等,2011.近红外光谱分析技术在烟叶产地鉴别中的应用[J].云南大学学报(自然科学版),33(1):77-82.

冯花,郭雅玲,2010.茶叶感官审评方法及其新发展[J].福建茶叶,32(7):28-31.

傅志民,2005.茶叶感官审评存在的不足和改进建议[J].中国茶叶加工,1:16-17.

刘发龙,马新刚,程福银,等,2008.近红外光谱分析技术在快速分析上的应用[J].分析测试技术与仪器,,14(4):241-247.

刘辉军,林敏,施秧,等,2008.遗传算法在绿茶叶近红外光谱分析中波长选择的应用[J].理化检验(化学分册),44(3):249-251.

李艳肖,黄晓玮,邹小波,等,2015.蚁群和遗传算法优化花茶花青素近红外光谱预测模型的比较[J].食品与生物技术学报,34(6):575-583.

尼珍,胡昌勤,冯芳,2008.近红外光谱分析中光谱预处理方法的作用及其发展[J].药物分析杂志,05:824-829.

任广鑫,2012.基于近红外分析技术的红茶成分分析与产地识别的研究[D].安徽:安徽农业大学.

王胜鹏,宛晓春,林茂先,等,2011.基于水分、全氮量和粗纤维含量的茶鲜叶原料质量近红外评价方法[J].茶叶科学,31(1):66-71.

许琼,马国欣,2007.近红外光谱技术在化学分析方面的应用进展[J].中国高新技术企业,3:123-124.

周明,孙树栋,1999.,遗传算法原理及应用[M].北京:国防工业出版社,1-202.

邹小波,赵杰文,2007.用遗传算法快速提取近红外光谱特征区域和特征波长[J].光学学报,27(7):1 316-1 321.

(责任编辑:陈晓雯)

The quality evaluation of Anxi Tieguanyin tea based on near-infrared spectroscopy combined with genetic algorithm

XIA Jin-Mei1,2, SUN Wei-Jiang2, LIN Tao1, YOU Yong1, ZENG Zhao-Hua1, WANG Bing-Yu2

(1.PesticideEnvironmentalSafetyAssessmentCenter,InstituteofPlantProtection,FujianAcademyofAgriculturalSciences,Fuzhou,Fujian350002,China;2.CollegeofHorticulture,FujianAgricultureandForestryUniversity,Fuzhou,Fujian350002,China)

To evaluate the quality of Anxi Tieguanyin (AXTGY) tea by unified standards, the present experiment studied the characterization of AXTGY tea using near-infrared spectroscopy and genetic algorithm. AXTGY tea was collected as the research materials, and genetic algorithm (GA) combined with partial least squares (PLS) was used for building the mathematical analysis model to analyse the quality of AXTGY tea. The results of comprehensive quality score determination model showed that the PLS model displayed the highest prediction performance after spectrum being processed by smoothing, the second derivative and normalized methods. Statistic results of PLS model:Rp=0.913, RMSEP=0.665.NIR spectra ranged from 6 670 to 4 000 cm-1were selected, using GA to select characteristic wavelength and then to construct GA-PLS calibration model which has higher predictive power and precision. Statistic results of GA-PLS model wereRC=0.959, RMSEC=0.413,RP=0.940, RMSEP=0.587.

near-infrared spectroscopy; genetic algorithm; partial least squares method; Anxi Tieguanyin tea; quality score

2016-07-19; 发表日期: 2016-10-31

福建省自然科学基金(2016J01139); 福建省省属公益类科研院所专项(2014R1024-6,2016R1023-9)。

夏金梅(1993-),女,本科,研究实习员。研究方向:农药环境毒理。Email:1083647947@qq.com。

O657.33; S132

A

1001-4276-(2016)01-0132-06

夏金梅,孙威江,林涛,等,2016.基于近红外光谱技术结合遗传算法的安溪铁观音品质评价[J].武夷科学,32:132-137.

猜你喜欢
茶样安溪铁观音
六盘水蟠龙镇古茶树试制不同茶类的品质分析
缩略词
喷灌、遮阴对夏季绿茶干茶色泽、汤色的影响研究
有一种好茶叫“铁观音 秋茶”
预防病毒
木栅铁观音 百年闽台缘
徐经表的“茶样”人生
——记五莲县“南茶北引”50年发展历程
几种信阳毛尖茶的化学成分研究
安溪寿星爱品茗
陈香型铁观音国家标准有望2015年发布