单瑞峰*, 甄书仙, 陈 瑶, 王 萧, 刘丽媛, 华承彬, 张淑琪
(曲阜师范大学地理与旅游学院,南四湖湿地生态与环境保护山东省高校重点实验室,山东日照 276826)
目前,传统的茶叶品质辨别方法有湿化学分析[1]和感官评定法[2]。湿化学分析方法步骤相对繁琐、费用昂贵、污染环境且茶叶样品不可反复利用,因而难以用于茶叶的快速分析;而感官评定法受人为因素和外界环境的干扰很大,并且要耗费大量的人力物力,成本高,耗时长[3]。因此,亟待建立一种快速评价茶叶品质的方法。目前,近红外光谱(NIRS)技术已成功应用于茶叶中的水分[4]、茶多酚[5 - 8]、抗氧化活性[9]、咖啡碱[10]、氨基酸[11]等成分的定量分析,并且已经不少研究实现了茶叶种类鉴别[12]、产地溯源[13]和真伪判别[14]等。另外,王曼等[15]通过分析近NIRS-鲜叶内含成分-鲜叶等级间相关性,得到茶鲜叶等级近红外预测模型,成功实现了茶鲜叶品质分析和等级的快速评价。
茶多酚又名茶单宁或茶鞣质,是从天然植物茶叶中分离提取的多羟基酚类衍生物的混合物,是茶叶的天然活性成分[16]。目前研究表明,茶多酚除了作为食品天然抗氧化剂以外,还具有抗肿瘤、降低血糖、血脂和胆固醇的作用[17]。本文建立了一种NIRS技术结合化学计量学方法快速预测山东日照绿茶茶鲜叶中的茶多酚,考察了多种光谱预处理及建模方法,建立能充分反映地理标志产品日照绿茶茶鲜叶专有品质属性关系的模型,从而对茶鲜叶质量进行定量分析。
Antaris TMⅡ近红外光谱仪(美国);紫外-可见分光光度计(日本,日立公司);电热恒温干燥箱(上海一恒科学仪器有限公司);电子天平(上海精密科学仪器公司)。
硫酸亚铁、酒石酸钾钠、磷酸氢钠、磷酸二氢钾,所用试剂均为分析纯,水为蒸馏水。
图1 60个茶鲜叶样品的近红外光谱图Fig.1 Measured spectra of 60 fresh tea shoots samples
茶鲜叶分别采自日照近郊苏家村和巨峰镇2个茶区的60个茶园,采摘标准为具有一芽二叶的茶鲜叶,采样方法为同一天采摘,以保证其采摘环境相同,减小误差;每个茶园按五角星型取五点及其中心一点共六点法取样,采样后用锡箔纸包装,然后贮藏于冰箱,备用。采集的茶鲜叶每个样品称取25 g,放入微波炉的吸水纸上摊成一层,微波杀青2 min。然后放入烘干的铝皿(105 ℃下烘1 h)中,置于90±2 ℃烘箱里加热 8 h 后,加盖取出,于干燥器内冷却至室温,称量。然后在研钵中研磨,过0.45 mm筛,备用。
以漫反射模式测定样品的近红外光谱。检测器为InGaAs光电检测器。扫描范围为900~2 000 nm,间隔为1 nm,扫描次数为32次。鲜叶采摘后,将30 g茶鲜叶装入45 mm旋转样品杯中,样品杯中茶叶均匀铺开,然后压实采集光谱,每个样品采集5条光谱,取5条光谱的平均值作为该茶鲜叶样品的光谱。采集了60个茶鲜叶样品的近红外光谱,如图1所示。采用茶多酚含量排序方法选取40条光谱作为校正集,20条光谱作为预测集。
茶鲜叶中茶多酚参照国家标准(GB/T8313-2002),用酒石酸比色法测定。
光谱的一阶导数(1stderivate)和Savitzky-Golay平滑是常用的光谱预处理方法。前者是常用的背景扣除方法。后者是可以提高光谱的平滑性,降低噪音的干扰。遗传算法(Genetic Algorithm,GA)主要是借鉴生物界自然选择和遗传机制,利用选择、交换及突变等算子的操作,不断遗传和迭代,保留能够使目标函数值最优的变量,淘汰使目标函数值较差的变量,最后达到最优结果[18]。
主成分回归(PCR)是利用主成分分析将变量重新组合成一组新的互相无关的综合变量,选取少数几个主成分,使其尽可能的保留原始变量的信息。然后关联光谱与测定的目标值,建立校正模型并进行预测[19]。偏最小二乘法(PLS)是在主成分回归的基础上发展起来的一种线性分析方法。该方法同时对自变量矩阵和目标值矩阵进行主成分分析,用提取的最相关的成分建立模型[20]。
模型的性能用相关系数(R)、决定系数(R2)、交叉验证均方根误差(RMSECV)、预测均方根误差(RMSEP)和剩余预测偏差(RPD)来衡量。其中R、R2和RPD值越大,RMSECV、RMSEP值越小,模型的性能越好。
本文数据处理软件采用Matlab 2011a。
表1为60个茶鲜叶样本中茶多酚含量的测定结果。可以看出,样本中茶多酚的含量变化较大,预测集样本的含量范围在校正集样品含量范围之内,能够满足建立近红外校正模型的基本条件。
表1 鲜茶叶茶多酚含量统计结果Table 1 Statistical results of tea polyphenol content(TP) in fresh tea shoots
为了选择最佳因子数,本文采用蒙特卡洛交叉验证方法确定。图2(a)、2(b)分别为PCR和PLS模型的交叉验证均方根误差(RMSECV)随因子数的变化情况,从图2(a)可以看出,因子数从2增大至12,RMSECV整体呈下降趋势,由12变化至16时,RMSECV逐渐达到平衡。图2(b)中,因子数在2至9之间,RMSECV逐渐下降,由9变化至16时,RMSECV逐渐上升,因子数为9时RMSECV达到最小。因此,建立PCR模型时,最佳因子数选择13;建立PLS模型时,最佳因子数选择9。
图2 PCR(a)和PLS (b)RMSECV随因子数的变化Fig.2 Variation of the RMSECVs with latent variable number for PCR (a) and PLS (b)
有研究表明,Savitzky-Golay平滑能够有效消除噪音的影响提高信噪比。一阶导数光谱可以消除基线和其它背景的干扰,分辨重叠峰,提高分辨率和灵敏度[21]。因此,我们考察了Savitzky-Golay平滑和一阶导数预处理方法对模型性能的影响,如表2所示。表中RMSECV、R及RPD分别为校正集样品的预测均方根误差、测定值和预测值之间的相关系数及剩余预测偏差。可以看出,经过预处理后,对于PCR模型,RMSECV减小,R及RPD增大,说明对于茶鲜叶的PCR模型,两种预处理方法都能够改善模型的性能。另外,还可以看出,Savitzky-Golay平滑效果明显优于一阶导数处理的结果。表2中PLS模型的预测结果可以看出,Savitzky-Golay平滑能够明显改善模型的性能,而一阶导数处理后,模型的性能变化不大。通常,当RPD在2.0~2.5之间时,模型就可用来粗略的定量预测;当RPD取值在2.5~3.0时,能够很好地进行定量预测;当RPD大于3时,模型非常优异[22]。从表中可以看出,RPD值基本都大于3,说明经过预处理后PCR和PLS模型都能较好地预测茶鲜叶中的茶多酚。
表2 不同模型的预测结果Table 2 Prediction results by different models
我们考察了GA算法对PCR和PLS模型的影响,如表3所示。GA算法从光谱中选择出了200个针对目标组分茶多酚的信息变量。从表3中可以看出,对于PCR模型,Savitzky-Golay平滑和GA组合后,模型的性能有所改善;一阶导数和GA组合后,模型性能变化不大。对于PLS模型,经过波长选择后,模型性能明显改善。
图3 茶鲜叶的平均光谱和GA选择的变量Fig.3 The mean spectra of fresh tea shoots and selected variables by genetic algorithm(GA)
图3为茶鲜叶的平均光谱及GA算法选择的变量,选择的变量用小竖线表示。该方法从1 271个变量中选择了200个对应茶多酚的信息变量,从图中可以看出,选择的变量在波长区间比较分散,主要原因在于目标组分茶多酚成分比较复杂,茶多酚由儿茶素类、黄酮甙类、花青甙类、酚酸等30多种化学物质组成[16]。
为了进一步验证模型的性能,采用优化的模型对外部验证集茶鲜叶样品进行预测。预测结果如表3所示,可以看出,PCR模型的预测均方根误差RMSECP小于PLS模型。两种模型预测值与测定值之间相关系数相差不大,都大于0.97,并且RPD值都远大于3,说明优化的PCR和PLS模型对于茶鲜叶中的茶多酚预测效果较好。
表3 优化模型的预测结果Table 3 Prediction results by optimal models
图4(a)、4(b)分别为优化的PCR和PLS模型预测值与参考值相关性图,可以看出,决定系数(R2)分别为0.9541和0.9451,说明对于茶鲜叶中茶多酚的预测,PCR模型稍优于PLS模型。
图4 PCR(a)和PLS(b)模型测定值和预测值的散点图Fig.4 Scatter plots of the measured and predicted content of PCR(a) and PLS(b)
本文建立了一种快速、无损定量预测日照绿茶茶鲜叶中茶多酚的分析方法。通过光谱预处理方法 Savitzky-Golay平滑和一阶导数有效扣除了光谱中噪音及背景的影响,提高了模型预测的准确度。采用GA算法去除了冗余变量,利用目标组分的信息变量建立模型,简化了模型,提高了模型的预测能力。通过不同的建模方法的对比,结果发现对于茶鲜叶中茶多酚的预测,两种模型都能得到较好的预测效果,但PCR模型稍优于PLS模型,二者剩余预测偏差RPD值都远大于3。该方法的建立对于山东日照绿茶茶鲜叶质量监控评价、保障茶鲜叶质量安全、实现茶叶生产的标准化、提高日照绿茶品质和维护其品牌效益具有重要意义。
参考文献:
[1] PENG J Y,SONG X L,LIU F,et al.Spectroscopy and Spectral Analysis(彭继宇,宋星霖,刘飞,等.光谱学与光谱分析),2016,36(3):775.
[2] SHI B L,ZHAO L,WANG H Y,et al.Food Science(史波林,赵镭,汪厚银,等.食品科学),2009,30(19):351.
[3] ZOU Y B,WANG J.Journal of Tea Science(周亦斌,王俊.茶叶科学),2004,24(2):82.
[4] LUO W W,ZHANG Y L,GONG S Y,et al.Journal of Tea(罗文文,张月玲,龚淑英,等.茶叶),2007,33(2):67.
[5] LIN X,NIU Z Y.Food Science(林新,牛智有.食品科学),2009,30(10):144.
[6] WANG S P,WAN X C,LIN M X,et al.Journal of Tea Science(王胜鹏,宛晓春,林茂先,等.茶叶科学),2011,31(1):66.
[7] Frizon C N T,Oliveira G A,Perussello C A,et al.Lwt-food Science and Technology,2015,60(2):795.
[8] Pan W X,Zhao J W,Chen Q S,et al.RSC Advances,2015,5(75):60876.
[9] JIN L,LI X B,DIND H Q,et al.Journal of Chinese Institute of Food Science and Technology(金亮,李小白,丁华侨,等.中国食品学报),2016,16(2):242.
[10] GENG X,CHEN B,YE J,et al.Transactions of the Chinese Society of Agricultural Engineering(耿响,陈斌,叶静,等.农业工程学报),2009,25(10):345.
[11] NING J M,YAN L,ZHANG Z Z,et al.Spectroscopy and Spectral Analysis(宁井铭,颜玲,张正竹,等.光谱学与光谱分析),2015,35(12):3422.
[12] Diniz P H G D,Pistonesi M F,Alvarez M B,et al.Journal of Food Composition & Analysis,2015,39:103.
[13] Zhuang X G,Wang L L,Wu X Y,et al.Journal of Infrared and Millimeter Waves,2016,35(2):200.
[14] Chen Q S,Zhang D L,Pan W X,et al.Trends in Food Science & Technology,2015,43:63.
[15] WANG M,ZHANG Z Z,NING J M,et al.Science and Technology of Food Industry(王曼,张正竹,宁井铭,等.食品工业科技),2014,35(22):57.
[16] MA M J,HU W Q,FU L Y,et al.Food Science(马梦君,胡文卿,傅丽亚,等.食品科学),2014,35(11):11.
[17] ZHANG X M,NI Y,LI X R.Drug Evaluation Research(张晓梦,倪艳,李先荣.药物评价研究),2013,36(2):157.
[18] Lucasius C B,Kateman G.Trac Trends in Analytical Chemistry,1991,10:254.
[19] TANG X Y,NIU L Z,XU Y,et al.Transactions of the Chinese Society of Agricultural Engineering(汤修映,牛力钊,徐杨,等.农业工程学报),2013,29(11):248.
[20] SHAO X G,CAI W S.Chemoinformatics.Beijing:Science Press(邵学广,蔡文生.化学信息学.北京:科学出版社),2005,206.
[21] Shan R F,Cai W S,Shao X G.Chemometrics and Intelligent Laboratory Systems,2014,131:31.
[22] Zornoza R,Guerrero C,Mataix-Solera J,et al.Soil Biology &Biochemistry,2008,40(7):1923.