徐荣荣,任广鑫,王胜鹏,王玉霞,张正竹
(安徽农业大学茶叶生物化学与生物技术教育部重点实验室,安徽合肥230036)
样品形态对绿茶品质成分近红外定量预测的影响
徐荣荣,任广鑫,王胜鹏,王玉霞,张正竹*
(安徽农业大学茶叶生物化学与生物技术教育部重点实验室,安徽合肥230036)
对110份绿茶样采用偏最小二乘法(PLS)建立水分、全氮量、粗纤维、水浸出物、茶多酚、咖啡碱和游离氨基酸的近红外预测模型。考察完整样、粉碎样的近红外光谱对该7种成分的建模效果,以及茶汤的近红外光谱对水浸出物、茶多酚、咖啡碱和游离氨基酸的建模影响。研究显示粉碎样光谱建立的模型最优,交叉验证均方差(RMSECV)和预测均方差(RMSEP)均小于0.5,外部验证的决定系数(R2)除粗纤维的为0.8598外,其余成分的R2均在0.9以上。茶汤光谱建立的模型效果不理想,其中咖啡碱和游离氨基酸的R2不超过0.5,相对分析误差(RPD)小于2.5%。结果表明:绿茶进行粉碎处理比完整样以及制备成茶汤建立的模型更为可靠,使用近红外光谱技术可以快速检测绿茶的7种成分。
绿茶,近红外光谱,样品形态,定量模型,快速分析
绿茶在我国产区分布最广,产销量最大,位居世界第一,其出口量占世界绿茶贸易总量的70%以上[1]。茶叶中含有水分、粗纤维、茶多酚、咖啡碱、氨基酸等多种成分,这些成分与茶叶品质直接相关[1-2]。随着茶叶产量和贸易量的增加,对茶叶品质分析手段提出了更高的要求。现有的茶叶成分分析方法大都利用不同化学方法(如比色法、HPLC法)对各成分进行逐一测定,操作复杂、费时费力、测试成本高且具破坏性,不能实现快速分析。因此迫切需要开发快速、简便、准确的茶品质成分分析的新方法。近红外光谱分析技术因其无污染、成本低、速度快、多组分同时测定等优点,被广泛应用于食品、农产品、医药和石油等领域[3-11]。国内外大量的研究表明,利用近红外光谱技术可以定量分析茶叶中的水分、茶多酚、咖啡碱、氨基酸等内含物的含量[12-20]。前人研究大都选择完整茶叶或粉碎样品中某一种样品形态建立模型,而采用不同形态样品(完整茶叶、粉碎样、茶汤)进行的研究鲜有报道。样品是否经过前处理,是液态还是固态等,对近红外检测结果影响很大[21-22]。本研究对绿茶进行近红外光谱解析,采用偏最小二乘法建立绿茶中7种成分的预测模型,旨在探讨完整茶样、粉碎样和茶汤三种样品形态对模型预测效果的影响,以期为绿茶品质检测提供一种快速、科学、准确的方法。
绿茶 收集当年生产的高、中、低档绿茶样品110个,产地主要是安徽、江苏、浙江等绿茶主产区,样品种类包括毛峰、瓜片、黄芽、猴魁、龙井、碧螺春等名优茶以及大宗炒青绿茶等。每个样品分两份,各约35g,一份不经处理,一份用JFSD-100型粉碎机磨碎,过40目筛,所有样品密封4℃冷藏备用;茶汤制备称取3g粉碎样(3份)置于500mL锥形瓶中,加入煮沸蒸馏水450mL,沸水浴中浸提45min,趁热抽滤,残渣用少量蒸馏水洗3次,将滤液移入500mL容量瓶中,冷却后用蒸馏水定容,摇匀备用。
MPA傅里叶变换近红外光谱仪 德国布鲁克光学仪器公司。
采用MPA傅里叶变换近红外光谱仪,扫描谱区范围800~2500nm(12500~4000cm-1),工作温度为25℃,分辨率8cm-1,PbS检测器。采用97mm金属样品杯配套自动旋转样品台采集完整样与粉碎样的漫反射光谱,扫描次数32次,完成一次光谱采集约32s;通过液体专用样品池采集茶汤的透射光谱,扫描次数16次,完成一次光谱采集约16s。每个样品均装样三次,取平均光谱作为分析光谱。
水分采用120℃烘箱法,依据GB/T 8304-2002测定;水浸出物采用恒重法,依据GB/T 8305-2002测定;茶多酚采用福林酚法,依据GB/T 8313-2008测定;游离氨基酸采用茚三酮比色法,依据GB/T 8314-2002测定;咖啡碱采用紫外分光光度法,依据GB/T 8313-2002测定;粗纤维利用CXC-06型纤维素分析仪器,依据GB/T 8310-2002测定;全氮量采用GB/T 5009.5-1985方法测定。每个样品平行测定3次,取平均值为样品的化学值。
为消除高频随机噪声、基线漂移和样品厚度不均等影响,对采集的光谱数据进行平滑、导数处理、多元散射校正和归一化等[23-24]必要的预处理。采用偏最小二乘法(PLS)作为建立模型的化学计量学方法,通过OPUS-QUANT2定量分析软件完成光谱数据的处理、模型的建立和验证。对建模样品采用留一法进行内部交叉验证建立模型,用剩余样品对模型进行外部验证,以交叉验证均方差(RMSECV)、预测均方差(RMSEP)、决定系数(R2)和相对分析误差(RPD)作为评价模型预测效果的指标。R2越大,RMSECV、RMSEP越小,建立的模型越可靠。当3%≤RPD<10%时,表明模型效果良好,预测精度高,可用于实际检验;如果2.5%<RPD<3%,模型预测效果一般,模型有待进一步优化;如果RPD≤2.5%,则说明难以用于定量分析[25-26]。
绿茶中有机物的含氢基团(C-H,O-H,N-H)振动的倍频与合频的吸收构成了近红外光谱的核心部分。图1中a、b、c分别是110个绿茶完整样、粉碎样和茶汤样的平均光谱图。从图1可以看出,完整样与粉碎样的光谱曲线大致呈现3个波段形状。第一个波段(12500~7000cm-1)是这些基团振动的高级倍频区,谱带较弱;第二个波段(7000~5200cm-1)和第三个波段(5200~4000cm-1)是这些基团振动的一级倍频和合频谱区,信息较强[27]。水分子中的O-H在近红外谱区有两个特征谱带:1940nm(5155cm-1)的组合频和1440nm(6944cm-1)伸缩振动的一级倍频。这两个特征吸收会干扰非水分的测定。图1中可以看出,茶汤中的水分对近红外光谱的吸收峰影响较大,为防止水分的干扰,在筛选波长范围时应尽量避开水分特征吸收区[28]。
图1 绿茶完整样(a)、粉碎样(b)的近红外漫反射光谱和茶汤(c)的透射光谱图Fig.1 Near infrared diffuse reflectance spectra of integrated(a)and crushed(b)samples and transmission spectra of green tea soup(c)
建立模型时会出现样品组分测定值或光谱数据出现较大误差的情况,该类异常样品的存在会影响模型预测的准确性,需要从样品集中剔除。剔除异常样品的方法是采用PLS法和留一法通过内部交叉验证对全部样品光谱进行异常值检验,马氏距离大于3.0的样品被视为异常样品[29],均被剔除。将非异常样品按各成分的含量大小排列后按隔二选一法划分为校正集和检验集,样品分集结果以及含量分布见表1。
对完整样、粉碎和茶汤三类样品形态的近红外光谱,使用校正集样品内部交叉验证建立了各成分的PLS模型,结果见表2。从表2可以看出,不同样品形态的近红外光谱建立的各成分模型的结果有明显差异,由粉碎样建立的7种成分的模型,R2、RPD值均比其完整样的模型高,RMSECV小;用茶汤光谱建立的水浸出物、茶多酚、咖啡碱和游离氨基酸的模型,RMSECV较大,R2、RPD值较小,其中水浸出物和茶多酚茶汤模型的R2为0.8473、0.7679,咖啡碱和游离氨基酸茶汤模型R2不超过0.5,RPD值小于2.5%,预测效果远不如固体光谱建立的模型。R2越接近1,RMSECV越小,表明模型对样品的预测结果越准确,模型的可靠性越高。因此由表2可知粉碎样光谱建立的模型效果最好。
表1 样品分集结果以及各成分的含量分布Table 1 The diversity results of samples and the contents distribution of measured values for each component
表2 不同样品形态下建立的PLS模型交叉验证的统计数据Table 2 Statistical values of cross-validation models by PLS with different sample shape
表3 最优模型的处理方法Table 3 Treatments of optimal models
使用粉碎样光谱,利用软件中的自动优化功能选择最佳的光谱预处理方法、谱区范围和主成分数,得到所有成分模型的最佳处理方法和预测结果见表3、表4。从表3可以看出,光谱经一阶导数处理,当主成分为8,选择波数范围在12493.1~4597.7cm-1时,建立的水分模型最优;光谱经矢量归一化处理,分别选择主成分数为11和10时,水浸出物和全氮量模型建立的效果最好,对应的最佳谱区分别是12493.1~6098.1、5450.1~4246.7和6101.9~4246.7cm-1;粗纤维模型在7502~5446.2、4424.1~4246.7cm-1,光谱经一阶导数+MSC处理,主成分为10时效果最好;光谱经过一阶导数+MSC和多元散射校正处理,主成分数都为9时,分别选择谱区在6101.9~5446.2和7502~5446.2、4424.1~4246.7cm-1时,建立的茶多酚和咖啡碱模型最优;光谱经一阶导数+矢量归一化,在7502~6800.1、5450.1~4246.7cm-1,主成分数为13时,游离氨基酸模型效果最好。
表4 近红外模型内部交叉验证与外部验证的结果Table 4 The results of models in cross validation and external validation
由表4可知,水分、全氮量、粗纤维、水浸出物、茶多酚、咖啡碱、游离氨基酸内部交叉验证的R2分别为0.9862、0.9183、0.8707、0.9367、0.9334、0.9609、0.9201,RMSECV分别为0.182、0.098、0.394、0.452、0.366、0.078、0.193。除粗纤维外,其他6种成分的模型的R2均在0.90以上,具有较好的相关性,RPD均大于3%,RMSECV均小于0.5,说明模型的预测精度较高。其中水分和咖啡碱模型效果最好,全氮量和粗纤维模型预测效果稍差,游离氨基酸的主成分数偏大,建立的模型较复杂,有待进一步优化。
对于建立的定量模型,需要用外部验证的方法进一步检验其准确性和实用性。对检验集样品的水分、全氮量、粗纤维、水浸出物、茶多酚、咖啡碱以及游离氨基酸含量进行预测,近红外模型预测值与化学测定值之间的相关关系见图2,验证结果见表4。从表4可以看出,粗纤维模型预测决定系数R2为0.8598,RPD为2.68%,只能用于粗略检测,模型有待进一步优化。其余成分的R2均在0.91以上,表明该6种成分的模型预测值与化学值有很好的相关性;RPD值均在3.5%以上,说明模型稳定性和预测能力好,可以用于实际检测。其中水分和咖啡碱的预测决定系数R2大于0.95,RPD超过5%,模型的预测性能最好。
通过对绿茶完整样、粉碎样和茶汤的近红外光谱进行PLS建模,粉碎样建立的模型除粗纤维RPD为2.68%外,其余成分的RPD均大于3%,预测稳定性和精度较高,可以实现绿茶中7种成分含量的快速测定。使用透射方式获得的茶汤光谱建立模型效果较差,不能用于实际检测,可能是由于浸提出来的茶汤中水分占大部分,水分的强吸收信号会使光谱出现吸收峰饱和,而且掩盖了含量小的有机物的吸收信号,引起光谱测量误差,试验中虽然优化了建模的谱区以避开水峰的干扰,但模型预测结果仍不理想,在以后的研究中可以尝试选择合适光谱测量条件如改变光程来提高灵敏度和减少水分的饱和干扰。另外,样品的数量和种类有限,难以覆盖绿茶所有含量范围,有待进一步扩大样品范围,以提高模型的适用性。当分析样品和所采用的仪器改变时,须进一步优化模型并进行验证和定期校正。
图2 绿茶7种成分的近红外模型的预测值与化学真值的相关性Fig.2 Correlation between predicted values of NIR models and true values of seven components in green tea
[1]顾谦.茶叶化学[M].合肥:中国科学技术大学出版社,2002:48-50,142.
[2]刘军海,李志洲.茶叶中有效成分应用及其提取工艺研究进展[J].食品研究与开发,2007,28(3):173-177.
[3]刘冰,杨季冬.近红外光谱法快速鉴别涪陵榨菜品牌的研究[J].食品工业科技,2011,32(8):397-403.
[4]王丽,韩晓祥,徐欢,等.近红外光谱法测定金华火腿生产过程中的品质参数[J].中国食品学报,2011,11(7):181-184.
[5]宋尚新,梁灵.近红外光谱技术鉴别方便面品牌的研究[J].现代食品科技,2010,26(10):1153-1156.
[6]孙晓荣,刘翠玲,吴静珠,等.基于近红外光谱的淀粉含水量快速检测研究[J].食品工业科技,2011,32(10):441-442.
[7]吴静珠,李慧,刘翠玲,等.基于近红外的蔬菜农残快速定性检测技术研究[J].食品工业科技,2010,31(10):377-379.
[8]陈坤杰,龚红菊,李毅念.基于近红外光谱的大米加工精度等级快速判定[J].中国粮油学报,2011,26(3):105-109.
[9]孙春晓.近红外光谱法应用于肝素钠质量控制的技术研究[D].济南:山东大学,2010.
[10]金鸣,胡敏,池文杰,等.近红外漫反射光谱法快速检测维C银翘片中的对乙酰氨基酚[J].中国药师,2011,14(8):1145-1147.
[11]孔翠萍,褚小立,杜泽学,等.近红外光谱方法预测生物柴油主要成分[J].分析化学,2010,38(6):805-810.
[12]张正竹,廖步岩,阎守和,等.近红外光谱(NIRS)技术在茶叶品质保真中的应用前景[J].食品工业科技,2009,30(9):349-352.
[13]周小芬,叶阳,陈芃,等.近红外光谱技术在茶叶品质评价中的研究与应用[J].食品工业科技,2012,33(5):413-417.
[14]王胜鹏,宛晓春,林茂先,等.基于水分、全氮量和粗纤维含量的茶鲜叶原料质量近红外评价方法[J].茶叶科学,2011,31(1):66-71.
[15]李晓丽,程术希,何勇.基于漫反射光谱的初制绿茶含水率无损检测方法[J].农业工程学报,2010,26(5):195-200.
[16]吴瑞梅,赵杰文,陈全胜,等.近红外光谱技术结合特征变量筛选快速检测绿茶滋味品质[J].光谱学与光谱分析,2011,31(7):1782-1785.
[17]牛智有,林新.茶叶定性和定量近红外光谱分析方法研究[J].光谱学与光谱分析,2009,29(9):2417-2420.
[18]赵红波,谭红,徐玮,等.近红外光谱法对茶叶中的咖啡碱含量的快速测定[J].中国酿造,2011(8):169-171.
[19]Luypaert J,Zhang M H,Massart D L.Feasibility study for the use of near infrared spectroscopy in the qualitative and quantitative analysis of green tea,camellia sinensis[J].Analytica Chimica Acta,2003,478(2):303-312.
[20]Shou-he Yan.Review:Evaluation of the composition and sensory properties of tea using near infrared spectroscopy and principal component analysis[J].Journal of Near Infrared Spectroscopy,2005,13(6):313-325.
[21]于海燕,应义斌,刘燕德.农产品品质近红外光谱分析结果影响因素研究综述[J].农业工程学报,2005,21(11):160-163.
[22]祝诗平,王刚,杨飞,等.粉末样品颗粒大小对花椒挥发油近红外光谱定量预测的影响研究[J].光谱学与光谱分析,2008,28(4):775-779.
[23]褚小立,袁洪福,陆婉珍.近红外分析中光谱预处理及波长选择方法进展与应用[J].化学进展,2004,16(4):528-542.
[24]严衍禄.近红外光谱分析基础与应用[M].北京:中国轻工业出版社,2005:8-9.
[25]牛智有,林新.茶叶定性和定量近红外光谱分析方法研究[J].光谱学与光谱分析,2009,29(9):2417-2420.
[26]朱大洲,孟超英,屠振华,等.不同类型近红外模型在苹果汁检测中的应用[J].农业工程学报,2009,25(S2):325-329.
[27]李军会,秦西云,张文娟,等.样品年份、化学值分布参数对近红外检测结果的影响[J].光谱学与光谱分析,2007,27(9):1754-1756.
[28]姜礼义,刘福莉,陈华才,尹军锋.绿茶汤中茶多酚近红外定量分析的光程选择[J].中国计量学院学报,2009,20(2):135-138.
[29]林新,牛智有.绿茶茶多酚近红外光谱定量分析模型优化研究[J].食品科学,2009,30(10):144-148.
Influence of sample shape on the quantitative prediction of the quality components in green tea by near infrared spectroscopy(NIRS)
XU Rong-rong,REN Guang-xin,WANG Sheng-peng,WANG Yu-xia,ZHANG Zheng-zhu*
(Key Laboratory of Tea Biochemistryamp;Biotechnology,Ministry of Education,Anhui Agricultural University,Hefei 230036,China)
The quantitative prediction models of seven main components including moisture content,total nitrogen,total crude fiber,water extract,tea polyphenols(TPP),caffeine and free amino acids(AA)in 110 green tea samples were established through partial least squares(PLS)by NIRS respectively.The effect of NIR spectra of integrated and crushed samples on the models of seven components as well as the green tea soup on the models of water extract,tea polyphenols(TPP),caffeine and free amino acids(AA)were investigated. The optimal models of seven components were developed by crushed samples.The root mean square errors of cross-validation(RMSECV)and the root mean square errors of prediction(RMSEP)were less than 0.5.The determination coefficients(R2)of validation exceeded 0.9,except for crude fiber model with R2of 0.8598.The effect of models established by tea soup was not ideal,among which the ratios of prediction to deviation(RPD)of caffeine and AA were less than 2.5%with R2not exceeding 0.5.The results showed that the models built by crushed green tea samples were more reliable than by integrated samples or tea soup,NIRS technology could be employed for quantitative determination of seven kinds of components in green tea rapidly.
green tea;near infrared spectroscopy(NIRS);sample shape;quantitative model;rapid determination
TS272.5+1
A
1002-0306(2012)14-0072-05
2011-11-29 *通讯联系人
徐荣荣(1987-),女,硕士研究生,主要从事茶叶生物化学方面的研究。
农业部948项目(2011-Z64);农业科技成果转化资金项目(2010GB2C300204)。