段丹丹 刘仲华 赵春江 赵 钰 王 凡
(1.湖南农业大学园艺学院, 长沙 410128; 2.国家农业信息化工程技术研究中心, 北京 100097; 3.北京农业智能装备技术研究中心, 北京 100097)
茶鲜叶中游离氨基酸含量直接影响成品茶茶汤的鲜爽风味[1]。因此,及时、快速、大面积地检测茶鲜叶中氨基酸含量对于把握茶青品质、提高成品茶市场竞争力具有重要意义。传统的审评测定方法依靠人为主观判断,耗时、费力,缺乏可量化的统一标准。
目前众多品质无损检测技术可快速诊断茶叶品质。光谱技术在检测茶多酚、氨基酸及茶叶氮磷钾含量等方面均取得了较多的研究成果[2-5]。前人研究主要进行单个生育期分析,针对茶树多生育时期进行连续光谱检测研究的报道较少。由于不同季节气候条件的差异,春茶、夏茶和秋茶生长速率及生理代谢均具有明显的差异,导致茶叶外形和内含物质具有明显的差异。在小麦、水稻等粮食作物的研究中发现,反演模型在单生育时期具有较高的精度但无法推广至全生育时期的作物农学参数检测[6-7]。光谱变换在放大和提取光谱特征以及消除背景噪声方面具有较好的效果[8-14]。为了分析变换后的光谱值与叶片氮素含量的相关关系,通过对玉米叶片光谱数据进行6种变换,在波长550 nm和680 nm处,光谱数据的归一化对数处理对于提高回归模型对氮素含量的反演精度有显著效果[15]。通过一阶导数与多元散射校正和平滑处理结合对原始光谱进行处理,提高了近红外光谱预测水稻叶片氮含量的模型准确性和预测能力[16]。而微分光谱能消除水稻土壤和水面背景的影响,尤其影响宽波段光谱指数对作物农学参数的反演精度[17]。为了进一步提高估算模型的精度,科研人员利用前人研究成果,构建了优化的新型植被指数[18-21]。光谱变换对凸显特征光谱及剔除背景、噪声影响具有重要作用,而现有植被指数均是基于原始反射率进行构建,将变换优化植被指数用于多生育时期茶鲜叶游离氨基酸含量估算尚未见报道。
本文以茶鲜叶游离氨基酸含量为研究对象,对光谱数据进行5种光谱变换(倒数1/R、对数lgR、一阶微分R′、倒数的一阶微分(1/R)′、对数的一阶微分(lgR)′),并对常用的10种光谱指数波段进行替换,进而分析优化植被指数在茶鲜叶游离氨基酸含量检测中的作用。
本研究于2020年夏季、秋季以及2021年春季3个季节在广东省英德市茶叶生产基地进行。实验品种:英红九号、金萱、鸿雁十二号、黄旦、金牡丹、英州一号、梅占、云南大叶、黄玫瑰和软枝乌龙共计10个品种。夏茶采摘期在2020年5月11—15日、2020年6月1—5日。秋茶从2020年8月7日开始进行观测,选取2020年9月14—18日、2020年10月5—9日。春茶从2021年2月3日开始进行观测,选取2021年3月29日—4月1日、2021年4月12—16日。每组样本设置5个重复。
采用美国ASD公司的FieldSpec4型光谱仪进行光谱检测(波段350~2 500 nm,在350~1 000 nm光谱区的分辨率为1.40 nm,在1 000~2 500 nm间分辨率为2 nm,采样间隔为1 nm)。茶鲜叶叶片测量前先通过标准白板进行光谱仪校正。并利用叶片夹持器(自带光源),通过手柄中的光源部分直接夹紧茶叶叶片所测部位(选择叶片中部较宽部位)。本实验的高光谱测定方法参考前人的实验方法[22]并做适当改进,分别采集每个品种20片标准叶片光谱数据。
在光谱数据采集位置对应采集和测量单位面积茶叶的鲜叶质量及干叶质量,在茶园选取约10个点进行测量,每个样本点进行10次测量,获取茶树冠层光谱数据。3个生长季节的茶鲜叶通过高光谱检测后采用国标法检测游离氨基酸总量(GB/T 8314—2013)[23]。计算公式为
(1)
式中An——游离氨基酸干基质量分数,%
C——茶鲜叶茶氨酸或谷氨酸质量,mg
V1——试液总体积,mL
V2——测定所需试液体积,mL
m——试样用量,g
w——试样干物质质量分数,%
1.4.1光谱变换方法
为消除背景噪声及水分的影响,删除350~400 nm以及2 400~2 500 nm波段后,对茶鲜叶检测得到的叶片光谱反射率分别进行光谱变换:原始光谱TR、倒数T1/R、对数TlgR、一阶微分TR′、倒数的一阶微分T(1/R)′、对数的一阶微分T(lgR)′,结果如图1所示。同一光谱变换中,不同季节的光谱反射率具有明显差异。
图1 不同季节变换光谱反射率Fig.1 Spectral reflectances of different spectral transformations
1.4.2光谱指数
基于10种常用的与氨基酸相关的光谱指数(归一化差值植被指数(NDVI)[24]、土壤调节植被指数(SAVI)[25]、植物衰老反射指数(PSRI)[26]、绿度指数(GI)[27]、转换叶绿素吸收植被指数(TCARI)[28]、宽范围植被指数(WDRVI)[29]、改善角度植被指数2(MTVI2)[30]、转换型植被指数(TVI)[31]、红色边缘叶绿素植被指数(CIred edge)[32]、土壤调节植被指数(OSAVI)[33]),以及其涉及的12个敏感光谱波段(中心波长分别为500、550、560、670、678、680、700、710、720、750、800、890 nm),并利用光谱变换波段对应代替植被指数中的原始波段,每个植被指数包含6种形式(原始光谱TR-VI、倒数T1/R-VI、对数TlgR-VI、一阶微分TR′-VI、倒数的一阶微分T(1/R)′-VI、对数的一阶微分T(lgR)′-VI,其中VI表示植被指数)。
多元线性回归(Multiple linear regression,MLR)是包括两个或两个以上自变量,并对应一个因变量的回归模型,详细步骤见文献[34]。
选取决定系数R2和均方根误差(RMSE)验证模型的精度[35]。R2反映模型建立和验证的稳定性,R2越接近于1,说明模型的稳定性越好、拟合程度越高。RMSE用来检验模型的误差,RMSE越小模型估算能力越好。
本实验共计样本141份,其中春茶样本50个,夏茶样本55个,秋茶样本36个。将其随机分为106份作为建模集,35份作为验证集,建模集和验证集的氨基酸描述性统计分析如表1所示。3个季节10种茶树鲜叶的氨基酸含量(干基质量分数)在2%~6%之间,不同季节氨基酸含量存在较大差异。春茶氨基酸含量最大值和平均值均最高(干基质量分数5.64%和4.03%),秋茶氨基酸含量最大值和平均值均居中(干基质量分数4.43%和3.72%),夏茶氨基酸含量最大值和平均值均最低(干基质量分数4.02%和2.91%)。其中,建模集数据的范围可包含验证集数据,建模集和验证集数据划分可靠。
表1 氨基酸干基质量分数的描述性统计分析Tab.1 Descriptive statistical analysis of tea amino acids
为进一步探讨不同光谱变换对春茶、夏茶、秋茶反演的影响,对10个常用的植被指数对应波段进行替换,优化后的植被指数与茶叶氨基酸含量相关性结果如图2所示。春茶氨基酸含量与叶绿素相关的经典植被指数具有较高的相关性,与PSRI和CIred edge的相关系数绝对值分别为0.50和0.67。秋茶和春茶具有相似的结果,秋茶氨基酸含量与PSRI和CIred edge的相关性较高,相关系数绝对值分别为0.61和0.40。夏茶氨基酸含量与植被指数相关性相对较差,与TVI相关性最高,相关系数绝对值为0.39。对于春茶、夏茶和秋茶,基于T1/R-VI和TlgR-VI与茶叶氨基酸含量的相关性多低于经典植被指数与氨基酸含量的相关性。相比经典植被指数,3种微分处理后波段替换的GI、MTVI2、TVI、SAVI和OSAVI与春茶氨基酸含量的相关性具有显著提高效果,3种微分处理后波段替换的PSRI、MTVI2、CIred edge和OSAVI与夏茶氨基酸含量的相关性显著提高,与秋茶氨基酸含量显著提高的有3种微分处理波段替换后的PSRI、TVI、CIred edge、SAVI和OSAVI。光谱处理后波段替换的优化植被指数中,与春茶氨基酸含量相关性最高的植被指数是TR′-CIred edge、SAVI和OSAVI,相关系数绝对值均为0.61;与夏茶氨基酸含量相关性最高的植被指数是T(1/R)′替换后的PSRI,相关系数绝对值均为0.27;与秋茶氨基酸含量相关性最高的植被指数是T(lgR)′-TCARI,相关系数绝对值均为0.61。
图2 茶鲜叶游离氨基酸含量与不同变换光谱指数的相关性分析Fig.2 Correlation of tea free mino acids with different spectral transformation indexes
通过5种光谱变换对10种植被指数进行优化,除TlgR-TCARI外,其他植被指数被光谱变换优化后与茶鲜叶游离氨基酸的相关性均高于经典植被指数与茶鲜叶游离氨基酸相关性,相关系数绝对值范围为0.10~0.30(表2)。除2种优化植被指数外(TlgR-TCARI、TlgR-TVI),其余8种优化植被指数与茶鲜叶游离氨基酸均达到极显著相关性。
表2 优化植被指数与游离氨基酸含量的相关性分析Tab.2 Correlation analysis between optimized vegetation index and free amino acids
基于不同光谱变换替换的优化植被指数构建的MLR氨基酸含量估算模型(表3)表明:对于春茶,TlgR-VI构建的MLR建模集模型精度最高,R2和RMSE分别为0.71和0.64%,TR′-VI构建的MLR验证模型精度最高,R2和RMSE分别为0.56和0.90%,其他光谱变换替换的植被指数所构建的MLR模型建模集和验证集均有较好的表现;夏茶,TlgR-VI构建的MLR建模集模型精度最高,R2和RMSE分别为0.50和0.37%,TR′-VI验证模型精度最高,R2和RMSE分别为0.41和0.37%,除T(1/R)′-VI(建模集R2和RMSE分别为0.10和0.45%,验证模型精度R2和RMSE分别为0.13和0.55%)外,其他光谱变换的植被指数所构建的MLR模型建模集和验证集均有较好的表现;秋茶,TR′-VI构建的MLR建模集精度较高和验证集模型精度最高(建模集R2和RMSE分别为0.66和0.28%,验证模型精度R2和RMSE分别为0.78和0.36%),其他光谱变换所构建的MLR模型建模集和验证集均有较好的表现;全采茶季,TlgR-VI构建的MLR建模集精度较高和验证集模型精度最高(建模集R2和RMSE分别为0.38和0.72%,验证模型精度R2和RMSE分别为0.20和0.84%),其他光谱变换所构建的MLR模型建模集和验证集表现均较差。
为了更直观地展现模型预测效果,制作了春、夏、秋茶3个季节的最优氨基酸含量预测模型1∶1拟合图,结果如图3所示。
本研究采集10个茶树品种春季、夏季、秋季3个连续生育期的茶鲜叶光谱和游离氨基酸含量数据,选取6种光谱预处理方法和10个常用的植被指数,通过光谱变换优化现有植被指数,进而对茶叶游离氨基酸含量进行光谱检测估算。
茶鲜叶建模集和验证集游离氨基酸含量的变化趋势从大到小均为春茶游离氨基酸含量(干基质量分数建模均值4.03%,验证均值3.98%)、秋茶游离氨基酸含量(干基质量分数建模均值3.72%,验证均值3.56%)、夏茶游离氨基酸含量(干基质量分数建模均值2.91%,验证均值2.93%)。这是由于春季物候条件适宜,茶树内多种氨基酸合成酶活性最高。夏季由于多项物候条件变化,气温较高,湿度较大,导致茶树内多种氨基酸合成酶活性降低。秋季,各项物候条件变为较适宜茶树生长,茶树内多种氨基酸合成酶活性再次升高。春茶氨基酸含量最高是由于春季是茶树新稍生长最为旺盛的阶段,而茶氨酸主要在茶树新稍中[1]。因而,茶叶游离氨基酸总量呈现出春季最高、秋季较高、夏季最低的情况。茶叶游离氨基酸因生育时期不同而产生明显差异,继而由于茶树冠层对光能的截获、折射和反射特性各不相同,造成基于冠层高光谱的茶叶游离氨基酸含量检测受生育期的影响较大。
现有植被指数主要以叶面积指数、覆盖度和氮素含量为目标进行构建[27-33],以氨基酸含量为目标的植被指数较少。本文选取的10种植被指数主要考虑与氨基酸次生代谢紧密相关的氮素反演植被指数,涉及波段主要包括500~890 nm的10个波段,与文献[36]对氮素的研究分析一致。为全面分析优化植被指数在茶叶氨基酸反演中的效应,本文对SAVI、OSAVI及TVI等不同计算形式也进行了分析。结果表明,SAVI、OSAVI和WDRVI这类相似的植被指数表达公式,在不同光谱变换后与茶叶氨基酸含量相关系数相近。本文基于光谱变换的反射率对优化植被指数的波段反射率进行替换分析。一方面现有植被指数均为两个或两个以上波段进行的数学组合,广泛应用于不同作物和目标的理化参数反演。另一方面,较少的波段是卫星产品及仪器开发降低成本的重要手段。除TCARI外,其他植被指数波段被光谱变换后的波段替换后与茶鲜叶氨基酸含量的相关性高于经典植被指数(表2),主要是由于受不同光谱变换方法的影响,且受该植被指数涉及的光谱波段影响。基于微分变换光谱所构建的优化植被指数在春茶、夏茶、秋茶的建模和验证中均得到了较好的精度,表明光谱变换后的优化植被指数在不同茶树品种样本间普适性更强,这与文献[17]研究结果相近。经过微分处理算法可以降低低频背景光谱对目标光谱的影响,同时微弱的特征光谱可以得到凸显[17]。基于对数变换的优化植被指数在不同生育时期及全生长季中均表现出较好的普适性,这可能与植被指数构建原理有关。经典的植被指数旨在放大红波和近红外波段的差异[25-29],而光谱对数变换能够进一步扩大光谱差异,有效突出光谱特征。在明确光谱差异性影响因子之后,选择适宜的光谱数据分析方法是提高光谱检测精度,构建普适性强、稳定性高的反演模型的基础与前提。
表3 氨基酸含量MLR预测模型Tab.3 MLR models of tea amino acids
图3 氨基酸含量最优模型1∶1拟合图Fig.3 Fitting diagram of optimal model of tea amino acids
(1)茶鲜叶建模集和验证集游离氨基酸含量的变化趋势从大到小均为春茶游离氨基酸含量(干基质量分数建模均值4.03%,验证均值3.98%)、秋茶游离氨基酸含量(干基质量分数建模均值3.72%,验证均值3.56%)、夏茶游离氨基酸含量(干基质量分数建模均值2.91%,验证均值2.93%)。
(2)除TlgR-TCARI外,其他植被指数被光谱变换优化后与茶鲜叶游离氨基酸含量的相关性均高于经典植被指数与茶鲜叶游离氨基酸含量相关性,相关系数绝对值范围为0.10~0.30。
(3)基于TlgR-VI构建的MLR模型在不同季节的建模集和验证集中均得到了较好的精度,且适用于多生育时期茶鲜叶氨基酸含量的估测。基于TlgR-VI构建的全生育时期MLR具有较高的精度(建模集R2和RMSE分别为0.38和0.72%,验证模型精度R2和RMSE分别为0.20和0.84%)。