郭 松,常庆瑞,崔小涛,张佑铭,陈 倩,蒋丹垚,落莉莉
(西北农林科技大学资源环境学院,陕西 杨凌 712100)
叶绿素含量为植被生长和营养胁迫等研究常用指示量,可反映植被初级生产力和生长状态[1-2]。分光光度法、荧光分析法等传统叶绿素含量检测方法不仅流程复杂、误差大、耗时长,且对植被本身损害较大,不利于大样本下叶绿素含量监测[3]。近年来,高光谱遥感技术以其数据蕴含较高维度信息的特点被应用到植被叶绿素含量估测研究中,为简便迅速、大范围测量植被叶绿素含量提供技术支持[4]。
目前,国内外在高光谱估算植被叶绿素方面开展大量研究,Bannari等使用Hyperion EO-1传感器获取地面和实验室高光谱数据,构建多个光谱叶绿素植被指数反演冠层尺度上小麦叶绿素a含量,模型决定系数达0.69[5];Ali等发现基于高光谱反射率提取的红边位置(REP)可准确估计植被叶绿素含量,通过红边位置建立的模型决定系数为0.90~0.93[6];Yamashita等利用机器学习算法和绿茶叶绿素高光谱敏感波段建立可较好的叶绿素反演模型,预测偏差1.4~2.0[7];陈澜等创建多个关中地区猕猴桃PCA-RF模型,决定系数最高达0.98[8];袁小康等对比不同灌溉条件下夏玉米高光谱特征变化,发现植被指数与叶绿素含量相关性较高,相关系数最小绝对值为0.812[9];陈春玲等为准确检测玉米叶片叶绿素含量,采用蚁群算法优化BP神经网络模型,结果表明,优化后神经网络模型建模和验证决定系数较未优化时分别提高0.073与0.078[10]。综上,利用高光谱遥感技术检测作物叶绿素含量的研究较成熟,但光谱变换可对光谱空间坐标作数学转换,突出原有光谱特点,同时消除光谱噪声[11],大部分研究依赖于作物原始光谱构建模型,较少探索光谱变换后的建模效果;连续投影算法为一种以矢量空间共线性最小为原则筛选变量的方法[12],目前大多基于主成分分析或偏最小二乘实现高光谱数据降维,而使用连续投影算法的报道较少。
本研究以陕西省关中地区玉米为研究对象,通过玉米原始光谱及其变换光谱,构建基于特征波段和植被指数的一元回归模型、基于连续投影算法的多元线性回归模型和支持向量回归模型,探究玉米叶绿素含量最优估算模型,旨在为实时获取关中地区玉米生长信息提供技术和理论支持。
研究区位于陕西省咸阳市乾县齐南村(108°07′04″E,34°38′32″N)(见图1),地处关中平原与渭北旱塬过渡地带,地貌类型为黄土台塬,平均海拔1 000 m;属暖温带半干旱大陆性季风气候,年均气温10.8℃,年均降水量560~600 mm,多集中在6~8月;试验区内土壤类型为红油土,持水保肥,适宜耕作;作物一年一熟,主要为小麦和玉米。试验于2020年6月1日开展,供试作物为“陕单2001”玉米,共设30个小区和1个大田(空白对照),小区面积72 m2(9 m×8 m),大田面积286 m2(11 m×26 m),施用氮、磷、钾3种肥料,每种肥料分5个施肥水平,共15个处理,每个处理重复两次,其中氮肥处理纯N施用量分别为:0、60、120、180、240 kg·hm-2;磷肥处理P2O5施用量分别为0、40、80、120、150 kg·hm-2;钾肥处理K2O施用量分别为0、30、60、90、120 kg·hm-2。在播种前一次性施入所有肥料,不追肥,与当地田间管理一致。试验样品采集于玉米抽雄期,每个小区与大田设两个采样点,每个采样点采集3片生长状态良好的玉米冠层叶片,叶片装入塑封袋并排尽空气,迅速保置于冰袋恒温箱,当天在室内测定叶片叶绿素含量与高光谱信息。
图1 研究区玉米试验田位置Fig.1 Location of maize test field in the study area
1.2.1 叶片SPAD值测定
玉米叶片叶绿素含量测定使用SPAD-502(柯尼卡美可达公司,日本)手持式叶绿素仪测定,用SPAD值表示[13]。测量时用纸巾轻轻擦净叶片表面灰尘并按顺序放置,在每片叶子尖、中、基3个部位分别测定4个SPAD值,测量时避开叶脉,每个样点3片叶子共获取36个SPAD值,取其平均值作为该样点最终SPAD值。
1.2.2 叶片光谱反射率测定
采用SVC HR-1024i(Spectrum Vista公司,美国)便携式地物光谱仪测定叶片光谱反射率。该仪器使用内置钨灯作为光源,光谱范围为350~2 500 nm,光谱分辨率在350~1 000、1 000~1 850、1 850~2 500 nm分别为3.5、9.5及6.5 nm。为确保数据科学可靠,自测量开始到结束,每0.5 h作一次白板校正。每片叶子在叶尖、叶中和叶基3个部位(与SPAD值测定位置相对应)分别测定两条光谱曲线,每个样点三3片叶子共获取18条光谱曲线。
对抽雄期玉米各样点SPAD值排序并按照3:1比例分层抽样,得到建模样本47个,预测样本15个。健康植被光谱响应波段主要集中在可见光-近红外[14],因此,将叶片光谱曲线重采样至400~1 000 nm,光谱间隔1 nm;每个样点获取18条玉米叶片光谱曲线,取平均作为该样点代表光谱曲线,通过Savitzky-Golay二阶平滑以减小光谱获取过程中产生的随机噪声;最后对代表光谱开展4种变换,分别为普通一阶导数变换[15]、间隙一阶导数变换[16]、连续统去除变换[17]和开平方根变换[18]。
选取4种物理意义较为明确的植被指数(见表1)及各类型光谱特征波段(与SPAD值相关性最高波段)作为单因素模型建模参数,单因素模型包括指数、对数和幂函数回归模型;通过连续投影算法(Successive projections algorithm,SPA)获取各类型光谱多因素模型建模参数,分别建立基于SPA的多元线性回归(Multiple linear regression,MLR)模型和支持向量回归(Support vector regression,SVR)模型。比较各模型的反演精度,筛选出最佳反演模型。模型建立在MATLAB 2016a中实现。
表1 植被指数计算方式Table 1 Calculation method of vegetation index
采用决定系数(R2)、均方根误差(RMSE)及平均相对误差(MRE)3个指标评价模型精度,决定系数越接近1,均方根误差和相对误差越小,评价模型质量越优。RMSE与MRE使用公式如下。
选取样本中SPAD最小值、最大值及中位数,分析不同SPAD值下玉米光谱变化特征,如图2所示。
图2 不同SPAD值玉米高光谱特征Fig.2 Hyperspectrum characteristics of maize with different SPAD values
不同SPAD值含量样本光谱曲线变化趋势一致,玉米叶绿素吸收蓝光与红光,反射绿光的特性,导致其在可见光波段400~520 nm及600~750 nm处分别形成两个吸收谷,其最低反射率分别为0.09和0.07,在520~600 nm形成一个弱反射峰,最高反射率为0.22;在680~780 nm处由叶绿素红光吸收过渡到叶片细胞结构对近红外的强烈散射、反射,产生“红边”;进而在780~1 000 nm处形成近红外高反射平台,该平台各波段反射率均在0.45以上。随叶绿素含量增加,叶片对光的利用效率增加,在400~680 nm处反射率随SPAD值上升而下降,“红边”向长波方向移动;同时叶绿素增加标志叶片成熟度越高、内部细胞结构越稳定,因此高反射平台会随SPAD值增加而上升。
2.2.1 光谱反射率与SPAD值相关性
各类型光谱反射率与SPAD值相关性如图3所示。由此可知,原始光谱与开平方根光谱相关性曲线变化趋势一致,二者通过0.01相关性检验的敏感波段数量分别为298、303个,均集中分布在451~745 nm,相应特征波段位于709、708 nm,相关系数分别为-0.852和-0.853;普通一阶导数与间隙一阶导数相关性曲线走势也同样类似,二者敏感波段数量分别为335和358个,均集中在477~550、552~670、670~713及717~861 nm,特征波段各自位于756和764 nm,二者相关系数分别为0.906与0.907;450~758、765~810、842~896 nm为连续统去除光谱的敏感波段区域,其敏感波段数量达400个,特征波段在746 nm处,相关系数为-0.893。在与SPAD值相关性方面,各变换光谱敏感波段数量多于原始光谱,且不同变换光谱特征波段相关系数绝对值均大于原始光谱,说明光谱变换可有效消除噪声,提高数据反演SPAD值潜力。
图3 不同类型光谱反射率与SPAD值相关性Fig.3 Correlation between different types of spectrum reflectance and SPAD values
2.2.2植被指数与SPAD值相关性
根据表1构建不同类型光谱植被指数,分别计算其与SPAD值相关性(见表2),由此可知,同一植被指数在不同类型光谱中反演SPAD值潜力不同,其中mNDVI和RVI最稳定,相关系数变化范围 分 别为0.777~0.883、0.863~0.874;而NDVI与MCARI在普通一阶导数及间隙一阶导数变化下相关性较差,相关系数绝对值最低分别为0.440和0.385。根据相关性高低确定PS、SRS和CRS 3种光谱类型最佳植被指数为NDVI,OFDS和GFDS两种光谱类型最佳植被指数为mNDVI。
表2 不同类型光谱植被指数与SPAD值相关性Table 2 Correlation of vegetation index of different spectrum types
选取不同类型光谱特征波段与最优植被指数分别构建单因素模型,建模结果见表3。
由表3可知,原始光谱与开平方根光谱两种模型建模精度相当,但为二者基于特征波段的验证精度不佳;连续统去除光谱、普通一阶导数光谱和间隙一阶导数光谱特征波段模型较相应植被指数模型,建模R2分别提高0.02、0.02、0.04,验证R2则分别提高0.05、0.09与0.06,同时三者基于特征波段模型在建模精度与验证精度方面,RMSE与MRE均处于较低水平。综合看,基于一阶导数特征波段模型为所有单因素模型中最优,其建模R2、RMSE和MRE分别为0.81、2.73和4.78%,验证R2、RMSE和MRE分别为0.83、2.40和4.36%,在应用单因素模型反演玉米叶片SPAD值时,应优先考虑该模型;其次为间隙一阶导数特征波段模型。
表3 不同光谱类型单因素模型Table 3 Single factor models of different spectrum types
2.4.1 基于SPA算法的多元建模参数提取
通过相关性检验(0.01水平)的各类型光谱敏感波段作为SPA算法输入量,SPAD值作为响应量,通过不断调试,以RMSE最小为原则[23],进一步提取不同类型光谱多因素模型建模参数。结果见表4,SPA算法可大幅降低光谱维度,筛选出各类型光谱建模参数5~9个,且降维比均在97%以上;其中间隙一阶导数光谱建模参数最多(9个),连续统去除光谱建模参数最少(5个)。
2.4.2 基于SPA-MLR的多因素模型建立及精度比较
利用表4中列出各类型光谱建模参数,建立多元线性回归方程(见表5)。与单因素模型相比,各类型光谱建模R2与验证R2分别提高0.03~0.09、0.01~0.16,同时具有较低RMSE与MRE,可见多元线性回归模型精度整体上优于单因素模型;同时普通一阶导数光谱与间隙一阶导数光谱MLR模型建模精度与验证精度均优于原始光谱,其中基于一阶导数光谱的MLR模型为最优模型。
表4 不同类型光谱多元建模参数Table 4 Multivariate modeling parameters of different types of spectra
表5 不同光谱类型下多元线性回归模型Table 5 Multiple linear regression models under different spectrum types
2.4.3 基于SPA-SVR的多因素模型建立及精度比较
支持向量回归(SVR)为一种使用超平面定义高维空间边界的非线性回归方法,该方法仅依靠支持向量来决定超平面,无需全部数据,适宜处理非线性拟合问题[24]。因此,本文基于表4中各多元建模参数,利用SVR反演玉米叶片SPAD值,为避免自变量数值差异过大影响建模精度,建模前将所有自变量作归一化处理。支持向量机类型选择epsilon-SVR,使用RBF核函数,gamma参数设置为特征数倒数,ε采用默认值0.05,通过网格法确定惩罚系数C值,由于C值偏大会造成过拟合,偏小会造成欠拟合,故网格法寻优区间为[10-2,102]。
建模结果如表6所示,除开平方根光谱外,其余各模型建模精度均较高,相应建模与验证R2在0.85、0.72以上,均方根误差不超过2.57、3.25,平均相对误差则在4.33%及6.39%以下。综合建模及验证精度看,基于普通一阶导数光谱SVR模型具有极高决定系数,建模和验证的决定系数均超过0.90,同时误差RMSE、MRE均处于较低水平,为支持向量回归模型中最优模型。
表6 不同光谱类型下支持向量回归模型Table 6 Support vector regression models under different spectrum types
比较各类型光谱不同建模方法,多元线性回归模型在建模效果与验证效果方面均优于单因素模型,支持向量回归模型建模精度优于单因素模型。但在连续统去除光谱、开平方根光谱及间隙一阶导数光谱中,SVR模型建模精度较高,验证精度低于单因素模型,说明支持向量回归模型易出现过拟合现象。
分别选择3种建模方法中最优模型,将相应预测值与实测值线性拟合(见图4),其中虚线为1:1线,实线为拟合线,当拟合方程斜率越接近1,截距越接近0,说明模型质量越好。由此可见,在所有模型中,普通一阶导数光谱支持向量回归模型为最优模型,其建模R2与验证R2高达0.92和0.90,相 应 建 模RMSE与MRE则 低 至1.85和3.06%,验证RMSE与MRE为1.87和3.61%。
图4 不同类型光谱最优模型实测值与预测值分布Fig.4 Distribution of measured and predicted values of different types of optimal spectrum models
不同形式光谱变换在降低作物反射光谱背景噪声同时可增强其固有波谱特征,提高光谱反演作物生理生化参数潜力[25]。本文所使用4种光谱变换均可提高SPAD与特征波段相关性,结果与林少喆等[26]研究结果一致。但光谱变换对选取的传统植被指数敏感性兼具增强与减弱,原因在于传统植被指数多为基于作物原始光谱构建,变换后光谱曲线特征与原始光谱相比已发生本质性变换,故其植被指数不完全优于原始光谱。因此对光谱变换后传统植被指数公式改进为下一步研究重点。连续投影算法筛选出各类型光谱多元建模参数介于5~9个,与前人筛选波段数量不一致[11,23],可能是高光谱反演对象不一样所致,未来研究可针对不同对象开展连续投影算法降维对比。
本文使用不同建模方法构建玉米SPAD值高光谱估算模型,各方法下最优模型建模精度由单因素向多因素、传统回归建模向机器学习模型递增,各类变换光谱中,普通一阶导数光谱建模效果最优,与Wang等研究结果一致[27]。单因素一元模型蕴含信息少、对SPAD值响应不全面,所以模型精度与多元模型相比较低;一阶导数光谱放大原始光谱的“红边”,建模效果最优。SVR提供众多核函数用以解决各种回归问题,且模型复杂度仅依赖于支持向量个数,而非数据本身。但该方法对参数及核函数选择比较敏感,易出现过拟合、收敛慢问题,所以在前人研究基础上[28],本研究结合连续投影算法与网格法寻优构建的SVR模型为最佳模型。
抽雄期为玉米生长发育最快时期,该时期玉米长势直接决定后期籽粒是否饱满。利用本研究建立的模型与田间获取的实测玉米叶片高光谱数据可反演玉米SPAD值,SPAD值高样点,说明玉米长势较好,无需追肥;SPAD值低样点,说明玉米长势较差,需追肥。但受气候、玉米品种及仪器等不同条件影响,本研究仅可反映关中地区抽雄期玉米情况,其他生育期估算反演模型有待进一步研究;同时,未来玉米SPAD值高光谱估测研究应逐渐向卫星遥感方向靠拢,通过遥感影像数据将地面SPAD值由点扩展到面,从大区域尺度上监测玉米长势状况。
本文以关中地区抽雄期玉米为研究对象,通过不同类型光谱构建基于特征波段与植被指数的单因素模型、基于连续投影的多元线性回归模型和支持向量回归模型,得出结论如下:
a.不同SPAD值玉米原始反射光谱曲线特征一致,随SPAD值增加,可见光波段反射率降低,近红外反射率上升,同时“红边”向长波方向偏移。
b.光谱变换不仅可增强特征波段与SPAD值相关性,还可增加敏感波段数量,提升建模质量;间隙一阶导数光谱特征波段相关系数绝对值最大,连续统去除光谱敏感波段数量最多,二者相较原始光谱分别增加0.054和102个;普通一阶导数光谱建模效果最佳,各类型模型建模与验证精度皆优于原始光谱。
c.连续投影算法显著降低数据维度,各类型光谱降维比均在97%以上。所有模型中,普通一阶导数光谱下SPA与SVR结合的模型决定系数最高,拟合误差最小,为最优玉米叶片SPAD值估算模型,其建模R2与验证R2分别达0.92、0.90。