陈秀青,杨 琦,韩景晔,林 琳,史良胜
武汉大学水资源与水电工程科学国家重点实验室,湖北 武汉 430072
叶片含水量是监测植物生理状态,评估干旱胁迫、火灾风险的重要指标,快速、准确地获取叶片含水量是进行作物干旱诊断以及灌溉决策的前提。高光谱遥感技术凭借快速、高效和无损的优势,已被广泛应用于作物生物理化参量的定量监测[1]。Thomas等[2]研究叶片含水量与光谱反射率之间的关系,结果表明1 450和1 930 nm波段的反射率与叶片相对含水量显著相关。Curran等[3]发现由水和其他分子中O—H键的伸缩和弯曲产生分子能级变化会引起目标光谱以970,1 200,1 450,1 940和2 500 nm为中心的吸收区域的相应变化。田庆久等[4]、王纪华等[5]研究发现,冬小麦叶片含水量与光谱反射率在1 450 nm附近的特征吸收峰深度和面积呈良好的线性正相关。根据众多学者研究可知叶片含水量敏感波段主要集中在近红外(NIR,700~1 300 nm)和短波红外区域(SWIR,1 300~2 500 nm),光谱水分吸收带主要在970,1 200,1 450,1 940和2 500 nm附近。同时,导数光谱可以消除背景噪声,解决重叠光谱现象。Danson等[6]发现,1 450 nm处的光谱反射率一阶导数曲线与叶片含水量关系密切,并且对叶片结构不敏感。Kumar[7]也发现叶片含水量与叶片尺度一阶导数光谱具有统计相关。Clevers等[8]发现在1 015~1 050 nm内的一阶导数光谱反射率能够很好地估算叶片含水量。
目前利用高光谱遥感数据估算作物水分的方法有两种:一是基于作物敏感波段反射率的统计法[9],二是基于物理过程的辐射传输模型反演法[10]。相比于机理模型的反演,统计法更简单方便,且同样能够获得较好的估算效果。本工作着重探讨统计回归方法对叶片含水量的估算。所有统计回归方法中应用最广泛的是植被指数法,然而采用植被指数的经验模型通常是基于某一作物在特定条件下建立,且仅采用两个或几个波段的信息,不能全面地解释与叶片含水量的相关性,往往导致模型缺乏通用性和精度。相比之下,偏最小二乘回归(partial least squares regression,PLSR)作为全波段方法,在利用全波段信息的同时能够有效解决高光谱数据在普通多元回归中的多重相关问题。Cho等[11]通过利用PLSR进行牧草干物质估算,证明PLSR具有估算作物理化参量的可行性。Mirzaie等[9]研究表明PLSR模型对预测叶片水分有较高的精度,Das等[12]研究表明相比于植被指数,逐步回归等统计模型,PLSR模型对冬小麦叶片含水量的预测效果最好。但PLSR并不总能提供最佳预测效果,因为有些波段不能够提供目标变量的信息,甚至可能干扰有用信息[13]。为了减少冗余波段信息的干扰,敏感波段筛选至关重要。Li等[14]根据达尔文进化理论中的“适者生存”原则提出了竞争自适应重加权采样(competitive adaptive reweighted sampling,CARS)特征波段提取方法,研究表明通过CARS筛选的波段能够提高PLSR模型预测能力和稳健性[15]。
目前采用CARS-PLSR方法进行叶片含水量估算的应用较少,且少有学者同时对比基于不同尺度、不同光谱处理形式的多种统计回归模型对叶片含水量的预测效果。本研究以此为切入点,通过设置冬小麦灌溉水平,人为制造不同水分胁迫水平,在冬小麦拔节期至灌浆期获取叶片、冠层尺度的光谱数据,进行原始和一阶导数两种处理,采用两波段植被指数、PLSR以及CARS-PLSR三种方法构建叶片含水量估算模型,同时与传统经典水分植被指数模型作比较,确定叶片含水量最优估算模型,为快速、准确地监测冬小麦叶片含水量及田间灌溉决策提供方法依据。
本研究共设2个冬小麦筒栽试验,于2016年—2018年在武汉大学灌溉排水综合试验场进行(30.5°N,114.4°E)。冬小麦种植于轨道式称重蒸渗仪测筒内,测筒直径为0.64 m,深为1.2 m。测筒回填土为粘土,饱和含水率为48.19%,田间持水率为30.81%,容重为1.36 g·m-3。冬小麦品种为郑麦9023,播种量为187.5 kg·ha-1,氮施用量为225 kg N·ha-1。播种时间分别为2016年11月16日以及2017年11月18日,通过人工控制灌水水平,以土壤水分下限为灌水信号,设置不同水分处理。在2016年—2017年试验中,设CK(control check), LD(light drought), MD(middle drought), SD(severe drought)4个水分处理(分别为田间持水率的80%,60%,40%,30%),随机分组,每组3个重复;在2017年—2018年试验中,设CK,LD和SD共3个水分处理(分别为田间持水率的80%,60%,40%),随机分组,每组4个重复。各试验于拔节期进行水分差异处理,持续到灌浆期结束。测筒上方配有遮雨棚,下雨时雨棚自动关闭。
采用美国ASD公司生产的FieldSpec FR4(350~2 500 nm)地物光谱仪获取冬小麦的叶片和冠层反射率光谱。光谱测量前后用白板进行校正,光谱仪光纤探头视场角为25°。冠层光谱测量时将探头垂直向下高于冠层顶部约1 m,每个测筒测定1次,每次重复测量10次,以其平均值作为该测筒的光谱反射值。光谱测定选择在晴朗无云的天气,测量时间为10:00—14:00。所有光谱反射率数据通过配套软件ViewSpecPro处理得到。冠层光谱剔除350~400,1 350~1 400,1 800~1 950以及2 400~2 500 nm的水分吸收带,并采用S-G滤波平滑, 其中每个窗口用21个数据点进行二项式拟合。叶片光谱测量采用地物光谱仪配套的叶片夹,每个测筒随机选取三片长势良好、伸展充分的旗叶进行测量,每片叶片重复测量5次,以其平均值作为该测筒的光谱反射值。数据采集的日期及其对应的生育期如表1所示。分别采集叶片、冠层光谱各120份,随机选取84份用于建立模型(建模集),剩下的36份用于验证模型(验证集)。
表1 光谱数据采集日期及对应的冬小麦生育Table 1 Date of hyperspectral data acquisition and growth stage of winter wheat
待叶片光谱测定完成后,立即将上述叶片取下,放入自封袋中(放置阴凉处)。将叶片放入铝盒中称取鲜重后,置于烘箱以65 ℃烘至恒重,测定其干重。叶片含水量按照式(1)进行测定,其统计特征见表2。其中FW(fresh weight)为叶片鲜重,DW(drought weight)为干重。
LWC=(FW-DW)/DW
(1)
植被指数是被广泛使用于获取作物生物物理变量。不同形式的植被指数对与植被特征相关的光谱信号增强效果不同,其中最常见的形式是比值型指数。因此通过在350~2 500 nm波段范围内,将任意两个波段进行组合分别构造两波段指数:归一化差值(NDSI)和比值(RSI)光谱指数[式(2)和式(3)],分析其与冬小麦叶片含水量的关系,建立估算模型。
NDSI=(Rλ1-Rλ2)/(Rλ1+Rλ2)
(2)
RSI=Rλ1/Rλ2
(3)
其中Rλ1和Rλ2分别为350~2 500 nm波段范围内的任意波段光谱反射率。
PLSR方法由Wold等[16]在1983年提出,其最大优势就是能够在自变量存在严重多重相关性的条件下进行有效回归建模。与PCA不同的是,PCA的主成分仅取决于自变量的方差,而PLSR的潜变量通过考虑自变量以及目标变量之间的协方差,增加了预测准确性。但全波段PLSR模型包含大量冗余波段信息,为提高PLSR模型的预测性,采用竞争自适应重加权采样(competitive adaptive reweighted sampling, CARS)方法进行敏感波段提取,主要步骤:(1)蒙特卡洛模型抽样N次,分别建立PLS回归模型;(2)采用指数递减函数(EDF)强制选择波段,去除回归系数绝对值相对较小的波长;(3)采用自适应重采样进行波长竞争性选择,选出回归系数绝对值较大的波长;(4)交叉验证,选择最小RMSE对应的变量子集。本文将比较CARS-PLSR与PLSR的预测效果,验证波段选取的有效性。
表2 冬小麦叶片含水量的统计特征Table 2 LWC of winter wheat during different growth stages
模型构建与验证分析在Matlab R2014a中完成。模型预测精度选取建模集和验证集的决定系数R2,均方根误差RMSE以及相对均方根误差RRMSE三个参数作为检测指标,其计算公式见式(4)—式(6)。
(4)
(5)
(6)
将所有获取的叶片含水量与对应的高光谱反射率(R)及一阶导数光谱反射率(FDR)进行相关分析[图1(a,b)]。结果显示,在叶片尺度,原始光谱在1 520~1 550 nm范围内呈现显著负相关(取|R|最大值的前1%,下同),最大相关系数波长为1 533 nm(r=-0.81)。一阶导数光谱在1 880~1 900 nm范围内呈现显著负相关,在1 960~1 980 nm范围内呈现显著正相关,最大相关系数波长为1 973 nm(r=0.86)。在冠层尺度,原始光谱在1 950~1 965和1 995~2 010 nm范围内呈现显著负相关,最大相关系数波长为1 959 nm(r=-0.60)。一阶导数光谱在555~580 nm范围内和1 738 nm附近呈现显著负相关,在1 580 nm附近呈现显著正相关,最大相关系数波长为563 nm(r=-0.63)。结果表明,在叶片尺度,原始光谱和一阶导数光谱的水分敏感波段都位于短波红外区域(1 300~2 500 nm);在冠层尺度,原始光谱的水分敏感波段均位于短波红外区域,而一阶导数光谱的水分敏感波段则分布在绿光区域以及短波红外区域,与前人研究结果相似[17]。
图1 冬小麦叶片含水量与原始光谱及一阶导数光谱反射率的相关性(a): 叶片尺度光谱;(b): 冠层尺度光谱
2.2.1 两波段植被指数回归建模
基于原始光谱,一阶导数光谱分别构建叶片、冠层尺度的两波段植被指数(NDSI,RSI),通过植被指数与叶片含水量的R2等值线图进行敏感波段组合筛选(图2),模型预测效果汇总于表3。
由图2可以看出,对比不同指数类型,NDSI与RSI对LWC的敏感波段组合类似,相同的敏感波段组合下,RSI比NDSI与LWC有更高的R2;对比不同尺度光谱可知,构建的叶片光谱指数与冠层光谱指数与LWC具有类似的敏感区域,不同波段组合下,叶片光谱指数与LWC的相关性大于冠层光谱指数;对比不同光谱处理类型可知,原始光谱指数的敏感波段组合主要分布在近红外(750~1 300 nm)和短波红外波段(1 300~1 900 nm)范围内,而一阶导数光谱指数的敏感波段组合主要分布在短波红外波段范围(1 300~2 100 nm)内,对比原始光谱指数,一阶导数光谱R2等值线图中峰值带宽较小。
由表3可知,对于叶片尺度,NDSI(R1 162,R1 321),RSI(R1 162,R1 321)与叶片含水量相关性最高(验证集R2为0.871和0.872,RMSE为0.354和0.352),在冠层尺度,NDSI(R1 653,R1 683),RSI(R1 684,R1 652)与叶片含水量相关性最高(验证集R2为0.811和0.817,RMSE分别为0.482和0.474)。同样利用一阶导数光谱进行指数构建,在叶片尺度,NDSI(R1 381,R1 977),RSI(R1 977,R1 380)与叶片含水量相关性最高(验证集R2为0.764和0.753,RMSE为0.498和0.508),在冠层尺度,NDSI(R563,R1 509),RSI(R1 288,R766)与叶片含水量相关性最高(验证集R2为0.490和0.669,RMSE为0.935和0.764)。
图2 NDSI,RSI与LWC的决定系数R2等值线图(a): NDSI-叶片原始光谱;(b):NDSI-叶片一阶导数光谱;(c):NDSI-冠层原始光谱;(d):NDSI-冠层一阶导数光谱;(e): RSI-叶片原始光谱;(f):RSI-叶片一阶导数光谱;(g):RSI-冠层原始光谱;(h): RSI-冠层一阶导数光谱
表3 新构建的植被指数对冬小麦叶片含水量估算效果分析Table 3 Results of model performance analysis by calibration and validation data sets
2.2.2 PLSR/CARS-PLSR回归建模
PLSR采用留一法(leave-one-out)进行交叉验证,通过使交叉验证集的RMSE最小确定最优潜变量个数。将所有数据随机分成建模集(70%)和验证集(30%),考虑到抽样本身具有随机性,故为提高模型预测效果的稳健性,研究中进行了10 000次重复抽样,取验证集R2出现频率最高时对应的建模与验证子集作为模型运行数据集。其中CARS波段筛选结果见图3,PLSR与CARS-PLSR回归模型的预测效果汇总于表4。
由图3可知,CARS-PLSR筛选出的波段大致分为两部分,一部分在1 200,1 450,1 950,2 100以及2 350 nm等水分敏感波段附近,另一部分在可见光及红边等与色素、胁迫强度相关的波段范围内,与Cater等[17]的研究结果一致。
根据表4,PLSR与CARS-PLSR回归模型无论在叶片还是冠层尺度的预测效果都较好(R2>0.66,RRMSE<14%)。对比不同方法可知,无论是基于不同尺度还是不同光谱处理形式,CARS-PLSR仅利用不足全波段2%的波段数信息,就获得优于PLSR的预测效果,表明CARS方法能够筛选出对叶片含水量较敏感的波段。通过分析两种方法验证集R2分布[图4(a—h)]可以看出,在10 000次随机抽样中,CARS-PLSR方法验证集的R2分布比PLSR更集中且更靠近1,且频率最高点对应的被选次数更高,这表明全波段的PLSR方法包含与LWC无关的波段信息,一定程度上影响PLSR对LWC的预测效果。相比之下,通过CARS提取特征波段可以保留有效波段信息,剔除无效波段信息,降低模型的复杂程度,获得较高的预测能力。因此CARS-PLSR模型对LWC的预测效果比PLSR模型好且具有更强的稳健性。对比基于叶片、冠层光谱的模型可以发现,基于叶片光谱的模型验证集R2分布均比基于冠层光谱的更集中且更接近1,可以说明基于叶片光谱建模的预测效果优于基于冠层光谱的建模且更具有稳健性。对比基于原始光谱和一阶导数光谱模型可以发现,在CARS-PLSR方法中,基于一阶导数光谱的模型预测效果优于基于原始光谱模型。
图3 平均光谱以及CARS方法筛选出的波段(a): 叶片-原始光谱;(b): 叶片-一阶导数光谱;(c): 冠层-原始光谱;(d): 冠层-一阶导数光谱
再对比2.2.1中构建的两波段指数,PLSR以及CARS-PLSR模型的预测能力优于两波段指数模型,究其原因是PLSR以及CARS-PLSR利用了更多与LWC相关波段信息,避免了两波段指数模型存在的有效信息“丢失”问题,因此具有更佳的预测效果。
表4 PLSR,CARS-PLSR对冬小麦叶片含水量估算效果分析Table 4 Results of model performance analysis by calibration and validation data sets
作物中叶片含水量的及时评估对于作物的干旱诊断和精确水分管理至关重要。分别比较了三种不同统计方法对冬小麦叶片含水量的预测效果。结果表明:三种方法中,基于叶片一阶导数光谱的CARS-PLSR模型对LWC的预测效果最好,CARS方法能提取与叶片含水量密切相关的敏感波段,从而提高模型预测效果。相比之下,两波段指数方法会“丢失”一些有效波段信息,而PLSR方法可能会包含一些具有干扰性的无效波段信息。
在三种方法中,叶片尺度的LWC估算效果均优于冠层尺度。但是,叶片尺度下的光谱监测难以向大区域推广。结果表明,在没有叶片光谱观测的条件下,基于冠层原始光谱的三种方法也可以达到较好的LWC预测效果(R2>0.81),其中基于冠层一阶导数光谱的模型在CARS-PLSR方法下取得较好的预测效果(R2=0.881)。从光谱特性可知,叶片含水量敏感波段处于近红外与短波红外范围,考虑到叶片结构以及叶面积指数影响的波段也主要处于短波红外范围,因此两波段指数以及CARS所筛选出的波段可能不仅仅对LWC敏感,同时所选波段的内在机理仍有待进一步研究,以期选出普适的波段组合。
本试验的水分差异处理从拔节后期开始一直持续至冬小麦成熟。通过人为设置不同水分差异处理,在不同生育期获取叶片含水量数据。由于不同生育期造成叶片含水量变化的原因不同,在作物生长期,叶片含水量降低主要受水分胁迫影响,而在作物生殖期,叶片开始衰老,叶片含水量自然降低,叶片含水量的变化并非单纯受到水分胁迫的影响。因此,未来的研究应考虑划分生育期构建叶片含水量估算模型。另外,试验设计目前缺乏不同作物品种间的对比,且研究结论是否适合小区试验或大田试验,在今后也需要深入研究。
(1)对比三种不同统计回归的方法,发现基于叶片一阶导数光谱的CARS-PLSR模型对LWC的预测效果最好(R2=0.969,RMSE=0.164,RRMSE=6.00%)。
(2)在两波段植被指数法中,NDSI与RSI具有相似的水分敏感区域,其中基于叶片原始光谱的NDVI(R1 162,R1 321)和RSI(R1 162,R1 321)模型对叶片含水量预测效果最好。在相同情况下RSI对叶片含水量的预测效果优于NDSI。
图4 PLSR模型验证集R2分布图(a,b,c,d);CARS-PLSR模型验证集R2分布图(e,f,g,h)(a): PLSR-叶片原始光谱;(b):PLSR-叶片一阶导数光谱;(c):PLSR-冠层原始光谱;(d):PLSR-冠层一阶导数光谱;(e): CARS-PLSR-叶片原始光谱;(f):CARS-PLSR-叶片一阶导数光谱;(g):CARS-PLSR-冠层原始光谱;(h): CARS-PLSR-冠层一阶导数光谱
(3)对比原始、一阶导数光谱两种光谱处理形式,在两波段指数和PLSR方法中,基于原始光谱的模型对叶片含水量的预测效果优于基于一阶导数光谱的模型,在CARS-PLSR方法中,结果相反。