分数阶微分技术在机载高光谱数据估算土壤含水量中的应用

2022-11-07 08:39王瑾杰丁建丽葛翔宇韩礼敬
光谱学与光谱分析 2022年11期
关键词:低阶阶数冠层

王瑾杰,丁建丽,葛翔宇,张 喆,韩礼敬

1. 新疆大学地理与遥感科学学院,新疆 乌鲁木齐 830017 2. 北京师范大学防沙治沙教育部工程研究中心,北京 100875 3. 中国科学院数字地球重点实验室,北京 100094 4. 新疆大学新疆绿洲生态自治区重点实验室,新疆 乌鲁木齐 830017 5. 新疆大学智慧城市与环境建模自治区普通高校重点实验室,新疆 乌鲁木齐 830017

引 言

土壤含水量(soil moisture content,SMC)是区域精准农业和水资源管理中易受影响的重要参量,是约束作物生态化学参数的关键指标[1]。在干旱和半干旱地区,农业极易受到干旱胁迫,造成作物长势稀疏、 产量下降[2-3]。尽管干旱区农业水资源具有重要意义,但在实践中仍然缺乏快速易行、 无损监测的手段。特别是农业土壤被作物覆盖,土壤水分的变化以植被生物化学结构表现,常见的星载光学遥感光谱分辨率较低,难以完整捕捉植被生物化学结构的细微变化[4]。因此,及时精准地掌握农业区域SMC的空间分布对精准农业和农业信息化发挥着重要作用。

随着无人机遥感技术在农业中的推广,及时的无损监测逐渐成为可能[5-6]。机载高光谱成像传感器能有效捕捉作物冠层特征,提供丰富的光谱信息,并保留地理空间属性[7]。然而,从高维的高光谱数据中挖掘出敏感变量仍存在一定难度。高光谱成像仪的波段范围适用于农业区域作物覆盖区域的监测[8]。虽然光谱范围较小(400~1 000 nm),但包含植被生化结构敏感波段和植被红边信息波段,并被证明植被冠层的光谱特征在不同的SMC胁迫条件下发生变化[9]。因此,通过挖掘植被冠层信息估算SMC的研究值得探索。近年在高光谱数据挖掘研究中,微分处理受到广泛关注[10]。袁婕等通过一阶和二阶微分光谱变换,探寻与植被盐分关联程度较高的敏感波段,并提升模型定量估算的效果[11]。Wang等考虑基于一阶和二阶微分光谱获得植被冠层的红边参数,并通过红边信息发现植被受到的胁迫程度[12]。尽管这些研究已经取得较好的结果,但整数阶微分处理仍有局限,整数阶微分可能造成光谱部分信息的丢失,并引入大量噪声峰[13]。此外,因一阶微分与二阶微分的波形差异较大,可能会忽略由于作物根部SMC造成冠层光谱细微的差异[14]。高整数阶微分处理可以增强成像光谱的图像边缘,然而精细的纹理和平滑的区域可能会被忽略[15]。分数阶微分利用较窄的阶数区间扩展了整数阶微分在光谱预处理中的应用[16],从而为处理机载高光谱数据提供了新的视角。

基于此,以干旱区典型农业区为研究对象,利用机载高光谱传感器获取成像光谱数据,基于分数阶技术挖掘冠层光谱信息与SMC间的敏感关系,以期提高SMC估算精度,旨在为干旱区的精准农业和农业信息化提供准确而有前景的解决方案。

1 实验部分

1.1 研究区概况

试验田位于乌鲁木齐市东北隅的阜康市,北邻库尔班通古特沙漠,是绿洲与荒漠的交错带(图1)。该地区以温带大陆性沙漠气候为特征,年平均降水量200 mm,全年无霜期176 d,年平均气温7.1 ℃,降水分布不均匀。阜康市是粮食、 优质蔬菜和特殊作物生产的重要基地。试验田内种植冬小麦,熟制为一年一熟。

图1 研究区及采样点分布 (a):高分1号RGB真彩色合成的阜康市及采样区示意图;(b):采样点示意图Fig.1 The study area and distribution of sampling points (a): RGB true color image of Fukang city and study area using Gaofen-1; (b):Sampling points

1.2 数据获取与处理

在试验区内均匀地布设采样网格(0.5 m×0.5 m),并用GPS记录网格中心位值坐标。每份土样通过环株四点法混合收集,均为表层土(0~10 cm)。土壤样品采集时均以铝盒密封,在室内处理。通过室内烘干(105 ℃烘干箱,48 h)计算得到SMC数据集。

无人机作业采用DJI Matrice600Pro®(中国深圳大疆创新科技有限公司)无人机平台和Headwall Nano-Hyperspec®高光谱传感器(Headwall Photonics Inc.,Bolton,MA,USA)。成像光谱仪具有400~100 nm的波段范围,6 nm的光谱分辨率,2.2 nm的重采样间隔和272个光谱波段。当航高为100 m时,所捕获影像空间分辨率为4 cm。高光谱数据于2018年4月17日15:00获取,作业时响晴无风,并遵循暗电流去除和白板校正流程。室内通过Hyperspec Ⅲ和Headwall SpectralView软件进行高光谱数据预处理和正射校正,利用Savitzky-Golay滤波器(second-order polynomial smoothing and 5-band window width,S-G)平滑处理影像(视为原始影像)。S-G平滑处理在MATLABR2016b(The MathWorks,Natick,MA,USA)中进行。所获取的影像长250 m,宽100 m,面积为2.5×104m2。

图2 无人机作业及机载高光谱传感器Fig.2 UAV operation and UAV-based hyperspectral sensor

1.3 分数阶微分技术

根据分数阶微分(fractional order differential,FOD)方法的几何和物理意义,FOD理论更适合处理分形问题。分数阶的几何意义是函数曲线的一般斜率,物理意义是分数流和广义振幅。一般来说,物体的光谱被视为一个物理光电信号[15]。分数阶微分通常有三个定义,包括Caputo,Riemann-Liouville,Grünwald-Letnikov(G-L)。我们根据研究的可持续性选择了G-L定义[16]。先前的研究中表明,三种算法定义中G-L在处理一维光谱时是有效的[16-17]。我们利用式(1)在MATLABR2016b中对成像光谱进行处理,在0~2阶区间内进行了20次分数阶变换,步长为0.1。

(1)

式(1)中,x为自变量,v为阶数,Γ(g(x))为Gamma函数,m是微分上下限差。当v=0.0则表示原始光谱,v=1.0则表示一阶微分,v=2.0表示二阶微分。

1.4 建模策略

选择基于联合x-y距离 (Simple set portioning based on joint x-y distance,SPXY)方法[18]对70个样本执行划分,50个样本为建模集,其余20个样本作为验证集。在构建估算模型时,全部波段作为预测变量,实测SMC则为响应变量。

梯度提升回归树(gradient-boosued regression tree,GBRT)是基于决策树的集成学习模型[19]。GBRT对解释冠层光谱信息与SMC的非线性关系极具潜力,是一种鲁棒性较强的估算模型。因其集成了多个弱学习机,并将多个弱学习机组合成共识模型,在先前研究中GBRT表现出优于随机森林的潜能。GBRT本质是在每次迭代时添加新的学习机,并利用最小二乘法最小化负梯度,对前一次遗留的残差的输入,允许从中学习,从而实现集成的效果[20]。GBRT关键参数设置如下:树的个数(n.trees)=500,树深(max_depth)= 5。

1.5 模型评价

2 结果与讨论

2.1 SMC统计特征

经SPXY模型划分后样本集合描述性统计结果如图3,小提琴图中三条曲线为核密度估计,其面积越大表示样本量越多,箱线的上下限分别表示一分位数和三分位数。全集、 建模集和验证集的均值(Mean)分别为24.464%,24.090%和25.400%,标准差分别是5.408%,5.832%和4.148%。相近的统计特征可以最大程度保证估算模型的效果,此外,各数据集样本分布直方图也保持近似的分布,可证明SPXY划分数据集具有较好的代表性,尽可能降低在模型估算中的误差。

图3 样本集的描述性统计图Fig.3 Descriptive chart of the sample sets

2.2 FOD对成像光谱效果

无人机高光谱影像具有图谱合一的特征,因而将从影像和光谱两个层面分析FOD处理后的效果。图4和图5分别是RGB影像和平均光谱。低阶FOD(0<阶数<1)和高阶FOD(1<阶数< 2)的结果有显著差异。在RGB影像中,低阶FOD的影像仍能保持较好的清晰度,但从0.6阶逐渐增现部分噪声,使得随着阶数增加图像清晰度下降。高阶FOD而言,噪声随着阶数增加而增加,难以清晰地分辨影像目标。图5中红色为平均光谱,蓝色区间表示均值加减标准差。低阶FOD的光谱区间能维持与植被光谱形似的光谱曲线,特别是对于水、 氧吸收谷区域(760 nm附近)突显。然而,高阶FOD处理后的光谱曲线随着阶数增加,植被光谱曲线形态特征丧失越明显,相应地增加了噪声峰。因此,从光谱特征角度可确定低阶FOD是处理无人机成像高光谱数据的首选方案。

不同FOD处理下光谱与SMC的相关系数如图6所示。与高阶FOD处理下光谱与SMC的相关系数相比,低阶FOD的相关系数较高,并集中于可见光波段范围内。通过比较不同预处理下光谱和SMC的最大绝对值(rmax),表明在0.4阶时,rmax值最大(rmax=0.768),低阶FOD的rmax整体上优于高阶FOD。在高阶FOD中,rmax变化较缓,显示出略高于原始光谱(0阶)与SMC的rmax值。与整数阶微分(一阶微分和二阶微分)的结果相比,0.4阶处理的光谱与SMC的相关性分别提高了0.157和0.158。因此,FOD可以很好地挖掘和凸显细微光谱间信息,提高光谱与SMC的相关性。

图4 分数阶微分处理后的高光谱影像 (a):高光谱影像立方体;(b)—(u):0.1阶—2阶处理结果Fig.4 Hyperspectral images after FOD processing (a):Hyperspectral image cube; (b)—(u): Processing results of 0.1 to 2 orders

图5 不同的FOD预处理光谱曲线Fig.5 Spectral preprocessed by different FOD

2.3 估算模型构建与对比

图6 不同FOD处理下光谱与SMC的相关系数 (a):不同预处理下光谱与SMC的相关系数热图;(b):不同预处理下光谱与SMC相关性系数的最大绝对值Fig.6 The correlation coefficient between band and SMC under different FOD pretreatments (a): Heatmap; (b): Maximum correlation coefficient

表1 基于不同FOD建模策略SMC的GBRT估算模型比较Table 1 Comparisons of GBRT models based ondifferent modeling strategies

2.4 光谱变量的重要性分析

集成学习算法优势在于对参与模型的变量均能赋予相应重要程度,不同FOD下的全波段重要性如图9所示。FOD处理后的光谱对SMC重要性最高的波段集中在400 nm附近,蓝光波段处通常为叶片含水量紧密相关。此外,在低阶FOD中,波段重要性主要集中在400~500,520和970 nm附近。对于高阶FOD,更重要的区域集中在大约400,640和720 nm附近。上述波段范围与植被的叶绿素、 作物胁迫和水分存在较好的响应。相较于原始波谱重要性而言,FOD技术挖掘了更多波段的协同响应。

图谱合一的无人机高光谱影像包含大量信息,光谱微分技术是分析反射光谱的一种有利方法,可以消除背景噪声、 锐化光谱特征[20]。FOD技术与整数阶微分相比,挖掘了光谱中细微的信息,并且光谱保留了光谱原始的特征(图5),低阶FOD处理后影像在红边区域非常明显。FOD技术在提

图7 实测SMC与估算SMC散点图Fig.7 Scatter plot of measured SMC and estimated SMC

图8 最优模型下SMC空间分布Fig.8 SMC spatial distribution under the optimal model

图9 不同预处理下波段重要性Fig.9 Bands importance under different FOD pretreatment

高光谱与SMC相关性的同时,改善模型精度。近年来,对高光谱数据的预处理主要集中于整数阶微分处理,相较之下,二阶微分处理效果不如一阶微分处理,其结果表现不足[23]。高阶FOD处理效果同样不如低阶FOD处理结果,因在高阶FOD处理结果中,光谱在近红外区域(900~1 000 nm)出现大量噪声峰,图像随着阶数的增加清晰度开始下降。因此高阶FOD可能不适合机载高光谱数据。FOD技术一定程度上扩展高维数据对预处理需求,同时对数据的挖掘极具潜力。值得注意的是,FOD技术理论上对等距间隔数据才可执行,对于非等距光谱间隔的星载遥感影像略显乏力。

植物生物物理特性和生物化学特性极易受到土壤属性的胁迫。特别是,干旱胁迫使叶绿素吸收强度变化,从而诱发植被冠层光谱的差异,在作物生长的早期,干旱胁迫的影响尤为明显。采样时节正值冬小麦返青期,SMC对作物叶绿素含量的边际效应随SMC的增加而增加[24]。从植物生化组分的光谱吸收特征及形成机理的角度出发,与叶绿素极大相关的关键位值基本在430,460,640和660 nm[25]。结合图9所示的波段重要性分析,不难发现分数阶微分处理后的光谱挖掘出更多与叶绿素强相关的光谱信息并协同了部分水分强吸收的信息。低阶FOD更多地拓展了430~460 nm的光谱信号,而高阶FOD更倾向于在红边和近红外附近挖掘更多信息。在此基础上,基于植被光谱信息定量估算SMC在物理原理上是可行的,利用植被光谱信息反演SMC存在清楚的遥感和光谱机制。在作物覆被较高的生长期,利用机载高光谱数据获取冠层光谱信息,从而方便制定更合理的精准农业灌溉管理方案。

即使机器学习往往能很好的解释非线性关系,但模型的训练尽可能需要大量样本和适合的超参数[25]。正因如此,本工作采用集成学习算法进行估算,集成学习可以有效地规避小样本建模估算的问题。从实测值与估算值的散点图(图7)中发现,算法出现了部分低估的现象,但在建模过程中取得了较好的精度和性能。总之,间接估算受胁迫的植被冠层光谱可能为SMC定量估计提供新的视角。此外,辐射传输模型和热红外数据在近年研究中应用于水分胁迫等研究[26],结合更多的理论和数据可能会带来更令人期待的估算结果。虽然本研究通过FOD技术有效地挖掘了“返青期”的冬小麦冠层信息,但由于现实情况限制,物候情境下的无人机高光谱数据未能采集,我们将进一步探索和实践。在此基础上,有助于实现了精确的灌溉管理,为干旱地区的绿洲农业日益脆弱的农业生态系统提供科学支持。

3 结 论

猜你喜欢
低阶阶数冠层
XIO 优化阶数对宫颈癌术后静态调强放射治疗计划的影响
密度与行距配置对向日葵冠层结构及光合特性的影响
低阶煤煤层气富集区预测方法研究与应用
不同灌溉条件下一个春小麦重组自交系(RIL)冠层温度与产量性状的相关性
基于激光雷达的树形靶标冠层叶面积探测模型研究
用于能谱本底处理的阶数自适应型正交多项式模型法
确定有限级数解的阶数上界的一种n阶展开方法
密度与播期互作下棉花冠层PAR时空特征分析
思辨阅读:让儿童思维从“低阶”走向“高阶”
从低阶走向高阶 从知识走向素养