基于小麦冠层无人机高光谱影像的农田土壤含水率估算

2023-05-15 03:40王梦迪李志娟贾中甫王敬哲邬国峰石铁柱
农业工程学报 2023年6期
关键词:小波基冠层波段

王梦迪,何 莉,刘 潜,李志娟,王 冉,贾中甫,王敬哲,邬国峰,石铁柱

基于小麦冠层无人机高光谱影像的农田土壤含水率估算

王梦迪1,何 莉2,刘 潜1,李志娟3,王 冉3,贾中甫3,王敬哲4,邬国峰1,石铁柱1※

(1. 深圳大学自然资源部大湾区地理环境监测重点实验室&广东省城市空间信息工程重点实验室&深圳市空间信息智能感知与服务重点实验室,深圳 518060;2. 深圳大学机电与控制工程学院,深圳 518060;3. 内蒙古自治区测绘地理信息中心,呼和浩特 010020;4. 深圳职业技术学院人工智能学院,深圳 518055)

精准监测农田土壤含水率(soil moisture content,SMC)有助于提高中国水资源利用率以及农业可持续发展水平,为实现国家农业经济的稳定发展及可持续发展目标打下坚实的基础。为了探索基于无人机遥感数据进行准确、快速的土壤含水率监测的方法,该研究选取新疆阜康绿洲田块为研究区,使用无人机(unmanned aerial vehicle,UAV)高光谱传感器采集田块尺度小麦冠层光谱信息,进行SMC定量估算和制图。对小麦冠层光谱进行savitzky-golay(SG)平滑,利用7种不同的小波基函数(bior4.4、coif4、db4、fk14、haar、rbio3.9、sym4)对光谱信息进行连续小波变换(continuous wavelet transform,CWT)处理,并采用遗传算法(genetic algorithm, GA)对小波系数进行特征提取,最后结合偏最小二乘回归(partial least square regress,PLSR)、支持向量机(support vector machine,SVM)、人工神经网络(artificial neural network,ANN)、随机森林(radom forest,RF)以及极端梯度提升(extreme gradient boosting,XGBoost)估算SMC并实现其空间制图。结果表明:基于GA的特征波段选择方法可有效提高SMC的估算精度。使用全波段小波系数构建模型的决定系数²在0.20~0.44之间,而使用特征小波系数的²为0.25~0.82。与其他小波基函数相比,采用db4特征小波系数的估算精度最优,PLSR、SVM、ANN、RF和XGBoost模型估算SMC的²分别为0.82、0.72、0.79、0.76和0.45。基于PLSR和ANN最优模型进行SMC空间制图,基于CWT和机器学习结合模型能够有效估算小田块尺度SMC。该研究基于无人机高光谱数据实现了SMC精确估算,为农田尺度SMC监测提供了有效手段。

土壤含水率;无人机;高光谱;连续小波变换;遗传算法

0 引 言

作为农业监测的重要指标之一,土壤含水率(soil moisture content,SMC)对于评估土壤墒情、农作物生长状况和产量具有指导性作用。在作物的生长过程中,SMC过低会导致土地硬化,进而影响农作物对水分以及养分的吸收[1]。同时,由于中国农业水资源利用率不高[2],尤其在中国西北部干旱区,精确获取绿洲农田SMC信息对于加强绿洲生态环境的稳定性以及农业可持续发展具有重要意义。

传统的SMC监测基于烘干法、中子仪测定法、γ射线法等[3],该类方法单点测定精度高,但需耗费大量的人力物力及时间资源,且无法提供连续的SMC空间表面信息。由于实时性、无损性以及非接触性等特点,可见光近红外遥感(visible and near-infrared,VIS-NIR)[4]和微波遥感[5]等为SMC监测提供了有效手段。微波辐射能够穿透土壤达到与波长相关的深度,但其分辨率相对VIS-NIR传感器较差[6],无法满足数字土壤制图日益精细化的需求。而高光谱传感器能够提供更高的光谱保真度,能够有效解决SMC容易受到蒸发蒸腾影响带来的监测误差[7]。干旱地区特殊的地理环境导致SMC具有较强的空间异质性。而卫星遥感数据相对较低的空间分辨率无法实时动态精准监测田块尺度SMC,提供精细化的空间尺度信息。相比卫星多光谱数据,无人机平台具有更高的空间分辨率,且简单高效、操作灵活,其可搭载高光谱传感器获取更为丰富的光谱信息,能够提供比卫星遥感技术更加精细的空间分辨率和光谱分辨率[8],适合田块尺度精细化监测,在精准获取农业信息方面已被广泛研究和应用[9],无人机高光谱已成为数字土壤制图中重要的数据源。然而,无人机在数据采集过程中,易受飞行姿态、天气条件的干扰,且在植被覆盖时无法直接获取到土壤表面光谱信息。而目前暂无一套适用于植被覆盖条件下对SMC进行预测的无人机高光谱影像数据处理流程与方法。研究表明[10],高光谱成像的部分特征波段可用于根据脱水对叶片色素特征的影响间接评估植物的水分状况。而仅有少量学者基于植被指数方法基于无人机植被冠层光谱数据进行土壤含水率的估算研究。因此,有必要进一步探索利用无人机高光谱获取的植被冠层信息估算SMC的方法。

高光谱数据具有丰富的波段信息,能够提供更为细致的光谱信息用来反映地物理化特性,但是同时也存在着噪声、信息高度冗余、吸收特征重叠等问题。作为强力有效的信号处理工具,小波变换(wavelet transform,WT)被证明可用于特征增强与提取[11],已被广泛应用于基于遥感数据的叶面积指数估算[12]、作物病虫害监测[13]和土壤重金属反演[14]等中,并表现出出色的增强光谱信息的能力。利用WT增强SMC光谱特征的微弱吸收峰,能够在一定程度上分离重叠的吸收特征[15],对高光谱信息进行连续小波变换(continuous wavelet transformation,CWT)也能够增强理化参数的特征信息[16]。

高光谱数据存在波段数众多、信息冗余度高的问题,可通过特征波段提取解决此类问题。目前,常用的特征提取方法主要有相关系数法、主成分分析法和连续投影法等。与这些常用的方法相比,遗传算法(genetic algorithm,GA)[17]提供了一种更为简单高效的数据建模方法,且保留了原始光谱变量的物理意义。GA以种群为目标在全局尺度上进行特征波长的选取,在极大程度上保持目标光谱在全域波段的完整性,避免了在特征选取过程中由于部分过于敏感的特征波段的影响而忽视了全局优化的情况,能够使模型更加稳定。遗传算法结合最小二乘法进行光谱特征波段选取是近几年的研究热点。LIU等[18]验证采用基于GA的反向传播(back propagation,BP)神经网络回归进行SMC预测在准确率方面优于BP神经网络回归。NGUYEN等[19]在利用极端梯度提升模型(extreme gradient boosting,XGBoost)进行SMC预测时发现结合GA进行最佳波段选择能够表现出更高的预测精度。因此,WT与GA相结合的方法应用于无人机高光谱数据,可综合二者的优势,在提升SMC预测精度的同时降低计算复杂度,提高模型的鲁棒性。而目前,几乎没有将WT与GA相结合的研究,故有必要探索WT与GA在SMC数字土壤制图方面的潜力。

机器学习方法常被用于构建SMC估算模型。如ADAB等[20]利用可见光近红外高光谱数据比较了支持向量机、随机森林、人工神经网络在预测SMC上的能力。但由于不同数据预处理方法以及土壤质地和气候环境等外部因素的影响,不同的机器学习算法在各研究中呈现不同程度的精度结果。因此有必要基于无人机植被冠层高光谱影像数据,探讨GA结合CWT在不同机器学习方法下估算SMC的效果。

综上,为利用UAV遥感数据进行准确、快速的土壤含水率监测,该研究基于UAV高光谱影像,探讨基于农作物冠层光谱反演SMC的可行性,旨在:1)建立一套适用于UAV高光谱影像的处理流程和方法;2)评估CWT结合GA算法提取适宜SMC反演的特征信息的效果;3)分析不同机器学习算法估算SMC的空间分布特征,以期为干旱区绿洲农田土壤水含量状况监测以及农业生态平衡发展提供数据参考。

1 材料与方法

1.1 采样区概况

本研究选取的地块位于中国新疆维吾尔族自治区阜康市的荒漠-绿洲过渡带(87°51'15″E,44°21'14″N)。该田块属温带大陆性荒漠气候区,北部为古尔班通古特沙漠。研究区全年降水主要集中于冬春季,普遍在150 mm以下,年蒸发量大于2 000 mm。研究区的主要土壤类型为灰棕漠土和风沙土,土壤有机质含量和含水率低。研究区内种植作物为一年一熟的冬小麦。该田块长度为220 m,宽度为130 m,总面积为2.72 hm2(图1)。

图1 研究区采样点分布

1.2 UAV高光谱数据采集

本研究使用DJI Matrice 600 Pro六旋翼无人机搭载Headwall公司Nano-Hyperspec高光谱成像仪获取研究区的高光谱影像数据(图2)。Nano-Hyperspec是集成光谱仪和数据存储模块的高光谱传感器,同时集成了GPS/IMU(inertial measurement unit)惯导系统,可以同步获取UAV的实时姿态信息。传感器的波段范围是红外/近红外波段(400~1 000 nm),包括270个光谱通道,光谱采样间隔低于2.4 nm/像素,光谱分辨率在20 µm狭缝时低于6 nm。飞行器处于100 m航高下,Nano-Hyperspec高光谱传感器焦距12 mm可获取空间分辨率约为4 cm的高光谱影像,像素为640×480。为确保数据的真实客观性,试验组首先确认野外作业前5天内无降水与人工干扰,并于2018年4月17日(冬小麦返青期)北京时间15:00进行了UAV高光谱数据的采集工作。在无人机起飞前需要对传感器进行暗电流校正和白板校正,飞行时天气晴朗且无大风影响,具有良好视野。数据采集完成后使用HyperspecⅢ及Headwall Spectral View软件进行几何校正及正射校正数据预处理。为减少原始高光谱数据的噪声,本研究采用savitzky-golay(SG)滤波平滑处理后的影像作为基础影像,设SG滤波平滑为2阶多项式及5点移动平均。本研究中的SG处理均在MATLAB R2016b中进行。

图2 无人机飞行平台搭载高光谱传感器

1.3 SMC样本采集

在高光谱数据采集的同时,在目标田块中均匀选取70个0.5 m×0.5 m的采样单元,使用GPS(LT500T,CHC Navigation Technology Co. Ltd. Shanghai,China)记录采样点位置,精度约为1 m。以各个采样单元中的小麦植株为中心点进行4点采样,从表层去除植物残留物和砾石等杂物,从植株中心样方的4个角采集4个0~10 cm土壤样品并彻底混合,并放置于铝盒中密封保存。完成土壤样本原始质量记录后,对70份样本进行热重分析测量土壤样本无水分质量,在105 ℃烘箱中进行48 h烘干,并计算SMC。

1.4 光谱处理与SMC建模方法

1.4.1 连续小波变换增强光谱特征信息

式中代表波长(400~1 000 nm),为缩放因子或称膨胀因子,为平移因子。

式中()代表反射光谱,。在研究应用中,须以实际情况对和的值进行设置。本研究中,是波长从2 00 nm到1 000 nm的偏移量。

本研究选取7种小波基函数(bior4.4、coif4、db4、fk14、haar、rbio3.9和sym4)分别对冬小麦的冠层光谱数据进行连续小波变换。其中正交小波基函数coif4、db4、fk14、haar和sym4具有良好的局部化特征,能够有效处理和分析微弱或突变的信号。双正交小波基函数bior4.4和rbio3.9具有非线性相位及对偶性特征,能够使生成的小波系数更加有规律,具有较好的平滑效果。除haar小波基函数外,其他正交小波基函数并不存在对称性。本文对所得到的9层分解尺度小波系数与SMC实测数据进行相关性分析,并利用显著性相关水平确定最优CWT尺度。

1.4.2 GA遗传算法提取特征波段

采用遗传算法对7种小波基函数最优CWT尺度的小波系数进一步提取特征波段。遗传算法是基于达尔文自然进化学说中的自然选择与遗传学机理,模拟生物自然进化过程的计算模型[22]。它基于种群搜索算法,同时对群体目标中的多个个体进行筛选,通过多次更迭,极大程度地降低局部最优解的风险。研究设置GA的初步种群大小为64,窗口宽度为1,初始变量集为10%,突变率为0.5%。并采用随机交叉验证,以均方根误差作为适应度函数来防止过拟合。当模型的适应度函数迭代达到一定次数时程序终止。在每次运行结束时,选定最佳染色体变量。为确保得到稳定可靠的结果,对数据重复执行 5 次,并对入选的波段及其频率进行累计,根据累计频率均值进行特征波段的提取。

1.4.3 基于机器学习方法的建模方法

基于遗传算法提取的特征小波系数,采用以下5种机器学习算法构建SMC估算模型,并与基于全波段小波系数的模型结果进行对比分析:1)偏最小二乘回归(partial least square regress,PLSR),该方法集主成分分析以及典型相关分析等传统分析模型为一体,能够在一定程度上解决数据非正态分布、因子结构不确定性等问题。在防止过拟合的前提下,本研究通过交叉验证的均方根误差来进行潜在变量最优数量选择[23]。2)支持向量机(support vector machine,SVM),是DRUCKER[24]基于统计学习的理论基础提出的,对神经网络中的局部极小值问题有着较好的优势。本研究中SVM的核函数使用高斯径向基函数[25];epsilon设置为1.0、0.1、0.01以控制决策边界的宽度;gamma设置为以对数均匀分布在10-6~10之间的15个值,其作用为用于定义高斯函数宽度的调优参数;cost则为每个支持向量的影响,设为以对数均匀分布在0.001~100之间的11个值[26]。3)人工神经网络(artificial neural network,ANN),这是现阶段广泛使用的机器学习算法之一,并在众多机器学习算法中有着相对较好的准确性、稳定性。本研究使用基于反向传播BP(backpropagation)的前馈多层感知机(multilayer perceptron,MLP)[27],通过连续更新或训练权值来减小估算误差。设学习率为0.125,学习周期为20,学习周期首次训练持续时间由学习率决定,后续每个学习周期的训练持续时间为前一轮的2倍。4)随机森林(radom forest,RF),它是一种基于回归树的集成学习算法,在2001年被BREIMAN等[28]提出,并被认为是现阶段最准确的回归预测方法之一。RF可以通过减少过度学习和过度拟合来提高性能,相较于传统的单树模型更加稳定[29]。本研究设置最大的弱学习器的个数为250,决策树最大深度为100,并采用袋外样本进行模型好坏的评估。5)极端梯度提升(extreme gradient boosting,XGBoost),该方法基于CHEN等[30]提出的梯度提升算法,通过使用更正则化的模型,形式化更好地控制过度拟合。XGBoost将弱分类器集成到强分类器中,并迭代生成新的树以适应先前树的残差。本研究经过多次调参设置学习率为0.07,指定树的最大深度为6,随机数种子为45。

为了更好地提高验证精度,充分使用样本点数据,防止由于建模集或验证集数量较少引起的偏差,在模型估算精度验证阶段采用留一法交叉验证。本研究采用决定系数(2)和均方根误差(MSE)进行模型精度评价,其计算式见文献[31-32]。

本研究使用最小距离分类法对原始高光谱影像数据进行植被像素的掩膜提取,剔除裸土像素。选取最优估算模型实现SMC空间分布制图。

2 结果与分析

2.1 土壤含水率及其光谱特征

研究区土壤样本SMC分布如图4所示,其平均值为25.15 g/kg,中位数为23.97 g/kg,最大值为37.63 g/kg,最小值为16.54 g/kg,标准偏差为4.81 g/kg,变异系数为19.14%。Shapiro-Wilk (SW)正态分布检验表明,SW=0.96,<0.01,表明SMC实测值整体呈非正态分布。

图3 土壤含水率分布直方图

为了直观呈现样本点SMC与冠层光谱响应特征之间的关系,本研究将样本点SMC均分为4个不同梯度并选取各梯度中SMC中位值的样本点进行小麦冠层反射率示例,图4所示为4个不同梯度的小麦冠层反射率曲线。反射率曲线在绿波段(550 nm附近)有一个明细的反射峰,光谱曲线呈现明显的植被光谱曲线特征。随着含水率的增高,冠层光谱在400~750 nm可见光区域反射率也会随着增高。在红边位置,含水率低于26 g/kg时,小麦冠层的反射率曲线则有着较大的斜率。

注:SMC是土壤含水率。

2.2 基于连续小波变换结果确定最优小波分解尺度

为了明确不同小波基函数的最优分解尺度,对不同基函数的小波系数与SMC实测值进行相关性分析。表1为不同分解尺度下小波系数与SMC间相关性通过0.01水平显著性检验的波段数结果。随着分解尺度的递增,haar函数的小波系数在0.01水平上显著的波段数也呈现递增趋势。其他小波基函数多数是在第4~6层分解尺度上呈显著性相关的波段数目最少。根据0.01水平上显著的波段数目,确定db4、coif4和fk14函数最优小波分解尺度为1尺度;sym4、bior4.4、haar和rbio3.9函数的最优小波分解尺度为9。

表1 通过小波系数与SMC相关分析显著性检验的波段数

2.3 遗传算法筛选出特征波段

利用GA算法,基于最优小波分解尺度的7种小波系数,分别选择出16(bior4.4)、 20(coif4)、19(db4)、24(fk14)、30(haar)、27(rbio3.9)、23(sym4)个特征小波系数(表 2)。rbio3.9、haar以及coif的特征信息主要集中在400~550,600~800 以及950~1 000 nm;fk14和bior4.4则是在450 nm以及600~800 nm集中,在其他波段并无明显断层式分布。db4函数在500~700 nm出现明显的高频段,其他波段相比之下分布比较均匀。7个小波基函数均在800~900 nm波段出现了明显的断层或者是稀疏分布,而在400~500 nm以及600~800 nm分布最为密集。总体而言,GA筛选得到的特征小波系数集中于蓝色波段(420~490 nm)、红色波段(680~780 nm)以及近红外波段(890~1 000 nm)。

表2 遗传算法提取的主要特征波段统计

2.4 基于不同机器学习模型的SMC估算结果对比

基于GA选择的特征小波系数,构建PLSR,SVM,ANN,RF和XGBoost模型,并与基于全波段小波系数的估算模型精度进行对比,留一法交叉验证结果如表3所示。结果表明,使用全波段小波系数构建模型的精度²在0.20~0.44之间,而使用特征小波系数的²为0.25~0.82。基于全波段构建的SMC估算模型中,基于PLSR和ANN模型的估算精度决定系数2为0.20~0.42。SVM和XGBoost在db4、fk14和haar小波基函数下有着相对较好表现。RF则在db4和haar小波基函数上相比其他小波基函数精度明显更好且精度高于其他机器学习模型。但基于全波段小波系数的估算结果整体较差。以经过GA算法筛选后得到的特征波段所对应的小波系数作为机器学习模型的输入变量构建的模型精度有明显提高,PLSR和ANN模型的2均在0.49及以上,基于db4小波基函数的2分别达到0.82和0.79,MSE分别达到2.28和2.54 g/kg。SVM、RF和XGBoost模型估算精度整体也明显提高且更加平稳。SVM和RF基于db4小波基函数的2均达到0.72和0.76,MSE分别达到2.82和2.62 g/kg。相较于全波段的PLSR、SVM和ANN估算模型基于coif4小波基函数的2提升最为明显,RF和XGBoost模型下的coif4小波基函数也有着明显的精度提升,提升幅度分别仅次于fk14和rbio3.9。PLSR、SVM、ANN、RF和XGBoost分别提高了265.61%、131.39%、275.99%、40.62%和73.33%。其他小波系数通过GA筛选后精度均有所提高。由此可见,GA能够在模型参与变量大幅减少的情况下,极大程度地提高模型精度。

表3 基于全波段和特征波段小波系数构建的SMC不同模型估算精度

注:PLSR、SVM、ANN、RF、XGBoost分别代表偏最小二乘回归算法、支持向量机算法、人工神经网络算法、随机森林算法、极端梯度提升算法。2是决定系数;MSE是均方根误差;下同。

Note: PLSR, SVM, ANN、RF、XGBoost represent partial least squares regression, support vector machine, artificial neural network, random forest, extreme gradient boosting.2is coefficient of determination;MSEis root mean square error; Same as below.

在使用GA筛选特征小波系数的SMC模型中,ANN在大多数小波基函数均有较好的估算精度,其他4种模型虽在部分小波基函数(例如db4)上有着较好的精度,但整体呈现较大的波动。5种模型均在db4小波基函数下具有最高的估算精度,而rbio3.9和bior4.4估算精度则相对较低。基于db4的PLSR和ANN模型的散点更接近于1∶1线,2分别为0.82和0.79,MSE分别为2.28和2.14 g/kg(图5)。

使用PLSR和ANN的最优模型进行SMC空间制图,结果表明(图6和图7),2种精度较高的模型估算SMC的空间分布整体一致。ANN模型估算的SMC结果离散程度较小,大多集中分布在30~40 g/kg,最大值为40.60 g/kg,最小值为10.70 g/kg。PLSR则分布离散程度较高,SMC最大值为52.39 g/kg,最小值为4.10 g/kg。对2种最优模型的估算结果与实测值进行绝对误差计算如图6所示,可见在整个研究区域内2种最优模型的SMC估算值与实测值偏差普遍存在,但大部分绝对误差均在3.00 g/kg以内,大多数绝对误差较大的区域集中在研究范围东部及北部土壤含水率较高的区域。对于ANN模型的估算结果,在中部部分含水率较低区域也存在偏差值较大的情况。对2种最优模型的估算结果与实测值进行相对误差计算如图7所示,可见2种模型相对误差分布基本一致,均在含水率较高区域存在较大相对误差。PLSR模型相对误差的离散程度明显较大,2种模型的相对误差大多均在10.0%以内。

图5 基于最优模型估算SMC的散点图

a. PLSR (db4)b. ANN (db4)

a. PLSR (db4)b. ANN (db4)

3 讨 论

当前针对SMC定量估算的研究通常是基于裸土反射率光谱进行[33],但在农作物生长的关键阶段,土壤被作物覆盖,无法直接获取土壤反射率。因此,本研究尝试基于小麦冠层高光谱影像构建SMC监测模型,以期实现农田SMC监测。多种研究表明植被冠层的不同状态及其光谱特征能够直接反映SMC程度,为基于小麦冠层光谱监测SMC提供了基础。狄艳等[34]认为SMC与植被冠层温度有显著关联性,冠层温度的变化直接对植被冠层的光谱曲线产生影响。DENNISON等[35]的研究表明,当SMC充足时,植被冠层反射率中红边信息明显,短红外波段随着水分含量增加而反射率降低,而SMC缺乏时,由于叶片细胞的衰老导致冠层反射率红边蓝移、短红外波段的反射率显著下降。另外,本研究认为基于小麦冠层光谱的SMC反演能够更加直接反映农作物生长状况与土壤环境协同情况,有助于掌握农作物生长状态,调整土壤环境。

小波变换作为现阶段高光谱数据处理的有效手段,已应用于大量研究并取得了较好的精度结果[36]。部分研究在进行小波基函数及分解尺度的选择时利用大量且复杂的优化计算方法[37],或直接利用前人研究的经验结果。PENG等[38]在土壤含水率反演中选用了13种小波基函数并基于6个不同的分解尺度生成78组数据,再对每组数据进行小波能力系数计算。SINGH等[39]根据先前研究中的经验选用了Mexican hat(mexh)、Daubechies(db2)和Biorthogonal(bior1.3)3种小波基函数进行大豆叶片色素的测算。相比之下,本研究利用相关性分析方法进行小波基函数和分解尺度的选取,在确保估算精度的同时避免繁琐复杂的优化计算试验。

本研究结果显示基于db4小波基函数构建的模型估算精度最佳,基于coif4、fk14、haar的估算模型也拥有较好表现。可能的原因是上述小波基函数均为正交小波基函数,在保留重要特征信息的同时,能够较好地处理噪声。同样地,使用小波变换对光谱进行处理,PENG等[38]也发现选择不同的小波基函数对SMC估算模型精度具有较大影响,其中 db4小波基函数效果最好。而由于bior4.4和rbio3.9双正交特性可能在一定程度上对光谱信息进行了过度压缩[40],因此,在本研究中相比较其他小波基函数,使用bior4.4和rbio3.9构建的模型估算SMC精度相对较差。以上表明,小波基函数的选择能够直接影响SMC模型的定量估测效果。

遗传算法能够搜索最佳特征波段以避免因波段选择不当而导致的不稳定风险。KHELIL等[41]表明基于GA建立的小波滤波器进行风速预测模型,能够优化CWT与机器学习相结合的问题。本研究结果显示,采用GA筛选特征小波系数结合不同机器学习模型均能有效提高SMC模型精度。这一结论与陈红艳等[42]的研究结果一致,他们结合小波变换和GA构建土壤碱解氮含量定量估算模型,显著提高了估算精度。此外,本研究表明GA筛选出来的特征信息波段主要在蓝光(420~490 nm)、红光(680~780 nm)以及近红外波段(890~1 000 nm),在植被红边波段(690~760 nm)尤为集中,以上波段与受到SMC影响的小麦叶片光谱特征波段吻合[15]。因此,本研究认为GA算法能够有效选择光谱特征,减少建模所变量数目,并去除高光谱数据中常存在的冗余信息,提高模型优化效率。

尽管机器学习在土壤学领域已被广泛应用,但对于SMC估算建模及空间制图方面的研究却很少[43]。因此,本研究利用5种机器学习算法完成SMC估算模型并进行评估。结果显示,最优PLSR模型精度2为0.82明显优于其他4种机器学习模型,且均能够实现较为准确地SMC估算和制图。同样地,HASSAN-ESFAHANI等[44]结合植被指数和ANN估算SMC精度2为0.77,表明利用机器学习算法建立SMC估算模型是可行的。de OLIVEIRA等[45]比较RF、SVM、ANN以及k最邻近算法4种机器学习模型对大西洋森林的SMC估算精度,其中ANN表现优于SVM,与本研究结果一致。但RF和XGBoost在本研究中的表现却没有明显优于ANN。以往研究表明[46],由于ANN和SVM具有很强的适应能力,可以通过学习到的复杂函数来拟合非线性关系,而RF和XGBoost算法则相对简单,难以捕捉复杂的非线性关系。因此,ANN在处理具有复杂线性关系的数据时,表现往往优于RF和XGBoost。在对基于PLSR和ANN最优模型所得SMC估算空间分布结果进行进一步分析时,ANN对于实测值较高或较低的样本点相比PLSR更加敏感。另外,ANN、RF和XGBoost回归建模在大样本时有优势[20],而本研究的样本点较少,可能也在一定程度导致以上模型结果相比PLSR精度略差。但在使用不同小波基函数时,ANN估算精度较为稳定,说明ANN能够适用于对经过GA降维后的小波系数进行SMC反演。同时,数据的维度特征较高时会导致RF和XGBoost容易出现过拟合问题,针对此问题,本研究在利用GA完成高光谱数据降维后,不同模型精度均有大幅度提升。

由于植被品种、生育期以及土壤营养状况等不同因素对植被光谱均有不同程度的影响,利用遥感手段完成基于植被冠层光谱的农田SMC估算尚未建立统一的研究范式。由于天气和手段等原因的限制,本研究无法获得多周期、多物侯的影像数据,因此所建立的SMC估算模型的泛化能力需要进一步验证。后续的研究应在此基础上建立大样本植被光谱数据库,深入探索植被冠层光谱与SMC之间的内在联系。

4 结 论

本研究无人机(unmanned aerial vehicle,UAV)遥感平台获取高空间/光谱分辨率的影像数据结合连续小波变换(continuous wavelet transform,CWT)和遗传算法(genetic algorithm,GA),基于农作物冠层高光谱光谱数据对农田土壤含水率(soil moisture content,SMC)进行反演,结论如下:

1)本研究考虑了不同的小波基函数对SMC估算精度的影响,选取7种小波基函数从9个分解尺度进行相关性对比,并有效选择最优小波基函数(db4)和分解尺度(9)。并对小波系数进行了GA特征波段选取,进一步减少数据的冗余性,提高模型精度。

2)基于GA选取的特征小波系数使用机器学习模型对整个田块SMC进行建模估算,所有机器学习模型结果精度均有提升,其中估算精度最佳模型为最小二乘回归,2为0.82。支持向量机、人工神经网络(以及随机森林也表现出了较好的精度,2分别为0.79、0.72和0.76。结果表明无人机获取得到的高光谱数据,进行CWT和GA特征提取后,结合机器学习能够获得理想的SMC的估算精度,制图效果较好。本研究的结果能够为中国干旱区农业用水规划提供有效的技术支撑及决策辅助。

[1] GILLIES R R, KUSTAS W P, HUMES K S. A verification of the' triangle' method for obtaining surface soil water content and energy fluxes from remote measurements of the normalized difference vegetation index (NDVI) and surface e[J]. International journal of remote sensing, 1997, 18(15): 3145-3166.

[2] 操信春,刘喆,吴梦洋,等. 水足迹分析中国耕地水资源短缺时空格局及驱动机制[J]. 农业工程学报,2019,35(18):94-100. CAO Xinchun, LIU Zhe, WU Mengyang, et al. Temporal-spatial distribution and driving mechanism of arable land water scarcity index in China from water footprint perspective[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2019, 35(18): 94-100. (in Chinese with English abstract)

[3] SU S L, SINGH D N, BAGHINI M S. A critical review of soil moisture measurement[J]. Measurement, 2014, 54: 92-105.

[4] Yuan J, Wang X, Yan C, et al. Soil moisture retrieval model for remote sensing using reflected hyperspectral information[J]. Remote Sensing, 2019, 11(3): 366.

[5] 王学,刘全明,屈忠义,等. 盐渍化土壤水分微波雷达反演与验证[J]. 农业工程学报,2017,33(11):108-114. WANG Xue, LIU Quanming, QU Zhongyi, et al. Inversion and verification of salinity soil moisture using microwave radar[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2017, 33(11): 108-114. (in Chinese with English abstract)

[6] 李奎,张瑞,段金亮,等. 利用SAR影像与多光谱数据反演广域土壤湿度[J]. 农业工程学报,2020,36(7):134-140. LI Kui, ZHANG Rui, DUAN Jinliang, et al. Wide-area soil moisture retrieval using SAR images and multispectral data[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2020, 36(7): 134-140. (in Chinese with English abstract)

[7] MARTÍNEZ-FERNÁNDEZ J, GONZÁLEZ-ZAMORA A, SÁNCHEZ N, et al. Satellite soil moisture for agricultural drought monitoring: Assessment of the SMOS derived soil water deficit index[J]. Remote Sensing of Environment, 2016, 177: 277-286.

[8] 张超,刘佳佳,苏伟,等. 基于小波包变换的农作物分类无人机遥感影像适宜尺度筛选[J]. 农业工程学报,2016,32(21):95-101. ZHANG Chao, LIU Jiajia, SU Wei, et al. Optimal scale of crop classification using unmanned aerial vehicle remote sensing imagery based on wavelet packet transform[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2016, 32(21): 95-101. (in Chinese with English abstract)

[9] JIN X, LIU S, BARET F, et al. Estimates of plant density of wheat crops at emergence from very low altitude UAV imagery[J]. Remote Sensing of Environment, 2017, 198: 105-114.

[10] RAPAPORT T, HOCHBERG U, SHOSHANY M, et al. Combining leaf physiology, hyperspectral imaging and partial least squares-regression (PLS-R) for grapevine water status assessment[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2015, 109: 88-97.

[11] TUNA S, KORKMAZ Ö, TUNGA B, et al. An efficient feature extraction approach for hyperspectral images using wavelet high dimensional model representation[J]. International Journal of Remote Sensing, Taylor & Francis, 2022, 43(19/20/21/22/23/24): 6899-6920.

[12] ZHOU C, GONG Y, FANG S, et al. Combining spectral and wavelet texture features for UAV remote estimation of rice LAI[J]. Frontiers in Plant Science, 2022, 13: 957870.

[13] 黄林生,刘文静,黄文江,等. 小波分析与支持向量机结合的冬小麦白粉病遥感监测[J]. 农业工程学报,2017,33(14):188-195. HUANG Linsheng, LIU Wenjing, HUANG Wenjiang, et al. Remote sensing monitoring of winter wheat powdery mildew based on wavelet analysis and support vector machine[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2017, 33(14): 188-195. (in Chinese with English abstract)

[14] 郭斌,白昊睿,张波,等. 基于RF和连续小波变换的露天煤矿土壤锌含量高光谱遥感反演[J]. 农业工程学报,2022,38(10):138-147. GUO Bin, BAI Haorui, ZHANG Bo, et al. Inversion of soil zinc contents using hyperspectral remote sensing based on random forest and continuous wavelet transform in an opencast coal mine[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2022, 38(10): 138-147. (in Chinese with English abstract)

[15] 褚小立,袁洪福,陆婉珍. 近红外分析中光谱预处理及波长选择方法进展与应用化学进展[J]. 化学进展,2004,16(4):528-542. CHU Xiaoli, YUAN Hongfu, LU Wanzhen. Progress and application of spectral data pretreatment and wavelength selection methods in NIR analytical technique[J]. Progress in Chemistry, 2004, 16(4): 528-542. (in Chinese with English abstract)

[16] ZHANG J, SUN H, GAO D, et al. Detection of canopy chlorophyll content of corn based on continuous wavelet transform analysis[J]. Remote Sensing, 2020, 12(17): 2741.

[17] 张霞,王一博,孙伟超,等. 基于铁氧化物特征光谱和改进遗传算法反演土壤Pb含量[J]. 农业工程学报,2020,36(16):103-109. ZHANG Xia, WANG Yibo, SUN Weichao, et al. Inversion of Pb content in soil based on iron oxide characteristic spectrum and improved genetic algorithm[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2020, 36(16): 103-109. (in Chinese with English abstract)

[18] LIU D, LIU C, TANG Y, et al. A GA-BP neural network regression model for predicting soil moisture in slope ecological protection[J]. Sustainability, 2022, 14(3): 1386.

[19] NGUYEN T T, NGO H H, GUO W, et al. A low-cost approach for soil moisture prediction using multi-sensor data and machine learning algorithm[J]. Science of the Total Environment, 2022, 833: 155066.

[20] ADAB H, MORBIDELLI R, SALTALIPPI C, et al. Machine learning to estimate surface soil moisture from remote sensing data[J]. Water, 2020, 12(11): 3223.

[21] GRAPS A. An introduction to wavelets[J]. IEEE Computational Science and Engineering, 1995, 2(2): 50-61.

[22] KATOCH S, CHAUHAN S S, KUMAR V. A review on genetic algorithm: Past, present, and future[J]. Multimedia Tools and Applications, 2021, 80(5): 8091-8126.

[23] AXELSSON C, SKIDMORE A K, SCHLERF M, et al. Hyperspectral analysis of mangrove foliar chemistry using PLSR and support vector regression[J]. International Journal of Remote Sensing, 2013, 34(5): 1724-1743.

[24] DRUCKER H, WU D, VAPNIK V N. Support vector machines for spam categorization[J]. IEEE Transactions on Neural Networks JF, 1999, 10(5): 1048-1054.

[25] ZHANG T, HUANG M, WANG Z. Estimation of chlorophyll-a concentration of lakes based on SVM algorithm and Landsat 8 OLI images[J]. Environmental Science and Pollution Research, 2020, 27(13): 14977-14990.

[26] LIEß M, SCHMIDT J, GLASER B. Improving the spatial prediction of soil organic carbon stocks in a complex tropical mountain landscape by methodological specifications in machine learning approaches[J]. Plos One, 2016, 11(4): e0153673.

[27] Shao W, Guan Q, Tan Z, et al. Application of BP - ANN model in evaluation of soil quality in the arid area, northwest China[J]. Soil and Tillage Research, 2021, 208: 104907.

[28] BREIMAN L. Random forests[J]. Machine Learning, 2001, 45: 5-32.

[29] ZHANG Y, SUI B, SHEN H, et al. Mapping stocks of soil total nitrogen using remote sensing data: A comparison of random forest models with different predictors[J]. Computers and Electronics in Agriculture, 2019, 160: 23-30.

[30] CHEN T, GUESTRIN C. Xgboost: A scalable tree boosting system[C]//Proceedings of the 22nd Acm Sigkdd International Conference on Knowledge Discovery and Data Mining. San Francisco: ACM Sigspatial, 2016: 785-794.

[31] WRIGHT S. Correlation and causation[J]. 1921, 20: 557-585.

[32] NEVITT J, HANCOCK G R. Improving the root mean square error of approximation for nonnormal conditions in structural equation modeling[J]. The Journal of Experimental Education, 2000, 68(3): 251-268.

[33] 程琦,叶回春,董祥林,等. 采用探地雷达频谱分析的复垦土壤含水率反演[J]. 农业工程学报,2021,37(6):108-116. CHENG Qi, YE Huichun, DONG Xianglin, et al. Inversion of reclaimed soil moisture based on spectrum analysis of ground penetrating radar[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2021, 37(6): 108-116. (in Chinese with English abstract)

[34] 狄艳,高懋芳,李强,等. 不同灌溉梯度下冬小麦冠层温度与土壤水分关系研究[J]. 中国农业信息,2021,33(2):13-23. DI Yan, GAO Maofang, LI Qiang, et al. Study on the relationship between winter wheat canopy temperature and soil moisture under different irrigation gradients[J]. China Agricultural Information, 2021, 33(2): 13-23. (in Chinese with English abstract)

[35] DENNISON P E, ROBERTS D A. The effects of vegetation phenology on endmember selection and species mapping in southern California chaparral[J]. Remote Sensing of Environment, 2003, 87(2): 295-309.

[36] KOGER C H, BRUCE L M, SHAW D R, et al. Wavelet analysis of hyperspectral reflectance data for detecting pitted morningglory () in soybean ()[J]. Remote Sensing of Environment, 2003, 86(1): 108-119.

[37] Pothisarn C, Klomjit J, Ngaopitakkul A, et al. Comparison of various mother wavelets for fault classification in electrical systems[J]. Applied Sciences, 2020, 10(4): 1203.

[38] PENG J, SHEN H, HE S W, et al. Soil moisture retrieving using hyperspectral data with the application of wavelet analysis[J]. Environmental Earth Sciences, 2013, 69(1): 279-288.

[39] SINGH S K, HOYOS-VILLEGAS V, RAY J D, et al. Quantification of leaf pigments in soybean ((L. ) Merr. ) based on wavelet decomposition of hyperspectral features[J]. Field Crops Research, 2013, 149: 20-32.

[40] 童力,刘翰柔,胡松涛,等. 听觉诱发电位信号分析中小波基函数的确定[J]. 科学技术与工程,2021,21(2):473-479. TONG Li, LIU Hanrou, HU Songtao, et al. Determination of wavelet basis function in auditory evoked potential signal analysis[J]. Science Technology and Engineering, 2021,21(2):473-479. (in Chinese with English abstract)

[41] KHELIL K, BERREZZEK F, BOUADJILA T. GA-based design of optimal discrete wavelet filters for efficient wind speed forecasting[J]. Neural Computing and Applications, 2021, 33(9): 4373-4386.

[42] 陈红艳, 赵庚星, 李希灿, 等. 基于DWT-GA-PLS的土壤碱解氮含量高光谱估测方法[J]. 应用生态学报, 2013, 24(11):3185-3191. CHEN Hongyan, ZHAO Gengxing, LI Xican, et al. Hyper spectral estimation method for soil alkali hydrolysable nitrogen content based on discrete wavelet transform and genetic algorithm in combining with partial least squares (DWT-GA-PLS) [J]. Chinese Journal of Applied Ecology, 2013, 24(11): 3185-3191. (in Chinese with English abstract)

[43] PADARIAN J, MINASNY B, MCBRATNEY A B. Machine learning and soil sciences: A review aided by machine learning tools[J]. Soil, 2020, 6(1): 35-52.

[44] HASSAN-ESFAHANI L, TORRES-RUA A, JENSEN A, et al. Assessment of surface soil moisture using high-resolution multi-spectral imagery and artificial neural networks[J]. Remote Sensing, 2015, 7(3): 2627-2646.

[45] de OLIVEIRA V A, RODRIGUES A F, MORAIS M A V, et al. Spatiotemporal modelling of soil moisture in an atlantic forest through machine learning algorithms[J]. European Journal of Soil Science, 2021, 72(5): 1969-1987.

[46] AHMAD S, KALRA A, STEPHEN H. Estimating soil moisture using remote sensing data: A machine learning approach[J]. Advances in Water Resources, 2010, 33(1): 69-80.

Estimating soil moisture contents of farmland using UAV hyperspectral images of wheat canopy

WANG Mengdi1, HE Li2, LIU Qian1, LI Zhijuan3, WANG Ran3, JIA Zhongfu3, WANG Jingzhe4, WU Guofeng1, SHI Tiezhu1※

(1.-,,518060,;2.,,518060,;3.,,010020,; 4.,,518055,)

Accurate monitoring of soil moisture content (SMC) in agricultural fields can greatly contribute to the utilization of water resources and sustainable development. Low SMC can cause the soil to harden during crop growth, which in turn affects the absorption of the crops' water and nutrients. In this study, the field-scale wheat canopy spectra were gathered to quantitatively estimate and map the SMC using an unmanned aerial vehicle (UAV) hyperspectral sensor. The study area was selected as Fukang City, Xinjiang Uygur Autonomous Region, China (87°51'15′′E, 44°21'14′′N) at the transition zone between a desert and an oasis. The soil samples were also collected concurrently with the hyperspectral data. 70 sampling units of 0.5 m×0.5 m were evenly selected in the target field, where the GPS locations were recorded. The wheat canopy spectra were smoothed using the savitzky-golay (SG). The spectral data were then transformed using the continuous wavelet transform (CWT) with seven different wavelet functions (bior4.4, coif4, db4, fk14, haar, rbio3.9, and sym 4). The wavelet coefficients were extracted by the genetic algorithm (GA), and finally combined with partial least squares (PLSR), Support Vector Machine (SVM), artificial neural network (ANN), radom forest (RF), and extreme gradient boosting (XGBoost) to predict the SMC. A neural Network was used to predict the SMC, and then map the SMC at a spatial scale. The results demonstrate that the accuracy of SMC estimation greatly increased using the GA-based feature band selection. The determination coefficient (2) of the feature band was 0.35-0.82 with the wavelet coefficients, while the2of the complete wavelet band ranged from 0.20 to 0.44. Furthermore, the2of SMC reached 0.82, 0.72, 0.79, 0.76, and 0.46, respectively, using PLSR, SVM, ANN, RF, and XGBoost models. The best estimation accuracy was achieved in the feature band with the db4 wavelet coefficients, compared with the rest wavelet functions. The predicted and measured values were remarkably similar. The GA significantly reduced the number of variables to maximize the feature factors in the remote sensing bands. The majority of the feature bands were retained to remove the redundant bands that frequently presented in the hyperspectral data. The more stable ANN model was achieved in the small number of sample points on the big sample, even though the accuracy was lower than that of PLSR. Consequently, the perfect estimation accuracy of SMC with excellent mapping was obtained in the continuous wavelet transform and GA feature extraction of the hyperspectral data acquired by the UAV. The improved inversion can be expected to achieve accurate SMC prediction using crop growth period spectra at the field scale. The finding can provide a strong reference for high-precision SMC monitoring using remote sensing.

soil moisture; unmanned aerial vehicle; hyperspectral images; genetic algorithm; continuous wavelet transform

10.11975/j.issn.1002-6819.202207170

S159.3;S252

A

1002-6819(2023)-06-0120-10

王梦迪,何莉,刘潜,等. 基于小麦冠层无人机高光谱影像的农田土壤含水率估算[J]. 农业工程学报,2023,39(6):120-129.doi:10.11975/j.issn.1002-6819.202207170 http://www.tcsae.org

Wang Mengdi, He Li, Liu Qian, et al. Estimating soil moisture contents of farmland using UAV hyperspectral images of wheat canopy[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2023, 39(6): 120-129. (in Chinese with English abstract) doi:10.11975/j.issn.1002-6819.202207170 http://www.tcsae.org

2022-07-18

2023-01-05

深圳市科创委基础研究(重点项目)(No.20210324120209027);广东省教育厅重点领域专项项目(2020ZDZX1052)

王梦迪,研究方向为农业定量遥感。Email:wangmengdi2020@email.szu.edu.cn

石铁柱,博士,特聘研究员,研究方向为农业定量遥感。Email:tiezhushi@szu.edu.cn

猜你喜欢
小波基冠层波段
基于低空遥感的果树冠层信息提取方法研究
基于激光雷达的树形靶标冠层叶面积探测模型研究
安徽省淮南森林冠层辐射传输过程的特征
利用小波变换分析电能质量扰动问题中的电压骤升影响
小波阈值图像去噪中小波基选择
施氮水平对冬小麦冠层氨挥发的影响
小波非参数回归分析方法的实现及比较研究*
M87的多波段辐射过程及其能谱拟合
日常维护对L 波段雷达的重要性
基于SPOT影像的最佳波段组合选取研究