姚志华,陈俊英※,张智韬,谭丞轩,魏广飞,王新涛
(1.西北农林科技大学水利与建筑工程学院,旱区农业水土工程教育部重点实验室,杨凌712100;2.西北农林科技大学中国旱区节水农业研究院,杨凌712100)
快速准确地获取盐渍土的盐分信息,对于土壤盐渍化的监测和防治,实现中国农业的可持续发展具有重要的意义[1]。遥感技术具有响应速度快、成本低以及覆盖面积大等优势,已逐渐成为土壤盐渍化监测领域的一种有效手段[2-5]。早期的研究发现,在电磁波谱的可见光和近红外区,盐碱土比普通土反射更多的入射能,具有明显的光谱特征[6]。Farifteh 等[7]通过建立土壤性质与土壤光谱之间的关系,发现不同盐度等级的土壤样品的光谱反射率存在着显著的差异。Srivastava等[8]则利用印度恒河平原地区的卫星高光谱数据,探究了适宜监测该区域土壤盐分类型的光谱反射率的波段范围。卢霞[9]以典型滨海盐土为研究对象,分析了盐土的光谱特征和盐分含量的分布特点。张晓光等[10]则通过建立土壤反射光谱与土壤盐分含量之间的偏最小二乘回归模型,探讨了利用反射光谱预测土壤盐分含量的可行性。Allbed 等[11]针对沙特阿拉伯东部地区的土壤盐化问题,利用IKONOS 遥感影像提取了包含植被指数和土壤盐度指数的13 个光谱指数,探究了这些指标对于土壤盐度的预测能力。姚远等[12]通过光谱变换和波段筛选,最终构建了5 种盐分指数并以此建立了区域土壤盐渍化监测模型,达到了良好的监测效果。郭鹏等[13]以山东省垦利县为研究区,通过构建任意波段的光谱指数进而筛选出敏感光谱指数的方法,构建了土壤盐分监测的随机森林(random forest,RF)模型,以实现对该区域土壤盐分的定量光谱估测。
虽然上述研究已经取得了许多成果,但这些研究大部分是以卫星遥感数据为基础,卫星遥感技术也是目前为止大区域土壤盐渍化监测的一种常用手段。由于农田覆膜技术可以改变土壤的水、气、热、盐状况,促进作物的生长,在河套灌区农业生产中有着广泛的应用[14]。此外,各种遥感仪器所接收的地表目标反射、发射的电磁辐射能与地表目标的表面温度、湿度以及粗糙度等性质有着很大的联系[15],而地膜覆盖的土壤表面与裸土区域有着不同的光谱特性,因此覆膜会对大区域土壤盐渍化的准确监测造成一定影响,是一个不可忽略的因素。由于卫星遥感的分辨率相对较低,无法剔除土壤表层覆膜的影响,因此会降低遥感监测的精度。而无人机遥感的时空分辨率相对较高,在剔除覆膜影响方面有一定的可操作性,但关于这方面的研究还未见报道。
鉴于此,本文利用无人机遥感获取多光谱数据反演农田土壤盐分含量,同时对遥感影像进行去膜处理并结合机器学习算法构建去膜前后的土壤含盐量估算模型,通过对不同模型精度作对比分析,探究覆膜对无人机多光谱遥感反演农田土壤含盐量精度的影响,为利用无人机遥感实施覆膜农田的土壤盐渍化监测提供一定的科学基础。
内蒙古河套灌区位于内蒙古自治区西部,是中国设计灌溉面积最大的灌区,也是重要的粮油作物生产基地之一。研究区位于河套灌区解放闸灌域内的沙壕渠灌区,是典型的黄土高原盐渍土灌区,地理位置介于东经107°05′~107°10′,北纬40°52′~41°00′之间(图1)。该地区地形平缓,平均坡度约为0.02%,土质类型以粉砂质黏壤土为主。气候类型为典型的大陆性干旱-半干旱气候,冬长夏短、干燥多风、昼夜温差较大。年平均气温7.1 ℃,平均相对湿度40%~50%,年均降水量155 mm,年均蒸发量2 000 mm,全年无霜期约130~150 d左右,主要作物包括小麦、玉米、西葫芦和向日葵等。近年来由于长期不合理的灌溉方式加上平缓的地形以及高蒸发量的自然条件,使得该地区约半数以上的土地都出现不同程度的盐渍化,严重影响了农业生产的发展。
图1 研究区位置图Fig.1 Location map of study area
本试验于沙壕渠灌域内选取4 块不同盐分分布的试验地(1、2、3、4 号地)作为采样区,每块试验地的面积约为16 hm2。试验地以农田为主,主要种植作物为葵花。试验于2018年5月和6月分2次进行,这个时期的农田已被覆膜,土壤盐分向表层聚集且地表绿色植被较少,采样时间分别为5 月14 日~18 日、6 月15 日~19 日。根据每块试验地的盐渍化程度和地形地貌特点,综合考虑采样点分布的代表性、均匀性等因素,在每块试验地布置13~14个采样点,采样方法为五点取样法,采样单元为16 m×16 m,采样深度为0~20 cm,最终样本数据为五点取样的均值,其中5 月份获得样本56 个,6 月份53 个,共计获得109 个试验数据。同时采用手持GPS 仪记录相应的位置信息,试验田及采样点位置如图2所示。
图2 试验田及采样点分布示意图Fig.2 Schematic diagram of test field and sampling point distribution
土壤含盐量采用电导仪法测量,首先将获取的土样烘干研磨后过1 mm 筛,之后按照土水比1:5 的比例配置土壤浸提液,静置8 h 后采用电导率仪(DDS-307A,上海佑科仪器公司)获取土壤溶液电导率(EC1:5,dS/m)值,最后通过经验公式换算得到土壤含盐量(SSC,%):SSC=(0.2882EC1:5+0.0183)[16],土壤的盐渍化等级划分以SSC<0.2% 为 非 盐 土,0.2%≤SSC<0.5% 为 轻 度 盐 渍 化,0.5%≤SSC<1.0%为重度盐渍化,SSC≤1.0%为盐土,土壤采样点的具体盐分统计状况如表1所示。
1.3.1 遥感数据的采集
遥感平台为深圳大疆创新科技有限公司生产的经纬M600六旋翼无人机,携带的遥感传感器为美国Tetracam公司生产的Micro-MCA 多光谱相机(简称MCA)。MCA最多可安装6 个通道,对应有6 个镜头,可采集6 种不同波长地物光谱反射信息,6 种波长分别为490(蓝光)、550(绿光)、680(红光)、720(红边)、800 (近红外)和900 (近红外) nm。多光谱图像的采集时间与土样的采集时间一致,无人机的飞行高度为120 m,多光谱相机镜头垂直向下,影像地面分辨率为0.065 m,无人机每次飞行前在试验区域布置校正白板,用于对获取影像的辐射标定。
1.3.2 遥感图像的处理
使用与多光谱相机配套的软件PixelWrench2 对获取的多光谱遥感影像进行提取、配准与合成,最后导出tif 格式的六波段遥感影像。利用Pix 4d软件将获取的试验地单幅遥感影像拼接为全景图。将获取的试验地全景图导入ENVI 5.3 软件中,同时按照取样点标定的GPS信息在图像中导入取样点位置信息。以取样点为中心,在遥感图像上裁剪出200×200(像素)、地面分辨率为13 m×13 m的遥感影像。同时考虑到遥感图像中覆膜对光谱反射率的影响,采用监督分类中的最大似然法首先对裁剪的遥感图像进行地膜和土壤的分类,之后导出只包含土壤层的遥感影像以达到去膜的目的(如图3 所示)。在ENVI 5.3 软件中分别提取出取样点去膜前后的灰度值均值,利用白板的灰度值进一步计算出对应的光谱反射率值。
表1 土壤采样点的盐分统计分析Table 1 Statistical analysis of soil salinity of sampling points
图3 多光谱图像去膜前后对比图Fig.3 Contrast before and after removing film of multispectral image
在裸地或者植被覆盖度极低的土壤中,通过土壤的光谱指数作为间接指标来对盐渍化区域盐分进行评价和作图,已取得良好的效果[17]。而盐度指数作为直接的盐度指标,突出了土壤表面盐壳的光谱反射率,尤其是在电磁波谱的可见光和近红外范围内[18]。因此,根据之前得到的土壤表层不同波段的光谱反射率数据,结合参考文献和经验,本文选取13 种常见的光谱指数(包括11 种盐度指数)作为土壤盐渍化监测模型的备选指标,其计算方法如表2所示。
机器学习算法是随着计算机技术和互联网的快速发展,通过计算机模拟或实现人类的学习行为而使计算机程序能随着经验的积累自动提高性能,最终实现从大数据中提取特征、发现隐含规律的方法[23]。由于盐渍化土壤的光谱信息与土壤参数间的转换函数是复杂的非线性关系,因此有越来越多的学者将机器学习算法应用到土壤盐渍化反演的模型构建上并取得了较好的效果[24]。本文采用支持向量机、反向传播神经网络和极限学习机算法来构建土壤盐分的反演模型。
表2 土壤光谱指数汇总表Table2 Soil spectral index summary
本次试验数据的采集时间为2018 年5 月和6 月,需要分不同的月份进行建模和验证,5 月份可供分析样本数为56 个,6 月份为53 个,总样本数为109 个,随机选取70%的样本作为建模集,30%的样本作为验证集,具体划分情况如表3所示。
表3 建模集和验证集Table 3 Modeling and Verification sets
对于模型的建模和验证精度评估采用以下3 个指标:决定系数R2、均方根误差RMSE 以及相对误差RE。R2越大,RMSE 和RE 越小说明模型效果越好,其计算公式如式(1)~式(3)所示。
式中yi为土壤含盐量实测值,y^i为土壤含盐量预测值,yˉ为土壤含盐量平均值,n为样本数。
将不同数据集中不同波段的光谱反射率与对应的土壤含盐量进行相关性分析,其相关系数的变化如图4示。
图4 光谱反射率与土壤含盐量的相关系数变化图Fig.4 Change chart of correlation coefficient between spectral reflectance and soil salinity
从图5 中可以看出,在波段490、550、680 和800 nm处的光谱反射率与土壤含盐量的相关性较高,均位于0.5以上,其中680 nm 处的相关性最高,而在720 和900 nm处的相关性则相对较低,这与前人的研究基本一致[25]。从图中还可以看出,经过去膜处理的光谱反射率与土壤含盐量的相关性相比未去膜的有所提高,其中5 月份平均提高0.040,6 月份平均提高0.013,总体平均提高0.028。而5 月份去膜处理后的数据在680 nm 波段处的光谱反射率与土壤含盐量的相关系数最为0.770。
根据不同光谱指数与土壤含盐量的相关性分析,得到不同处理的13 个光谱指数与对应的土壤含盐量相关系数,结果如表4所示。
通过分析不同光谱指数与土壤含盐量的相关系数大小,可以得出对应的相关性显著程度。由表4 可以看出,无论是5月、6月还是总体,S3、S4、S5、S6、SI1、SI2、SI3、BI这8 个光谱指数与土壤含盐量均表现出了极显著相关的相关关系,而S1、S2、SI-T、SR、NDSI这5个光谱指数与土壤含盐量的相关性则较低。其中,S3和S5与土壤含盐量的相关系数变化范围在0.4~0.6 左右,因此,本文拟采用与土壤含盐量极显著相关且相关系数r>0.7 的6 种光谱指数即S4、S6、SI1、SI2、SI3、BI 作为最佳光谱指数用于土壤盐分模型的建模验证。
表4 不同光谱指数与土壤含盐量的相关系数Table4 Correlation coefficients between different spectral indices and soil salinity
将不同处理得到的6 波段光谱反射率作为自变量,对应的土壤含盐量作为因变量,分别利用支持向量机、反向神经网络和极限学习机3 种机器学习方法建立基于光谱反射率的土壤盐分估算模型。3种机器学习方法分别使用R 语言软件中的e1071、nnet 和elmNNRcpp 包实现(下同),相关建模及验证结果如表5所示。
从表5 可以看出,3 种机器学习模型中,建模集的决定系数均在0.6 以上,均方根误差均在0.2 以下,均取得了较好的建模效果。而验证集验证效果则相对较差,但验证R2也都达到了0.5 以上,验证均方根误差均在0.25以下,相对误差均在50%以下。同时可以看出,通过去膜处理的数据集建模验证效果要好于原始的数据集,其中基于SVM 回归的5 月份去膜数据达到了最好的建模效果,建模R2和RMSE 分别为0.790 和0.154,基于ELM回归的6 月去膜数据达到了最好的验证效果,验证R2和RMSE分别为0.717和0.171。5月未去膜数据的建模验证效果要好于6月,但通过去膜处理后,6月的数据建模验证效果有明显提升,即6月的去膜效果好于5月份。而就3种机器学习方法而言,ELM的建模与验证效果相对最稳定,建模集和验证集的决定系数最为接近。
表5 光谱反射率与土壤盐分的机器学习模型Table 5 Estimation models for spectral reflectivity and soil salinity by machine learning
将2.2 节筛选得到的6 种光谱指数作为自变量,分别与对应的土壤含盐量建立支持向量机、反向神经网络和极限学习机机器学习模型,结果如表6所示。
由表6可知,基于不同机器学习方法构建的光谱指数与土壤盐分的估算模型中,建模集的决定系数都在0.6以上,RMSE 都在0.25 以下,验证集的决定系数都在0.5 以上,RMSE 都在0.25以下,RE 都在50%以下,通过去膜处理的数据集建模和验证的效果都要优于原始数据。其中,在6 月份,基于ELM 构建的盐分估算模型未去膜前的建模R2和RMSE 分别为0.639 和0.198,验证R2和RMSE 分别为0.617和0.194,通过去膜处理后的建模R2和RMSE分别 为0.663 和0.191,验 证R2和RMSE 分 别 为0.716 和0.169,去膜前后模型精度提升最为明显。而就总体数据而言,基于不同机器学习方法构建的盐分估算模型虽然精度相差不大,但通过去膜处理后的模型精度都有所提升。
表6 光谱指数与土壤盐分的机器学习模型Table 6 Estimation models for spectral index and soil salinity by machine learning
通过对表5 和表6 的综合分析可以发现,3 种机器学习模型对基于光谱反射率和光谱指数来反演土壤盐分均可以达到较好的建模验证效果,且无论是光谱反射率还是光谱指数,通过去膜处理均能使模型的预测效果有所提升。同时,基于光谱指数建立的盐分估算模型的稳定性整体要优于直接采用光谱反射率建立的盐分模型。从表5 可以看出基于光谱反射率建立的盐分模型的建模R2大多分布在0.6~0.7之间,而验证R2则大多分布于0.5~0.6之间,从表6 可以发现,基于光谱指数建立的盐分模型的建模R2大多分布在0.6~0.7之间,验证R2同样大多分布于0.6~0.7之间。
基于光谱反射和光谱指数的3 种机器学习模型的预测值和实测值比较如图5 和图6 所示。从图5 中可以看出,在5 月份,基于光谱反射率的3 种机器学习模型的拟合效果相差不多,拟合曲线几乎重合。而在6 月份用去膜处理后的数据建立的BP 模型和ELM 模型的拟合效果明显要优于其他模型,曲线斜率更加接近于1。基于总体数据建立的3 种机器学习模型的决定系数均大于0.6,表现出了较好的拟合效果。从图6 可以看出,就5 月份和总体的数据而言,基于光谱指数的3 种机器学习模型拟合效果相差不大,拟合回归直线近似于重合分布。而以6 月份的数据建立的预测模型中,通过去膜处理的ELM 模型预测效果最好,拟合方程的决定系数为0.716,未去膜的BP 模型预测效果最差,拟合方程的决定系数为0.611。
图5 基于机器学习的光谱反射率反演土壤含盐量预测值与实测值比较Fig.5 Comparison of measured and predicted SSC by spectral reflectance based on machine learning
图6 基于机器学习的光谱指数反演土壤含盐量预测值与实测值比较Fig.6 Comparison of measured and predicted SSC by spectral index based on machine learning
本文研究发现无论是直接提取得到的光谱反射率,还是进一步构建的光谱指数,均能够与实测的土壤含盐量达到良好相关性,对土壤盐渍化的定量分析有一定的指示作用,这与前人的研究基本一致[16,26-28],同时发现基于光谱反射率进一步构建光谱指数来反演土壤盐分的整体反演效果优于直接使用光谱反射率反演。Triki等[29]在突尼斯东南部利用获取的多光谱遥感数据构建光谱指数反演土壤盐分,发现SI3和S3与土壤盐度的相关性最高,而本研究中S3则不是最优指数,可能与试验区域地理位置及取样方法的不同有关。Allbed 等[30]在利用IKONOS高分辨率图像建立基于光谱反射率的土壤盐分综合反演模型来反演试验区盐分的空间变化时,发现可见光波段中的红波段能更好地表征土壤盐分格局和分布特点,而本研究也发现红光波段与土壤盐分具有较高的相关性。除此之外,通过去膜处理后的数据建立的盐分反演模型整体上相较于原始数据,在模型稳定性及反演效果上均有所提升,印证了在无人机遥感监测领域剔除相应的干扰背景的必要性[31]。而在不同月份数据的对比上,出现了5 月份整体数据建模效果优于6 月份但6 月份的去膜效果好于5月份的现象,分析原因可能5月份试验区只有裸土和地膜,无其他干扰因素,而在6 月份的地膜上已长出部分作物幼苗,使得未去膜地面的光谱反射情况更加复杂,去膜后数据变化幅度更大,去膜效果也就更明显。此外,不少学者在土壤盐渍化遥感监测的研究中均引入机器学习方法来建模验证,并取得了较好的预测效果[24,32],但是在无人机遥感领域的应用则相对较少。因此,本文在建模方法上对机器学习算法的应用不仅是对前人研究方法的肯定,同时也是对相关研究领域的必要补充。
然而,本研究也存在许多不足之处。张同瑞等[33-34]以黄河三角洲为研究区,基于不同光谱参数构建的盐分估算模型精度的相对误差RE 变化范围仅为6.64%~13.64%和18.56%~22.42%。王瑾杰等[35]利用相对误差RE对艾比湖流域土壤剖面电导率的模型精度进行验证,认为当RE 小于30%时,模拟效果较好。而本文研究结果中的建模集和验证集的相对误差RE 多集中于20%~40%,相较于其他人的研究出现了偏大的情况。但是,由于野外试验条件的限制以及土壤盐分分布的复杂性,本研究中在数据采集的过程中难免会出现一些误差。同时,土壤盐分数据采集的面积广、无人机传感器飞行的高度高等因素都会产生一定的随机误差,这些误差都会导致最终构建的模型精度低于传统的小区域或近地试验的精度,因此,本文的相对误差针对本研究而言,尚在合理的范围之内,依然具有一定的代表意义。此外,相较于王飞等[36]和哈学萍等[37]基于光谱指数构建特征空间来反演土壤盐渍化的方式,本试验缺乏对盐渍化的空间分布监测。此外,单一的多光谱遥感形式的监测也会导致信息收集的不完整,有不少学者已经开始尝试使用多种遥感形式来综合进行盐渍化的监测,逐渐成为了今后的研究重点[38-39]。最后,由于研究区温度、气候、土壤水分等自然条件的差异,本试验的试验方法以及研究结论是否适用于其它地区的土壤盐渍化状况还有待进一步探讨。
1)农田覆膜会对无人机多光谱遥感反演土壤盐分产生一定的影响,经过去膜处理后的数据构建的模型反演效果要优于原始的数据,基于光谱反射率进一步构建光谱指数来反演土壤含盐量,也可以提高盐分模型的反演精度。其中最佳模型的建模R2和RMSE 分别为0.695 和0.182,验证R2和RMSE分别为0.717和0.171。
2)基于不同处理的不同月份数据构建的盐分反演模型预测效果不同,基于整体数据构建的模型与各月份数据构建的模型反演效果也有所差异。总体而言5 月份的数据构建的模型反演效果最好,其中最佳模型的建模R2和RMSE 分别为0.792 和0.154,验证R2和RMSE 分别为0.641和0.195。6月份数据去膜处理的效果最为明显,其中最佳模型的建模R2和RMSE 分别为0.663 和0.191,验证R2和RMSE分别为0.716和0.169。
3)比较3 种机器学习方法构建的盐分反演模型精度,发现ELM 模型的反演效果最好,SVM 模型效果次之,BPNN模型反演效果相对较差。但3种模型均可在一定程度上对土壤盐分取得不错的反演效果,表明这3 种机器学习方法在无人机多光谱遥感监测农田土壤含盐量方面均具有一定的适用性。