王金鑫,姚 静,李聪玲,陈晓丽
(1.郑州大学地球科学与技术学院,郑州450000;2.郑州大学水利科学与工程学院,郑州450000)
土壤墒情在农业生产活动中起着十分重要的作用[1],控制地表蒸发,影响作物的生长发育,也是旱情监测、农作物估产的重要参数[2]。目前在大区域土壤墒情的遥感监测中,综合多源遥感的方法已成为重要发展趋势,尤以微波遥感和光学遥感的结合应用较多[3,4]。光学遥感方法利用土壤和植被反射光谱信息,通过光谱反射率构建植被指数实现土壤水分的快速估测。被动微波遥感法主要通过建立土壤介电常数与土壤微波辐射的关系,利用介电常数模型获得土壤含水量[5];主动微波遥感法通过建立微波的后向散射系数与土壤水分的关系获得土壤含水量[6]。土壤粗糙度是制约微波遥感土壤水分精度的最主要因素,如何降低地表粗糙度对土壤水分反演的影响一直是该领域的研究重点[7]。除野外实测外,基于微波遥感机理建立的经验半经验模型是解决该问题的传统方法。如主动微波遥感适用于裸土的Dobson[8]、Oh[9]、Shi[10]等模型,适用于植被覆盖的MIMICS 模型[11]、水云模型[12]、Karam[13]等;被动遥感适用于裸土的Q/H模型[14]、H/P模型[15]、Q/P 模型[16],适用于植被覆盖的“ω-τ”模型[17]等。上述模型要么参数多、模型复杂,要么需要大量的实测先验信息,参数要求苛刻,适用性受限[18]。为了提高模型的泛化能力,国内外学者将神经网络、遗传算法等智能算法引入微波遥感协调反演领域,并展开研究[19-21],Paloscia 等[22]和Hajj 等[23]利用模拟的全极化SAR 数据,结合归一化植被指数(Normalized Difference Vegetation Index,NDVI)训练了多个ANN,对比分析了各单极化SAR 数据反演土壤湿度的效果。余凡等[24]提出了基于神经网络的主被动遥感数据协同反演土壤水分算法。关韵桐等[25]提出用遗传算法优化后的神经网络辅以多源遥感数据的方法进行地表土壤水分反演。Alexakis 等[26]将Sentinel-1 SAR 的后向散射系数、入射角信息,与Landsat 8 数据的NDVI、热红外温度TIR信息作为人工神经网络模型的输入参数,输出为土壤水分含量,并将反演得到的土壤水分含量用于后续的水文模型。上述方法均取得了良好的效果。智能算法的引入,为遥感土壤墒情反演提供了新的思路,提高了反演的精度,是时空大数据时代遥感墒情监测的重要发展趋势。但涉及的参数、数据多,有一定的样本依赖性和不确定性。
综上所述,利用微波和光学遥感信息融合反演土壤墒情的方法是适用的,且智能算法的应用进一步提高了墒情监测的精度。但大区域土壤粗糙度的估算无论是外业实测内插,还是基于模型反演,工作量大,参数多,不确定性大,依然是制约微波遥感法发展的一个瓶颈。本研究旨在探索一种简单快捷的去除大区域土壤粗糙度影响的方法,提出粗糙度不变假设,即假设麦田的土壤粗糙度在小麦生长期内是不变的,将高植被覆盖期和裸土期的后向散射系数求差,即可消除其对后向散射系数的影响。以河南省豫中东部为研究区域,以MODIS、Sentinel-1A 遥感影像和土壤含水量实测数据为数据源,将NDVI、NDWI(Normalized Difference Water Index,归一化水指数)、后向散射系数及其差值作为输入值,土壤水分实测数据作为输出值参与BP 网络模型的构建,最终利用遗传算法提高神经网络的稳定性并对反演结果进行精度验证,取得了预期的效果。
研究区域坐落于河南省黄淮海平原中东部,地理坐标介于东经112°51′~116°35′,北纬32°08′~36°21′,属暖温带大陆性季风气候,四季分明,雨量充沛,冬季温差较大,降水夏秋多,冬季较少。该地区整体地势平坦、土壤肥沃,多为黏土、壤土和沙土,适宜各类农作物种植,是华北平原的粮食主产区之一。研究区地理位置及36 个土壤水分实测站点分布图如图1所示。
图1 研究区域位置示意图
豫中东部的冬小麦生长周期一般为头年10月至次年6月,其中冬小麦的播种时间为当年的10月上旬左右,为裸土时期;10月中下旬至次年3月中旬为低植被覆盖时期;3月下旬至6月上旬为高植被覆盖时期。
采用从河南省气象局调研获取的研究区内36 个土壤墒情测站点2015年10月至2016年6月每日0~10 cm、0~20 cm 土壤含水量实测数据,用于水分反演模型的构建和验证。
光学遥感影像从NASA 网站下载,MOD13A2 是由1KM 分辨率的植被指数产品16 d 合成。MODIS 数据处理过程:利用MRT 从MOD13A2 提取出归一化植被指数产品NDVI、中红外波段反射率MIR和近红外波段反射率NIR。通过MRT 对以上产品进行投影转换后,利用IDL批量裁剪出研究区并根据测站点经纬度坐标提取出影像的DN值,依次读取各产品的头文件以获取定标参数,最后辐射定标得NDVI、MIR、NIR值。本研究共获取了7 景MOD13A2 影像,时间分别为2015年10月18日,2016年3月21日、4月6日、4月22日、5月8日、5月24日和6月9日。雷达遥感影像从欧空局(https://scihub.copernicus.eu/)获取,包括2015年10月研究区裸土时期和2016年3-6月植被覆盖时期的7 幅影像,影像时间与MOD13A2 影像一致。本研究选用ENVI5.3 来对Sentinel-1A 数据进行预处理,再利用IDL根据测站点的经纬度坐标提取各个站点的后向散射系数。对得到的结果去噪声处理后,做投影转换和坐标系定义,将该影像设置为和MODIS 影像相同的投影坐标系,即Albers投影、WGS84坐标系。
主动微波遥感通过建立微波的后向散射系数与土壤水分的关系获得土壤含水量[27]。雷达后向散射系数(σ)主要受到土壤介电常数(主要取决于土壤水分)、地表粗糙度和植被覆盖等因素的影响[28]。实际应用中,大面积准确获取地表粗糙度十分困难。假定地表粗糙度在一定时间内保持不变(或者变化可以忽略),那么雷达后向散射系数的变化就只与植被覆盖和土壤介电常数(土壤水分)的变化有关。将生长后期(植被较茂盛)与裸土(播种)时期的后向散射系数作差,即可消除地表粗糙度对后向散射系数的影响;其差值(Δσ)主要反映土壤水分与植被覆盖的影响,它与土壤水分的相关关系应该更好。
豫中东部的冬小麦在3月下旬-6月中旬处于高植被覆盖时期。为验证上述假设的正确性,本研究通过提取Sentinel-1A 影像(2016年4月22日)的后向散射系数,再对后向散射系数和该日采样点土壤含水量值进行归一化处理后进行相关分析,结果如图2 所示。同理,将2016年4月22日与2015年10月18日后向散射系数的差值与4月22日样本点土壤含水量(0~10 cm)之间做相关分析,结果如图3所示。
图2 VV、VH极化对土壤含水量的相关分析
图3 ΔVV、ΔVH极化对土壤含水量的相关分析
可以看出,对中原地区土壤墒情而言,VV 极化方式优于VH 极化方式;但两种极化方式的Δσ与土壤含水量的拟合优度比σ都提高了0.2 以上,其对土壤含水量的敏感性更高。验证了上述假设的正确性与可行性。
植物的生长过程是一个主动适应环境的、非线性的复杂过程。其生长状况受多种生态环境因素的综合影响,很难用一个确定的数学函数来表达。神经网络模型在土壤墒情分析和预测中具有广泛的适应性[29],遗传算法作为仿生智能算法为描述复杂生命现象提供了得力工具[30]。根据数据实际情况,本文选择后向散射系数(包括上述差值)和相关植被指数[包括NDVI和NDWI(与NDVI相比,它能更有效地提取植被冠层的水分含量;在植被冠层受水分胁迫时,该指数能够及时响应[31])]等因子,通过神经网络建立它们与土壤含水量W的关系,并通过遗传算法对网络进行优化,从而实现土壤墒情的反演。
将NDVI、NDWI、σVV、σVH作为输入数据,土壤含水量W作为输出数据,建立BPσ神经网络模型;同理,将NDVI、NDWI、VV 极化的后向散射系数差ΔσVV、VH 极化的后向散射系数差ΔσVH作为输入数据,W作为输出数据,利用Matlab 建立BPΔσ神经网络模型。根据实验,将两个模型中单隐层节点数设置为8,“学习速率”设置为0.1,其他训练参数采用系统默认值。从2016年3-6月共252 组数据中,选取231 组数据作为训练样本,余下的21 组数据作为检验样本,验证模型的准确性。
尽管BP 神经网络具有很强的非线性映射能力,但极易出现网络拓扑结构不稳定、陷入局部极小值等问题。遗传算法具有较高的全局搜索能力,更容易获取全局最优解[32]。因此,可通过遗传算法优化BP 神经网络的权值和阈值,提前锁定全局最优[33,34],在加快网络的收敛速度的同时还能提高预测精度。改进后的神经网络模型称为GA-BP 神经网络[35]。算法原理如下:
(1)个体编码及种群的初始化:个体是指BP 神经网络中所有的权值和阈值。本文采用实数编码的方式。编码长度为:
式中:n为输入层节点数;m为隐含层节点数;l为输出层节点数。研究选择初始种群规模为50。
(2)适应度函数的设定:
式中:SE为BP神经网络预测值与实际值间误差的平方和。BP神经网络的预测误差越小,其适应度函数越大,适应性就越强。
(3)个体的选择:按照概率进行选择,公式如下:
式中:fi为个体i的适应度值;k为种群的个体数。
(4)交叉操作和变异操作:最优的个体直接复制到下一代,不参与交叉和变异操作。其他任意两个个体通过交叉概率pc和变异概率pm进行交叉和变异操作,得到两个新的个体。通过实验,本文采用pc=0.37,pm=0.06,进化代数为120。
(5)循环操作:循环上述(2)~(4)3 个步骤,直到训练目标满足设置要求或迭代次数达到设定值为止。
基于遗传算法优化的BP神经网络流程如图4所示。
图4 遗传算法优化BP神经网络流程
冬小麦植被茂盛时期,将训练好的3种模型应用到整个研究区域,0~10 cm 土壤墒情实测值与预测值对比如表1、图5和图6所示。
表1 3种神经网络模型0~10cm土壤墒情预测结果与实测值分析 %
图5 3种神经网络模型0~10 cm土壤墒情预测值与实测值对比图
由上可明显看出,在土壤深度为0~10 cm 时,BPΔσ网络模型预测精度优于BPσ网络模型,预测的土壤含水量与实测值的相对误差主要集中在10%~30%,预测结果较为可靠。优化BPΔσ神经网络后的预测结果的相对误差集中在10%~15%之间,故经遗传算法优化后的GA-BPΔσ神经网络预测的相对误差更小,预测的精度更高。由图6 可以看出,第15 号站点是一个孤立点,每种方法在该点的预测精度都比较差,所以,该点的土壤水分实测值包含较大的粗差,应该是错误的(土壤水分是根据传感器自动采集)。上述结果表明:在河南省中东部地区可行,地表粗糙度不变假设成立。河南省中东部地区地势平坦,鲜少出现沙尘暴及泥石流等自然灾害,地表粗糙度变化主要受风沙和雨雪影响,然而在植被覆盖的情况下风沙和雨雪对地表的侵蚀作用不显著,故可认为在冬小麦主要生长周期内研究区地表粗糙度不变。
图6 3种神经网络模型0~10 cm土壤墒情预测相对误差对比图
为分析不同深度墒情对遥感监测的响应,并进一步验证粗糙度不变假设,本文将0~20cm 土壤墒情实测值与预测值对比如表2、图7和图8所示。
表2 3种神经网络模型0~20 cm土壤墒情预测结果与实测值分析 %
图7 3种模型墒情预测值与实测值对比图(0~20 cm)
图8 3种神经网络模型0~20 cm土壤墒情预测相对误差对比图
不同土壤深度下,3 种不同网络模型的均方根误差RMSE值如表3所示。
表3 不同深度3种神经网络模型土壤墒情反演结果精度对比
从以上图表可以得出:与0~10 cm 深度土壤墒情反演结果类似,在0~20 cm 深度,GA-BPΔσ神经网络预测的相对误差多集中在10%以下,预测精度最高,BPΔσ和BPσ的测相对误差和精度依次递减,再次印证了粗糙度不变假设的正确性与可行性;相同模型在不同土壤深度的墒情反演精度均为0~20 cm较高,其原因应该是一般农作物根系分布的土壤深度主要集中在地表下20 cm 左右[36],根部墒情是影响农作物生长状态的重要因子,对主要反映地表覆盖状况的遥感监测响应更为敏感。
针对土壤墒情遥感监测精度优化目标,本文以河南省中东部的冬小麦为研究对象,利用2016年冬小麦植被茂盛时期MODIS 和Sentinel-1A 遥感数据,结合实测的土壤水分数据,利用BP 神经网络实现土壤含水量的监测。并通过遗传算法对网络进行优化,以提高神经网络模型预测土壤含水量结果的准确性。主要研究结论如下。
(1)在河南省中东部平原地区,集成多源遥感和智能算法的冬小麦土壤墒情监测方法精度较高,尤其是用遗传算法优化BPΔσ神经网络的GA-BPΔσ方法是一种可行的精准农业监测手段。
(2)黄淮海平原地区,地势平坦,地质灾害绝少发生。在冬小麦整个生育期内,将地表粗糙度视为一个常数,通过冬小麦茂盛期的后向散射系数与裸土时期的求差,可有效消除地表粗糙度对后向散射系数的影响,从而提高墒情遥感监测的精度。本文研究假设具有一定的正确性和可行性。
(3)对比0~10 cm 和0~20 cm 不同深度的3 种BP 神经网络模型,均为0~20 cm 深度范围预测值与实测值相对误差较小,预测精度较高,证明了根部墒情对遥感监测更为敏感。