何泽,李世华,2
1.电子科技大学 资源与环境学院,成都 611731;
2.电子科技大学 长三角研究院(湖州),湖州 313001
水稻生产关系国计民生,是经济社会发展和粮食安全的基础保障,及时准确的监测水稻耕种状况是农业生产管理的重中之重。传统的种植范围划定和长势观测依赖实地调查,时效性和准确性较低。卫星遥感技术具有观测频次高和覆盖范围广的特点,通过数理方法和计算机技术对遥感获取的水稻波谱响应进行分析,可以有效地识别水稻耕作和植株生长状态(姚飞和何隆华,2016)。陆表遥感监测研究中应用最为广泛的光学卫星影像具有数据源多样、波段信息丰富、成像噪声小和解译难度低等优点。然而水稻生长在气候湿热的季节,光学遥感在这一时期往往受云雾气象干扰,尤其在中低纬度地区难以获取高质量的光学影像。以成都平原为例,检索该地区2021 年4 月中旬至9月水稻耕作季常用的Landsat 8和Sentinel-2光学卫星数据,区域云量高于30%的影像占比接近90%,并且在6 月至8 月这一水稻快速生长期几乎没有可用的光学数据。星载合成孔径雷达SAR(Synthetic Aperture Radar)通过主动发射电磁波,记录地表散射回波特征实现目标观测,可以不受天气状况影响持续对地成像,因此成为水稻遥感监测的重要数据源。在过去的三十年(1991 年—2021年),星载SAR 传感器持续升级迭代,成像性能和数据获取手段不断优化,基于SAR 数据的水稻遥感监测研究取得了长足的进步(唐鹏钦 等,2009)。
波段、极化和时空分辨率是SAR 成像的关键指标,很大程度上决定了SAR 数据的应用潜力(Zhao 等,2021)。波段表征雷达发射的电磁波频率,目前常见的有L波段(如PALSAR-2)、C波段(如Sentinel-1、Radarsat-2 和高分三号)和X 波段(如TerraSAR-X 和Cosmo-Skymed)。不同波段的电磁波拥有不同的波长,因而对探测目标的尺寸敏感性不同。C 波段和L 波段电磁波的波长与水稻植株器官(茎杆、叶片和稻穗等)的尺寸接近,对植株生长过程的散射响应最为明显,因此被广泛用于水稻遥感监测(Suga 和Konishi,2008)。极化表征电磁波的电场取向,分为水平极化H(Horizontal)和垂直极化V(Vertical),根据收发信号的配置组合产生同极化(HH 和VV)和交叉极化(HV 和VH)通道。星载SAR 传感器经历了从单极化到全极化成像的发展历程。不同极化信号对地物有不同的电磁作用机制,极化方式的增加使SAR 获取的水稻散射信息更丰富(Yang 等,2012)。时空分辨率表征卫星成像的重访周期和空间精细度,水稻生长迅速且地块狭小,故而需要高时空分辨率SAR 对地观测。受相干成像机理影响,SAR 数据不可避免地存在斑点噪声,时空分辨率的提高可以为噪声抑制提供更多的散射信息参考。
SAR 影像特征参数主要有后向散射系数和各种极化参数,后向散射系数是最基本的SAR 参数,表征地物后向散射强度,与水稻介电和几何特性密切相关。极化参数主要来源于紧缩极化模拟、极化分解(Freeman 和Durden,1998;Cloude 和Pottier,1997),以及其他极化运算,如极化相干和相位差(Lopez-Sanchez 等,2012,2014)。通过相干或协方差矩阵运算可以综合SAR 数据的幅度和相位信息,得到数理意义明确的极化参数,更为清晰地描述水稻散射的能量组成。SAR 干涉测量技术InSAR(Interferometric SAR)通过对不同轨道的SAR 数据进行干涉处理获取地表高程的微小变化,多被用于估算水稻植株高度(Erten 等,2015,2016;Rossi 和Erten,2015;Lopez-Sanchez等,2017)。受数据质量和反演精度的制约,基于SAR 干涉技术的水稻监测应用仍处于实验探索阶段。
目前水稻雷达监测研究主要聚焦种植面积提取、生理参数反演、物候与熟制识别等。种植面积提取研究关注水稻耕作的空间分布,基于水稻与其他地表覆盖类型的后向散射特征时空差异进行SAR 影像分类,经历了从先验阈值决策判别到时空特征机器学习的发展过程。生理参数反演研究关注水稻生育相关参量(如株高、叶面积指数和生物量),基于植株生理参数与后向散射特征的时空关联性进行参量映射,方法主要有经验回归、机器学习、机理建模和数据同化。物候和熟制识别研究关注水稻的生育节律和复种情况,基于水稻后向散射特征的时间变化规律进行生长情况判读,方法主要有时序检测法和机器学习法。
虽然目前水稻遥感监测精度和广度不断提升,但各研究案例中水稻种植情况、SAR 数据属性、算法模型配置、训练和验证样本质量均存在较大差异,导致不同技术思路的实验结果难以横向比较。随着多源数据获取能力的提高和水稻监测对象的多元化,协同多种技术方法的复合监测策略被广泛采用,这种应用趋势虽然可以有效地整合已有研究成果,发挥不同技术手段的优势,但也造成算法模型的发展脉络越来越模糊。为了明晰水稻雷达遥感监测的研究历程、现状与趋势,本文系统梳理了各研究方向的理论基础和技术瓶颈,探讨了SAR 数据用于水稻遥感监测的优缺点和存在的科学问题,对未来的研究重点进行了讨论与总结,以期为相关方向的科研人员提供参考。
获取水稻种植面积是生理参数反演、物候熟制识别和产量预估工作的基础,早期水稻雷达监测应用也主要着力于水稻空间分布信息提取。种植面积提取的本质是SAR 影像中水稻像元识别,根据特定时期水稻与其他地表覆盖类型的后向散射差异进行影像分类。
波谱信息较少和斑点噪声较大是制约SAR 影像分类精度的主要问题,波谱信息较少导致水稻与其他植被的影像差异不显著,斑点噪声较大导致分类结果椒盐噪声明显。从数据处理的角度,可以通过参数合成(如波段运算和极化分解)增加波谱信息,利用滤波技术(空间和时间滤波)平滑噪声。而从技术策略的角度,则可以通过多时相和多源观测来弥补波谱信息不足,利用空间聚类来降低像元异质性。
早期的水稻监测研究一般选择在生长季获取2—5 景影像,通过变化阈值检测法识别水稻,SAR 观测频次增加后,该方法被时序特征识别法取代。随着机器学习技术的发展,监督分类和非监督分类算法被引入SAR 影像分类,其中监督分类算法因其较高的灵活性和精确度成为水稻种植面积提取的主流算法,此后学者分别从算法优化(深度学习)和特征辅助(多源协同)的角度不断提升模型分类精度。非监督分类算法精度较低,但基于空间聚类思想发展出的面向对象分类方法,是抑制分类噪声的有效手段(图1)。
图1 水稻种植面积提取方法发展历程Fig.1 Development of rice planting area identification methods
作为人工培育的作物,水稻有着特殊的耕作生长过程,在SAR 影像中表现出区别于其他地物的散射变化规律,随气候和耕种管理的差异表现出地域性的时序特征。很多研究利用水稻生长的物候先验信息,针对性地获取相应时相的SAR 影像,通过对时序变化特征的统计分析,识别与水稻生长规律相符的像元,实现水稻种植面积的提取。
2.1.1 变化阈值检测
变化阈值检测是最经典的水稻识别方法,通过分析研究区特定时段内水稻像元和其他像元的散射变化差异,确定时变阈值进行决策分类。水稻生育周期可分为移栽期、营养生长期、生殖生长期和成熟期4 个阶段(图2),其中移栽期到营养生长期水稻植株快速生长,是变化阈值监测法最关注的时段。
图2 水稻生长关键物候期(He等,2018)Fig.2 Photographs for the key rice phenological periods(He et al.,2018)
移栽是水稻特有的栽种方式,水稻先在育秧田中完成从种子到秧苗的发育,期间对稻作田进行浇灌蓄水,随后将水稻秧苗从育秧田移栽入稻作田,即为水稻的移栽期。随后水稻将经历快速的植株生长,地面观测特征主要有茎秆数目增加(分蘖)、叶片增多、茎秆直径和长度增加(拔节)、植株孕穗,同时田间积水逐渐减少,这一阶段称为水稻的营养生长期。
从移栽期到营养生长期田间水分和植被覆盖的独特变化趋势造就了这一时期水稻遥感信号的显著特点,在光学遥感信号中表现为水稻像元绿度加深,植被指数快速增大,土壤水分指数逐步降低。对雷达观测而言,移栽期间的稻田主要表现出田间积水的散射特征,水对微波能量的吸收和侧视成像造成的水体镜面散射,导致此时雷达接收的回波信号较为微弱。而营养生长期的水稻散射则由植株和土壤的散射能量组成,植株冠层的体散射、粗糙地表的表面散射、植株—土壤之间的多次散射,共同贡献出较强的回波能量(Yonezawa 等,2012;Corcione 等,2016)。很多学者通过获取水稻生长初始阶段和高峰阶段的雷达数据,识别水稻回波信号由弱到强的快速增长特征(图3),实现了总体精度在80%左右的水稻种植面积提取(Bouvet和Le Toan,2011)。
图3 各物候阶段的水稻SAR散射特征变化(He等,2019)Fig.3 Phenological variation of the SAR polarimetric parameters(He et al.,2019)
变化阈值检测法简单高效,适用于地表覆盖类型简单、地形平坦的稻作区,主要的缺点有:(1)依赖研究区域的水稻物候先验知识,需要确定适合阈值检测的最优前后时相;(2)需要足够数量的水稻及非水稻样本,用于散射变化差异的统计分析;(3)识别精度受成像噪声和田间管理(如移栽日期、灌溉方式和施肥选种等)差异的显著影响。因此,变化阈值检测法多用于足够先验信息支撑下的小样区水稻面积快速提取。
2.1.2 时序特征识别
水稻耕作物候历呈现区域差异和年际差异,农村土地分散经营还导致同一地区不同田块的水稻生长节律并不完全同步。高时间分辨率SAR 数据可以实现水稻复杂物候进程的精细追踪(图4),通过分析水稻散射的时间变化规律,提取散射时序曲线特征,如极值、曲率和拐点日期间隔(Phan等,2018),进行阈值规则判别或相似性度量,从而实现水稻属性识别。其中相似性度量通过测试未知类型曲线与水稻标准曲线的形态匹配度,进行水稻散射模式判别,对经验阈值的依赖较小,是更为自动化的水稻识别方法,典型的算法有波谱相似性算法(Yang 等,2018)和时间动态规划算法(Wang等,2020)。
图4 水稻后向散射密集时序观测(Nguyen等,2016)Fig.4 Time series VV and VH polarized backscatter over rice fields(Nguyen et al.,2016)
时序特征识别法是高时间分辨率SAR 数据应用的有效方法,借助水稻生育周期的高频次雷达观测,避免了分类时相的人工选择,水稻识别精度略高于变化阈值检测法。变化阈值检测法需要水稻物候先验知识,分类效果易受阈值选取的影响。而时序相似性度量方法需要采集大量代表性样本,在构建时序标准特征曲线时需考虑复杂的耕种实际情况,此外逐像元的长时序特征匹配也导致运算量比较高,因此该方法的区域推广还需要开展大量的样本标注、分析和验证工作,同时需要高性能存储与运算平台的支撑。
水稻种植面积提取的本质是图像分类,因此数字图像处理领域的各种机器学习算法也被广泛引入水稻识别研究,并成为目前最常用的面积提取方法,主要包括不需要人工干预的非监督分类方法、人工选择样本的监督分类方法和自动提取数据特征的深度学习方法。
2.2.1 非监督分类
非监督分类不需要地类先验样本,在对SAR影像特征进行聚集统计分析的基础上,自动确定特征参数和决策规则,从而实现水稻像元集群的聚类。目前应用于水稻种植面积提取的非监督分类算法包括K 均值聚类(Gandharum 等,2021)、层次聚类分析(Rudiyanto 等,2019)和迭代自组织数据分析(ISODATA)算法(Karila等,2014)。
非监督分类方法的优点是无须人为干预、参数设置简单和类内同质性高,缺点是水稻识别精度不高(一般在80%左右),且分类结果与地表覆盖类型的对应关系不明确,需对分类结果进行人工分析判读才能确定水稻聚类。SAR 影像“同物异谱—同谱异物”现象和斑点噪声显著,水稻极易与其他地类混淆,进一步增加了类别匹配的难度,因此非监督方法常用于水稻识别前的地物类别粗提取,作为非水稻(如水体和城镇)像元剔除和异质水稻像元归并的属性参考(Rudiyanto 等,2019)。
2.2.2 监督分类
监督分类是在已知样本提供类别先验信息的基础上,筛选SAR 影像特征参数进行分离度测试,通过线性或非线性判别算法实现水稻和非水稻像元的分离,通常有以下几个步骤:(1)分类样本选取。通过实地调查或高分辨率光学影像目视解译获得水稻和非水稻样本点;(2)影像获取与特征选择。根据实验需求获取各类成像模式(如多频段、多极化和多时相)的SAR 数据集,提取并筛选出对水稻特征敏感的SAR 参数(如后向散射系数和极化分解参数);(3)分类器选择与算法参数调整。根据研究区和样本情况选择合适的分类算法,包括阈值决策(Choudhury 和Chakraborty,2006;Choudhury等,2012)、最大似然(Panigrahy等,1997)、人工神经网络(Chen 和McNairn,2006)、随机森 林(Hütt 等,2016;Bazzi 等,2019)和支持向量机(Tan 等,2007;Zhang 等,2009)等;(4)分类后处理与精度验证。对分类结果中可能存在的错分和漏分等制图误差进行合理修正,并基于验证样本测试分类精度。通过对研究区的大量代表性地物样本选择和SAR 影像特征优选,监督分类器可以较为准确的识别出雷达水稻像元。
监督分类算法是最主流的水稻种植面积提取方法,其优点是样本特征可人工调整优化、分类过程可控、类别属性明确且精度较高(一般在90%以上),缺点是分类前需要进行专业细致的地面调查或光学影像判读,训练样本的采集和特征参数的评估工作量较大,样本的完备性和可靠性易受人为因素影响。此外,SAR 影像波段信息较少,不同地类的散射特征易混淆,往往需要补充多时相数据才能获得较高的分类精度,而最优成像日期的选择需要经验知识和反复试验。尽管如此,在遥感大样本和大数据蓬勃发展的背景下,监督分类仍是水稻种植面积提取的首选方法,未来应重点完善水稻散射特征的时空谱多维描述,同时提高监督分类模型对小样本的泛化能力。
2.2.3 深度学习
作为目前机器学习领域的热点分支,深度学习算法在多种信号处理和模式识别任务中表现卓越,因此也被引入SAR 影像分类和水稻种植面积提取研究。传统的机器学习算法需要人工提取筛选对水稻生长状态敏感的SAR 分类特征,而深度学习模型是含有多个隐藏层的神经网络,能够通过分层处理自动学习水稻特征。通过对多极化多时相影像的样本学习,以及对模型的结构参数优化,深度学习算法往往能取得极高的水稻识别精度(Ndikumana 等,2018a;Wei 等,2021)。此外还可以补充光学数据,降低斑点噪声对SAR 影像分类结果的影响,Zhou 等(2019)使用光学影像和多尺度图像分割算法进行地块识别,在此基础上将SAR 散射时序特征输入长短时记忆网络LSTM(Long Short-Term Memory network),实现田块级的水稻种植面积提取(总体精度=84.2%,Kappa系数=0.81),优于支持向量机(总体精度=75.4%,Kappa系数=0.72)和随机森林(总体精度=77.4%,Kappa系数=0.73)算法。
深度学习算法在样本和模型优化的基础上提升了水稻识别效能,在提取水稻种植面积时能保留田块的边界细节,辨别散射特征混淆的地物,抑制分类结果的椒盐噪声(de Castro 等,2020)。深度学习算法的缺点主要是模型设计复杂、计算量庞大,对训练数据的数量和质量要求高,因而目前多是样区尺度的研究。从训练数据角度来看,深度学习的理论基础仍然是概率统计,在样区研究中取得不错效果的模型,很难保证基准数据集之外的分类精度,复杂多样的水稻生长场景需要使用庞大的标注特征来描述,数据量过小会造成模型的过拟合。从模型设计角度来看,深度学习超参数众多,参数调整在很大程度上依赖实验经验,设置不同的学习率、梯度下降方法、参数初始化方法、样本组织方法和归一化方法等都会影响模型效果,验证过程需要很高的计算成本(GPU 等硬件算力)和时间成本(数天至数月)。此外,深度学习的模型结构复杂,分类结果的可解释性不强,模型参数的含义及其对分类结果的影响很难明确,因此深度学习应用于水稻遥感研究时,学者更为重视雷达数据使用策略的改进。传统机器学习的模型结构直观明晰,还有特征提取和筛选的工作流程,反而带来了较好的可解释性。
已有一些方法可以减少深度学习算法对训练数据的依赖,比如迁移学习、少样本学习、无监督学习和弱监督学习,虽然其分类性能尚弱于监督学习,但对于干扰因素众多、多样化耕作场景难以穷举的水稻遥感监测而言,仍是具有重要意义的研究方向。随着卫星遥感数据获取和处理能力的快速提升,各种高时空分辨率和覆盖范围的土地利用分类产品(如FROM-GLC10 和ESAWorldCover10m)陆续推出,结合众源地理数据和高分辨率光学影像,水稻标签数据集的制作与验证工作将得到有力支撑。模型的云端训练与调用也是很有前景的应用方向,利用遥感云平台获取大规模水稻标签数据集,导入深度学习云平台进行模型训练与测试,最后返回遥感云平台上进行模型调用与大区域制图,可以在一定程度上缓解数据集获取、存储和计算压力,提升遥感监测时效性。
高空间分辨率SAR 影像可以提供更为精细的水稻散射信息,但由于波段信息较少且存在相干斑噪,SAR 影像空间异质性也一定程度增加。使用传统基于像元的影像分类方法进行水稻制图,难以完整提取地块边界轮廓,且识别结果存在显著噪声。面向对象的分类算法是降低分类噪声、提高目标地物识别完整性的有效手段,目前在水稻识别研究中越来越受到关注。该方法首先根据散射信息同质性对SAR 像元进行合并和分割,形成由同质像元组成的目标对象,然后在对象尺度进行散射特征提取与筛选,最后选用适当的影像分类算法(如各种机器学习方法)实现水稻田块的整体识别(翟鹏飞 等,2021)。
为保证图像分割效果,往往需要使用多时相SAR 数据,提取多种极化特征(汪小钦 等,2008),或者辅助使用光学数据(Erasmi 和Twele,2009)和地理信息数据(杜烨 等,2014)。面向对象的分类算法可以较好地实现SAR 影像中的水稻像元的聚合和判别,提供田块尺度的水稻制图结果(图5),总体精度略高于基于像素的监督分类方法(Pierdicca等,2017)。
图5 面向对象的水稻种植面积提取效果(Zhang等,2018)Fig.5 The performance of object-oriented classification for rice planting area identification(Zhang et al.,2018)
面向对象的图像分类方法可以充分利用地物的波谱、纹理和拓扑信息,刻画地物的散射、几何和邻接属性,在识别破碎田块和稻田边界方面显示出优势(Gstaiger等,2012;Clauss等,2018)。该方法的缺点是存在最优分割尺度选择的问题,对象分割的质量对分类效果有较大的影响。未来应关注不同种植模式下的影像多尺度分割方法,优化尺度参数调整的效率。
SAR 数据对水稻的介电特性和几何结构特性敏感,光学数据对水稻的光合组分特性敏感,在成像条件支持的情况下获取高质量光学卫星数据,利用光学精细成像和SAR全天候观测的优势,可以有效提高水稻识别精度(Villa 等,2015;Mansaray等,2017)。
数据协同策略分为特征级协同和决策级协同,其中典型的特征级协同是将光学和SAR 影像特征参数联合输入分类决策器(Torbick 等,2011;Onojeghuo等,2018),这是最常见的多源数据使用方案。而决策级协同一般是使用光学遥感信息对SAR 分类过程进行指导或修正,比如先使用光学影像进行地表覆盖粗分类(Tian 等,2018;Lee 和Lee,2003)或对象分割(Cai 等,2019),在此基础上使用SAR 影像特征识别水稻。决策级协同在技术路径上考虑了两种传感器的成像信息差异,是更具机理性的方法。此外,非遥感数据(如DEM 数据和水文数据)的补充也对识别精度的提升有积极贡献(Li 等,2003;Park 等,2018)。光学与SAR 成像优势互补,二者协同使用可以弥补单一类型传感器的观测局限。由于光学成像易受云雾干扰,连续高质量的光学数据获取难以保证,因此未来应重点研究如何使用SAR 数据对光学信息时空缺失进行补偿,以及如何在决策级协同框架下使用有限的光学数据最大程度提高SAR 数据的水稻制图效能。
水稻长势监测是掌握水稻时空分布后的又一项重要工作,水稻生理参数反演是实现水稻长势监测的具体手段,关注对象包括叶面积指数LAI(Leaf Area Index)、光合有效辐射吸收率FPAR(Fraction of Absorbed Photosynthetically Active Radiation)、株高、生物量和含水量等,通过经验拟合和辐射传输建模等方法,建立SAR 特征参数和水稻生理参数之间的映射关系和预测模型(Inoue 和Sakaiya,2013;Inoue 等,2014)。水稻生理参数和长势信息不仅能适时指导田间管理(如灌溉、施肥和收割),还能及时对农业病虫、干旱、洪涝和倒伏灾害进行预警和评估,通过对关键指标的动态监测,还能实现水稻产量预测,为粮食政策的制定提供技术参考。
早期雷达反演研究主要基于概率统计理论,使用经验模型(回归拟合和机器学习)反演水稻生理参数。为提高反演过程机理性,各种基于辐射传输理论的物理模型和半经验模型被提出,揭示了水稻生理参数和微波散射机制的内在联系。此后又出现了耦合水稻散射模型和生长模型的数据同化方法,实现了植株生长机理驱动下的参数动态反演。考虑到SAR 数据无法反映水稻光合组分变化,也有研究在反演过程中加入光学遥感特征,弥补了雷达的观测局限性(图6)。
图6 水稻生理参数反演方法发展历程Fig.6 Development of rice biophysical parameter retrieval methods
经验建模是反演水稻生理参数的经典方法,通过分析SAR 影像参数和水稻生理参数的统计特征和数值关联性,建立映射模型实现参数估算(Chakraborty 等,2005;Chen 等,2009),统计回归分析和机器学习是最常用于确定映射关系的方法。He 等(2019)使用多时相全极化Radarsat-2数据获取后向散射系数和极化分解参数,分析各物候阶段与全生育期的水稻LAI 与SAR 参数的相关性(图7),发现基于Freeman-Durden 分解的雷达植被指数与水稻LAI的相关性最佳,可以使用指数拟合方程描述二者的映射关系(R2=0.84,RMSE=0.81)。Ndikumana等(2018b)获取双极化Sentinel-1数据,使用回归模型和机器学习算法反演水稻株高和干生物量,发现支持向量回归(株高:R2=0.89,RMSE=9.2 cm;生物量:R2=0.86,RMSE=193 g/m2)和随机森林(株高:R2=0.91,RMSE=8.2 cm;生物量:R2=0.89,RMSE=174 g/m2)算法的参数反演效果优于多元线性回归方法(株高:R2=0.79,RMSE=12.4 cm;生物量:R2=0.83,RMSE=213 g/m2),且生物量与VH极化的相关性很高。
图7 基于RVIFD(Freeman-Durden分解雷达植被指数)和HV/VV的水稻LAI经验反演模型(He等,2019)Fig.7 The relationship between rice LAI and RVIFD(Radar Vegetation Index based on Freeman-Durden decomposition)or HV/VV(He et al.,2019)
经验反演方法简单易行,在训练样本质量足够高的情况下,能获得不错的参数反演精度,适用于种植模式单一的小样区,其弱点是缺乏对散射过程的物理认知和机理解释,普适性较差。当研究区域、成像时期和数据来源发生变化时,需要重新进行参数训练,因而无法适应大范围复杂环境的水稻遥感监测,但从经验模型获得的参数响应规律仍可以为水稻散射的机制理解和物理建模提供参考。
物理模型通过前向运算模拟不同空间结构和理化状态下的水稻植株和土壤雷达回波,根据水稻冠层场景建模和辐射传输机理建立水稻生理参数和雷达散射的映射关系,结合真实SAR 影像和最优化算法,反向运算获得生理参数估计值。物理模型能够较为精确地模拟目标散射过程,在解释水稻后向散射机制方面有重要意义,其对水稻植株结构及散射机制进行不同程度的简化,将水稻地表器官(如茎秆、叶片和稻穗)描述为具有一定尺寸、形状、数量和空间分布规律的规则几何体,根据生长阶段的不同,通常茎秆和稻穗被描述为尺寸不同的圆柱体,而叶片被描述为椭圆盘或针状体(Koay等,2007;Jia等,2013)。在此基础上进行辐射传输方程解算(Wang 等,2009;Liu 等,2016b)或蒙特卡洛模 拟(Le Toan 等,1997;Yuzugullu 等,2017),从而获得关键散射类型成分,包括冠层体散射、下垫面散射、冠层与下垫面之间的双次散射等。
水稻微波散射模型最初多是针对森林场景构建,如Karam 模型(Karam 等,1995)、Sun 模型(Sun 等,1991)和MIMICS(Michigan Microwave Canopy Scattering Model)(McDonald和Ulaby,1993),在水稻场景建模中将森林散射模型中的树干层描述去除,同时调整冠层组分的介电和结构参数,即可用于水稻等低矮作物的散射模拟。物理模型描述了电磁传播过程和能量辐射机理,数理基础完备,使水稻生理参数反演不再盲目,其缺点是算法复杂,需要获取植株和土壤的介电参数,同时对冠层散射体的大小、形状、方向和空间分布等几何结构参数进行测量和假设,模型的使用难度较大,为适应大区域监测中复杂的水稻耕作情况,物理模型的结构应进行适当简化。
半经验模型对水稻散射过程做更为简化的描述,既保留对散射机制的物理表达,又兼有易于计算的优点,是介于经验模型和物理模型之间的折中建模方案。水云模型(Water Cloud Model)是最常用的半经验散射模型(Attema和Ulaby,1978),其将冠层描述为空间中均匀分布的水分粒子云团,将雷达回波分解为植被体散射和植被双层衰减后的土壤散射两部分。水云模型中冠层属性可以借由长势相关参数(如LAI和株高)来表达,下垫面散射贡献可以使用土壤含水量经验拟合获得。张晓倩等(2014)考虑水稻生长过程中田间持续积水的情况,将水云模型中土壤散射成分视为常量,将LAI 作为水稻冠层的量化参数,使用全生育期LAI 和HH/VV 散射比进行水云模型参数训练,使用最小二乘法成功反演水稻LAI(R2=0.73,RMSE=0.63)。
水云模型是对植被散射场景的巨大简化,未考虑到水稻等茎秆作物的冠层结构在水平和垂直方向具有异质性,也忽略了水稻植株与下垫面之间的多次散射,因此参数反演精度受到一定影响,Yang 等(2016)针对这一缺陷对水云模型进行改进,细化了不同物候阶段水稻冠层的非均匀空间分布描述,同时考虑了茎秆和稻穗的散射贡献(图8),将改进的水云模型和极化分解参数耦合,基于多时相Radarsat-2数据和遗传算法反演了水稻LAI(R2=0.82,RMSE=0.48)、株高(R2=0.89,RMSE=10.37 cm)、植株体积含水量(R2=0.86,RMSE=0.57 kg/m3)和穗生物量(R2=0.85,RMSE=0.22 kg/m3)等参数,精度优于原始的水云模型,Guo等(2018)验证了这种改进模型与紧缩极化参数耦合用于参数反演的有效性。
图8 考虑水稻冠层垂直和水平结构异质性的改进水云模型散射场景描述(Yang等,2016)Fig.8 The modified water cloud model considering the heterogeneity of the rice canopy in both horizontal and vertical direction(Yang et al.,2016)
半经验模型简洁地描述了水稻散射机制,植株和下垫面理化特性的量化指标较少,参数测量和模型训练都更易实施,在算法复杂度和机理性方面取得了平衡,可以灵活地与光学遥感指数、土壤散射模型以及水稻生长模型耦合使用,在大区域监测中有很大的应用潜力。
水稻生理参数反演需要开展与SAR 成像同步的地面观测实验,对植株生长状态进行动态采样,获得生理参数变化规律的统计表达,往往需要等到生长季结束才能完成全生育周期的参数采集和模型训练,因此无法及时预测卫星成像下一时刻的水稻生长。
水稻生长模型基于作物生长原理,机理性地描述水稻生长过程与环境条件的关系,先于实际观测给出下一时刻的水稻长势预估,可以在单点尺度较好地模拟水稻生理参数变化。为获得区域尺度的生长模型预测,需要引入数据同化技术,将多时相SAR 数据、水稻生长模型和散射模型耦合起来,利用遥感观测信息不断进行生长模型的参数校正或替代,动态缩小预测误差(Setiyono等,2018;宋丽娟 等,2020)。Shen等(2009)以水稻LAI 为媒介耦合水云模型和ORYZA2000 水稻生长模型(Bouman 和van Laar,2006),基于敏感性分析和SCE-UA 全局优化方法对ORYZA2000 模型进行参数调整和初始化,实现了水稻产量预估(总体精度=87%)。Liu 等(2016a)使用水云模型和Radarsat-2 数据反演水稻生物量,将其同化到WOFOST 生长模型(Savin等,1997),模拟水稻根系干重并计算根系质量占比,实现水稻植株重金属胁迫的监测。
数据同化方法将SAR 时序观测与水稻生长模型有效地结合起来,利用动态迭代不断降低生长模型的预测偏差,使模拟结果接近真实过程,还能通过生长模型获得众多作物状态参量。目前遥感数据同化研究大多基于光学数据,使用SAR 数据与水稻生长模型进行同化反演的研究成果较为零散。这一方面是因为SAR 数据的波谱信息较少,与水稻长势因子的相关性弱于光学指数,另一方面也是受SAR 数据较长的重访周期和较高的获取成本限制。随着SAR 成像获取能力的提高、水稻生长机制和散射机制的研究深入,数据同化应用将迎来新的发展契机。
光学影像有较高的波谱分辨率和较小的成像噪声,对水稻植株光谱反射率变化的响应较为敏感,而SAR 数据对水稻及其下垫面的介电性质和几何结构变化敏感,两种成像方式优势互补,可以从不同角度反映水稻信息。目前光学和SAR 数据协同反演水稻生理参数的研究尚不深入,以特征参数的简单组合为主。Alebele 等(2020)基于Sentinel-1/2数据构造了SAR 和光学组合植被指数,作为高斯过程回归的输入,用以估计水稻植株器官的生物量,结果表明使用组合植被指数的反演精度(R2=0.87,RMSE=0.16 kg/m2)优于只使用光学指数(R2=0.45,RMSE=1.08 kg/m2)或SAR 指数(R2=0.60,RMSE=0.24 kg/m2)。
协同光学和SAR 数据能够充分利用水稻在不同观测手段下表现出的遥感特性,更为全面地反映植株及下垫面的理化性质。目前数据协同策略多是特征组合,光学和SAR 特征被视为独立变量,联合输入回归方程或机器学习模型,这类协同方式缺乏对异构数据的关联性挖掘,未考虑两种遥感特征的机理互补性。同时,特征组合需要在光学卫星可以高质量成像的前提下实现,因而不适用于气象干扰频繁的地区。如何综合利用多源数据的时空谱变化规律,考虑光学和SAR 特征在时间趋势和波谱响应上的相关性,耦合光学和微波辐射传输机理,在有限光学信息辅助下优化SAR参数反演效果值得进一步研究。
物候是水稻生长的时间节律,表征植株发育和耕作条件的规律性变化,包括育苗、移栽、分蘖、拔节、孕穗、抽穗、扬花、灌浆、成熟和收割等具体阶段。熟制是稻作区受气候和社会发展水平的影响,耕地田块的水稻年度种植次数,主要分为单季稻(如川渝贵地区)、双季稻(如粤桂地区)和三季稻(海南部分地区)。通过物候信息可以判断水稻的发育状况,指导田间种植管理,而熟制信息可以反映水稻种植强度,为区域估产提供依据。物候和熟制信息相互补充,共同描述了一年中各时刻的水稻长势。
水稻物候和熟制的遥感提取需要借助多时相对地观测,通过分析水稻散射的时间变化规律,筛选能够指示水稻生长状态的SAR 特征因子。早期的研究通常将不同物候或熟制的田块视作不同的地物类型,采用影像分类的思路进行物候和熟制判别。随着高时间分辨率SAR 数据的出现,通过识别季内和年内的散射时序波动特征提取水稻物候和熟制成为可能(图9)。
图9 水稻物候与熟制识别方法发展历程Fig.9 Development of rice phenology and cropping intensity identification methods
物候识别方法主要有阈值分割法(Lopez-Sanchez 等,2014)、监督分类法(Yuzugullu 等,2015)和时序特征法(Nguyen 等,2016)。阈值分割法分析水稻在多个关键生长期的SAR 特征参数聚集分布情况,在参数空间设置阶段阈值实现不同物候期的分割,Yang 等(2014)分析紧缩极化SAR 参数对水稻物候变化的时域响应,获取物候分割最优参数及经验阈值,采用决策树方法实现水稻物候识别(总体精度=86%)。监督分类法将不同物候期的水稻视为不同地类,筛选对水稻物候变化敏感的SAR 特征,通过对监督分类模型进行样本训练实现物候识别。Kucuk等(2016)从多时相TerraSAR-X 数据中提取极化和纹理特征,将水稻生育周期分阶段进行类别标注,使用支持向量机(总体精度=81.1%,Kappa 系数=0.76)、k近邻(总体精度=81.2%,Kappa 系数=0.76)和决策树(总体精度=73.2%,Kappa 系数=0.66)等方法实现了水稻物候期分类识别。时序特征法通过密集SAR 观测获取水稻散射时序,使用平滑滤波和多阶求导等方法提取时序曲线的峰值、谷值和曲率极值等作为物候指示节点,Nguyen 等(2016)分析了Sentinel-1 VH 和VV 极化后向散射在水稻生长周期的时间变化规律,发现VH 极化受田间积水变化的影响更小,对VH 极化时序进行平滑求导,提取了水稻生长的移栽期(时序谷值)、抽穗期(时序峰值)和耕作季长度(峰谷间隔)等物候特征。
在对大量观测样本进行统计分析和模型训练的基础上,阈值分割法和监督分类法能取得不错的物候识别效果,但其普适性易受各种经验因素的制约。时序特征法依赖高频次卫星观测,通过对散射时序曲线的构建与分析,能够较好地追踪水稻的物候发育过程,然而SAR 时序特征与水稻精细物候的对应关系,目前尚缺乏统一认识。
熟制识别方法主要分为多时相分类法和时序特征法,多时相分类法在一年中适宜栽植水稻的时间段内获取多期SAR 影像,通过季节分段依次分类(Bouvet 等,2009)和多季影像叠合分类(Singha 等,2019)两种思路识别水稻多熟种植情况。Lasko 等(2018)通过地面调查获取水稻样本熟制信息,对Sentinel-1 数据进行多季叠合,使用随机森林算法实现了水稻熟制提取(总体精度=93.5%)。时序特征法分析单、双和三季稻的散射时序变化规律(图10),提取时序曲线的物候节点特征(如峰谷值)以识别单个生长周期,统计物候节点重复次数实现耕作轮次的判断,精度一般在85%左右(Nguyen 等,2015)。多时相分类法对SAR 观测频次的要求不高,且影像分类算法较为成熟,因而实际应用更为普遍。时序特征法适用于成像时间密集的SAR 数据,在峰形识别中需要解决成像噪声和轮种、间种作物造成的伪波峰问题,而多时相分类法的技术关键是分类时相和分类样本的合理选择。
图10 多季稻SAR散射时序规律(Nguyen等,2015)Fig.10 Time series SAR backscatter behavior in relation to rice growing season(Nguyen et al.,2015)
水稻散射与植株生育状态息息相关,高频次对地观测可以提供较为连续的水稻散射时序信息,时序曲线的季相波动可以表征水稻物候和熟制,因此未来应重点开展时序特征提取和模式识别工作,分析水稻生长机理和散射机制的内在联系,完善复杂种植条件下水稻散射时序的机理性表达,逐步降低对经验样本的依赖。
基于SAR 数据的水稻遥感监测技术在过去三十年(1991年—2021年)取得了长足的发展,这主要归功于SAR 成像能力增强和监测方法进步。空间分辨率的提高使监测尺度更加精细,时间分辨率的提高使生长动态捕获更加密集,极化模式的增加使水稻散射机制理解更加全面。监测方法的进步不仅使建模决策从经验分析发展到机理推导,更将数学和计算机领域的前沿算法引入了水稻遥感监测。
虽然SAR 数据已成功应用于水稻生长监测的诸多方面,但要准确描述水稻散射的时空谱特性仍需解决多项难题:
(1)破碎地块和复杂地形。平原地区规模化种植是水稻遥感监测的理想场景,然而以中国南方丘陵地区为代表的稻作区地块破碎且地形复杂,这类区域同样有大量稻田分布。这些稻田形状大小各异,面积最小处宽度仅数米,毗邻道桥、屋舍、沟渠、园林和坡埂等非农耕地类,同时耕地分散经营模式导致种植类型多样、稻田分布零散。目前常用的SAR 卫星影像空间分辨率多为10 m 量级,稻田像元极易受到非水稻地物的散射干扰,且SAR 斑点噪声会进一步劣化破碎田块的水稻散射特性表达。
丘陵地区稻作耕地受地形起伏影响,邻近田块存在明显的高程差异,山岭地区为提高土地利用率还存在依托山体开垦梯田的情况,邻近高差不仅使相邻田块的雷达局部入射角存在差异,还导致田块边界出现高度不一的坡埂,这些土质立面与水稻下垫面形成朝向各异的二面角结构,对SAR 侧视成像信号造成了严重干扰,此外SAR 影像会在地势起伏区域出现叠掩和阴影等异常散射,进一步干扰水稻散射特征获取。
(2)稻田栽培条件多样性。稻田栽培条件包括田间管理和植株性状两个方面,田间管理多样性主要指植秧技术(育苗、耕犁和移栽)、栽作技术(株簇密度和垄行朝向)、管水技术(淹水、灌溉和排水)、施肥技术(肥料类型和用量)、除草技术(除草方式和频次)、晒田技术(晒田日期和时长)、病害管控(虫害和倒伏防治)水平的田块间差异。植株性状多样性主要是由水稻品种和水肥差异导致的植株地表器官(茎叶穗)数量、尺寸、含水量和质地的差异,以及发育速度和生育周期的区别。
稻田散射特征受下垫面和植株的理化特性共同影响,田间管理和植株性状的多样化影响因子会显著增加水稻散射的描述难度。虽然物理散射模型和作物生长模型的同化技术可以模拟SAR 信号对稻田栽培条件的响应,但受限于模型参数获取和算法复杂度,其应用于生产实际的难度还很大。
(3)季候异步和轮作间作。受地形、水文、气候、社会发展水平以及耕作分散经营等因素的影响,不同地区的水稻熟制(单、双、三季稻和再生稻等)、轮作(同一田块轮流种植不同种类的作物)、间作(田垄边界种植不同种类的作物,或田间混合种植不同品种的水稻)方式存在差异,耕作节律并不同步,导致水稻散射的季候规律极为复杂,比如单季中稻区(如川渝贵地区)通常在5 月移栽、7 月抽穗、9 月收割,轮作油菜,间作玉米,而双季稻区(如粤桂地区)的早稻一般在4月移栽、6月抽穗、7月收割,晚稻一般在8月移栽、9 月抽穗、11 月收割,轮作间作各类蔬菜。不同于光学遥感植被指数典型的时序曲线峰型特征,SAR 数据对水稻生育过程的响应往往局限于移栽期至抽穗期,且极易受田间管理因素和成像噪声干扰,难以形成稳定的物候动态响应。
对于大区域水稻种植遥感监测而言,先验信息的获取是极为复杂繁重的工作,水稻多样化的耕作实践也导致先验信息的代表性和可靠性难以保证,因此现有研究成果的适用范围一般局限于样本训练区,水稻监测的精细程度不够理想。
数据与方法的进步,为水稻种植面积提取、生理参数反演、物候与熟制识别研究提供了具有潜力的探索方向:
(1)依赖更少先验信息的种植面积精细识别。随着SAR 数据空间分辨率的提高,面向对象分类算法在抑制成像噪声和分类噪声方面优势凸显,高空间分辨率SAR 影像和面向对象分类算法的结合,是破碎稻田精细提取的有效方案。在分析水稻生长机理和散射变化规律的基础上,生成多种典型时序曲线,进行包容度可调节的模式识别,有望降低分类过程对复杂类型稻田样本的依赖。
(2)顾及建模效率与精度的生理参数动态反演。兼顾机理描述和计算简化的半经验模型,目前看来是平衡反演精度和效率的不错选择,此外模型能够根据实时观测进行参数自适应调整也很重要。数据同化方法是耦合水稻生长模型和散射模型的动态反演方法,可以做到模型实时修正和长势预测,随着SAR 数据时间分辨率不断提高,该方法具有极大的应用潜力,未来对水稻生长模型的参数简化将为数据同化方法的区域应用提供便利。
(3)结合生长机理和时序观测的物候熟制自动识别。随着SAR 历史数据的积累,耕地种植状态的年际监测成为可能,未来的研究应结合水稻的生长机理,考虑多种典型耕作环境,进一步细化散射时序与水稻物候的对应关系,同时优化雷达时序降噪算法,关注复杂种植结构下水稻散射的季候变化规律,通过时序模式识别实现水稻物候和熟制的自动判读,降低因地而异的阈值依赖,提高识别算法的普适性和灵活性。
纵观水稻雷达遥感监测研究的发展进程,成像技术的进步一直是水稻监测技术发展的重要驱动因子。从最初的单极化到现在的全极化,SAR数据实现了波谱信息量的提升;从早期的空间分辨率数十米到目前的数米,SAR 数据实现了空间信息量的提升;从早期的时间分辨率数十天到目前的数天,SAR 数据实现了时间信息量的提升。新一代的星载SAR 卫星的空间分辨率能达到米级,重访频率也大大提高,Sentinel-1 双星重访周期缩短至6 d,高分三号单侧视重访周期小于3 d,有效地提高了观测频率和动态监测能力,这些卫星向用户免费便捷地分发数据,将通过增加时间信息量有力弥补空间和波谱信息短板。
粮食安全是经济发展和社会稳定的基石,水稻种植是中国粮食生产的关键组成部分,在多云雾稻作区使用雷达数据进行水稻遥感监测,对于及时把握水稻耕作生长信息和指导农业管理决策有重要意义。水稻遥感监测主要分为种植面积提取、生理参数反演、物候和熟制识别3个部分,其中种植面积提取关注水稻的空间分布信息,生理参数反演关注水稻的植株长势信息,物候识别关注水稻的生育演化信息,熟制识别关注水稻的耕作轮次信息,这些信息共同构成水稻耕种状态的综合描述,可为水稻的耕作管理和产量预估提供参考依据。
伴随着电子技术和计算机技术的发展,SAR成像能力不断进步,各领域的前沿技术方法也在与遥感技术深度融合,水稻雷达遥感监测朝着更大的覆盖面积、更长的时间跨度和更精细的时空感知能力推进。这一切都需要对水稻生长机制和散射机理的深入理解、对模型复杂度和灵活性的改进、对SAR 数据获取和处理能力的提升。高质量SAR 数据的开放获取和云计算平台的推广普及,将助力水稻种植的长时序大区域精准监测。