基于长时序遥感影像的珠三角水稻种植范围提取

2021-07-25 10:00罗明帆王冬至
地理空间信息 2021年7期
关键词:森林法植被指数光谱

罗明帆,王冬至*

(1.广东省国土资源测绘院,广东 广州 510500)

稻谷是我国南方最重要的粮食作物。国家一直把粮食安全保障作为头等大事来抓,近年来又陆续出台政策建设高标准基本农田、禁止乱占耕地建房等,从各方面提升水田质量,保障人民的粮食安全。我国的主要水稻产地绝大部分分布在以成都平原、长江中下游平原、珠江三角洲平原为代表的平原地区,其中珠江三角洲平原位于广东省,是全省最重要的水稻供应基地。然而,广东省属亚热带季风气候,台风暴雨等极端气候频发,受分辨率、时相、云层等客观条件的限制,一般的卫星光学影像不易开展遥感监测。

目前国内外已有不少针对水稻种植范围提取的研究成果,其中阈值法是主流方法之一[1]。随着大数据和机器学习应用的不断拓展,随机森林法逐渐成为提取水稻的重要方法,如雷小雨[2]等利用两个时相的数据构建差值特征来突出水稻物候变化特点,并与随机森林法相结合提取了水稻种植面积,完成了湖南省常德市鼎城区的水稻种植面积提取;宋盼盼[3]等提出了一种基于时间序列GF-1号遥感影像的水稻识别方法,验证了NIR、R、NDVI时间序列曲线拟合的有效性以及拟合曲线目标特征区域设置的合理性;栗云峰[4]等提出了一种融合多时相的GF-1号卫星多光谱影像和Sentinel-1雷达影像的水稻田提取方法,并在南京市江宁区进行了研究。总体而言,受不同地区的水稻生长状况和季节变化影响,不同的水稻提取方法的效果可能存在差异。由于遥感影像质量和周期等的影响,目前的水稻提取研究主要仍集中在小区域范围的提取研究实验上[5-6],大范围的水稻提取应用对比研究还比较缺乏,因此本文以珠三角地区为研究对象,基于长时间序列的SAR和多光谱遥感影像,利用阈值法和随机森林法进行水稻提取,并对两种方法的提取效果进行了比较,以期为广东省的水稻提取提供思路。

1 研究区域、数据来源与方法

1.1 研究区概况

本文选取的研究区为珠江三角洲平原所在的广东省珠三角地区,涉及广州、深圳、佛山、东莞、惠州、江门、珠海、中山、肇庆等9个地级市。珠三角地区大部分位于北回归线以南,南亚热带;属亚热带海洋季风气候,雨量充沛,热量充足,雨热同季;年日照为2 000 h,四季分布比较均匀;年平均气温为21.4~22.4℃;年平均降雨量为1 600~2 300 mm,受季风气候影响,降雨量集中在4-9月;冬季盛行偏北风、天气干燥,夏季盛行西南和东南风、高温多雨。其中,江门市的水稻种植最多,素有“珠三角的粮仓”之称。

1.2 数据来源与预处理

1.2.1 SAR数据

Sentinel-1卫星为全天时、全天候雷达成像,不受天气影响。本文采用经过预处理(轨道校正、热噪声去除、辐射校正、几何校正和斑点噪声抑制)的2019年12个月的珠三角地区的Sentinel-1影像数据,极化方式为VV和VH极化。

1.2.2 多光谱数据

Sentinel-2A卫星携带一台多光谱成像仪,可覆盖13个光谱波段,从可见光和近红外到短波红外,具有不同的空间分辨率。该卫星数据在红边范围含有3个波段,有利于监测植被健康信息。广东省水稻种植类型多为双季稻,第一季稻在上半年种植,光谱信息易被云层遮挡;第二季稻在下半年种植,一般为农历7月中旬到7月底种植,农历10月中旬成熟。因此,本文主要采用7月、9月、11月(对应水稻种植初期、水稻种植后期和水稻收割后)的Sentinel-2A遥感影像数据,并根据去云算法对云覆盖区域进行掩膜。将每个月份的多张影像进行云掩膜处理后取中值,最终采用一张影像代表一个月的数据,作为实验的分类数据。

1.2.3 样本选取

本文选取的样本主要包括水稻、旱地、林地和其他(水体和城市用地)等,通过目视解译Sentinel-2A影像选取水体和城市用地样本;通过目视解译Sentinel-2A影像并结合广东省当年的高分辨率影像数据选取林地样本;通过目视解译Sentinel-2A影像和高分辨率影像数据,并结合12个月的改进的归一化水体指数(MNDWI)选取水稻和旱地样本(水稻3月和8月的MNDWI值明显大于0.1,而旱地全年的MNDWI值均小于0)。选取的样本类型、定义和数量如表1所示。将选取的样本进行随机抽样,按照“训练数据∶验证数据=3∶1”的比例进行后续训练与验证。

表1 样本类型、定义和数量

1.3 研究方法

1)阈值法。阈值法是目前较成熟的水稻识别方法,通过对选取的水稻样本2019年12个月的NDVI和MNDWI的平均值进行统计,可得到研究区的样本特征值区别于旱地、林地和其他地物的水体和植被特征的实际情况,再根据不同时间的NDVI和MNDWI设置阈值提取水稻。本文将6月和10月的NDVI均值大于0.4,且3月和7月的MNDWI均值大于0.1作为判断水稻的依据。

2)随机森林法。随机森林法是一种基于分类树的算法[7],可在进行回归或分类时评估变量的重要性[8],在运算量没有显著提高的前提下提高预测精度。本文利用随机森林法,基于Sentinel-1数据和Sentinel-2A数据,采用不同的特征组合进行水稻提取和检测,并分析各特征和组合特征的重要性,以发现对于提取水稻比较好的特征与特征组合,从而得到较高精度的水稻分类结果。

1.4 研究思路

本文利用2019年7月、9月、11月的Sentinel-2A数据以及2019年12个月的Sentinel-1数据获得光谱特征、多种植被指数、水体指数、纹理特征以及预处理后的VV、VH极化特征。其中,植被指数包括NDVI、增强型植被指数(EVI)[9]、两波段增强型植被指数(EVI2)、归一化红外指数(NDII)[10];水体指数包括MNDWI和对叶片水分和土壤水分敏感的地面水指数(LSWI)[9]。

根据水稻的水体属性和植被属性,对每幅Sentinel-2A影像的红边、近红外、短波红外波段(本文选择Sentinel-2A的B6、B8、B11和B12,其中B6为红边波段,B8为近红外波段、B11和B12为短波红外波段)进行基于3×3窗口的纹理滤波计算。纹理参数包括均值、方差、对比度、相关性,因此每个月的影像有共计4×4=16种纹理特征。

Sentinel-1的VV和VH极化都能在不同程度上体现地物特征[11],因此本文提取了2019年12个月的Sentinel-1的VV、VH极化特征,并纳入特征集。选取的各种特征如表2所示。

表2 选取特征汇总表

本文首先利用2019年3月、6月、7月、10月的Sentinel-2A影像提取2019年6月、10月的NDVI数据以及3月、7月的MNDWI数据;再根据阈值法得到珠三角地区水稻分类结果,并进行精度验证;然后利用2019年7月、9月、11月的 Sentinel-2A影像进行光谱特征、多种植被指数、水体指数和纹理特征的提取,根据2019年12个月的Sentinel-1数据得到12个月的VV、VH波段数据,并对光谱特征、多种植被指数、水体指数、纹理特征和VV、VH数据进行特征组合得到随机森林分类结果,计算精度验证结果;最后将阈值法与随机森林法得到的结果进行对比综合,得到精度较好的珠三角地区水稻提取结果,如图1所示。

图1 研究思路图

2 研究结果与分析

阈值法的分类结果如图2所示,随机森林法的分类结果如图3所示,可以看出,利用阈值法提取的水稻分布情况与利用SAR特征随机森林分类提取的水稻分布情况相似(蓝色线区域),但后者提取的水稻明显更多一些;利用光谱特征随机森林分类提取的水稻分布情况与利用植被指数和水体指数提取的植被分布情况相似(红色线区域);利用纹理特征随机森林分类提取的水稻较少,相对于其他的分类结果少了很多细碎的点。

图2 阈值法(NDVI+MNDWI提取)的分类结果

图3 随机森林法的分类结果

通过选取的验证样本对分类结果进行精度验证,结果如表3所示,可以看出,阈值法提取的水稻总体精度(OA)、Kappa系数、查全率(Recall)、F1score都是最低的,但查准率(Precision)却是最高的;光谱特征随机森林分类得到的各项精度指标均优于其他特征随机森林分类结果。通过比较发现,大范围内不同地区的水稻灌溉时间差异较大,阈值法所采用的模型相对简单,不能很好地判断这种差异与其他地物的区别;而随机森林法使用的模型更复杂,能较好地避开水稻灌溉时间差异对识别的影响。

表3 选取样本的精度验证的结果

光谱特征和植被指数+水体指数的分类结果的Kappa系数均在0.95之上,SAR特征和纹理特征的分类结果的Kappa系数在0.85~0.9之间。根据SAR特征、光谱特征和植被指数+水体指数的水稻分类结果的面积相差不大,而利用阈值法和纹理特征随机森林分类得到的水稻提取面积明显低于其他3种分类结果。

本文将不同的特征组合作为输入特征进行随机森林分类,特征组合包括:①光谱特征+植被指数+水体指数;②光谱特征+纹理特征;③光谱特征+SAR特征。3种特征组合进行随机森林分类得到的水稻分布情况相似,进一步验证精度,得到的结果如表4所示。当光谱特征与植被指数+水体指数进行组合时,分类精度相较于只采用光谱特征的精度提升至0.99左右;当光谱特征与植被指数+SAR特征进行组合时,分类精度相较于只采用光谱特征的精度由0.98降至0.95左右。

表4 组合特征精度验证结果

3 结 语

本文分别利用阈值法和随机森林法进行水稻种植面积提取,结果表明,阈值法提取的水稻数量的Kappa系数、OA、F1score、Recall等指标均明显低于随机森林法的提取结果,但阈值法提取的水稻的Precision非常高。在仅采用单类特征进行随机森林分类的情况下,光谱特征的分类效果最好,其次是植被指数+水体指数,两种分类结果的Kappa系数均在0.95之上;而SAR特征和纹理特征的分类结果的Kappa系数在0.85~0.9之间。将光谱特征与其他特征进行组合发现,当光谱特征与植被指数+水体指数进行组合时,分类精度相较于只采用光谱特征的精度提升至0.99左右;当光谱特征与植被指数+SAR特征进行组合时,分类精度相较于只采用光谱特征的精度明显下降,从0.98降至0.95左右。今后需要改进的方向为:

1)样本数量。本文选取的样本较少,但保证了样本的均匀分布和可靠性,并对结果的有效性进行了验证,今后可选取更多的样本进行训练,以提高识别精度。

2)样本类型。本文得到的分类器可以很好地区分水稻和旱地,但与水稻易混淆的地物还有其他水生农作物(如莲藕)。由于仅靠目视解译难以选出其他水生农作物的样本,因此本文选取的样本主要为旱地作物的样本。虽然水生农作物的面积相对于水稻面积来说只有很少一部分,但若有一些样本可以用来训练的话,得到的水稻提取效果将更好,且分类时,纹理特征作用也将更明显。

3)面积对比。由于未在统计年鉴上找到珠三角地区各市关于稻田面积的统计,因此本文未能将分类结果得到的面积与实际稻田面积进行对比,查看分类面积情况。

4)特征组合。本文对一些特征组合进行分类发现,光谱特征与植被指数+水体指数进行组合时的分类效果最好,今后可进行更加细致的特征组合,得到更加优化的特征组合结果。

猜你喜欢
森林法植被指数光谱
基于三维Saab变换的高光谱图像压缩方法
立足职能发挥作用 全面推动新修订的《森林法》贯彻实施
铁岭市自然资源局举行新《森林法》宣传活动
黑龙江省林业和草原局关于贯彻落实新修订森林法有关林木采伐管理工作的通知
基于植被指数选择算法和决策树的生态系统识别
森林法修改下放采伐限额审批权
AMSR_2微波植被指数在黄河流域的适用性对比与分析
河南省冬小麦产量遥感监测精度比较研究
星载近红外高光谱CO2遥感进展
主要植被指数在生态环评中的作用