基于多时相遥感影像的水稻种植信息提取

2022-04-19 20:32张红华赵威成刘强凯
安徽农业科学 2022年7期
关键词:旱地时序光谱

张红华 赵威成 刘强凯

摘要 获取水稻种植信息对于指导水稻生产,监测作物生长及合理分配水资源具有重要意义。针对基于单时相影像提取水稻信息精度有限,以Sentinel-2A/B多时相影像为数据源,构建NDVI、EVI、NDWI和光谱特征4种时序特征数据集并设计6种试验方案,结合随机森林算法对水稻种植信息进行提取。结果表明,NDVI、EVI时序曲线可以较好反映出水稻生育期的物候特征,不同地类的光谱时序曲线和NDWI时序曲线可分离度较高,有利于提高分类精度;基于NDVI時序数据集的分类精度最低,基于光谱时序数据集的分类精度最高,总体精度达95.559 0%,Kappa系数为0.943 3,与基于NDVI的分类结果相比,总体精度、Kappa系数、水稻生产者精度和用户精度分别提高了3.530 4%、0.044 9、8.64%和3.36%,水稻与旱地的混分现象得到有效抑制。该研究为区域水稻种植信息精确提取在数据源选择、时序特征构建方面提供了一种新的思路和技术手段。

关键词 Sentinel-2A/B;多时相;时序特征;水稻

中图分类号 S127  文献标识码 A  文章编号 0517-6611(2022)07-0234-05

doi:10.3969/j.issn.0517-6611.2022.07.056

开放科学(资源服务)标识码(OSID):

Rice Planting Information Extraction Based on Multi-temporal Remote Sensing Images

ZHANG Hong-hua, ZHAO Wei-cheng, LIU Qiang-kai

(Heilongjiang University of Science and Technology, Harbin, Heilongjiang 150022)

Abstract Obtaining rice planting information is of great significance for guiding rice production, monitoring crop growth and rational allocation of water resources. In view of the limited accuracy of extracting rice information based on single temporal image, four time-series feature data sets of NDVI, EVI, NDWI and spectral features were created based on sentinel-2A/B multi-temporal images. Six experimental schemes were designed to extract rice planting information combined with random forest algorithm. The results showed that NDVI and EVI time series could better reflect the phenological characteristics of rice growth period, and the spectral time series and NDWI time series of different land types had a high degree of separation, which was conducive to improve the classification accuracy;the classification accuracy based on NDVI time series dataset was the lowest, and the classification accuracy based on spectral time series dataset was the highest, the overall accuracy was 95.559 0%, and the Kappa coefficient was 0.943 3. Compared with the classification results based on NDVI, the overall accuracy, Kappa coefficient, rice producer accuracy and user accuracy were improved by 3.530 4%, 0.044 9, 8.64% and 3.36%, respectively. And  the mixing of rice and dry land was effectively controlled. This research provided a new idea and technical means for accurate extraction of regional rice planting information in data sources selection and time series feature construction.

Key words Sentinel-2A/B;Multi-temporal;Timing characteristics;Rice

准确获取区域水稻种植结构信息,对于作物产量估计、种植结构调整具有重要意义[1]。与传统的田间调查与统计汇总方法相比,利用遥感技术提取作物种植结构,更加直观和准确[2]。水稻常与背景信息在空间上相互交错,由水稻植株、水体和土壤的混合地物组成,这种组合的季相变换带来的光谱信息差异可作为区分水稻田和其他地物的重要依据。作物生育期内,仅基于单时相影像难以将水稻与其他作物区分,可利用多时相影像获取作物的时间序列特征来提取水稻信息。以往研究多是通过构建归一化植被指数(Normalized Difference Vegetation Index,NDVI)时序数据集来进行作物的提取,如利用MODIS NDVI时间序列实现作物的识别[3-5],基于Sentinel-2[6-8]或GF-1[9-11]数据构建NDVI时间序列,基于多源影像构建NDVI时间序列等[12]。然而,目前利用多时相数据进行水稻提取多局限于构建NDVI时序数据,对其他时序特征很少关注和研究。鉴于此,笔者以黑龙江省五常市龙凤山镇为研究区,利用作物整个生育期内的多时相Sentinel-2A/B遥感影像构建4种不同的时间序列特征,包括光谱特征、归一化植被指数、增强植被指数(Enhanced vegetation index,EVI)、归一化水体指数(Normalized difference water index,NDWI);同时设计6种时序特征组合方案,结合随机森林分类方法提取水稻空间分布信息,以期提高区域尺度的水稻种植信息的提取精度,为精准农情监测提供参考。

1 研究区及数据来源

该研究以黑龙江省五常市龙凤山镇为研究区(图1),五常市位于黑龙江省南部(44°04′~45°26′N,126°33′~128°14′E),是五常大米主产地。五常市属中温带大陆性季风气候,夏短冬长,寒暑悬殊,年均气温3~4 ℃,年均降水量500~800 mm。由于气候特征的影响,水稻主要分布于五常市西南的C型盆地中,因其独特的地形条件,有利于在4—9月份达到优质水稻所需要的活动积温。

根据五常水稻生育周期,选取了涵盖2021年整个生长季(5—10月)的10景Sentinel-2影像(表1),其中4景为Sentinel-2A数据,6景为Sentinel-2B数据。数据均来源于欧空局(ESA)数据中心(https://scihub.copernicus.eu/),产品等级为Level-2A级,其中红绿蓝和近红外4个波段空间分辨率为10 m,坐标系WGS-84,投影UTM,Zone 52 N。该研究样本数据主要通过实地调查和依据天地图进行目视解译2种方式获取。于2021年8月对研究区进行样本采集,包括地物类型、经纬度信息和生长状况。

2 研究方法

以10景不同时期的Sentinel-2A/B影像为数据源,构建时间序列数据集,包括光谱特征、NDVI、EVI、NDWI,分析其时序曲线特征,利用随机森林算法对水稻种植信息进行提取并评定其精度。

2.1 时序特征数据集的构建

2.1.1 时序光谱数据集。

该研究利用红绿蓝和近红外4个10 m波段构建时序光谱数据集,10景影像共计40个波段,分析不同地类光谱曲线特征,进而完成分类。

2.1.2 NDVI时序数据集。

由于植被的红边效应,将红光波段与近红外波段进行组合形成的植被指数可以较好反应地表植被的生长状况,其中归一化植被指数(NDVI)是遥感影像分类中应用最广泛的植被指數,是植被生长状态和植被分布密度的最佳指数因子。NDVI时间序列可以反映出作物从播种、生长、成熟到收割的作物生长过程,以及植被覆盖度的变化,并且消除一些辐射错误。NDVI的计算方法如式(1)所示:

NDVI=(ρ nir-ρ red)/(ρ nir+ρ red)(1)

式中,ρ nir为近红外波段的反射率;ρ red为红波段的反射率。

2.1.3 EVI时序数据集。

增强植被指数(EVI)通过加入蓝色波段以增强植被信号,矫正土壤背景和气溶胶散射的影响,该指数常用于植被茂密区,计算方法见式(2)。

EVI=2.5ρ nir-ρ redρ nir+6ρ red-7.5ρ blue+1(2)

式中,ρ nir为近红外波段的反射率;ρ red为红波段的反射率。ρ blue为蓝波段的反射率。

2.1.4 NDWI时序数据集。

归一化水体指数(NDWI)是基于绿波段与近红外波段的归一化比值指数。该NDWI一般用来提取影像中的水体信息,效果较好。因水稻特有的水生特点,使得其生长环境离不开水体,所以引入NDWI,以便对水稻和其他植被或作物进行区分,NDWI的计算方法见式(3)。

NDWI=(ρ green-ρ nir)/(ρ green+ρ nir)(3)

式中,ρ green为绿波段的反射率;ρ nir为近红外波段的反射率。

2.2 随机森林算法

随机森林是以CART决策树为基本分类器的集成学习模型[13],采用自助抽样技术随机抽取大约2/3的样本作为训练样本子集,未被抽中的1/3称为袋外样本(Out-Of-Bag,OOB),OOB数据可以通过内部交叉验证的方法估算每一棵决策树的泛化误差,将随机森林中所有决策树的OOB误差估计取平均值即可获得整个随机森林的泛化误差估计。当输入待分类的样本时,最终的分类结果由单个决策树的输出结果投票决定。随机森林克服了决策树过拟合问题,对噪声和异常值有较好的容忍性,在遥感影像信息提取方面取得了较好的分类效果[14-16]。

2.3 试验方案

该研究设计6种试验方案进行对比研究(表2),通过不同方案之间的对比,探索提高水稻信息提取精度的方法。

3 结果与分析

3.1 时序特征曲线

利用10期5—10月的遥感影像,分地类计算每期训练样本光谱特征、DNVI、EVI、NDWI的平均值,绘制时序曲线,如图2~5所示。

从图2可以看出,水体和建设用地的时序光谱曲线平稳,不同时期光谱反射率变化幅度较小,与绿色植被(林地、水稻、旱地)可分离度较高。水稻、旱地和林地在7—8月反射率值较高,整个生长季波谱变化幅度较大,但从时序曲线上来看,绿色植被间也表现了明显的差异性,有利于提高其分类精度。从图3的NDVI时序曲线来看,5种地类均有独特的时序特征,林地、建设用地和水体可分离性较高,水稻和旱地在7—8月间NDVI值极为接近,可分离性稍差,该时期为水稻拔节期和抽穗期,生长旺盛,ENVI值较高,最大值达0.848 0。由图4可知,各地类EVI时序曲线差异较明显,但在7—8月间,水稻、旱地和林地的EVI值差异非常小,在7月24日、8月8日和8月18日的遥感影像上,绿色植被可分离性较差。由图5中NDWI时序曲线可知,各地类间特征差异显著,在生长季易混分的水稻和旱地也具有较好的可分离性。总体来看,4类时序曲线仅在少数时相上存在水稻和旱地的分离度较低的情况,但各地类均有独特的时序特征,有利于分类精度的提高。

3.2 随机森林分类结果及精度评价

依据6种特征组合方案进行随机森林分类,提取结果如图6所示。该研究将研究区分为水稻、旱地、林地、建设用地和水体5种类型。通过与原始图像对比可以看出,不同方案中旱地的提取结果存在差异,主要原因是水稻和旱地的混分;水体中大面积水域(即龙凤山水库)提取精度高,而河流和沟渠提取精度较低,存在建设用地和水体混分的现象;林地提取结果较理想。

利用验证样本计算混淆矩阵,通过总体精度、Kappa系数、各类别的生产者精度(Producer’s Accuracy,PA)、用户精度(User’s Accuracy,UA)来评价不同试验方案的分类精度(表3)。从总体精度和Kappa系数来看,方案1和2的分类精度相近,方案3、4和5的分类精度接近并高于方案1、2,方案6总体精度最高,与总体精度最低的方案1相比,总体精度和Kappa系数分别提高了3.530 4%和0.044 9,说明利用时序光谱特征进行分类的总体精度最高。由各地类的生产者精度和用户精度可知,方案1即基于时序NDVI分类,旱地与水稻混分比例较高,旱地与水稻的生产者精度均低于90.00%,旱地的用户精度低于70.00%,在方案2中混分现象没有明显改善,方案3中水稻和旱地的分类精度有较大提升,水稻的PA和UA分别提升了4.29%和2.68%,旱地分别提升了4.26%和8.95%;方案4和5的结果与方案3相比,分类精度提高有限,甚至方案4整体分类精度略低于方案3,说明在NDWI的基础上加入NDVI或EVI,分类精度并没有明显提高;方案6总体精度最高,水稻和旱地的混分现象得到有效抑制,与方案1相比,水稻的PA和UA分别提升了8.64%和3.36%。综上,方案6即利用时序光谱特征进行分类,各地类的分类精度及总体精度均较高,方案3即基于时序NDWI的分类结果也较为理想。

4 结论

利用覆盖水稻完整生育期的多时相Sentinel-2A/B数据,构建NDVI、EVI、NDWI和光谱特征时间序列数据集并设计6种试验方案,结合随机森林算法进行五常市龙凤山镇水稻信息提取,同时计算混淆矩阵来评价不同实验方案的水稻种植信息提取精度,主要结论如下:

(1)NDVI、EVI时序曲线可以明显反映出水稻生长季的物候特征;各类地物的光谱时序曲线和NDWI时序曲线均具有的特征,有利于提高分类精度。

(2)基于NDVI、EVI时序数据集的分类结果,水稻与旱地混分比例较高,分类精度较低;基于光谱特征时序数据集的分类结果,总体精度、Kappa系数、水稻生产者精度和用户精度均较高,同时水稻与旱地的混分现象得到有效控制。

由于该研究采用的是基于像素的分类方法,分类结果存在一定的“椒盐现象”,未来应将时序数据集与基于对象的分类方法结合,减少“同物异谱”和“同谱异物”的产生。

参考文献

[1] 陈安旭,李月臣.基于Sentinel-2影像的西南山区不同生长期水稻识别[J].农业工程学报,2020,36(7):192-199.

[2] 麦丽素,乌兰吐雅.基于Sentinel-2数据的水稻面积提取方法比较分析[J].北方农业学报,2019,47(5):119-126.

[3] 周思,何祺胜,刘宝柱.基于MODIS的黑龙江省农作物种植结构提取研究[J].地理空间信息,2018,16(1):79-82.

[4] 郭昱杉,刘庆生,刘高焕,等.基于MODIS时序NDVI主要农作物种植信息提取研究[J].自然资源学报,2017,32(10):1808-1818.

[5] 朱彤,張学霞,王士远,等.基于物候特征和混合光谱信息的春玉米种植面积提取[J].沈阳农业大学学报,2017,48(3):328-337.

[6] 王利军,郭燕,贺佳,等.基于决策树和SVM的Sentinel-2A影像作物提取方法[J].农业机械学报,2018,49(9):146-153.

[7] 毕恺艺,牛铮,黄妮,等.基于Sentinel-2A时序数据和面向对象决策树方法的植被识别[J].地理与地理信息科学,2017,33(5):16-20.

[8] 杜保佳,张晶,王宗明,等.应用Sentinel-2A NDVI时间序列和面向对象决策树方法的农作物分类[J].地球信息科学学报,2019,21(5):740-751.

[9] 张海东,田婷,张青,等.基于GF-1影像的耕地地块破碎区水稻遥感提取[J].遥感技术与应用,2019,34(4):785-792.

[10] 杨闫君,占玉林,田庆久,等.基于 GF-1/WFV NDVI时间序列数据的作物分类[J].农业工程学报,2015,31(24):155-161.

[11] 万丛,梁治华,张锦水.基于高分一号宽幅时序影像的冬小麦分布识别研究[J].安徽农业科学,2020,48(23):256-259.

[12] 王碧晴,韩文泉,许驰.基于图像分割和NDVI时间序列曲线分类模型的冬小麦种植区域识别与提取[J].国土资源遥感,2020,32(2):219-225.

[13] 张磊,宫兆宁,王启为,等.Sentinel-2 影像多特征优选的黄河三角洲湿地信息提取[J].遥感学报,2019,23(2):313-326.

[14] 何云,黄翀,李贺,等.基于Sentinel-2A影像特征优选的随机森林土地覆盖分类[J].资源科学,2019,41(5):992-1001.

[15] 冯文卿,眭海刚,涂继辉,等.高分辨率遥感影像的随机森林变化检测方法[J].测绘学报,2017,46(11):1880-1890.

[16] 詹国旗,杨国东,王凤艳,等.基于特征空间优化的随机森林算法在GF-2影像湿地分类中的研究[J].地球信息科学学报,2018,20(10):1520-1528.

猜你喜欢
旱地时序光谱
旱地麦田夏闲期复种绿肥 保持土壤的可持续生产力
基于三维Saab变换的高光谱图像压缩方法
基于Sentinel-2时序NDVI的麦冬识别研究
旱地冰球运动开展价值的研究
旱地冰球运动推广及发展策略
基于FPGA 的时序信号光纤传输系统
一种毫米波放大器时序直流电源的设计
星载近红外高光谱CO2遥感进展
苦味酸与牛血清蛋白相互作用的光谱研究
铽(Ⅲ)与PvdA作用的光谱研究