基于多时相遥感数据的水稻种植面积信息提取

2020-05-11 12:13彭乐文张亚
湖北农业科学 2020年2期
关键词:信息提取决策树水稻

彭乐文 张亚

摘要:在遥感影像中,植物的含水量、土壤湿度在短波红外波段下表现很敏感,而红光波段和近红外波段对植物覆盖率、植物长势反映很强烈。基于时间差异的决策树水稻提取模型,通过计算水稻生长不同时期的归一化植被指数NDVI和土壤含水量指数LSWI,在江苏省盐城市射阳县开展了水稻种植区提取的相关研究。经过提取的水稻面积和地方统计数据对比表明,该模型能有效区分出水域、玉米和菜地等较易与水稻种植区混淆的地物,面积提取精度达到76.26%。

关键词:多时相影像;决策树;水稻;信息提取

中图分类号:P237         文献标识码:A

文章编号:0439-8114(2020)02-0157-04

DOI:10.14088/j.cnki.issn0439-8114.2020.02.035           开放科学(资源服务)标识码(OSID):

Rice planting area information extraction based on multi-temporal remote sensing data

PENG Le-wen,ZHANG Ya

(School of Earth Sciences and Engineering,Hohai University,Nanjing 211100,China)

Abstract: In remote sensing images, the moisture content and soil moisture of plants were sensitive to the short-wave infrared band, while the red band and near-infrared band reflected the coverage rate and growth rate of plants strongly. According to the characteristics of rice growing in moist soil, based on a decision tree rice extraction model with time difference, this paper carried out relevant research on rice growing area extraction in sheyang county, yancheng city, jiangsu province by calculating NDVI and LSWI of normalized vegetation index and soil moisture index at different growth periods. The comparison of the extracted rice area and local statistical data showed that the model can effectively distinguish the water area, corn and vegetable fields that were easily confused with rice, and the precision of area extraction reached 76.26%.

Key words: multi-temporal image; decision tree; rice; information extraction

对水稻种植面积及产量信息的获取有助于规划水稻种植区及监测其长势,并且对预测稻米的价格也具有参考作用。相较于传统方法,利用遥感技术对水稻种植面积进行信息提取具有很大的优势,且提取结果更加丰富[1,2]。在运用遥感数据提取水稻信息方面,郑璐悦等[3]基于Landsat 8 OLI遥感影像,运用ENVI 5.1的软件平台建立了沈阳市水稻面积提取模型;郑长春等[4]利用植被特征波段对SPOT-5卫星影像水稻面积进行信息提取,将归一化植被指数融入到影像中,提高了信息自动提取精度。根据提取数據的不同,可以将水稻信息提取方法分为低分辨率数据提取和中高分辨率数据提取。其中,低分辨率数据提取方法是通过归一化植被指数(Normalized difference vegetation index,NDVI)的差异性来提高分类精度。另外,提高水稻信息提取的精度还可以从选择水稻生长的最佳时期入手,基于NDVI时序数据,苗翠翠等[5]利用S-G滤波法进行时间序列重构,并且采取决策树分类器建立提取模型,表明该方法明显能提高提取精度。

近年来,将决策树分类算法应用于遥感影像分类是研究的热点之一。研究表明,该类算法可以明显提高分类的精度[6],并且可以极大提高遥感信息分类的工作效率。基于C5.0决策树分类算法,温兴平等[7]通过数据融合和大气校正处理对ETM+影像进行信息提取,提高了分类及水稻面积信息提取精度。吴健生等[8]在对丽江市土地利用分类研究时,选择基于QUEST决策树分类方法对该地区TM影像数据进行分类,该分类方法具有较快的运算速度和较高的分类精度。

在对水稻种植面积进行信息提取时,选择水稻生长的最佳时相并且运用将决策树分类算法,不仅可以提高水稻种植面积信息分类的精度和效率,而且还可以提高提取精度。水稻生长最佳单一时相信息提取有一定的局限性,很难发现与背景地物的区别。因此,本研究基于Landsat8 OLI影像利用不同时相归一化植被指数(NDVI)和陆地表水指数(Land surface water index,LSWI)不同变化进行小尺度水稻识别,提出分类规则集,并且建立基于时间差异的决策树水稻信息提取模型,并对江苏省盐城市射阳县水稻种植面积进行了提取。

1  研究区域与数据预处理

1.1  研究区域概况

射阳县地处江苏北部里下河下游地区,位于北纬33°24′~34°07′和东经119°59′~120°33′,总面积为2 776.49 km2,海岸线全长103 km,海堤长141 km。全县土地总面积277 648.8 hm2,辖13个镇、1个开发区、1个盐场、4个农场和2个林场(图1)。

射阳县气候温和,属季风气候区,为亚热带和温暖带交界處。地形以平原为主,地势平坦,土地肥沃,适合多种农作物种植。研究区内大部分地区实行一年两熟制,水稻、小麦、油菜是射阳县主要种植的三大农作物,其中水稻的种植面积最大。每年10月至次年6月是油菜和小麦种植期,6—10月是水稻的种植期(表1)。

1.2  数据预处理

本研究采用的试验数据均从地理空间数据云官网获取,条带号119,行编号37,云量在10%以下。获取的时间为2016年6月25日(水稻分蘖初期)、2016年8月28日(水稻抽穗灌浆期)以及2016年10月13日(水稻成熟期)。

1)辐射定标。需要先对遥感影像进行辐射定标,然后由反射率数据计算得到NDVI和LSWI指数。

第一步,先将DN值转换成辐射亮度值L?姿,公式如下:

L?姿=k·DN+Offset

式中,L?姿为光谱辐亮度,k为响应函数的斜率,DN为记录的电信号数据,Offset为响应函数的截距。

第二步,再把辐射亮度值转换成反射率,公式如下:

?籽p=■

式中,d为天文单位日地距离,ESUN?姿为太阳表观辐射度均值,?兹s为太阳高度角。上述计算均在ENVI 5.1的Landsat Calibration模块中进行。

2)大气校正。大气校正的目的是消除大气对地物反射的影响,同时也是反演地物真实反射率的过程[9]。大气校正在ENVI 5.1软件的FLASH Atmospheric Correction模块中进行。

3)裁剪出研究区域。预处理后的遥感影像如图2所示。

2  决策树模型水稻识别提取

决策树是一种常用的数学分类方法[10],由于其具有较高的分类精度和计算效率,被广泛地运用于地物识别提取[11,12],主要流程包括特征指数的选取、样本的选取、决策树模型的建立。

2.1  特征指数选取

健康植被的光谱曲线有很明显的特点,在红波段附近有一个明显的吸收谷,而在近红外波段之间形成一个反射率高的反射峰。基于这一特点,归一化植被指数(NDVI)是近红外波段和可见光波段数值之差和这两个波段数值之和的比值,被广泛应用于植被提取中,其计算公式如下:

NDVI=(?籽nir-?籽red)/(?籽nir+?籽red)

式中,?籽nir为近红外波段反射率,?籽red为红光波段的反射率。

NDVI可以反映植被在可见光、近红外波段反射与土壤反射的差异,且能呈现作物生长变化和物候信息的规律性。由于受到水吸收带(1.4~1.9 μm)的影响,短波红外波段可以反映土壤和植被的含水量敏感程度,因此通常使用陆表水分指数LSWI来区分水稻与其他植被,LSWI计算公式如下:

LSWI=(?籽nir-?籽swir1)/(?籽nir+?籽swir1)

式中,?籽swir1为短波红外段反射率。

2.2  样本选取

为保证决策树模型的精度,需要保证样本数据的可靠性和精确性,且不同类别的样本之间的分离度要尽可能大;另外,为了保证所使用的分类法则能够准确地区分地物类型,就需要有足够大的样本数量[13,14]。本研究以GoogleEarth上的影像作参考获取样本区域251个,并且结合土地利用调查数据,最终得到5 463个样本数据,包括水稻、建筑物、林地、蔬菜、水域等。

2.3  决策树模型

样本数据是建立决策树模型的基础数据,通过对样本数据的数学统计和归纳分析可以获得决策树模型的分类规则。地物样本的特征指数均值随时间变化呈现出一定的差异,为了明显地观察特征指数之间随时间的变化关系,通过扩大NDVI和LSWI指数将区域各种样本地物之间差异性放大,如图3、图4所示归一化植被指数和陆表水分指数都扩大10倍后的图像。

从图3可以看出,①2016年6月25日建筑物、裸土、水体的NDVI值较为接近且几乎是0;大豆、蔬菜和水稻的NDVI值较为接近,在1.5~2.5;林地的NDVI值明显高于其他植被,达到了4.0。②各样本地物NDVI值的变化趋势:2016年6月25至8月28日是农作物的生长旺盛期,农作物的近红外波段反射率大幅增强,因此水稻、蔬菜和大豆的NDVI值明显上升;林地在这两个月间的生长并没有很大变化,故特征统计值上升并不明显;建筑物和水体的NDVI不变,裸土的NDVI稍稍上升;③2016年8月28日至10月13日,水稻进入成熟期,叶片数量减少、含水量下降,除大豆和蔬菜的统计值有些微的增加,其他所有植被的统计值呈减小趋势。

从图4可以看出,①2016年6月25日地物样本的LSWI值可分为两类,一类是值较低的大豆、裸土、建筑物和林地,即含水量低,另一类是含水量较高的水体、蔬菜和水稻;②8月28日时大豆、裸土和水稻的LSWI值均较高且接近,不易区分,水体和蔬菜的值较低且接近,难以辨别;③各样本地物LSWI值的变化趋势:水体和蔬菜在3个时期稳定在较低值,裸土和建筑物稳定在较高值,变化趋势不明显,从6月25日至8月28日,水稻的LSWI值上升明显,而林地的LSWI值呈下降趋势。

综上分析,根据8月植被生长旺盛,NDVI指数较高,且此时水稻处于生长期,稻田的光谱特征表现为植被这一特点,利用NDVI<0将水体提取出来。建筑物和裸土的NDVI值比水体高,但与林地和农作物等植被比较,仍然要低不少。利用NDVI<0.2将建筑物和裸土提取出来。水稻和其他植被在3期NDVI值的变化上区别不大,但是在LSWI上的变化有明显区别,水稻的LSWI值从6月25日至8月28日有明显的上升,这是因为水稻从移栽期到了生长期,从水田变为较为干旱的土地,设置LSWI0828-LSWI0625>0.5这一阈值,将水稻和其他植被区分开来。

根据这些规则集,本研究建立了水稻信息提取决策树模型,展示了完整的水稻提取过程,如图5所示。

3  实例分析

基于已建立的水稻信息提取决策树模型,根据LSWI和NDVI值处理图像,得到的射阳县水稻图像识别分类如图6所示。由于村庄房屋、县城楼房等建筑用地的LSWI值较低,首先利用LSWI值去除建筑用地面积;然后根据NDVI指数变化值对影像植被信息进行分区,并且去除非水稻的地物,最后得到最终的研究区分类结果。

从分类结果来看,水稻种植区较为集中,主要分布在射阳县西北海河、四明、千秋三镇以及淮海、临海、新阳3个农场中,这几个地区灌溉条件较好、水资源有保障。表2为分类结果和地方统计面积的比较,分析可知使用多时相遥感数据提取的水稻面积要低于统计面积,这可能是由于研究区域内有部分水稻的种植时间不统一,故而在分类结果中将这部分水稻划为其他植物,分类精度达到76.26%,对于高效宏观的遥感调查来说,精度是可以接受的。

4  结论与展望

由于农作物的光谱特征较为相近,利用单期影像难以对农作物进行准确地分类,因此可以利用不同农作物有不同的生长周期及物候期的特点,通过选取地物有明显变化的时相影像,实现水稻面积的种植提取。本研究根据一年中3个不同时相的NDVI以及LSWI变化特征,建立了水稻信息提取决策树模型,并对江苏省盐城市射阳县水稻种植面积进行了提取,提取的水稻面积和地方统计数据相比的精度为76.26%。

利用遥感技术提取水稻种植面积信息,不仅可以节省大量时间和人力物力,还可以提高影像数据的可视性和宏观性。但是,本研究也有需要进一步改进和完善的地方,如由于天气原因不容易获取水稻生长关键时期的高质量影像以及易受TM数据成像时间分辨率的影响,另外本研究所建的决策树信息提取模型考虑了不同时相水稻特征指数的变化,但能否适用于双季稻种植区,需进一步研究。

参考文献:

[1] 刘喜珍,李国靖,王立平,等.应用卫星遥感技术对水稻面积变化实施动态监测[J].中国稻米,2003(2):5-7.

[2] 张  莉.基于EOS/MODIS数据的晚稻面积提取技术研究[D].北京:中国农业科学院,2012.

[3] 郑璐悦,许童羽,周云成,等.基于Landsat 8 OLI遥感影像的沈阳市水稻种植面积提取方法[J].浙江农业学报,2017,29(10):1749-1758.

[4] 鄭长春,王秀珍,黄敬峰.基于特征波段的SPOT-5卫星影像水稻面积信息自动提取的方法研究[J].遥感技术与应用,2008,23(3):294-299.

[5] 苗翠翠,江  南,彭世揆,等.基于NDVI时序数据的水稻种植面积遥感监测分析——以江苏省为例[J].地球信息科学学报,2011, 13(2):273-280.

[6] YANG C C,PRASHER S O,ENRIGHT P,et al. Application of decision tree technology for image classification using remote sensing data[J].Agricultural systems,2003,76(3),1101-1117.

[7] 温兴平,胡光道,杨晓峰.基于C5.0决策树分类算法的ETM+影像信息提取[J].地理与地理信息科学,2007,23(6):26-29.

[8] 吴健生,潘况一,彭  建,等.基于QUEST决策树的遥感影像土地利用分类——以云南省丽江市为例[J].地理研究,2012,31(11):1973-1980.

[9] 邓书斌.遥感图像处理方法[M].北京:科学出版社,2010.

[10] FREID M A,BRODLEY C E. Decision tree classification ofland cover from remotely sensed data[J].Remote sensing of environment,1997,61(3):399-409.

[11] 李  爽,张二勋.基于决策树的遥感影像分类方法研究[J].地域研究与开发,2003,2(1):17-21.

[12] CONRAD C,COLDITZ R R,DECH S,et al. Temporal segmentation of MODIS time series for improving crop classification in Central Asian irrigation systems[J].International journal of remote sensing,2011,32(23):8763-8778.

[13] 吴健平,杨卫星.遥感数据监督分类中训练样本的纯化[J].国土资源遥感,1996(1):36-41.

[14] 朱秀芳,潘耀忠,张锦水,等.训练样本对TM尺度小麦面积监测精度影响研究(I)[J].遥感学报,2007,11(6):827-836.

收稿日期:2019-09-20

作者简介:彭乐文(1995-),女,湖南衡阳人,硕士,研究方向为遥感信息工程,(电话)18351938837(电子信箱)Grit_Peng@163.com。

猜你喜欢
信息提取决策树水稻
水稻种植60天就能收获啦
一种针对不均衡数据集的SVM决策树算法
决策树和随机森林方法在管理决策中的应用
基于决策树的出租车乘客出行目的识别
基于肺癌CT的决策树模型在肺癌诊断中的应用