基于GF-1/WFV时间序列数据的河套灌区主要农作物识别

2019-12-04 03:47乌云德吉于利峰包珺玮许洪滔赵佳乐乌兰吐雅
北方农业学报 2019年5期
关键词:春小麦向日葵农作物

乌云德吉,于利峰,承 昊,包珺玮,许洪滔,赵佳乐,乌兰吐雅

(1.内蒙古自治区农牧业科学院农牧业经济与信息研究所,内蒙古呼和浩特 010031;2.中国农业科学院农业资源与农业区划研究所/农业农村部农业遥感重点实验室,北京 100081)

农田作物信息的快速获取与解析是开展精准农业实践的前提和基础,在农作物识别和农情信息提取上,遥感技术优势明显[1]。作物种类复杂多样,不同作物之间存在明显的光谱重叠,利用单一时相的影像进行农作物分类时容易出现“错分、漏分”现象,很难达到理想的精度[2]。因此,采用多时相数据构成时间序列逐步监测[3-5]是提高分类精度的一个主要方法,其中基于植被指数的时间序列能够有效地减少影像上“同谱异物”和“同物异谱”现象,补充单时相影像的不足,可在农业资源调查和农情评价中发挥重要作用[6]。

国内外许多专家、学者针对农作物精准识别方法做了不同程度的研究,在低分辨率遥感影像应用于农作物识别方面:林文鹏等[7]利用TERRA/MODIS数据,采用波谱分析方法,构建了一种基于遥感影像全覆盖秋季作物类型自动提取方法,对北京地区主要秋季作物进行了遥感自动识别,精度达到了86%以上。JAKUBAUSKAS 等[8]利用傅里叶变换后的AVHRR 数据提取了美国堪萨斯州芬尼县的玉米、大豆和苜蓿3 种作物类型,变换后振幅、相位与作物类型的对应性更强,能够更为准确地提取作物类型。在中高分辨率遥感影像方面,杨闫君等[2]利用GF-1/WFV 16 m宽覆盖影像,构建了16 m 分辨率的NDVI 时间序列,对河北唐山南部地区的主要农作物进行分类研究,支持向量分类方法精度达到了96.33%。刘佳[9]等利用国产环境星CCD 数据月度NDVI 时间序列数据对河北省衡水市完整的行政单元内的冬小麦、夏玉米、春玉米、棉花、花生和大豆等主要农作物进行了分类,在全生育期波谱特征曲线分析基础上,提取了主要农作物的曲线特征,分类总体精度达到了90.9%。SOLBERG 等[10]将ERS-1/SAR(Earth observation satellite-1/Synthetic aperture radar) 雷达影像与TM-(Thematic mapper)全色图像相结合进行农作物的分类提取工作,结果表明,其他辅助空间数据(高程、坡度、坡向等)的引入能够显著地改善分类精度。TURNER 等[11]利用3 个时相的SPOT-XS 20 m分辨率影像,采用非监督分类与监督分类相结合的方法,获取了较高精度的非洲半干旱地区水稻分布图。

遥感数据具有时效性高、客观性强和可视性好等特点,但是遥感数据在获取处理分析过程会产生误差,因此,非遥感的GIS 和GPS 辅助数据在微观和中观领域,特别是高精度的遥感监测中非常有价值,辅助数据不仅用于对遥感数据的补充与纠正,而且用于对遥感最终结果的分析与精度评价,外业采集和实地调查是辅助数据的主要来源之一[12]。

高时间频率的中高空间分辨率遥感影像可以提供更为准确的作物面积分布数据,但国外提供的中高分辨率遥感影像回访周期较长,如LandSat8 号卫星的OLI(Operational land image)传感器回访周期为16 d,其他更高分辨率的卫星影像也大于这个周期,加之获取途径、价格等因素的影响,在作物生长周期内可以获得有效数据更少,大大限制了中高分辨率时间序列数据的应用。但是国产高分卫星的发射和卫星图像的开放应用填补了这个空白。

目前,国产GF-1/WFV 数据具有16 m 的空间分辨率及4 d 的重访周期,只需利用单一数据源就能有效地构建高空间分辨率NDVI 时间序列,对时间序列数据作物分类识别研究具有重要意义,在遥感技术应用农业资源基础调查方面有着广阔的应用前景。

本研究用2017年4月19日—10月20日9 个时相的GF-1/WFV 数据构建了NDVI 时间序列,分析了临河区春小麦、玉米、向日葵和蔬菜(西葫芦、番茄)农作物在归一化植被指数(NDVI)时间序列上的变化特征,提取了变化曲线,通过5 种农作物NDVI时间序列曲线来确定阈值进而构建了分类决策树模型,获取了研究区主要农作物种植面积。

1 材料和方法

1.1 研究区概况

研究区位于内蒙古自治区西部,黄河北岸,阴山南麓,河套平原中部,南临黄河,故名“临河”。地理坐标为东经107°6′~107°44′,北纬40°34′~41°17′。临河区全境为黄河冲积平原,地面开阔平坦,地势从西南向东北微度倾斜,海拔高度为1 209~1 045 m。临河区属于典型的温带大陆性气候,全年日照时数高达3 211~3 306 h,年平均气温6.1~7.6 ℃,≥10 ℃的积温2 876~3 221 ℃。得天独厚的气候和灌溉条件,适宜各类农作物生长。但是由于近年来水资源的过度浪费、农膜和化肥农药的大量使用,巴彦淖尔河套灌区在农业资源可持续利用水平分级中被划分为农业资源可持续利用3 级区域(共4 级,1 级为最优)[13]。

1.2 研究区数据获取与分析

1.2.1 遥感数据获取 本研究所利用的GF-1 数据均下载自:中国资源卫星应用中心http://www.cresda.com/CN/。

GF-1/WFV 重访周期短,对研究范围为县级尺度来说,能够获取与地面数据相匹配关键期的遥感数据。本研究下载了覆盖研究区5 种农作物生长周期内能够获取的少云或无云的数据。数据获取情况见表1。

表1 临河区2017年GF-1 卫星WFV 影像清单

数据预处理在ENVI5.3 平台下进行,对GF-1/WFV数据进行几何精校正、辐射定标、大气校正等操作,在预处理基础上,分别计算了2017年4月19日—10月20日的9 景影像的NDVI 值,计算公式为:

式中,Ref4 和Ref3 分别对应GF-1/WFV 第三和第四波段的反射率。

1.2.2 辅助数据获取

地面解译点数据。在采集外业数据时,以手持GPS 为采集设备,平均每5 km 一个春小麦解译点,解译点选择在3.33 hm2以上较大地块,区域包括平原、丘陵等地形,将点定位地块中央,以“点代面”充分体现地块信息,在种植结构复杂,大量出现间种、套种耕作模式地区,集中打点,不同农作物解译点间隔>45 m。在临河区均匀采集了33 个春小麦点、38 个玉米点、9 个向日葵点、21 个蔬菜(西葫芦、番茄)点作为提取5 种农作物感兴区的依据。

为了精度验证的需求,研究利用2017年8月9日的5 m 分辨率RapidEye 影像,覆盖研究区行政区划面积达52.54%。本研究在设计分类精度验证时因影像覆盖区耕地分布较为平均,所以选取了种植结构较为规整的10 个样方,结合地面数据用人工目视解译的方法,将10 个样地进行了精细的勾绘。图1给出了局部样方的RapidEye 影像图和样方内的作物种植情况。RapidEye 影像对该地区农作物分类具有较大的优势,用纹理特征和颜色就能较好地分辨出待分类的几种农作物[14],尤其本研究所用的8月影像上玉米、春小麦和向日葵的光谱特征差异较大。为保证GF-1 和RapidEye 影像位置的精确配准,所有野外调查数据和影像均以2017年8月TM 影像为基准,进行了几何精校正,误差控制在1 个像元以内。

12 个地面样方总面积为509.29 hm2,其中,春小麦88.47 hm2、玉米107.97 hm2、向日葵153.72 hm2、蔬菜151.85 hm2、林地7.20 hm2,分别占样方总面积的17.4%,21.2%,30.2%,29.8%,其他地物占1.4%。

图1 验证样方影像与样方内作物类型

在研究区,春小麦、玉米、向日葵和蔬菜(包括西葫芦、番茄)5 种作物中,春小麦最先播种,3月下旬播种,4月上旬出苗,6月中旬抽穗,7月中旬成熟,7月下旬基本收割完毕。因河套灌区春小麦收割较早,收割后温度适宜,且灌溉条件好,所以农户在收割后的部分春小麦地上重新种植其他农作物,例如白菜等越冬蔬菜,所以在本研究数据处理过程中小麦地的NDVI 值在9月影像上有小幅上升,达到了另1 份波峰。2017年研究区的玉米因轮作相关政策的约束,玉米种植面积有所下调,通常在5月上旬播种,5月末开始出苗,6月下旬进入拔节期,10月成熟收获,生长季近180 d,是单季农作物。

向日葵主要生长时期有幼苗期、现蕾期、开花期和成熟期;5月中旬播种,6月中旬处于幼苗期、7月下旬进入现蕾期,8月开花,进入生长最茂盛时期。向日葵是河套灌区最晚收割的大宗农作物。

研究区蔬菜种类较为多样,但大面积种植的蔬菜以西葫芦和番茄为主,且生育期和生长周期基本相近,光谱特征和纹理特征也类似,在时间序列影像上难以区分,所以合并为一类,生育期以西葫芦为例说明:西葫芦生长周期大致可以分为发芽期、幼苗期、初花期和结瓜期4 个时期。河套灌区西葫芦一般4月中旬播种,5月上旬发芽,5月中旬进入幼苗期。6月上旬进入初花期,7月中旬结瓜(表2)。

表2 主要农作物生长周期

分类过程中本研究结合地面解译点数据,基于9 期GF-1/WFV NDVI 时间序列,在ENVI 5.3 中画出了每种农作物的典型样本,提取了5 种农作物的NDVI 变化曲线,使用最大值、最小值、平均值、峰值、峰值出现时间等5 个特征阈值作为典型特征,构建了5 级决策树,将其他地区、背景和5 种农作物逐层提取出来。结合地面解译点文件,在解译点辐射10 个像元内画出感兴区,依照此标准划定了57 个玉米感兴区、45 个春小麦感兴区、37 个向日葵感兴区、24 个蔬菜感兴区和17 个林地感兴区。

本研究基于验证样方目视解译分类结果,以总体分类精度、Kappa 系数、用户精度和制图精度4 个指标表示分类精度[15-16]。

2 结果与分析

2.1 不同农作物NDVI 值时间特征分析

不同农作物在不同生长季节、生育时期具有不同的生理特征,并在某些方面(如群体特征)通过NDVI值来反应[17]。因此,基于多时相遥感数据的NDVI 时间序列数据能表现不同植被在生育期内的差异。

由表3可知,林地的NDVI 值4—10月一直大于0.2;春小麦的NDVI 值从4月19日至5月30日持续上升,在5月30日达到峰值,与研究区的春小麦生长实际情况吻合。8月玉米和向日葵生长旺季时春小麦已经收获完毕,春小麦NDVI 值处于最低值,但9月有小幅上升,造成这种情况的原因是河套地区积温较高,且灌溉条件较好,春小麦地在收割后复种白菜等小日期蔬菜,但并非所有小麦地都复种。由表3可以看出,向日葵的生长旺季出现在8月下旬至9月上旬,而玉米的生长旺季出现在7月上旬至8月下旬,区分的关键阈值出现在7月上旬,二者NDVI 值有较大的差距;而蔬菜的生长旺季出现在7月上旬,但8月部分蔬菜成熟收获,所以从7—8月,NDVI 值有较大幅度的下降,这是蔬菜与玉米、向日葵区分的关键。

2.2 基于NDVI 值的农作物类别区分过程

在分析研究区目标农作物的时间序列NDVI 值特征的基础上,从全生育期时间覆盖的角度上,提取了5 种农作物的NDVI 值变化曲线,使用最大值、最小值、平均值、峰值、峰值出现时间5 个特征阈值作为典型特征,用于构建决策树的模型。其中主要农作物的NDVI 平均值在决策树构建中发挥了最主要的作用,是用于确定区分农作物种类的关键阈值。峰值和峰值出现时间是区分春小麦和其他作物的关键,并且根据峰值出现的时间,大致判断出关键生育时期并用关键生育时期,NDVI 值区分玉米、向日葵和蔬菜。在ENVI 5.3 软件平台中按照图2所示的决策树分类模型进行分类,采用了12 个样方对结果进行了精度验证,当精度验证结果较低时,重新调试阈值进行分类,当精度改善不大时停止调试,接收目前的分类结果。

表3 临河区主要作物归一化植被指数NDVI 值变化特征

图2 基于NDVI 阈值分割的决策树分类模型

在分类过程中,首先判断背景和非植被区域,一般认为7—9月NDVI 值大于0.2 是植被,否则是非植被,但是河套灌区春小麦和部分蔬菜收割较早,地面裸露,NDVI 值趋于0,所以经过反复调试阈值,满足7月10日NDVI 值大于0.2 并且8—9月NDVI值大于0.1 的是植被覆盖区域,否则是背景或非植被。林地的NDVI 值始终大于0.2,且7月的NDVI最小值也大于0.5,所以4—10月的NDVI 值均大于等于0.2,且7月NDVI 值大于等于0.5 为林地,没有满足上述条件的则是农作物。春小麦是最先播种的农作物,最早达到生长旺季,并且最先收获,所以如果满足5月末至6月初的NDVI 值大于等于0.2,且8月NDVI 值减去6月NDVI 值小于0,则判定为春小麦,否则就是其他作物。蔬菜的生长旺季仅次于春小麦,在7—8月NDVI 值有较大地下降,满足8月NDVI 值减去7月NDVI 值大于0.1,否则是玉米或向日葵。玉米的播种比向日葵早,生长旺季也明显早于向日葵,在7月玉米的NDVI 值大于向日葵,而9月初的玉米NDVI 值有明显的下降趋势,且比向日葵小。所以,决策树最后一层,本研究用8月NDVI 值减去7月NDVI 值大于0,且6月NDVI 值小于等于0.15 的为玉米,否则为向日葵。

2.3 分类结果与精度评价

采用研究中构建的决策树分类模型对内蒙古巴彦淖尔市临河区2017年春小麦、玉米、向日葵和蔬菜进行了识别分类。图3给出了5 种农作物的空间分布。基于分类结果统计出了研究区5 种农作物的总面积为20.28 万hm2,春小麦、玉米、向日葵和蔬菜面积分别为0.97 万,6.52 万,9.65 万,3.14 万hm2,分别占农作物总面积的4.8%,32.1%,47.6%,15.5%。

图3 农作物种植分类结果

由图3可以看出,向日葵主要分布在临河区北部区域,北部区域土壤盐碱化程度高,适宜向日葵种植;而玉米大面积种植区域主要在南部黄河冲积平原一带,灌溉条件好,地力等级较高,种植意愿更倾向于玉米;春小麦种植面积小,且地块破碎,连片种植较少,中部有一片春小麦连片种植区域为临河农场,春小麦实际种植面积要远低于统计数据;蔬菜(西葫芦、番茄)分布较为均匀,且面积大于春小麦,这与实地调查中了解到的情况基本一致。

在精度评价结果分析时,文章采用了10 个地面样方对基于决策树的分类结果进行了精度验证,表4给出了验证结果混淆矩阵。由表4可知,总体精度为76.29%,Kappa 系数为0.652 9,达到了高度一致性。从用户精度和制图精度上,春小麦分类精度最高,向日葵次之,蔬菜的分类精度最低。造成分类精度未能达到80.00%以上的原因有:(1)获取图像质量问题,7月10日影像和8月24日影像上有部分云遮挡;(2)作物长势情况不均衡,从实际情况来看,玉米和向日葵错分的情况较为突出,北部干旱、南部水利条件较好,长势差的玉米有可能被错分为向日葵和蔬菜;(3)蔬菜分类精度较低,临河区蔬菜种类较多,种植面积较广泛的是西葫芦、番茄,但是还有其他经济类的蔬菜和小部分瓜地,因反射率差异较小,未能全部分类,分类当中产生了相混淆的情况;(4)研究区地块较为破碎,分类难度较大。

表4 分类结果误差矩阵(基于像元)

3 结论

本研究采用的方法试图在县级尺度上建立快速、简单、操作性强的主要农作物分类识别方法。该方法初步探索了研究区5 种作物在GF-1/WFV 原始光谱影像上难以识别的问题,研究结果证明,蔬菜的解译精度未能达到以往文献中报道的平均水平,但在局部区域取得了较好的分类效果,这证明基于植被指数时间序列的决策树分类方法在识别北方地区春小麦、玉米、向日葵和蔬菜上的适用性较强。

通过决策树分类模型发现春小麦识别影像窗口期为5—6月和8月春小麦收割之后,识别玉米和向日葵的影像窗口期在8月末至9月,蔬菜的窗口期在7月中旬。

本研究的结果表明,该方法的进一步完善和细化应侧重原始光谱信息的深入分析和挖掘,达到针对性更强的目的,进一步提高分类精度。

猜你喜欢
春小麦向日葵农作物
高温干旱持续 农作物亟须“防护伞”
俄发现保护农作物新方法
夏季农作物如何防热害
厉害了!农作物“喝”上环保酵素
向日葵
呼和浩特市土默特左旗春小麦播种发育期、理论产量与气象要素关系
绿色农产品春小麦主要虫害防治技术
克什克腾旗旱地优质春小麦高产栽培技术探讨
向日葵
超级向日葵