周俊利 杨振
(河南省遥感测绘院,河南 郑州 450003)
我国是农业大国,同时也是粮食需求大国,及时、准确地获取农作物种植面积及空间分布是关系社会发展、农业政策、国家粮食安全等的重要问题[1]。如何准确获取高原地区农作物种植面积一直是农业调查工作的重中之重。传统的农作物种植面积信息获取不仅费时费力、效率低下,而且难以获取准确面积[2]。遥感技术是一种远距离、非接触的探测技术,具有重访周期短、覆盖范围广、现势性强、数据获取与处理简便等优势,为农作物信息的精准获取提供了强有力的手段[3]。近年来,农业遥感的应用越来越广泛,使遥感技术成为快速、准确获取农情信息的主要途径[4-6]。基于遥感影像的农作物分类与提取是目前农业遥感领域的热点问题[7,8]。张有智等采用人工目视解译与计算机自动分类方法对水稻进行提取,结果显示计算机自动分类的精度与人工目视解译精度相似,但效率提高十倍[9]。计算机自动分类已经成为目前应用最广泛的农作物分类方法,较常用的分类方法为决策树分类、最大似然法分类、随机森林分类、支持向量机分类等[10]。面向对象分类方法是近年提出的一种新的分类方法,是一种基于目标的分类方法,可以充分利用高分辨率影像的空间信息,综合考虑光谱特征、形状、大小、纹理特征等一系列因素,并对多种特征进行综合计算与分类识别,得到具有较高精度的分类成果[11]。目前国内专家学者利用面向对象分类方法开展了大量农作物种植面积提取研究[12-15],然而我国西部山区的农作物遥感提取研究较少,其难点在于山地地区的农作物易受林草影响出现错分类现象,同时受山区阴影影响,也会降低农作物分类精度[16]。
欧空局发布的Sentinel-2A/B 影像具有重访周期短、波段多、波普范围广等优势[17],在农业遥感中已有大量应用[18,19]。张掖市位于我国西北部高原地区,农作物多种植在山谷、山坡、河滩地,相对于平原以及盆地地区,传统的分类方法容易出现错分漏分情况,基于此,本研究选用Sentinel-2 哨兵多光谱影像,采用多波段组合的红边指数作为改进的指数特征参与到面向对象分类中,以此提高农作物分类精度。
张掖市位于甘肃省西北部,河西走廊中段,地处东经97°20′~102°12′,北纬37°28′~39°57′,东靠武威、金昌,西至嘉峪关、酒泉,南与青海省接壤,北和内蒙古毗邻。张掖市属冷温带干旱和祁连山高寒带半干旱半湿润两种气候类型。其特点是夏季短而酷热,冬季长而严寒,干旱少雨,且降水分布不均,昼夜温差大。张掖有全国第二大内陆河黑河水灌溉,地势平坦,土壤肥沃,物产丰饶,以乌江米为有名,盛产小麦、玉米、水稻、油菜、胡麻等农作物,为全国重点建设的12 个商品粮基地之一。
本研究采用的数据为Sentinel-2 多光谱影像,下载地址为欧空局哨兵数据下载官网(https://scihub.copernicus.eu/)。Sentinel-2 是高分辨率多光谱成像卫星,携带一枚多光谱成像仪(MSI),用于陆地监测。Sentinel-2 分为2A 和2B 两颗卫星,一颗卫星重访周期为10 天,两颗协同拍摄,重访周期为5 天。Sentinel-2 卫星影像具有13 个波段,是唯一一颗在红边范围具有3 个波段的卫星,Sentinel-2 卫星影像具有覆盖范围广、波段多、分辨率高等优点,用于陆地监测,可提供植被、土壤和水覆盖、内陆水路及海岸区域等图像,Sentinel-2 影像预处理利用Python代码进行重采样及转投影,最终得到IMG 或者TIFF 格式的WGS1984 坐标系的栅格影像。
面向对象方法的提取类似决策树的构思,从简到繁,先剔除其他无关信息,再经过多次筛选找出有用的地物类别,实现地物的分层提取。与传统分类方法相比其最大的不同是:面向对象分类方法的操作尺度单元不是基于单个像素,而是基于影像对象。面向对象分类方法分为:多尺度分割、特征选择、规则建立与分类。面向对象分类具体流程如图1 所示。
图1 面向对象分类流程
规则建立是指根据影像特征及地物之间的关系建立各层之间的规则以及层内子类型与父类型的规则;根据建立的分类规则,选取合适的分类方法进行影像分类。
张掖市地处高原,植被仅在生长季会存在变化,其他时段植被在影像上随时间的变化不明显[20]。如每年的11 月份至翌年4 月份,植被指数数值多集中在0.2以下,本研究选取的影像时段为2020 年5 月至10 月,即植被变化较明显的生长季作为研究时段。对处理后的无云覆盖的高质量Sentinel-2 影像进行归一化植被指数NDVI 计算,对各时期NDVI 进行均值计算,以时间维横轴进行多时期NDVI 变化趋势展示,如图2 所示,张掖市地区植被变化趋势整体符合植被生长季植被指数变化趋势,即植被指数呈现由低到高、由高到低的变化趋势,植被较明显的时段为2020 年7 月4 日、2020 年8 月13 日、2020 年8 月18 日,其 中2020 年7 月4 日NDVI 数值最高,说明此时段植被长势最好,故本研究采用的最优影像时间节点为2020 年7 月4 日。
图2 张掖市植被生长季变化趋势
以张掖市东南部区域为例,进行植被指数变化斜率计算,斜率空间变化如图3 所示,植被变化斜率绝对值最大区域集中在平原地区,即农作物种植区域,山地地区植被变化斜率绝对值整体低于农作物种植区域,引起这种斜率变化特征的主要原因是农作物在5月至10 月分别处于耕种、出芽、拔节、成熟、收获等物候阶段,该特征较好地区分出了农作物与林草,基于次特征进行植被指数及红边指数计算,可较好地提取出农作物种植面积。同时,植被变化斜率特征为勾画农作物分类样本提供指示作用,减少外出采样工作量,也为后期分类及精度验证提供样本支撑。
图3 张掖市东南部植被变化斜率空间分布
基于Sentinel-2 影像的红边波段计算得出的红边指数NDVIre1、NDVIre2、NDVIre3,分别与NDVI 进行相关分析,分析三个红边指数与NDVI 指数的相关性,结果如图4 所示,其中图4(a)为植被指数NDVI 与红边指数NDVIre1的相关系数空间分布,图4(b)为植被指数NDVI 与红边指数NDVIre2的相关系数空间分布,图4(c)为植被指数NDVI 与红边指数NDVIre3的相关系数空间分布。由图可知,山地地区植被指数NDVI 与3 个红边指数均呈现显著正相关关系,相关系数均在0.5 以上,而地势较平坦的农作物种植区域,植被指数NDVI 与3 个红边指数多呈显著负相关关系,引起这种差别的主要原因是植被在红光波段与红边波段对太阳光的吸收与反射。通过此特征,可证实本研究构建的3 个红边指数在植被反演中具有良好的可用性,将其带入多特征分类器中势必会提高分类精度。
图4 植被指数与红边指数相关系数空间分布
采用植被长势最好的2020 年7 月4 日Sentinel-2影像作为数据源,分别进行纹理特征计算与植被指数、红边指数计算,并将所有特征波段进行组合,输入面向对象分类器中进行分类,分类结果如图5 所示。由图可知,张掖市农作物种植集中分布在山谷地区,其中黑河流域沿岸农作物分布较多,河流山区源头至张掖市城区段,农作物种植分布较少,主要原因为该地区为山地,多为林地、草地,且灌溉条件较差;而东南部地区虽然河流水系较少,但该地区地势相对平坦,灌溉条件较好,农作物种植也较多。改进指数特征的面向对象分类方法,较好地剔除了林地草地对分类成果的影响,本研究分类成果中,东南部的林地草地几乎没有影响农作物提取,同时在西南部地物覆盖类型复杂区域,也较好地提取了农作物。
图5 张掖市周边农作物遥感提取成果
结合植被变化斜率对分类结果进行精度验证。将分类结果套合到植被变化斜率成果上,以此验证农作物提取精度。上文通过研究得出结论:农作物种植区域植被变化斜率绝对值较高,套合解译成果后可知,解译成果范围内植被变化斜率绝对值整体较高,与上文植被变化分析结果相符合,即农作物在5 月至10 月生长季经历了播种、发芽、拔节、孕穗、收获等时期,其地表光谱特征变化较大,不同时段的植被指数相差较大,导致变化斜率绝对值整体偏高。改进指数特征后的面向对象解译成果与此结论相符,即本研究整体分类可信度较好,提取精度较高。
本研究基于Sentinel-2 遥感影像,进行了张掖市植被生长变化分析,筛选出植被生长最优时段,并进行了影像的纹理、植被红边指数等特征的计算,通过面向对象多特征分类方法进行张掖市周边农作物种植遥感提取,本研究在植被红边指数上进行了改进,以此提高分类精度,通过实验得出以下结论:
(1)通过长时间序列植被生长变化分析,得出了适用于张掖市周边农作物提取的最优时段。
(2)基于Sentinel-2 影像计算的红边指数与植被指数NDVI 呈显著负相关关系。
(3)改进指数特征的面向对象多特征分类方法在张掖市农作物提取中具有良好的适用性,整体分类结果精度较高。
本文对农作物进行分类时,是基于像元尺度,会出现椒盐现象,后续会进行更深层次的分类研究。此外,本文并未对特征信息进行筛选,不可避免会存在数据冗余现象,后续研究会进行不同地区的最优特征选取,在保证总体分类精度的同时,进一步提高感兴趣地物的提取精度。