马春莹
(夏津县自然资源局,山东 德州 253200)
夏津是我国棉花种值大县,棉花种植面积和产量均稳居山东省前三位。近年来,随着乡村振兴战略的深入推进,夏津县高度重视棉花产业的发展,政府对棉花种植面积和空间分布的重视程度不断增强。如何准确、快速地获取大区域尺度下的棉花种植面积是掌握农作物基础信息的必要途径,同时对于落实棉花种植直补和各项惠农补贴、及时了解市场行情发挥着重要的导向作用[1]。早前,棉花种植面积主要通过人工实地调查的方式来获取,这种方法具有劳动强度大、速度慢、成本高等不足,且统计信息受人为因素影响大,在大尺度空间分布调查时很难得到精准的种植信息[2]。
随着遥感技术的快速发展,卫星影像在现代农业管理中得到了广泛运用,早期卫星的空间分辨率较低,混合像元的存在限制了其在农作物面积提取方面的应用[3]。国产高分卫星6号(以下简称GF-6)是国内第一颗搭载了能有效辨别作物类型的高空间分辨率遥感卫星,其在卫星传感器中首次配置了能有效反映农作物特有光谱特性的“红边”波段,该波段是反应植物生长状况的敏感性波段,能够显著提升作物精准识别的能力,为高精度、定量化的农业生产过程和农业资源环境要素监测提供了可靠的数据支撑。本文选取山东省夏津县为研究区,以GF-6卫星影像为主要数据源,哨兵2号(以下简称Sentinel-2)卫星影像作为参照,采用面向对象的决策树型分类方法,并选用易康遥感影像分析软件(以下简称eCogniton)进行分类,实现了该县棉花种植面积的精准提取。
夏津县地处鲁西北平原、鲁冀两省交界处,北依德州,南靠聊城,西临京杭大运河。夏津县属暖温带半湿润大陆性季风气候,冷热、干湿明显,四季变化明显,晚秋经常出现干旱,干旱对于喜温好光的棉花影响比其他作物小,这是夏津县种植棉花历史悠久的气候原因。近年来,夏津县强化要素集聚,科学划定棉花保护区,统筹高标准农田、小农水、土地整理等项目,重点提升棉田基建,助力绿色高质高效棉花生产。
本研究选取GF-6卫星影像作为遥感数据源,GF-6卫星配置2m全色/8m多光谱高分辨率相机、16m多光谱中分辨率宽幅相机,2m全色/8m多光谱相机观测幅宽90 km,16m多光谱相机观测幅宽800 km(表1)。为了检验GF-6卫星棉花种植面积的提取精度,同时选取同时相的Sentinel-2影像数据进行提取,对比两者的解译精度。采用的其他数据如耕地分布图、向量行政区域规划图、农作物种植面积调查统计年鉴等资料均来自官方统计数据。利用ENVI 5.3软件对卫星影像数据进行预处理,主要包括正射校正、几何配准、影像融合、图像掩膜、辐射校正等步骤[4-5]。
表1 GF-6卫星参数
1.3.1 提取方案
合理的作物识别方法可以提高作物识别的精度,有利于获取到准确的棉花空间分布信息与面积[6]。参照棉花的光谱特征和遥感影像颜色特征,采用构建决策树模型方式进行分析提取,得到基于监督分类方法下棉花的像元结果,按照棉花掩膜规则生成棉花掩膜后,将其应用在夏津县卫星影像上,由于其他作物基本被掩膜遮蔽,棉花光谱和掩膜区域内其他地物的光谱可分性较好,再使用eCogniton软件进行分类,排除符合掩膜规则的农田以外地物,达到精确提取棉花种植面积的目的[7],具体流程见图1。
图1 提取流程图
1.3.2 精度评价的方法
将估测面积和统计数据进行对比,分析提取精度,再采用Kappa系数对提取方法进行精度评价,Kappa系数的计算基于混淆矩阵,K值的范围通常为-1~1之间,一般大于0[8],Kappa系数计算公式见式(1):
(1)
其中:Po—所有对角线元素之和除以整个矩阵元素之和得到的商值;Pe—每个真实样本乘以预测样本的和再除以样本个数的平方的值。
夏津县的棉花种植规律为4月份开始播种,此时的植被覆盖率较低,5~6月份,大多数的棉花还处于幼苗期,卫星影像呈现为淡绿色,此时地面植物的反射光谱特征基本相似,难以进行分类提取。8月初,棉花生长进入第一个花铃期,此阶段的棉花繁殖和发育最强烈,2~3周后棉花开始进入初开和盛花期,此时的植株长势达到最高峰,卫星图像呈现出鲜绿色。通过对棉花种植结构特征、遥感影像颜色特征、光谱特征的分析,可知棉花的最佳遥感识别期为8月中下旬,此时地物间植被指数差异较大,棉花较容易的识别出来(图2)。
图2 夏津县8月份几种地物的反射波谱曲线图
参照夏津县棉花调查整理数据,利用其中有准确经纬度、种植作物信息的地面调查点,建立研究区作物样本图斑,分别建立棉花、玉米、水体、林地的训练样本和验证样本,统计遥感数据训练样本可分离系数的变化情况。本研究选取卫星影像中R、G、B和NIR共4个10 m分辨率的波段图像进行融合,利用ENV15.6和ArcGIS10.7对融合后影像重新构建金字塔,然后提取相对应的每个采样点的光谱波段反射率值,结合卫星遥感指数已有算法,并利用ENVI5.3平台的Band Math工具计算出不同土地利用类型的植被指数[9]。
本研究利用eCogniton软件进行分类提取,eCogniton是一款高分辨率遥感影像分析软件,主要通过面向对象的影像分割技术,来实现影像的分析与数据获取[10],提取步骤如下:
(1)棉花粗提。分类的基本过程中,先选定目标地物样本对象,由软件系统自动计算该类地物的属性值,然后建立特征空间结构[11]。以已确定样本的特点空间结构为核心,通过统计方法分析其余未分类型的摄影对象和该区位特性空隙之间的差距,那么影像对象离哪个区位的特性空隙最近,即会被分类在该类别中。8月棉花的平均反射率均高于树类和其他作物,而水域和灌木因为其独特的地理特点导致波谱特征几乎不会有太大明显变化,其他地类的波谱曲线的形态都有较大变动[12],由此,参照不同作物的像元可以得到棉花粗提结果。
(2)棉花掩膜。按照掩膜规则生成棉花掩膜后,将其应用在卫星影像上,由于其他作物基本被掩膜遮蔽,棉花光谱和掩膜区域内其他地物的光谱可分性较好。通过分割试验得到研究区域内的影像分割参数,调整各参数权值,包括分割尺寸、图形紧致度、平滑度和色彩参数权重等,得出在多种分割图层下解析不同地物最适宜的切割尺寸[13-14]。根据分割结果来调整样本点的疏密,使得遥感影像精度和分割尺度、样本集相匹配,最终使用的分割尺度参数为100、形状参数为0.3、精致度参数为0.7。使用支持向量机分类方法进行监督分类,排除符合掩膜规则的农田以外地物,达到精确识别棉花种植面积目的。
(3)棉花提取。已经分离出的农作物图层中含有农田、苗木和少量的不透水地表(池塘等),首先在分割尺寸为100的影像对象层中进行粗提纯,再使用光谱特性“Ratiored”和几何特性“Length/Width”进行初步提纯;随后再将初步提纯后的作物类别传送到分割尺寸为100的影像对象层中再次进行提纯。提取过程如图3所示。
图3 棉花提取过程
综合利用遥感数据源,采用面向对象的决策树型分类方法,并基于eCogniton的棉花种植信息分类提取方案,得出夏津县棉花识别的最佳解译结果(图4、图5),结合实地验证点、作物分类样本对解译精度及棉花提取精度进行验证[15]。
图4 基于GF-6卫星提取的夏津县棉花分布图
图5 基于Sentinel-2卫星提取的夏津县棉花分布图
根据分类结果,利用ENVI中的Statistic(统计)工具,计算得出棉花所占的像元总数,然后计算其种植面积(种植面积=像元数×像元面积)[16],最后得到基于GF-6卫星和Sentinel-2卫星提取的夏津县2021年棉花种植面积分别为11369.96 hm2和11109.96 hm2。将估测结果与官方统计数据进行对比(统计结果见表2)。
表2 提取面积与官方统计面积对比 单位:hm2
从表2数据看出,基于GF-6卫星遥感提取的面积更加接近官方统计的面积。
分别计算基于GF-6卫星和Sentinel-2卫星的棉花种植信息提取的总体分类精度、Kappa系数、生产精度和用户精度,统计数据见表3。
表3 作物验证样本检验解译精度汇总表
由表3可知,GF-6卫星在总体分类精度、生产精度、用户精度等方面的数值均高出Sentinel-2卫星约2个百分点,证明了其对棉花形状、纹理、大小等特征均有更高的辨别度,红边波段的确能提高作物识别的能力[16],提高作物的解译精度。
为了评估分类的准确性,在夏津县棉花分布图中选取49个验证点与实地进行对比分析,由于验证点是随机选取,且未均匀分布于研究区域内,所以本次统计仅计算总体分类精度[17]。经实地调查统计,利用GF-6卫星提取的49个验证点中有46个分类正确,3个分类错误,总体精度达到93.88%;利用Sentinel-2卫星提取的49个验证点中有45个分类正确,4个分类错误,总体精度达到91.84%。实地调查分类错误的原因,其中2个验证点周围种植有大豆和芦苇,提取结果将其误判为棉花;2个验证点套种有其他作物,提取结果产生漏分。GF-6卫星分类结果图斑具有更好的完整性,误判和漏分的情况要优于Sentinel-2卫星。
同时,选取某处验证样方对棉花种植面积提取的精度进行分析,检测方法为利用GPS-RTK实地测量验证样方内的棉花种植面积,与GF-6卫星和Sentinel-2卫星提取的验证样方内的棉花种植面积进行对比,统计结果见表4。从表4统计数据可以看出,GF-6卫星和Sentinel-2卫星提取的棉花种植面积相对误差均小于10%,说明2种卫星提取的面积精度都比较高,GF-6卫星的全色分辨率达到2 m,Sentinel-2卫星的分辨率为10m,GF-6卫星对作物种类及边界匹配更加准确,其对验证样方中棉花地块的形状、纹理、大小等特征上的表现更加突出。
表4 棉花种植面积提取相对误差统计表
本研究以GF-6卫星影像为主要数据源,采用面向对象的决策树型分类方法,并基于eCogniton遥感影像分析软件成功提取出夏津县棉花种植面积,该方法在处理高维度、大体积遥感数据中展现出天然的优势,其对大区域尺度的历史遥感影像处理分析能够更高效、准确的获取区域种植空间分布信息,通过研究总结如下:
(1)经检验,基于GF-6卫星的棉花面积提取结果在精度方面明显优于Sentinel-2卫星,证明了GF-6卫星新增的红边波段能够显著增强作物的识别能力,红边波段特征与作物生长状况、植被特征的相关性更强,其850 km的宽幅数据可较好地用于中小区域尺度的地物提取,使得复杂地块作物面积监测结果更加客观合理,GF-6卫星能为遥感解译提供更加丰富的信息,其在作物面积提取方面具有广泛的应用潜力,极大地推动了卫星遥感技术的国产化应用。
(2)随着对地观测技术的不断发展,高空间、时间以及光谱分辨率的卫星持续发射,其载荷类型不断丰富,空间信息网络通信能力不断提升,在轨数据处理能力不断加强,为农业资源调查等应用提供了更加丰富的数据源。考虑到单一遥感系统观测往往并不全面,后续通过多传感器进行数据融合研究能更有效发挥多平台互补观测的优势,即将包含同一目标或场景,在空间、时间、光谱上冗余或互补的多源遥感数据按照一定规则(或算法)进行运算处理,获得比任何单一数据更精确、完整、有效的信息,实现更加精准、全面的作物分类提取。
(3)为提高经济效益,当前的棉花田存在很多套种方式,呈现出“花花田”的现象,即在一块耕地上按照一定的行、株距和占地的宽窄比例种植几种作物,对棉花种植面积识别与提取造成较大的影响,在后续研究中,应当加大对多种作物光谱反射特征的研究,寻找作物之间光谱反射特征的差异,以进一步提高作物识别与提取的能力,为区域发展“精准农业”“智慧农业”建设提供重要的技术支撑。