基于高分辨率遥感影像的耕地信息快速提取方法研究

2018-03-29 10:27孙家波张晓艳牛鲁燕刘延忠刘炳福张维战
山东农业科学 2018年3期
关键词:耕地

孙家波 张晓艳 牛鲁燕 刘延忠 刘炳福 张维战

摘要:本研究以北京市昌平区作为研究区域,基于2.5 m空间分辨率的SPOT5遥感影像,同时利用SEaTH算法和CART决策树两种分类方法,在自动获取分类规则的基础上,实现了对耕地信息的快速提取。结果表明,两种分类方法的总体精度均在90%以上,KAPPA系数均能达到0.80;SEaTH算法与CART决策树相比,在从高分辨率遥感影像中快速提取耕地专题信息时,耕地的漏分现象得到明显改善,且分类的稳定性更好。

关键词:高分辨率遥感影像;耕地;信息提取;面向对象影像分析

中图分类号:S127文献标识号:A文章编号:1001-4942(2018)02-0132-06

Abstract In this paper, Changping District of Beijing City was selected as research area, and its farmland information was extracted from 2.5-meter SPOT5 remotely-sensed images using SEaTH and CART methods on the basis of automatic access to classification rules. The results showed that the overall accuracy of the two classification methods were above 90%, and the KAPPA coefficient could reach 0.80. Compared with CART method, the leakage of farmland was decreased obviously and the classification stability was better using SEaTH method.

Keywords High-resolution remotely-sensed image; Farmland; Information extraction; Object-based image analysis

耕地的數量和质量关系着我国的粮食安全。随着社会经济发展和城镇化进程的加剧,非法占用耕地的现象随处可见,耕地面积逐渐减少。为了有效保护耕地资源,国土资源部先后提出了“保持耕地总量动态平衡”和“严守20亿亩耕地红线”等目标,并于2014年下发了《关于强化管控落实最严格耕地保护制度的通知》,提出了新形势下耕地保护的新目标、新要求和新举措。耕地数量及分布信息的获取是实现耕地保护的前提,也能够为耕地动态监测、耕地地力调查与评价、基本农田划定等提供数据支持。

遥感技术能够从广域和局域的空间尺度客观地获取耕地信息,基于遥感影像的耕地信息提取一直以来也是研究的热点。随着遥感技术的发展和国内外高分辨率卫星的发射,目前高分辨率影像在测绘制图、交通建设、资源环境、灾害监测和国土管理等领域已得到广泛应用。高分辨率影像能够清晰、准确地表达地物的边界、形状、表面纹理、内部结构和空间关系,因此能够充分利用影像信息进行耕地信息提取,提取的结果从数量和空间分布上也更为可信。但是,高分辨率影像自身的特点也为耕地信息的快速提取带来了一定的难度和挑战,主要体现在:(1)类内差异增强。以耕地为例,耕地与周围地物在空间上镶嵌并相互交织,构成一些不易识别的混合体,同时由于土壤属性、作物组成、种植方式等的差异,造成耕地内部的光谱差异。(2)干扰因素复杂。由于影像内容的高度细节化,加上地物边缘部分的模糊性及地物内部区域的阴影遮挡等,导致影像内部“同物异谱”现象突出,“异物同谱”现象也依旧存在。(3)数据量急剧增加。覆盖一个县域行政区的数据量通常超过若干GB。(4)自动化处理难度增加。高度细节化及结构独立化使得解译对象的数量急剧增加,而适用于高分辨率影像自动解译的技术非常缺乏,且远未达到实用化阶段。

国内外众多研究已表明,面向对象的影像分析比传统的基于像素的分类更适合于高分辨率影像专题信息提取。面向对象的影像分析主要包含分割和分类两个过程,由于均需要较多的人工参与,分类自动化程度较低,导致实际应用中高分辨率影像仍然以目视解译为主。分类过程难点主要集中在分类规则的自动获取,目前常用的方法包括CART(Classification and Regression Tree)决策树和SEaTH(Separability and Thresholds)算法。CART决策树的基本原理是通过由测试变量和目标变量构成的训练数据集的循环分析形成二叉树结构的决策树,其结构清晰,易于理解,能够清晰地指出变量对分类的重要性。Laliberte等结合CART决策树和面向对象影像分析技术,实现了对湿地植被覆盖的分类[1]。SEaTH算法基本原理是首先利用J-M(Jeffries-Matudita)距离衡量两两类别之间基于某特征的可分离性,选择分离度较高的特征作为类别区分的显著特征,其次基于高斯概率分布混合模型确定显著特征对应的最佳阈值,以保证当使用该阈值时两两类别之间的混分最少。Nussbaum利用SEaTH算法基于航片、ASTER影像、QuickBird影像等,对核设施进行面向对象分类和变化检测,均取得了较高的精度[2];Gao等利用SEaTH算法对ETM+影像进行土地覆盖分类,并与面向对象的最邻近分类和基于像素的最大似然分类进行比较,精度分别为79%、66%和69%,证明了该算法同样适用于中分辨率影像[3]。

CART决策树和SEaTH算法均能解决分类规则自动获取的问题,前者虽然能够直接得到分类决策树,但是需要同时兼顾所有地类,针对性差;后者基于两两地类进行分析,针对性较强,能够直接提取典型地类专题信息。因此,本研究以北京市昌平区为例,选用SPOT5高分辨率遥感影像,利用SEaTH算法实现耕地分类规则的自动构建,提取耕地专题信息,并与CART决策树方法的结果进行对比分析,为实现高分辨率影像其他典型地类的专题信息快速提取提供借鉴。

1 研究区概况与研究方法

1.1 研究区概况

研究区选择北京市昌平区百善镇,该区域耕地以种植玉米、小麦和大豆为主,设施农业也占了一定的比例,以蔬菜、草莓等温室大棚为主。试验数据为融合后的SPOT5影像(图1),空间分辨率为2.5 m,时相为2002年10月1日,包括红、绿、蓝和近红外四个波段。以2002年昌平区1∶10 000土地利用现状矢量数据为基准,对影像进行几何校正,均方根误差控制在1个像元以内。

1.2 研究方法

1.2.1 土地覆盖分析 影像中的地物类别依据其存在的独立性,可以划分为基础类别和附属类别[4],前者是指某类别的存在与其他类别的存在没有直接联系,后者是指某类别的存在依赖于其他一个或多个类别的存在。研究区的基础类别包括耕地、林地、建设用地、裸地和水体;附属类别包括阴影,这里将阴影也作为一种覆盖类别。每一种地类的具体细分及覆盖表现如图2。

1.2.2 影像分割 分割是面向对象影像分析的基础,分割效果的好坏直接关系到分类的精度[5]。本研究是以耕地作为目标地类,只需要保证耕地的分割效果,不需要综合考虑全部地类的分割效果,因此只建立了一个分割层;在分割算法的选择上采用的是多尺度分割结合光谱差异分割的形式,即先利用多尺度分割算法对影像实现过分割,然后再利用光谱差异分割算法对分割结果进行优化。利用eCognition 9.0软件,通过多次参数设置及分割效果的目视分析,多尺度分割算法的参数设置为:光谱因子权重0.9,形状因子权重0.1,紧致度因子权重0.5,平滑度因子权重为0.5;光谱差异分割的参数设置为5。两种分割算法执行的效果如图3所示。

2 结果与分析

2.1 分类规则的自动获取

利用SEaTH算法的J-M距离分析耕地各个

子类与非耕地类别的可区分度,结果如图4。可以得到如下信息:(1)密集作物覆盖和菜地这两种耕地子类,出现在同一个图例中,表示它们与非耕地类别区分使用的特征是一致的,因此可以合并为一个类别,不需要单独提取;(2)非耕地类别与耕地子类的J-M距离均在1.80以上,表明利用SEaTH算法优选出来的两两类别区分的特征是比较有效的;(3)对耕地整体分析,J-M距离大于1.95表示特征区分两种类别的效果非常好,可以发现与耕地最容易区分的地类包括水体、阴影和建筑物,因此在提取耕地时应该按照“从易到难”的原则,将涉及这三种类别的规则执行顺序放在最前面,首先排除掉这三种类别;(4)对耕地子类分析,密集作物覆盖和菜地与非耕地类别最容易区分,其次是中等作物覆盖和稀疏作物覆盖,而无作物覆盖与水泥地面较难区分,中等作物覆盖和林地较难区分,这些均与实际相符。

利用SEaTH算法自动获取耕地各个子类与非耕地类别区分的规则,如表1到表4所示。对于分类特征一致的多条规则,可以合并为一条。

2.2 耕地提取精度分析

基于相同的分类样本和分类特征,使用CART决策树算法进行耕地信息提取,并基于相同的验证样本进行精度评价,结果如图5所示。虽然两种算法耕地提取总体精度均在90%以上,但CART决策树算法的用户精度和KAPPA系数明显低于SEaTH算法,表明CART算法对耕地对象的错分较为严重,且耕地提取的质量较差。

为了更好地比较SEaTH算法和CART决策树算法的耕地提取效果,首先将两种算法的耕地提取结果矢量数据S1和S2取交集得到S3,然后分别从S1和S2中擦除S3得到S1′和S2′,如图6所示,S1′区域用红色表示,即SEaTH算法分为耕地而CART决策树算法分为非耕地的影像对象;S2′区域用蓝色表示,即CART决策树算法分为耕地而SEaTH算法分为非耕地的影像对象。

分别统计S1′和S2′涉及的影像对象的真实类别,结果如表5所示。可以看出:(1)CART决策树算法对耕地错分明显比SEaTH算法要严重,这与两种算法用户精度的差异是一致的;(2)SEaTH算法漏分的耕地对象是46个,CART决策树算法漏分的耕地对象是78个,前者也优于后者。

3 讨论

对于高分辨率遥感影像而言,利用面向对象的影像分析技术进行信息提取,可采用两种分类器,一种是监督分类,一种是规则分类。监督分类对于大范围、大数据量的高分辨率影像而言,不仅计算速度非常慢,而且分类效果较差。而规则分类是一种分层分类法,更具有针对性,更符合目视解译的一般过程,即面对复杂影像,按照先易后难、从已知到未知、先清楚后模糊、先整体后局部等原则,进行多层次的分析判断,因此可以增强信息提取能力、分类精度和计算效率,且在数据分析和解译方法上表现出更大的灵活性[6,7]。本研究在进行耕地专题信息提取时,正是运用这种分层分类法,不仅在很大程度上避免了异物同谱的地物被划归为一类,同时可以先将一些易于识别的地物区分出来,为后面的信息提取创造纯净的环境;而对于那些不易于分类的地物,可以运用掩膜进行分类,以节省分类时间。可见,利用分层分类法进行高分辨率影像信息提取时,每层处理只针对一类目标进行提取,目标明确,问题相对简单,从而提高了每一类目标的提取精度[8]。

对于分层分类法而言,关键在于每层分类规则的构建。分类规则的有效性直接影响到提取精度,分类规则获取的自动性直接影响到提取效率[9,10]。SEaTH算法和CART决策树算法是目前较为常用的两种分类规则自动获取方法。本研究从分类精度和分类效果上均证明SEaTH算法更适合于耕地的专题信息提取。

但在应用该方法的过程中也发现了一些问题:(1)与CART决策树算法相比,SEaTH算法得到的分类规则层次性差,先执行哪条规则、后执行哪条规则需要根据J-M距离的大小人工判断,这在一定程度上降低了耕地提取的自动化程度,是今后需要改进的地方之一。(2)规则又可分为确定性规则和模糊规则,又称为硬分类规则和软分类规则,本研究中耕地提取采用的仅是确定性规则,而且每一条规则里仅选用了一个分类特征,并没有使用多个分类特征的交集或者并集这种形式,这种方式对于J-M距离较大、与耕地容易区分的类别,例如水体、阴影、建筑物等提取效果较好,但是对于J-M距离较小、与耕地容易混淆的类别,如裸地、林地等,分类精度相对较差,因此需要引入模糊规则,利用隶属度分类的方法,减少漏分,纠正错分,进一步提高耕地的提取精度。(3)SEaTH算法最初是用于核设施的监测,即用来提取建设用地信息,与提取耕地信息相比较为容易。这是因为建设用地可以看作是不透水面,而易与不透水面混淆的地类非常少;耕地是透水面,有作物覆盖时容易与林地混淆,无作物覆盖时则容易與裸地混淆。因此本研究提出的针对耕地的快速提取方法,可以推广至建设用地,实现对新增建设用地的快速检测。

4 结论

本研究基于高分辨率的SPOT5影像,以北京市昌平区百善镇为研究区,利用SEaTH算法实现了耕地专题信息的获取,并与CART决策树方法进行了对比分析。结果表明,SEaTH算法无论是在耕地提取精度和分类稳定性上均优于CART决策树方法,而且SEaTH算法的针对性更强,能够通过自动获取分类规则实现耕地信息的快速提取。

参 考 文 献:

[1] Liliberte A S, Fredrickson E L, Rango A. Combining decision trees with hierarchical object-oriented image analysis for mapping arid rangelands [J]. Photogrammetric Engineering & Remote Sensing, 2007, 73(2): 197-207.

[2] Nussbaum S, Niemeyer I. Automated extraction of change information from multispectral satellite imagery [J]. Esarda Bulletin, 2007, 36: 19-25.

[3] Gao Y, Marpu P, Niemeyer I, et al. Object—based classification with features extracted by a semi-automatic feature extraction algorithm—SEaTH [J]. Geocarto International, 2011, 26(3): 211-226.

[4] 鄧媛媛, 巫兆聪, 易俐娜, 等. 面向对象的高分辨率影像农用地分类[J]. 国土资源遥感, 2010, 22(4): 117-121.

[5] 李敏, 崔世勇, 李成名, 等. 面向对象的高分辨率遥感影像信息提取——以耕地提取为例[J]. 遥感信息, 2008, 11(6): 63-66.

[6] 柳稼航. 基于视觉特征的高分辨率光学遥感影像目标识别与提取技术研究[D]. 上海:上海交通大学, 2011.

[7] 周成虎, 骆剑承, 杨晓梅,等. 遥感影像地学理解与分析[J]. 北京: 科学出版社, 1999: 267-269.

[8] 孙家波. 基于知识的高分辨率遥感影像耕地自动提取技术研究[D]. 北京:中国农业大学, 2014.

[9] 葛春青, 张凌寒, 杨杰. 基于决策树规则的面向对象遥感影像分类[J]. 遥感信息, 2009(2):86-90,56.

[10]邓劲松, 王珂, 沈掌泉, 等. 基于特征波段的 SPOT-5 卫星影像耕地信息自动提取的方法研究[J]. 农业工程学报, 2005, 20(6): 145-148.

猜你喜欢
耕地
坚决落实耕地保护“军令状” 牢牢掌握粮食安全主动权
推进耕地占补平衡制度改革的探索与思考
河南制定耕地破坏鉴定技术规范
国务院办公厅《关于坚决制止耕地“非农化”行为的通知》
基于质量提升的规划期内县域耕地产能占补平衡潜力评价研究
浙江:加强耕地保护和改进占补平衡
我国严禁擅自填湖“造耕地”
耕地占补平衡要不降质不减量
我国首次将耕地分等定级
吃饭问题二千年