基于面向对象CART决策树的土地利用分类研究

2023-02-07 03:09张静懿王金亮胡文英
地理空间信息 2023年1期
关键词:面向对象决策树纹理

张静懿,王金亮,2,胡文英,2*,张 硕,王 帆

(1.云南师范大学 地理学部,云南 昆明 650500;2.云南省高校资源与环境遥感重点实验室,云南 昆明 650500;3.云南广厦规划建筑设计院有限公司,云南 楚雄 675000;4.云南师范大学 生命与科学学院,云南 昆明 650500)

遥感数据具有快速、准确、宏观、及时更新等特点,应用遥感影像可以方便快捷地提取大量地表信息[1]。利用多波段卫星遥感影像进行土地利用分类是提取土地利用信息的重要方法之一,也是开展土地利用时空演化、动态变化等研究的基础。目前流行的监督分类、非监督分类、神经网络分类[2]以及模糊分类[3]等都是以地物光谱特征为基础的分类方法,在分类过程中会因“同物异谱、异物同谱”而引发漏分、错分问题[4]。面向对象的决策树分类方法依据分割后图像地物的纹理、光谱和形状特征进行土地利用分类,可以很好地解决上述问题,分类效果较好。目前,一些学者基于遥感影像开展面向对象的地物分类已取得了一定成效,如孙建伟[5]等基于ZY-3号遥感数据,采用CART决策树分类法对湖北省荆州八岭山镇进行了土地利用分类;张睎伟[6]等采用决策树分类法提取了中卫市沙坡头区的沙地信息;李恒凯[7]等采用模糊分类和CART决策树分类相结合的方法提取了东江流域土地利用分类信息。基于遥感影像的土地利用分类研究已应用于土地资源管理规划、环境评估等各个领域,其研究结果有利于政府和科研人员了解土地利用分布现状[8]。基于上述研究,本文采用面向对象的CART决策树分类方法,结合光谱、形状和纹理特征对鹿城镇进行土地利用分类研究,挖掘适宜构建CART决策树开展土地利用分类研究的特征变量;同时将二级分类体系与一级分类体系的分类结果进行比较,探索解决一级地类中相似地物因光谱、纹理不同而产生地物错分问题。

1 研究区概况

鹿城镇位于楚雄市东北部,地理范围为24°30′~25°15′N、100°35′~101°48′E,包含山区、坝区和城区,总面积为370 km2,地势东南低西北高;气候温和湿润,年均气温为15.7℃,年均降雨量为813.8 mm,平均空气相对湿度为68%。鹿城镇是楚雄市唯一的一类乡镇,下辖东兴、北浦、万家坝等19个社区,各项经济指标均处于全州前列,其经济发展一直以来都对楚雄市产生巨大影响。

2 数据来源与预处理

国产GF-1号卫星WFV数据回访周期短、幅宽大,适用于大范围土地利用变化检测。本文采用向云南高分中心申请的2013年WFV数据,云量不超过1,包含蓝、绿、红和近红外4个波段,分辨率为16 m。辅助数据为从地理空间数据云获取的Landsat8 OLI影像、GDEMV2 30 m分辨率的DEM数据以及鹿城镇边界矢量数据。GF-1号遥感影像的预处理包括辐射定标、大气校正、正射校正和图像裁剪等,需从中国资源卫星应用中心(http://www.cresda.com/CN/sjfw/zxsj/index.shtml)下载定标参数和WFV波谱响应文件辅助辐射定标和大气校正。实验采用的影像数据如表1所示。

表1 影像类型与获取时间

3 研究方法

本文的研究过程主要包括多尺度分割、CART决策树分类和精度验证3个部分。首先,以2013年GF-1号数据为数据源进行数据预处理,利用影像的光谱和空间特征寻找最优分割尺度,生成图像对象[9];再结合植被指数、波段均值、纹理和长宽比等特征,在二级分类体系下采用面向对象的CART决策树分类方法对鹿城镇进行土地利用分类研究。技术路线如图1所示。

图1 技术路线图

3.1 分类体系与解译标志的建立

根据研究区实际地表情况,参考GB/T 21010-2007《土地利用现状分类》的分类系统[8],将鹿城镇的土地利用类型分为耕地、草地、裸地、林地、建设用地、水体和道路7个一级地类。在eCognition9.1中进行土地利用分类时发现,一级地类中相似地物因光谱、纹理不同会产生错分的情况,因此需建立更详细的二级分类体系,并确立目视解译标志(表2)。本文首先按照二级分类体系进行分类,再利用ArcGIS将二级地类归并到一级地类,由此得到鹿城镇的土地利用分类结果。为了更好地反映二级分类体系对分类精度的影响,本文进行了一级分类体系下的土地利用分类,并比较了其精度。

表2 分类体系与解译标志

3.2 多尺度分割

多尺度分割是开展面向对象分类的基础,利用影像对象的光谱和形状特征,基于影像对象间的最小异质性合并相邻像素,最终把影像划分为多个不重叠的对象。分割效果的好坏将决定地物分离的效果,分割不足与过度分割都会导致分类精度下降。因此,分割尺度的选择对于获取高精度的土地利用分类至关重要。

本文通过ESP工具[10]寻找最优尺度,设置起始尺度为10、20、40,步长为1、10、100,结合局部方差变化率中较明显的几个峰值,寻找最佳形状因子(形状因子包括紧致度和平滑度)和光谱因子。经反复试验得到,各波段权重为1、分割尺度为26、形状因子为0.3、紧致度为0.2时,分割得到的影像对象轮廓最贴近实际地物。

3.3 影像特征提取

分割得到的影像对象含有相似的属性特征[11],通过构建特征空间将属性相似的地物筛选出来即可达到地物分类的目的[12]。本文主要利用3个方面的特征来建立地物识别的特征空间。

1)光谱特征。运用多光谱数据可提取植被指数,其指数大小能反映地表植被覆盖程度的高低,不同地物计算得到的植被指数差别也较大。利用eCognition9.1软件中的波段均值计算植被指数,可辅助地物进行分类,本文采用的植被指数及其计算公式见表3。除了植被指数外,还可运用4个波段均值、Brightnes、Max.diff和Standard Deviation等光谱特征参数辅助分类,如植被呈墨绿色或淡黄色,水体呈青色,建筑物呈白色、红色或蓝色;建筑物亮度较高,山坡背阴面亮度较低等,不同地物所含有的光谱特征均有所差别。

表3 植被指数统计表

2)形状特征。形状指数的运用可快速准确地识别出几何特征差异明显的地物,如研究区道路长宽比较大,运用形状指数Length/Width可快速识别道路;在水体分类过程中,由于山体背阴面和水体的光谱特征极为相似,运用光谱特征很难区分开,而河流和湖泊的形状特征明显,块状湖泊的长宽比接近1,条状河流的长宽比远远大于1,因此通过形状指数就可识别出河流和湖泊。

3)纹理特征。纹理反映了影像灰度级的空间分布与联系,利用纹理特征可将光谱特征相似的地物很好地区分开。通过目视解译可知,耕地形状规则,其条带状和块状纹理较明显。纹理特征分析方法中灰度共生矩阵提供了图像灰度相邻间隔、变化幅度以及关于方向等的综合信息[13]。本文采用均值(Mean)、均一性(Homogeneity)、二阶矩(Second Moment)、非相似性(Dissimilarity)、标准差(StdDev)、相关性(Correlation)、对比度(Contrast)和熵(Entropy)8个纹理特征辅助分类,可准确识别纹理特征明显的地物。纹理特征参数及其计算公式见表4。

表4 纹理特征参数及其计算公式

基于面向对象的CART决策树分类可充分利用特征信息进行土地利用分类。经过反复分类尝试,本文最终确定用来分类的特征为波段均值(B1-B4)、Brightnes、Max.diff、Standard Deviation、植 被 指 数(NDVI、RVI、DVI)、形状指数Length/Width、纹理特征(Mean、Homogeneity、Second Moment、StdDev)等共计19个。

3.4 CART决策树分类

在实际分类中,不同的分类方法具有不同的适宜性。为了避免GF-1号影像“同物异谱、异物同谱”现象对分类精度的影响,本文采用面向对象的CART决策树分类方法。该方法能充分利用分割图像中包含的光谱、形状和纹理信息,使分类结果更接近现实。CART决策树具有超强的分析解译功能,自动化程度较高,在每一步分类中,利用“是”或“否”将数据分为两类,通过多次递归分割完成土地利用分类[14]。CART决策树分类方法以基尼系数(Gini Index)为阈值分割依据,其定义为:

式中,P(j h)、ni(h)分别为训练样本集中测试变量为h时,属于j类的概率和样本数;j为类别数;n(h)为训练样本中测试变量为h时的样本数[4]。

CART决策树是一种特殊的监督分类方法,分类前需选取学习样本集进行决策树的构造并评估。本文采用eCognition9.1构建CART决策树进行分类,实验简单且容易实现[10]。根据分割所得的影像对象,选取训练样本,测试变量为植被指数(NDVI、RVI、DVI)、4个波段均值、Brightnes、Max.diff、Standard Deviation、8个纹理特征(Mean、Homogeneity、Second Moment、StdDev等)和形状指数长宽比Length/Width,目标变量为河流、水库、湖泊、旱地、水田、建设用地、道路、林地等12个地类。CART决策树在eCognition9.1软件中生成并进行分类,部分分类规则如表5所示,可以看出,分类过程充分应用了光谱、形状和纹理特征的统计指标。利用分类规则推理得到的部分CART决策树如图2所示。

图2 部分CART决策树

表5 CART决策树部分分类规则

4 分类结果与精度评价

利用所建CART决策树对鹿城镇进行土地利用分类,可以清楚地看到鹿城镇土地利用类型分为林地、天然草地、人造草地、水田、旱地等14个二级地类。在ArcGIS10.4软件中,根据数据属性信息,将二级地类归并到一级地类,得到一级地类的分类结果如图3所示。为了比较二级分类体系对分类精度的影响,本文基于同样的分类规则,按照一级分类体系直接进行CART决策树分类,得到的分类结果如图4所示。

图3 鹿城镇二级分类体系下土地利用分类结果

图4 鹿城镇一级分类体系下土地利用分类结果

本文采用随机采样、分类检验的方法开展精度评价。随机选取的样本点需满足两方面要求:①样本点应包含所有地类且数量合理;②选取的样本点应具有普遍性和随机性,包含同一土地利用类型下的所有地物特征,不能单纯选择特征突出的地物。本文共采集751个检验样本点,其中耕地289个、林地170个、草地33个、建设用地143个、水体35个、道路44个、裸地37个。本文依据所选的样本点在eCognition9.1软件中建立混淆矩阵,计算Kappa系数和总体精度,对面向对象的CART决策树分类结果进行精度评价,并对一级分类体系和二级分类体系的分类结果进行比较。验证结果如表6所示,可以看出,选取19个特征变量开展的面向对象CART决策树分类效果较好,Kappa系数达到了86.84%,总体精度达到了90.22%,其中林地的分类精度最高,其次是建设用地和耕地;二级分类系统的应用明显提高了耕地、裸地的分类精度,二级分类体系下CART决策树分类的总体精度提高了7.06%,Kappa系数提高了8.71%。

表6 各分类体系下面向对象CART决策树分类精度/%

5 结语

本文基于2013年GF-1号数据,采用多尺度分割面向对象的CART决策树分类方法,运用二级分类体系在光谱特征的基础上融入形状特征和纹理特征,选取19个特征变量,将楚雄市鹿城镇的土地利用类型分为草地、道路、耕地、建设用地、林地、裸地、水体7类,得到的结论为:

1)影像对象是开展面向对象CART决策树分类研究的基础。本文经过多次尝试发现,当最优分割尺度为26、波段权重为1、形状因子为0.3、光谱因子为0.7、紧致度因子为0.2、平滑度因子为0.8时,分割得到的影像对象轮廓更加贴近实际地物。

2)本文运用多尺度分割下影像对象所包含的光谱、形状和纹理信息对鹿城镇开展面向对象的CART决策树分类,挖掘出有利于识别各类地物的19个特征变量。通过精度验证可知,该方法所得的土地利用分类效果较好,Kappa系数为86.84%,总体精度达到90.22%。从各地类的分类精度来看,林地的分类效果最好,其次是耕地、裸地和建设用地。

3)二级分类体系的构建与应用有效解决了一级地类中耕地、裸地等相似地物因光谱、纹理不同而产生的错分问题,提高了土地利用分类精度,总体精度提高了7.06%,Kappa系数提高了8.71%。

基于19个特征变量开展的面向对象CART决策树分类效果总体较好,但草地、道路、水体的分类效果不是很理想,易产生错分情况。鹿城镇的草地占地面积较小,与裸地、耕地的地理位置相近,光谱特征也较相似,受耕地和裸地的影响,其在二级分类体系下得到的分类精度较低。今后可进一步分析造成地物错分的原因,深入探索其他特征变量,以提高草地、道路、水体的分类精度。

猜你喜欢
面向对象决策树纹理
基于BM3D的复杂纹理区域图像去噪
一种针对不均衡数据集的SVM决策树算法
使用纹理叠加添加艺术画特效
决策树和随机森林方法在管理决策中的应用
TEXTURE ON TEXTURE质地上的纹理
基于决策树的出租车乘客出行目的识别
消除凹凸纹理有妙招!
面向对象Web开发编程语言的的评估方法
峰丛洼地农作物面向对象信息提取规则集
基于面向对象的车辆管理软件的研制与开发