基于决策树的京津冀地区Landsat图像分类

2023-06-22 23:21魏向祎孔令然肖磊
现代信息科技 2023年5期
关键词:遥感影像决策树分类

魏向祎 孔令然 肖磊

摘  要:遥感图像是获取土地覆被信息的重要数据源,基于遥感数据的及时性、高效性、精准性等优点进行土地覆被分类是当前的研究热点。文章采用决策树分类技术,将京津冀地区作为研究区,结合京津冀地区土地覆被的分类特征,建立一套符合京津冀地区的图像分类体系。以Landsat 8数据为原始数据,基于不同类型的光谱特征构建决策树模型,获取研究区地表覆被分类结果,所得结果直观地反映了京津冀地区土地覆被的分布特征。

关键词:决策树;分类;遥感影像

中图分类号:TP751    文献标识码:A  文章编号:2096-4706(2023)05-0041-04

Landsat Image Classification in Beijing-Tianjin-Hebei Region Based on Decision Tree

WEI Xiangyi1, KONG Lingran1, XIAO Lei2

(1.China Water Resources Beifang Investigation, Design and Research Co. Ltd., Tianjin  300222, China;

2.Hydrology and Water Resources Management Center of Tianjin City, Tianjin  300061, China)

Abstract: Remote sensing image is an important data source for obtaining land cover information. Land cover classification based on the advantages of timeliness, efficiency and accuracy of remote sensing data is a current research hotspot. In this paper, taking the Beijing-Tianjin-Hebei region as the study area, and combining the classification characteristics of the land cover in the Beijing-Tianjin-Hebei region, the decision tree classification technology is used to establish a set of image classification system that conforms to the Beijing-Tianjin-Hebei region. Taking Landsat8 data as the original data, a decision tree model is built according to different types of spectral characteristics to obtain the classification results of land cover in the study area. The obtained results directly reflect the distribution characteristics of land cover in Beijing-Tianjin-Hebei region.

Keywords: decision tree; classification; remote sensing image

0  引  言

高光谱遥感影像是一种高维图像,它的数据反映了地物目标的分布特征和光谱特性,且具有很大的数据信息量。遥感图像中的地物由非单个像素的元素组成,相邻像元间的相关性很高。对于高分辨率遥感数据,利用传统的分类方法,通过对地物的光谱提取,识别其分布特征和光谱特性来进行分类,会造成大量的空间数据冗余。基于决策树算法的分類方法可以有效地克服这种难题,建立有意义的分类知识库,进行较为稳定且精确度较高的分类。

决策树分类方法是监督分类方法中一种普遍应用的分类方法,通过构建分类树或分类规则来对遥感图像进行分类,突破了以往常用的方法。当前,各种对遥感图像的处理(如特征信息提取及土地覆被分类利用等)已经开始利用决策树分类方法。国外对运用决策树分类方法进行遥感分类的研究表明,该分类方法的分类效果较好,在对土地特征信息提取、土地覆被分类、土地利用效果上都得到了显著的提高。

1  基于决策树的遥感图像分类

随着遥感图像技术的不断发展,利用遥感图像进行分类逐渐应用于各行业各领域。从人工翻译分类,到基于光谱特性的分类,再到成为相关领域研究热点的基于决策树的计算机自动分类都与遥感图像息息相关。

基于决策树的遥感图像分类通过对遥感图像数据进行处理,构建决策规则并进行图像分类。利用决策树进行遥感分类时结合专家的经验,并加入了辅助因子,能够实现清晰的分类并提高分类精度。

决策树分类算法具有规则简单、处理灵活、精度较高等特点,在高尺度的遥感图像分类上有着很大的优势。我们可以通过提取目标特征信息以及结合先验知识辅助决策来提高遥感图像分类的分类效果,因此,在进行土地分类时将决策树算法与遥感影像系统相结合是提高稳定性和分类精度的一个绝好方法,已成为相关领域的研究热点。

2  决策树分类结果与分析

Landsat 8卫星于2013年在美国空军基地发射,它的轨道周期为99分钟,重访周期为16天。Landsat 8的OLI陆地成像仪具有9个波段,空间分辨率为30米,能够很好地对地物目标的特征进行甄别。Landsat 8上的TIRS是目前最先进、性能最好的卫星载荷,其具有2个单独的热红外波段。Landsat 8在空间分辨率和光谱方面都有很大的优势,包含11个波段。

2.1  研究区概况

本文的研究区域为京津冀地区,总面积约为21.6万平方千米。该地区的海拔高度由西北向东南逐渐降低,地形依次过渡为高原、山地、丘陵和平原,呈现出西北高东南低的地形特点;京津冀地區地貌复杂多样,主要以平原为主,其他地形有坝上高原、太原盆地、太行山丘陵等。紧傍渤海,多滩涂、湿地、海河流域。从气候方面来看,该地区位处华北平原,属温带季风气候,四季交替明显,春季温暖湿润,夏季高温多雨,秋季干爽清凉,冬季寒冷干燥。冀北高原草本植物分布较多,太行山燕山丘陵以灌木为主,冀西北盆地主要为森林,南部平原则多为耕地和人工植被。

2.2  决策树模型构建

2.2.1  NDVI植被指数

NDVI是指归一化植被指数,也叫标准差异植被指数。为近红外波段的反射值与红光波段的反射值之差比上两者之和,主要应用于检测植被的生长状态、植被覆盖度,消除部分辐射误差等。其表达式为:

其中,nir表示近红外波段的反射率值,red表示红波段的反射率值。

NDVI能够部分消除与大气条件有关的辐射变化的影响。NDVI的值被限定在[-1,1]的范围之间,数值过大或过小都会引起不必要的麻烦,其值小于0时,表示地面覆盖为云、水、雪等,对可见光高反射;其值为0时,表示地面为岩石或裸土等;其值大于0时,表示有植被覆盖,NDVI越大,表明植被覆盖率也就越大。

2.2.2  利用不同方式提取植被信息

本文以2018年京津冀地区遥感影像的太行山遥感影像作为训练样本数据,如图1(a)所示,分别利用非决策树的监督分类法、非监督分类法和决策树分类方法对训练样本植被的特征信息提取数据进行了对比。实验过程中可以发现:如图1(b)所示,利用非决策树监督分类法对植被信息的提取首先要提取感兴趣区,非决策树监督分类只可识别训练样本的定义类别,受人为因素影响较大,得出的结果内容缺失较为严重,对分类结果和分类精度造成一定的影响。如图1(c)所示,当利用非监督分类法对太行山地物目标的信息进行提取时,由于对特征信息的提取即是对整体的提取,对单一地物目标的信息提取例如对植被信息的提取,需要进行大量分析及处理,并且会出现“同物异谱”或“同谱异物”的问题,使得数据集与类别更难匹配,从而在一定程度上影响了分类结果和分类精度;而利用决策树分类法提取影像数据的植被信息时,不需要提取感兴趣区,决策树分类法也无须事先确定,其分类是非参数化密度正态分布的,提取数据的特征空间分布,只需构建单一的决策树结构二叉树规则,即可对地物目标遥感图像提取出相应的数据,如图1(d)所示。

通过对这三种分类方法的比较发现:决策树分类法在提取地物信息方面更简捷、高效,决策树构建的决策规则清晰明了,分类效果好,对于处理地物目标的信息特征和分类具有更好的弹性,充分体现了决策树在遥感图像信息提取和分类方面的优势。

2.3  构建决策树规则

首先按照NDVI定义根节点,结合京津冀地区的实际情况,选取NDVI分为大于0.3、小于或等于0.3,这样就完成了第一层节点的构建。

根据NDVI值的不同划分为植被和非植被两个部分,构建第一层决策树节点,进一步分类则是根据坡度继续划分为缓坡植被和陡坡植被,构建第二层决策树节点。

采用同样的方法,将所有规则输入,最后选择分类结果的名称和颜色。

2.4  结果与分析

通过决策树分类得到本次实验京津冀地区的分类结果,如图2所示,京津冀地区分类结果属性表如表1所示,耕地类别共111 001 829个像元,林地类别共51 039 534个像元,草地类别共37 831 394个像元,水体类别共7 866 968个像元,建筑用地类别共30 739 428个像元,未利用地类别共1 857 409个像元。

通过计算可以得出各种类别用地的面积,如图3所示,京津冀地区总面积216 302.816平方千米,耕地面积99 901.646 1平方千米,占京津冀地区总面积的46%;林地面积45 935.580 6平方千米,占京津冀地区总面积的21%;草地面积34 048.254 6平方千米,占京津冀地区总面积的16%;水体面积7 080.271 2平方千米,占京津冀地区总面积的3%;建筑用地面积27 665.395 2平方千米,占京津冀地区总面积的13%;未利用地面积1 671.668 1平方千米,占京津冀地区总面积的1%。

用户精度评估表如表2所示。

从表2用户精度评估表中各类型精度值可以看出,总体精度很高,达到了95.31%。耕地、林地、草地的分类效果不错,但水体、建筑用地、未利用地的分类效果不是很理想。这三者有不同程度的误差,存在错分漏分。错分即在分类图上提取样本图时,被错分为该类型(实际应是其他类型);漏分即例如任取一个建筑用地样本,图像被错误地划分为其他类型。总体来说,决策树的分类效果比较好。

3  结  论

本文基于决策树为京津冀地区构建一套以Landsat8遥感数据为源数据的分类体系。通过建立决策树对京津冀地区的土地覆被进行分类,并对分类结果进行修正和精度评估,通过研究得出以下结论:

(1)与传统自动分类方法相比,基于决策树的遥感图像土地覆被分类方法不需要事先假设数据集的正态分布,并且还可以使用GIS数据库中多个源的信息。计算机自动分类的过程和自动化要求更高的精准性和适应性,不仅可以选择最优算法,还可以在分类过程中加入辅助因子数据来提高分类精度。在进行遥感图像分类时所加入辅助因子的分辨率必须与待分类影像的分辨率相近,否则无法提高分类效果和分类精度,甚至还会影响分类效果和分类精度。

(2)对遥感图像进行分类是解译遥感图像的重要方法,其技术也是如今的研究热点。遥感图像分类方法的選取与分类后的效果、精度息息相关,遥感分类已成为遥感领域的一个重要研究方向。虽然传统的监督分类和非监督分类方法在处理遥感分类问题上有自己独特的优点,但随着遥感技术的不断发展,它们越来越无法满足分类要求的高时效性、高精准性。通过决策树对遥感图像进行分类,要根据实际情况选择合适的特征来构建决策树模型,这样才能使分类效果达到最佳。因此,还需要对遥感分类和算法研究进行更为深入的探索,改进算法并将其应用于遥感分类,改善分类效果,提高分类精度,实现更加高效、精准的分类目标,满足计算机自动化分类的要求。

(3)本文的决策树分类体系是以京津冀地区的实际情况为前提而建立的,适用范围限于京津冀研究区。

(4)本文研究发现:通过决策树算法对遥感图像进行分类的技术尚未成熟,其在遥感领域还处于探索研究的阶段,很大程度上都是在理论的基础上针对决策树算法的自身特点进行分类体系的探讨,目前的研究成果不多。不同的特征变量组合有着不同的决策规则,相应的分类结果精度也不相同,因此选择最优特征向量是关键。通过研究,本文认为将决策树算法与其他技术相结合,在进行分类时加入辅助因子来提高分类精度和分类效率是现阶段较为关键的一步。

参考文献:

[1] 张蓬涛,周雁,刘晓庄,等.人工神经网络在农业自然资源研究中的应用 [J].安徽农业科学,2007(27):8711-8713.

[2] 汤国安.遥感数字图像处理 [M].北京:科学出版社,2004.

[3] 邸凯昌,李德仁,李德毅.基于空间数据发掘的遥感图象分类方法研究 [J].武汉测绘科技大学学报,2000,25(1):42-48.

[4] 李爽,张二勋.基于决策树的遥感影像分类方法研究 [J].地域研究与开发,2003,22(1):17-21.

[5] 魏强.基于MODIS和TM数据的京津冀地区土地覆被分类方法研究 [D].石家庄:河北师范大学,2010.

[6] 贾涛,韩萌,王少峰,等.基于McDiarmid不等式的决策树分类算法 [J].山西大学学报:自然科学版,2019,74(4):718-728.

作者简介:魏向祎(1990—),女,汉族,河北石家庄人,工程师,硕士研究生,研究方向:摄影测量与遥感。

收稿日期:2022-10-17

猜你喜欢
遥感影像决策树分类
分类算一算
一种针对不均衡数据集的SVM决策树算法
分类讨论求坐标
决策树和随机森林方法在管理决策中的应用
数据分析中的分类讨论
教你一招:数的分类
遥感影像资料在海图制图中的应用研究
基于决策树的出租车乘客出行目的识别
遥感数字图像处理课程实验综述
高分遥感影像中道路信息提取方法综述