基于决策树的植被分类研究

2015-05-30 10:48张文静
科技创新与应用 2015年35期
关键词:遥感影像知识库决策树

摘 要:基于IKONOS遥感影像,采用决策树分类算法对南京的植被覆盖进行分类。根据各种植被光谱特征建立知识库,确定决策树规则与算法对植被进行了有效分类与识别,精度较高。

关键词:遥感影像;植被分类;知识库;决策树;纹理

1 概述

植被作为生态系统的主要组成,是生态系统存在的基础,也是联结土壤、大气和水分的自然“纽带”,它在陆地表面的能量交换过程、生物地球化学循环过程和水文循环过程中扮演着重要的角色,在全球变化研究中起着“指示器”的作用[1]。自然界的植被类型复杂多样,传统的进行实地调查的方法耗费大量人力和物力,近年来日益成熟的遥感技术为植被的分类和识别提供了一条新的途径。遥感影像全面真实地记录了地表植被与环境的信息,植被类型的波谱特性在影像上表现为亮度值的不同,这使得对它们的区分成为可能。

目前对于植被类型的识别方法很多,但是由于各种植被类型相互掺杂,且受土壤湿度、同谱异物和同物异谱等多种因素的影响,传统的分类方法对于植被类型识别的结果精度不高。植被的光谱特征可使其在遥感影像上有效地与其他地物相区别;植被指数也被广泛用来定性和定量评价植被覆盖及其生长活力。与单波段相比,用植被指数探测绿色植被更具有灵敏性;决策树分类法具有灵活、直观、清晰、健壮及运算效率高等特点,相对传统的分类方法而言,决策树分类法对于输入数据空间特征和分类标识具有更好的弹性和鲁棒性[2]。

本实验通过各种植被类型的光谱特征统计,得到各种植被类型的光谱曲线和NDVI区间,并利用植被分布的纹理特征,通过比较与分析确定决策树的规则,进行植被分类。

2 研究区概况和数据

本实验所选取的研究区为南京地区。该地区地处长江下游的丘陵地区,中心位于北纬31°56,东经119°14;海拔高度20-448m,属北亚热带季风气候区,年平均气温15.1℃,年降水量1019mm。该地区的植被的特征和种类具有较强的代表性。本实验所采用的数据为IKONOS遥感影像。影像成像于3月份,大小为400×400像素,影像的空间分辨率为4m,如图1所示。

3 基于光谱信息的植被分类

3.1利用NDVI進行植被与非植被的区分

陈君颖、田庆久[3]经过实地考察与土地利用现状图相结合,确定南京的植被类型主要分为灌木林地、草地、农田。由于本试验所用影像为3月份成像,考虑到植被的季相不同,例如豌豆等作物在影像上的表现接近于裸地,故而确定南京的植被类型为灌木林地、草地、农田、裸地,目视判读如图1所示。由于本研究的目的是对植被进行分类,因此需要将植被与非植被分开。已有很多研究证明,用归一化植被指数(NDVI)进行阈值分割可较精确地提取出植被信息。NDV I被定义为近红外波段与可见光红波段数值之差和这两个波段数值之和的比值。即:

NDVI=(DNNIR-DNR)/(DNNIR+DNR)

本研究选取多个植被样本,通过比较其NDVI值,确定了NDVI的阈值为0.5,即NDVI≥0.5的像元为植被,否则为非植被。

3.2 不同植被类型光谱特征的统计

不同植被类型具有不同的光谱特征,本试验对遥感影像中各种植被类型进行了光谱特征统计分析。陈君颖、田庆久[3]利用对所有样本四个波段的DN值、NDVI值及纹理信息进行决策树进行植被分类取得了较好的分类结果。本试验通过对不同植被类型进行采样,共选择了396个灌木林地样本、721个草地样本、497个农田1样本、423个农田2样本、398个裸地样本。然后对所有的样本实验得出各种植被类型的纹理信息(利用Homogeneity指数[7]计算得到)、4个波段的DN值及NDVI进行了统计分析,见表1,其中B1、B2、B3、B4、B5、B6分别代表纹理,近红外波段、蓝光波段、绿光波段、红光波段、NDVI。B1利用Homogeneity指数计算得到,如图2所示。

从统计资料表1与图2比较分析得到:

(1)在B5(红光)波段上,灌木林地相比于其它植被种类DN值较大,因此可以用B5波段的DN值将灌林与农田、草地、裸地分开;(2)从统计资料发现,农田1,农田2,草地在B5(红光)波段上的DN值农田1相对较小,因此可以用B5波段的DN值将农田1与农田2、草地区分开;(3)农田2与草地在B4(绿光)波段上DN值差别较大,因此可以用B4波段上的DN值区分开农田2与草地;(4)从各种植被类型的光谱特征统计(表1)和B4(绿光)波段的纹理一致性图(图2)上我们通过比较分析,发现可能由于地物分布较为支离破碎,纹理并不能起到区分植被类型的作用。

3.3 决策树算法

决策树(Decision tree)法是指根据影像的不同特征,以树型结构表示分类或决策集合,产生规则和发现规律[4]。首先利用训练空间实体集生成判别函数,其次根据不同取值建立树的分支,在每个分支子集中重复建立下层结点和分支,最后形成决策树[5]。决策树由一个根结点(Root nodes)、一系列内部结点(Internal nodes)和终极结点(Terminal nodes)组成,每个结点只有一个父结点和两个或多个子结点。决策树算法在遥感分类中的应用是依据规则把遥感数据集一级级往下细分作为决策树的各个分支,终极结点则为分类结果(图3)。

3.4 基于光谱信息的植被分类

本试验通过在3.2小节中对各种植被类型的光谱信息与纹理信息的比较与分析,结合ENVI软件的决策树自动生成模块,对自动生成的决策树进行了反复的试验与改进,最终确定如图4的决策树算法。

图4中,B2、B3、B4、B5分别为近红外、蓝光、绿光、红光波段的DN值, B6为植被的NDVI。

分类过程为:

(1)计算影像的B5波段的DN值, 其中DN值小于等于291的提取为水体,DN值大于291的提取为植被、建筑、裸地;(2)计算影像的NDVI值,其中大于0.5的归为植被类,小于等于0.5的划分为建筑与裸地;(3)在植被类型的区分中,B5波段DN值小于等于485的分为灌木林地类,大于485的提取为农田1、农田2、草地;(4)在建筑与裸地的去分中,B3波段DN值大于609的划分为建筑2,小于等于609的提取为建筑1、建筑3与裸地;(5)在农田1、农田2、草地的区分中,B5波段的DN值小于等于606的划分为农田1,大于606的划分为农田2与草地;(6)在建筑1、建筑3、裸地的区分中,B2波段的DN值大于484的提取为建筑1,相反提取为裸地与建筑3;(7)在农田2与草地的区分中,B4波段的DN值大于334的提取为农田2,小于等于334的划分为草地;(8)在裸地与建筑3的区分中,B5波段的DN值大于368的提取为裸地,小于等于368的划分为建筑3。应用该算法对影像进行植被分类,并将建筑1、建筑2、建筑3、水体合并,得到的植被分类结果如图5所示。

3.5 分类结果精度评价

为了对分类结果精度进行评价,本研究通过遥感影像目视判读,分别选取了71个建筑水体样本,769个草地样本、400个灌木林地样本、520个农田1样本和460个农田2样本,457个裸地样本,建立混淆矩阵,计算相关指标,得到分类精度评价,结果见表2。

由图1目视判读也可以看出,裸地易与建筑类混淆,草地易与农田2混淆。在表2中,就每种植被类型的用户精度而言,灌林和农田1(见图1)的分类精度最高,裸地、农田2和草地(见图1)的分类精度相对较低,这与目视判读是一致的。从表2可知,测试样本的总体分类精度达到了81.3%,证明该植被分类方法具有较好的分类能力和可行性。

4 结束语

文章提出的植被分类方法是基于各种植被类型光谱特征的知识库采用的决策树分类算法。研究结果表明,该植被分类方法能有效地对植被进行分类与识别,精度较高。对于不同的数据源,如能综合利用更多的地理信息,會进一步提高分类的精度。随着遥感理论与技术的发展,应用多种地理信息综合分析,势必会成为未来发展的主导方向。

参考文献

[1]张云霞,李晓兵,陈云浩.草地植被盖度的多尺度遥感与实地测量方法综述[J].地球科学进展,2003,18(1):85-93.

[2]李爽,张二勋.基于决策树的遥感影像分类方法研究[J].地域研究与开发,2003,22(1):17-21.

[3]陈君颖,田庆久.高分辨率遥感植被分类研究[J].遥感学报,2007,11(2):221-227.

[4]Quinlan J. Introduction of Decision Trees[J].Machine Learning,1986(5):239-266.

[5]Li D R, Wang S L, LiD Y, etal. Theories and Technologies of Spatial Data Mining and Knowledge Discovery [J]. Geomantic and Information Science of Wuhan University,2002,27(3):221-233.

[6]Friedl M A,Brodeley C E. Decision Tree Classification of Land Cover from Remotely Sensed Data [J].Remote Sens.Environ,1997(61):399-409.

[7]Haralick R. Statistical and Structural Approaches to Texture [J].Proceedings of the IEEE,1979,67(5):786-804.

作者简介:张文静(1984,3-),女,工程师,广州市水务科学研究所,现主要从事测绘、地理信息系统技术有关的应用研究、技术开发、生产管理等方面工作。

猜你喜欢
遥感影像知识库决策树
一种针对不均衡数据集的SVM决策树算法
基于TRIZ与知识库的创新模型构建及在注塑机设计中的应用
决策树和随机森林方法在管理决策中的应用
遥感影像资料在海图制图中的应用研究
基于决策树的出租车乘客出行目的识别
遥感数字图像处理课程实验综述
高速公路信息系统维护知识库的建立和应用
基于Drupal发布学者知识库关联数据的研究
高分遥感影像中道路信息提取方法综述
基于肺癌CT的决策树模型在肺癌诊断中的应用