德宏州森林覆盖遥感制图

2021-12-02 06:05刘昕岑
陕西林业科技 2021年5期
关键词:决策树波段类别

刘 畅,刘昕岑,付 尧

(1.西南林业大学 林学院,昆明 650000;2. 玉溪师范学院 地理与国土工程学院,云南 玉溪653100)

植被是覆盖地表的植物群落的总称,包括森林、草地、农作物、灌丛和沼泽等。它与气候、土壤、地形、动物界及水状况等自然环境要素密切相关。植被覆盖程度是研究区域生态系统环境变化的重要指标,对水文、生态、区域变化等都具有重要意义[1-3]。

植被分类是研究植被覆盖的基础,运用遥感影像分类是获取植被信息的重要方式[4],决策树分类法最常用。该方法最早产生于20世纪六七十年代,由Quinlan[5-6]最早在1986年提出ID3算法和1993年提出C4.5算法。目前,国内外专家利用该方法进行了大量研究,也取得了很多成果。Colstoun等[7]基于Landsat ETM+多时相卫星数据探讨了决策树分类器应用的可行性,而且对美国Delaware Water国家级公园里的11种土地覆盖类型进行了分类制图,其研究结果表明,决策树分类方法在土地覆盖和森林制图方面具有可行性。韩婷婷等[8]利用Landsat TM影像,采用决策树方法研究云南省森林分类,抽取香格里拉县建立决策树模型,并进行精度评价。白秀莲等[9]对内蒙古自治区赤峰市中部采用C5.0算法的决策树分类方法进行分类,研究表明C5.0决策树能够有效的利用各种辅助信息参与到遥感分类,从而不同程度地提高分类精度。杨正斌等[10]构建了基于决策树规则的滇南西双版纳森林覆盖信息提取模型,进行精度评价得到总体精度达99.08%,Kappa系数为0.923。与传统分类方法相比发现,采用决策树方法提取森林信息的精度更高。申文明等[11]利用Landsat ETM+影像和GIS 数据对决策树分类和传统自动分类进行了对比,结果表明基于决策树的分类方法相较于传统分类方法具有更高的分类精度和适应能力,易于实现计算机自动分类的流程化和自动化。

基于此,本文运用遥感技术,通过分析各分类类型的光谱特性、纹理以及色彩等信息,建立决策树模型,对整个德宏地区的地物进行分类,再对分类结果进行遥感制图,以期为促进德宏区生态建设和可持续发展,为研究德宏区生态环境提供参考。

1 材料与方法

1.1 研究区概况

德宏州地处我国西南边陲,位于东经97°31′~98°43′,北纬23°50′~25°20′之间,是云南省8个少数民族自治州之一。东和东北与保山市的龙陵、腾冲相邻,南、西和西北三面与缅甸联邦接壤,全州除梁河县外其它县市都有国境线,国境线总长503.8 km。地势东北高西南低,全州海拔最高点在盈江北部大娘山,为3 404.6 m,海拔最低点也在盈江的西部那邦坝的羯羊河谷,海拔210 m。南亚热带季风气候,具有冬无严寒,夏无酷暑,雨量充沛,雨热同期,干冷同季,年温差小,日温差大,霜期短、霜日少等特点,年降水量1 400~1 700 mm,年均气温18.4~20 ℃。水系有“三江四河”,即怒江、大盈江、瑞丽江、芒市河、南畹河、户撒河、芒东河。不同气候带森林植被类型和面积不尽相同:热带、北亚热带季风气候区森林面积占全州森林总面积5.4%;亚热带以阔叶林为主的森林面积占全州森林总面积57.2%;暖温带主要植被为常绿阔叶林以及油茶、核桃等经济林,面积约占全州森林36.1%;温带山地主要植被为铁杉、高山栎、杜鹃灌木丛等,面积约占全州森林1.3%。

图1 研究区示意图

1.2 研究方法

1.2.1 基于专家知识的决策树分类 基于专家知识的决策树分类是基于遥感图像数据及其他空间数据,通过专家经验总结、简单的数学统计和归纳方法等,获得分类规则并进行遥感分类。分类规则易于理解,也符合人的认知过程,最大的特点是利用多源数据。总体上分为4个过程:定义分类规则、构建决策树、执行决策树和评价分类结果。

决策树方法分为自下而上和自上而下2类。自下而上方法的基本思想是将每个像素作为一个类,首先计算所有类别之间的距离,合并距离最近的两类形成一个新类,然后计算新类和其他类别之间的距离,重复前面的工作,直到最终所有类别都合并为一个大类,形成整个树结构的根部。每次合并产生树结构中的一个结点,分类树由多个结点和分枝组成,最下面一层的结点称为根结点,最上面一层的结点称为终端结点,终端结点为一类。本研究采用自上而下的方法,该方法基本思想是将图像作为一个大类,按照最大的差异性区分出两个类别,对于区分出的类别同样按照最大差异性继续分类,直到达到工作要求。

决策树分类包括训练和分类两步,首先利用训练样本对分类树进行训练,构造分类树结构,然后用训练好的分类树对像素进行逐级判定,最终确定其类别归属。当分类出现类别混淆又难以解决时,可以采取逐级分类的方法。先确定特征明显的大类别,对每一大类再作出进一步的划分,此时可以更换分类方法,也可以更换分类使用的图像特征,以提高这一类别的可分性。

1.2.2 光谱特征分析 地物光谱特性是指各种地物各自所具有的电磁波特性(发射辐射或反射辐射)。遥感图像中灰度与色调的变化是遥感图像所对应的地面范围内电磁波谱特性的反映。将影像分为针叶、阔叶、针阔混交、灌木、草本、居民地、水体、湿地、荒地、旱地和水田11个类别,分别在每个类别中勾选出具有代表性和典型性的样本,统计样本的光谱均值,绘制地物光谱曲线,分析每个类别的光谱特性。

1.2.3 植被指数 植被指数是对地表植被状况的简单、有效和经验的度量,广泛地应用在全球与区域土地覆盖、植被分类,目前已经定义了40多种植被指数,本研究利用NDVI指数、DVI指数和MNDWI指数。

归一化植被指数(NDVI)由Rouse等[13]人提出,可应用于植被覆盖度研究,消除大部分与仪器定标、太阳角、地形、云阴影和大气条件有关辐照度的变化,增强对植被的响应能力。NDVI值范围为-1~1,一般绿色植被区的范围是0.2~0.8。其计算公式为:

(1)

其中,LNIR为近红外波段,LR为红波段。

差值植被指数(DVI)对土壤背景的变化极其敏感,能很好地消除土壤背景对植被造成的影响。其计算公式是:

IDVI=LNIR-LR

(2)

其中,LNIR为近红外波段,LR为红波段。

徐秋涵[14]在归一化差异水体指数(NDWI)的基础上,提出了改进的归一化差异水体指数(MNDWI),对比发现MNDWI更能揭示水体的微细特征,很容易地区分阴影和水体,解决了水体提取中难以消除阴影的难题。其计算公式是:

(3)

其中,LG为绿波段,LMIR为中红外波段。

1.3 研究数据

本文采用的数据有:德宏州陇川县的二调数据;覆盖德宏区的Landsat8 OLI遥感影像(成像时间2017年11月14日,影像空间分辨率30 m,共1景影像,轨道号p132r43,共11个波段);GoogleEarth 影像。

2 结果与分析

2.1 地物类别的光谱特征分析

本研究在Landsat8 OLI遥感影像上选取的针叶、阔叶、针阔混交林、灌木、草本、居民地、水、湿地、荒地、水田和旱地11个类别的样本数量分别为140、155、137、113、105、160、140、22、81、52和150,并留取一部分样本作为验证样本。统计光谱均值,绘制样本在Landsat8 OLI遥感影像多光谱2~8波段、3个植被指数、主成分分析的前4个分量以及缨帽变换的前3个分量共17个波段上的光谱均值曲线。图2为典型地物的光谱均值曲线图,其中B1~B7分别对应Landsat8 OLI遥感影像的2~8个波段,NDVI、DVI、MNDWI分别对应3个植被指数(即NDVI指数、DVI指数和MNDWI指数),PC1~PC4对应主成分分析的前4个分量,KT1~KT3对应缨帽变换的前3个分量(即亮度、绿度和湿度)。

从图2可以看出,11个类别在B5、B6、B7、DVI、PC1、PC2、PC3、PC4、KT1、KT2、KT3等11个波段的光谱均值差距较大,因此可以结合这11个波段的光谱均值曲线和直方图曲线,分析确定每一个类别的最佳分离阈值,逐步分离除水体外的10个类别。最后通过NDVI指数区分出植被与非植被,MNDWI指数区分出水体与非水体即可。

图2 典型地物光谱均值曲线

2.2 基于决策树的森林覆盖提取模型

2.2.1 决策树模型 以NDVI指数、DVI指数、MNDWI指数和光谱特征为依据,确定每种类别之间的最佳分离阈值。通过反复试验,结果表明:NDVI大于0.7即为植被,反之即为非植被。在植被区,B5大于3 671和B5大于1 446为阔叶,B6 大于1 395 和B5大于3 044为草本,PC1大于-517和B6大于1 257为灌木,PC3大于-25 和KT2大于-510为针叶,PC1大于-2 655为针阔混交林。 在非植被区,MNDVI大于0.24即为水体,反之即为非水体,B6大于2 311、DVI大于1 575和PC3小于-362为荒地,PC4小于-77.223为居民地,PC1小于-2 864为旱地,DVI大于616和PC2大于690为湿地,MNDVI大于-0.2为水田。图3为决策树模型。

图3 决策树模型

2.2.2 分类结果图 执行决策树模型后,对分类结果进行Majority分析剔除小图斑,生成德宏森林覆盖图(图4)。

图4 德宏森林覆盖图

2.3 精度评价

从决策树分类精度检验表(表1)可以看出,基于决策树的德宏森林覆盖信息提取模型的总体精度为66.265 4%,Kappa系数为0.603 6。其中水体、居民地、阔叶、针阔混交的制图精度都在70%以上,其他几类的漏分精度都在50%以上。

表1 决策树分类精度检验表

本研究采用的分类方法是基于专家知识的决策树分类方法,由于分类类别较为细致,因此在确定分离阈值的时候存在一定难度,持续时间较长,需要参考大量文献反复试验,以求的最佳分类结果。从分类精度来看,该模型的分类体系可以满足德宏州的精度要求,但是分类结果中还是出现大量错分的情况。由于Landsat 8 OIL传感器还没有相应的缨帽变换模型,而OIL影像的Band2~7波段和ETM+的6个多光谱影像波段范围相近,因此在对经过预处理之后的遥感影像进行缨帽变换时,可以选择ETM+模型进行缨帽变换[12]。

3 结论

(1)利用NDVI指数可以很好的区分出植被与非植被,MNDWI指数可以很好的区分出水体与非水体。通过反复试验得到NDVI大于0.7即为植被,反之即为非植被。MNDVI大于0.24即为水体,反之即为非水体。

(2)建立混淆矩阵计算得到该模型的总体精度为66.265 4%,Kappa系数为0.603 6。其中水体、居民地、阔叶、针阔混交的分类精度较好,针叶、荒地、水田和旱地错分情况不多但是漏分精度较高,灌木、草本和湿地的错分和漏分精度较高。

猜你喜欢
决策树波段类别
最佳波段组合的典型地物信息提取
基于决策树和神经网络的高血压病危险因素研究
论陶瓷刻划花艺术类别与特征
一起去图书馆吧
决策树和随机森林方法在管理决策中的应用
基于PLL的Ku波段频率源设计与测试
小型化Ka波段65W脉冲功放模块
L波段kw级固态功放测试技术
决策树多元分类模型预测森林植被覆盖
决策树在施工项目管理中的应用