基于RS的贵州威宁草海湿地植被分类研究*

2021-05-17 01:35夏传花贺中华汪开花
贵州科学 2021年2期
关键词:草海决策树植被

夏传花,贺中华,汪开花

(贵州师范大学 地理与环境科学学院,贵州 贵阳 550025)

0 引言

近年来,随着社会经济的高速发展,人类活动对环境的破坏越来越大,人们对湿地环境没有保护意识,许多湿地受到了不同程度的毁坏,导致一些以湿地为生存环境的物种濒临灭绝,破坏了湿地生态系统的平衡,致使全球气候变暖。

湿地是指地表过湿或者常常积水,发展湿地生物的区域。湿地与森林、海洋共同构成地球上最重要的三类生态系统[1],湿地生态系统是一个包含了湿地植物、栖身于湿地的动物、微生物及其环境的统一整体,其拥有特殊的水文状况、陆地和水域生态系统交错带作用以及由此而产生的特殊的生态系统功能,例如调节径流、净化水源、改变洪涝和干旱状况、保护生物多样性和海岸线、调节地下水水位和小气候、供应旅游资源。湿地之所以被称为“地球之肾”,是因为它对自然界和人类产生的废水和废弃物具备天然接收器的作用,在全球尺度上湿地则被一些人称作二氧化碳接收器和气候稳定器,湿地景观结构复杂、生态系统多样,是自然界最富生物多样性的生态景观。植被在湿地中扮演着十分重要的角色,因为植被是最能反映生态系统环境变化的重要因子,植被类型的识别与分类是进行植被研究的基础,植被覆盖信息对生态环境变化监测研究极为重要[2],作为生态系统中的初级生产力,它不仅是系统构成和运行的基础,而且提供湿地生物的食物来源,存储能量以及积累有机物。湿地中的植被一直都是人们非常关注的研究部分,包括研究它的种类和数量、生态学特点、生物学特征以及利用保护价值。

威宁草海周边涉及了14个行政村,人类社会经济活动对草海的生态环境产生了很大的影响。目前,草海水体污染严重,出现了水体富营养化,其污染源主要是化肥的使用、家禽畜类的尿粪和生活污水[3]。随着社会的发展,城镇不断开发建设,人们围湖造地导致水域面积减少,耕地面积不断减少,森林覆盖率降低,植被遭受破坏,水土流失严重,从而影响到了草海地区的动植物种类的减少。近些年来,由于政府的重视,威宁草海的环境问题得到了一定的治理,但是并没有得到有效的解决[4]。

1 研究现状

湿地是地球上生物多样性最丰富、生产力最高、生态系统服务价值最大的生态系统[5],湿地植被是湿地的核心。国内外学者对湿地植被的研究进行了大量尝试,然而传统的湿地监测方法成本较高、费时、费力而且积水区通常难以接近,遥感与地理信息系统相结合的湿地监测技术被广泛应用于不同尺度下湿地景观动态变化的监测与研究,应用结果显著[6]。李天平等[7]基于ISODATA非监督分类的方法,通过多次的提取与细化,对岷江源头的植被进行分类,分类结果精度较高。乔艳雯等[8]以扎龙湿地为目标,利用TM影像、DEM等数据来构建决策树模型对湿地信息进行提取,然后与监督分类的结果进行对比发现决策树是一种更为有效的提取手段。张雪红等[9]运用决策树的分类方法,以归一化差值湿度指数NDMI以及修正归一化差值池塘指数MNDPI为分类特征可以有效提取红树林信息。颜梅春等[10]利用IKONOS影像数据对南京市钟山景区进行植被分类,通过对比基于纹理信息、基于植被指数、最小距离法监督分类和ISODATA非监督分类的分类结果,发现基于纹理信息分类的精度最高,植被指数次之,非监督分类精度最低。邹文涛等[11]将波段数据和主成分分析后的四个分量作为进行分类的8个特征,结合其他辅助数据,选择QUEST算法的决策树模型进行植被分类,通过与最大似然法的分类结果对比,发现QUEST算法的分类结果总体最佳。魏瑄[12]采用了最大似然法和支持向量机进行湿地植被分类,再通过加入一阶、二阶纹理特征进行再一次分类,结果表明加入纹理信息能提高分类精度。赵玉灵等[13]根据遥感解译和野外调查,运用TM2、TM5、TM7和NDVI来提取红树林,通过四期影像对比发现红树林面积变化具有先下降后上升的趋势。刘瑜、韩震[14]通过波段组合,首先进行非监督分类,然后根据实地调查建立训练样本,参照光谱信息以及NDVI进行监督分类,利用误差矩阵进行分类结果的精度评价。

目前,现有的对于草海的研究主要是关于草海的环境污染,植被方面的研究基本上是通过实地调查,很少通过遥感技术来进行植被研究的。因此本文基于环境小卫星CCD影像数据,通过监督分类、非监督分类以及决策树分类等遥感技术对威宁草海湿地核心区进行植被分类,以期了解草海植被群落分布现状,希望能对草海自然保护区的生态环境规划提供一些参考。

2 研究区概况及数据来源

2.1 研究区概况

贵州威宁草海位于云贵高原东部,贵州省的西北部,在乌蒙山麓的威宁彝族回族苗族自治县的西南处(图1),地处县人民政府驻地——草海镇辖区[19],地理坐标介于N26°47′32″~26°52′52″,E104°10′16″~104°20′40″之间。草海地区的气候冬季长,无夏季,春秋相连,属于亚热带季风气候,年平均气温为10.5℃,7月平均气温17.7℃,1月平均气温1.9℃。草海是贵州最大的淡水天然湖泊,也是一个典型的高原湿地生态系统,其中水域面积25平方公里,有着丰富的动植物资源,是黑颈鹤等珍稀鸟类及其他候鸟的重要越冬地,草海因此被誉为“鸟类王国”“高原明珠”;1985年草海被列为贵州省级重点自然保护区,1992年经国务院批准为国家级自然保护区[2]。

图1 研究区地理位置Fig.1 Location of the study area

除了河流流入草海湖中的水急处外,草海几乎长满了水生植被,从草海中心到边缘,有沉水植被群落,挺水植被群落和浮水植被群落。各个植被群落的优势种也十分显著,如水莎草、灯芯草草甸分布于草海东部边滩,面积较大,狐尾藻群落分布于中部水深的地方,其边缘光叶眼子菜逐渐增多,藨草、李氏禾群落分布在草海西南部,李氏禾群落分布在东部、东北部、东南部浅水地带,有水葱,慈姑,菹草等,穿叶眼子菜、狐尾藻群落分布在西南部水域,伴生有海菜花、竹叶眼子菜、黒藻等。

2.2 数据来源

环境卫星遥感影像来源于环境保护部卫星环境应用中心,其影像参数如表1所示。TM校正影像来源于地理空间数据云,矢量边界来源于国家林业局昆明勘察设计院贵阳办事处2005年编制的贵州草海国家级自然保护区总体规划图。以2017年8月的环境一号(HJ-1)卫星CCD影像数据为数据源进行湿地植被分类。

表1 环境小卫星CCD相机主要技术参数Tab. 1 Main technical parameters of CCD camera

3 研究方法

3.1 技术路线

如图2。

图2 技术路线图Fig.2 Technical route

3.2 数据预处理

3.2.1 数据读取及辐射定标

在ENVI5.3中读取数据时,需要IDL开发的环境小卫星数据读取补丁来读取,在读取过程中补丁对影像进行了波段组合以及辐射定标。

3.2.2 几何校正

本次研究采用经过校正的草海地区TM影像为基准影像,通过Image Registration Workflow工具将TM影像和环境小卫星影像进行配准。配准过后的影像拥有精确的地理信息和坐标,以便和实地测量数据进行匹配。

3.2.3 大气校正

大气层会影响遥感传感器的成像,大气校正能消减或消除大气和光照等因素对地物反射的影响,获得地物反射率、辐射率、地表温度等真实物理模型参数,用来消除大气中水蒸气、氧气、二氧化碳、甲烷和臭氧等对地物反射的影响,消除大气分子和气溶胶散射的影响,从而得到真实的地表反射信息[15]。

3.3 选择训练样本

研究表明,训练样本选择的好坏、样本的多少很大程度上决定着不同分类器或相同分类器的分类效果[2]。最可靠也是最准确的选择训练样本的方法是通过野外调查确定,实地测量选点,利用GPS仪器获取并记录各个实测点的坐标位置,在ENVI中,将点与影像叠加在一起,通过这些实测点数据建立感兴趣区域(ROI),这样选择的训练样本具有非常高的精度。本研究共获取了36个采样点(图3),其中沉水植被8个,包括金鱼藻、光叶眼子菜、狐尾藻等;挺水植被27个,包含水葱、香蒲、灯心草、雀稗、芦苇、藨草、荆三棱等;浮水植被1个,以此为基础对草海湿地植被进行分类。

图3 样点分布图Fig.3 Sampling site distribution

4 遥感解译与分类

4.1 监督分类

监督分类是用确定类别的样本像元去识别其他未知类别像元的过程,通过野外实地调查或者预先目视解译,对遥感影像上的地物类别有了先验知识,然后对每一类别选取一定数量的训练样本,计算机计算训练样区的统计信息或者其他信息,然后用这些种子类别对判决函数进行训练,利用训练好的判决函数对影像数据进行分类。将每个像元同训练样本作比较,按不同的规则将其划分到和其最相似的样本类[15]。

以实测GPS点数据为样本,在ENVI 5.3中定义训练样本,然后进行监督分类。监督分类中有多种监督分类器,比如:平行六面体、最小距离、马氏距离、最大似然、神经网络、支持向量机、光谱角等,选择不同的分类器需要设置的参数不一样。此次研究进行监督分类选择了最小距离分类法,其原理是利用训练样本数据计算出每一类的均值向量和标准差向量,然后以均值向量作为该类在特征空间中的中心位置,计算输入图像中每个像元到各类中心的距离,到哪一类中心的距离最小,该像元就归入哪一类[15]。分类结果如图4,从分类图来看,草海植被从湖中央至浅水区依次按沉水植被、挺水植被、浮水植被规律分布。

图4 监督分类结果Fig.4 Results of supervised classification

4.2 非监督分类

与监督分类不同,非监督分类也称为聚类分析,是在多光谱图像中搜寻、定义其自然相似光谱集群组的过程[16]。事先没有训练样本,在分类过程中不用任何的先验知识,凭借遥感影像地物之间光谱特征的差异进行分类,其分类结果能对地物类别进行区分,但不可以确定类别的属性,其属性要通过实地调查或者目视判读来确定。常用的算法有迭代自组织的数据分析法(ISODATA)、K-means均值法。本研究采用ISODATA算法进行非监督分类,ISODATA是一种重复自组织数据分析技术,通过迭代算法对光谱特征相同的像元聚类,对于匹配度较高、符合光谱特征的部分直接合并成对应类型,对难以识别的部分可以将其提取出来,再一次利用非监督分类进行细分,如此反复迭代,直到所有像元符合光谱特征相同的标准为止。得到非监督分类的结果后,通过目视进行类别的定义与合并,结果如图5所示。

4.3 决策树分类

决策树分类是在遥感图像数据及其他空间数据的基础上,对研究区典型地物的光谱特征、纹理特征

图5 非监督分类结果Fig.5 Results of unsupervised classification

和其他特征分析,通过反复试错获得决策树各节点的分割阈值[17],然后建立分类规则进行遥感分类,分类规则易于理解,分类过程也符合人的认知过程,其特点是利用多源数据。在决策树分类中最关键的是特征信息的选取,遥感影像的光谱响应特征是最基础、最底层的原始信息特征[18]。计算机通过大量复杂的计算,从遥感影像中提取出特征信息,然后在众多特征信息中提取出最佳的特征。

由于研究区域中有云,首先利用归一化植被指数NDVI将云与植被区分开来,在ENVI5.3通过波段运算,利用环境小卫星第三波段和第四波段计算出草海核心区的NDVI图像,通过反复测试阈值,发现当NDVI>0.2是能将云与植被较好的区分,在此基础上进行植被种类的划分。根据GPS实测点来选择特征地物感兴趣区,对HJ-1的1-4波段进行光谱统计,观察研究区域的植被光谱曲线(图6),其中横坐标为波段,纵坐标为地物的DN值。通过植被光谱图及光谱统计特征值(表2),发现在第4波段植被间的光谱值差异较大,利用B4>2903,可将浮水植被与挺水植被、沉水植被区分开。

图6 植被光谱曲线Fig.6 Vegetation spectral curves

对HJ-1影像进行主成分分析,生成pc1、pc2、pc3、pc4四个组分,依据感兴趣区(ROI),统计主成分分析的四个组分的光谱信息,从主成分分析的光谱图(图7)上以及统计数据(表3)来看,从pc2到pc4,沉水植被的值有上升趋势,而挺水植被的值则有下降趋势,通过pc2-pc4>0来区分,大于0为挺水植被,小于0则为沉水植被。利用这些特征差异建立分类规则,然后构建决策树模型(图8)进行植被分类。

表2 各湿地植被类型光谱特征统计表Tab.2 Spectral characteristics of different types of wetland vegetation

图7 主成分分析光谱图Fig.7 Spectrum of principal component analysis

表3 各主成分分量光谱值Tab.3 Spectral values of each principal component

图8 决策树模型Fig.8 Decision tree model

图9 决策树分类结果Fig.9 Results of decision tree classification

表4 各种植被类型面积统计表Tab.4 Area statistics of different vegetation types

5 精度验证

为了确定分类的精度与可靠性,需要对分类结果进行评价,对比三种分类方法的分类精度。根据实地调查获取的采样点建立感兴趣区域,其中沉水植被8个,将4个作为分类样点,另外4个作为验证样点,挺水植被27个,将14个作为分类样点,另外13个作为验证样点,由于浮水植被数据的缺少,所以此处未进行浮水植被的精度验证。各个分类方法的分类精度如表5-表7所示。监督分类的总体分类精度为57.14%,Kappa系数0.143,非监督分类的总体分类精度为53.33%,Kappa系数0.146,决策树分类的总体分类精度为47.06%,Kappa系数0.084。总的来看,各个方法分类精度总体不高,由于客观原因,实测样点数据太少,难以代表整个草海核心区,而且无法获取植被的实测光谱,只能根据采样点从影像上获取光谱信息,此外,影像的质量也影响着分类的精度。

表5 监督分类(最小距离法)分类结果精度评价Tab.5 Accuracy evaluation of supervised classification (minimum distance method)

表6 非监督分类(ISODATA)分类结果精度评价Tab.6 Accuracy evaluation of unsupervised classification(ISODATA)

表7 决策树分类法分类结果精度评价Tab.7 Accuracy evaluation of decision tree classification

6 结果与分析

本次研究以贵州威宁草海自然保护区的核心区为研究区域,以环境小卫星遥感影像以及野外调查数据为基础,分别采用监督分类、非监督分类、决策树分类分析了草海核心区湿地植被的空间分布格局,得出如下结论:

(1)从三种分类方法的结果来看,湿地植被分布图体现的植被空间格局基本一致,从中心的深水区到边缘的浅水区,湿地植被依次是沉水植被、挺水植被、浮水植被。

(2)通过与方嗣昭[19]研究草海植被的调查结果相比,发现此次分类结果中各植被类型的分布趋势与之大体一致,其中沉水植被都是占据了草海湖的大部分面积,以深水区为中心向四周扩散,挺水植被围绕整个湖的周边分布,面积较少,由于方嗣昭的研究中并未涉及浮水植被,所以此处无法对比浮水植被。

(3)由于各个方法的计算方式不同,各种计算参数不同,这三种方法所分类的各植被类型面积也各不相同。其中监督分类、非监督分类的结果较为一致,各植被类型面积差异不大,但是决策树分类结果与另外两种相比面积差异较大,特别是浮水植被,浮水植被面积差异较大的原因可能是由于浮水植被的实测样点较少,无法代表整个区域内浮水植被的特征。

(4)这三种分类方法的分类结果总体精度不高,由于采样点的数据太少,且样点间的可分离度不高,在影像上获取的各植被类型的光谱曲线差异不大,不能较好区分以及建立分类规则。

猜你喜欢
草海决策树植被
基于植被复绿技术的孔植试验及应用
烟雨草海
一种针对不均衡数据集的SVM决策树算法
决策树和随机森林方法在管理决策中的应用
威宁草海
草海初冬
草海的春天别样美
绿色植被在溯溪旅游中的应用
基于决策树的出租车乘客出行目的识别
基于原生植被的长山群岛植被退化分析