基于光谱特征的雅鲁藏布江源区草地类型识别

2012-01-05 07:57沈渭寿李海东
自然资源遥感 2012年1期
关键词:源区决策树波段

孙 明,沈渭寿,谢 敏,李海东,高 菲

基于光谱特征的雅鲁藏布江源区草地类型识别

孙 明1,2,沈渭寿1,谢 敏3,李海东1,高 菲4

(1.环境保护部南京环境科学研究所,南京 210042;2.广西区气象减灾研究所/国家气象卫星中心遥感应用试验基地,南宁 530022;3.广西区气候中心,南宁 530022;4.江苏省秦淮河水利工程管理处,南京 210001)

以雅鲁藏布江源区为研究对象,以Landsat5 TM图像为数据源,根据不同草地类型的波段组合特征,结合源区1∶100万植被类型图、DEM和NDVI数据,构建草地判别规则,利用决策树分类法对雅鲁藏布江源区草地类型进行遥感识别。研究结果表明:①不同类型草地因其生境不同,利用不同波段组合特征进行草地类型识别能够达到较好的效果;②与传统的监督分类法相比,基于波段组合特征的决策树分类法具有较高的识别精度(总体精度提高了15.4%,Kappa系数提高了0.225);③在海拔4 400~5 000 m区域内,固沙草草原面积最大,其次为矮嵩草和小嵩草混生草甸,再次为变色锦鸡儿和金露梅灌丛,藏北嵩草草甸面积最小。

光谱特征;决策树分类;遥感;雅鲁藏布江源区;草地类型

0 引言

雅鲁藏布江源区(以下简称源区,亦称马泉河流域)发源于喜马拉雅山北麓的杰马央宗冰川,地处西藏自治区西南边陲。因地势很高,物理冻融侵蚀作用分布广泛,地表多沙、植被稀疏,山体坡面物质不稳定,生态环境极其脆弱。源区至今没有气象、水文等监测站点,自然环境背景数据极为缺乏,科研基础资料更是寥寥无几。20世纪70—80年代,中国科学院青藏高原综合考察队曾在青藏高原进行过科学考察,但在已发表的文献中涉及源区的内容比较概略[1-4]。20世纪 80年代末期,西藏自治区农委组织以县为单位开展过土地利用调查、土壤普查、草地资源调查及草场等级评价,源区各县的相关调查成果图成为该区域重要的基础资料[5]。

植物群落的调查研究能够为区域生物多样性的系统研究奠定基础,进而揭示不同植物群落的发生和发展过程,推论生态环境的演化历史和发展方向。关于源区植被类型的描述仅有中国科学院编纂的1993年1∶100万植被类型图以及何萍等[5]通过实地考察对源区植被类型、群落构成以及地理分布特征提出的轮廓性描述。近20 a来,源区土地沙化程度逐年加重,沙化土地面积以年均0.4%的速率递增[6],较强烈的风沙作用直接破坏着丰盛的水草牧场[7],草地退化趋势明显。对源区草地类型开展定量研究,不仅能准确了解源区不同草地类型的分布范围及面积,更能为草地沙化研究提供基础植被类型数据。本文在2010年7月对源区主要植被类型进行野外考察的基础上,充分分析现有的各种遥感数据源,采用基于光谱特征的决策树分类方法对源区主要植被类型进行了识别研究。

1 研究区概况

源区地理位置在 N 29°09'30″~ 30°58'12″,E 81°05'07″~84°30'20″之间,面积约 26 347.82 km2,包括日喀则地区仲巴县帕羊区全部、扎东区大部、隆嘎尔区小部分,阿里地区革吉县东南角、普兰县东缘以及萨嘎县很小的面积。海拔均在4 400 m以上,具有光照充足、辐射强度大、干湿季节明显、暖季凉爽、冬季严寒等特点。据周边地区的气象台站资料推测,源区年平均气温为 -0.3~1.2℃,年≥0℃积温为1 167~1 188℃;年降雨量为136~290 mm,6—9月份降水量占全年的90%左右;年蒸发量为2 200~2 300 mm,是年降水量的8~12倍;年湿润度为40%左右,属典型的高原寒冷干旱、半干旱气候区;年日照时数为2 897~3 168 h,年≥8级风日数为112~150 d。

马泉河谷南侧为喜马拉雅山脉,北侧为冈底斯山脉,南北两山脉之间为陷落型地堑宽谷,谷宽10~20 km,谷底发育着宽坦的冲积平原。谷底由西向东逐渐下降,马泉河自西向东在宽谷中缓缓流过。河谷基本上都是牧区,帕羊以下河谷两侧由蒿草组成的沼泽化草甸是优良的冬春牧场;帕羊以上沼泽化草甸渐趋消失,代之以高寒草原,坦荡的谷地广泛分布着紫花针茅和蒿属植物,是主要的夏季牧场。

2 数据与方法

2.1 野外调查

2010年7月下旬,作者对源区开展了野外调查,范围主要在219国道沿线,重点考察仲巴新、旧县城,珠珠、岗久居民点以及帕羊镇、霍尔巴乡等乡镇周边的山坡与沼泽化草甸。调查的草地类型主要包括固沙草草原、藏北嵩草草甸、矮嵩草和小嵩草混生草甸、金露梅灌丛以及变色锦鸡儿灌丛。共设置样地51个,每个样地的大小为1 m×1 m。样地的设置考虑到了所在群落斑块的大小和均质性,以保证由定位误差引起的样地偏移不超出所在像元范围。详细调查了不同样地的经纬度坐标、海拔高度、建群种高度、植被盖度以及土壤水分等数据,并对每个样地拍摄了照片。

2.2 遥感数据

植被覆盖度具有明显的时空分异特性,高原植被的返青时间比较晚,生长期短,7—8月份是草地生长的旺季,因而遥感图像的最佳时相应选择7—9月份[8]。考虑成像质量和时相,分析比较现有的各种可用的遥感数据源,仅Landsat 5有时相与野外调查相近且成像质量相对较好的图像,故本文选用2009年夏季源区的3景Landsat 5图像(轨道号/行号分别为143/39,142/39和142/40,获取日期分别为2009-08-01,2009-10-13和2009-06-07)。其中,143/39图像成像日期与野外采样日期最为接近,基本满足时相同步要求,3景图像中以该景图像所包含的源区面积最大,故本文主要以143/39图像为主,对源区草地类型进行遥感识别,辅以另外2景图像合成整个源区的草地类型图。

2.3 研究方法

使用ERDAS和ENVI软件对遥感图像进行辐射校正、大气校正和几何精纠正。由于同一草地类型具有相似的生境条件,而不同草地类型的生境条件差异很大,因此背景土壤类型和土壤水分条件的干扰和影响在一定程度上会增大不同草种之间的光谱可分性。在植被类型样地调查的基础上,采用基于波段组合特征的地类识别方法,根据不同草地类型的波段组合特征,构建草地类型识别的判别决策树,从而对源区草地类型进行遥感识别。本次样地调查,海拔最低处为4 529 m,最高为5 088 m。考虑遥感反演的可信度,在通过NDVI提取源区植被界线的基础上,借助DEM数据将源区草地以5 000 m为界分为两部分,5 000 m以下为野外调查的草地类型,5 000 m以上多为野外调查未涉及的高海拔植被。本文主要采用决策树分类的方法对5 000 m以下的草地进行类型识别,技术路线见图1。

图1 草地类型遥感识别技术流程Fig.1 Flow chart of remote sensing identification of grassland types

3 结果与分析

3.1 植被信息提取

植被信息提取的目的是在遥感图像上有效地确定植被的分布、类型、长势等信息以及对植被的生物量作出估算[9]。植被指数(NDVI)能很好地反映植被的生长数量、状况、活力等信息,比用单波段探测绿色植被更具有灵敏性,从而有助于增强遥感图像的解译能力[10]。NDVI在植被提取中具有较好的效果,植被区和非植被区的界线较明显;但由于裸地在近红外波段的光谱亮度值也大于红光波段[11],就不能简单地以0为阈值,需设定合适的阈值才能达到较好的植被提取效果。

根据野外样地调查数据及其经纬度坐标,提取不同植被盖度的草地样地的NDVI值,并选择区分植被的 NDVI阈值。当阈值设为 0.024(即当NDVI>0.024)时,源区草地边界提取精度较高。其中固沙草的18个实测点中有15个在提取区内,藏北嵩草的7个实测点中有6个在提取区内,矮嵩草和小嵩草混生草甸的8个实测点中有6个在提取区内,灌丛中变色锦鸡儿的3个采样点均在提取区内;但金露梅灌丛由于植被稀疏,对NDVI的响应较低,因此提取效果较差。

3.2 草地建群种光谱特征分析

3.2.1 草地建群种光谱曲线提取

由于源区草地存在不同程度的沙化现象,草地植被的光谱值受背景干扰比较大,即使是同一种草地也可能因为草地的稀疏差异而形成“同物异谱”的现象,因此在选取采样点时,对同一种草地类型要尽可能多地选取采样点,兼顾不同沙化等级的草地,以便使光谱特征具有广泛的代表性。根据GPS采集的不同草地类型的样地坐标,从遥感图像中提取出对应植被类型的亮度值,绘制出各草地类型的光谱特征曲线(图2)。

图2 不同草地类型光谱特征曲线Fig.2 Spectral feature curves of different grassland types

图3 主要草地建群种光谱特征曲线Fig.3 Spectral feature curves of dominant grassland species

3.2.2 草地光谱特征分析

地物反射和辐射特征的微弱差异是通过各种不

对每个建群种的所有采样点光谱特征曲线取平均值,得出每个建群种的像元亮度值;根据不同草地类型的光谱亮度值的均值,绘制出不同草地建群种的光谱特征曲线(图3)。同类型传感器的不同波谱通道来获取的,所以不同波谱通道识别物体能力的大小是有差异的,可以利用某一波谱通道的光谱特征直接识别物体,但是在研究对象的单波段光谱特征相差较小的情况下(特别是要识别同一类型的不同子类时),单波段数据的识别能力非常有限(如在TM 3波段,藏北嵩草和变色锦鸡儿的光谱特征相差很大,但固沙草和矮嵩草、小嵩草混生草甸却有着相似的光谱特征)。所以,利用一个固定的分类模式来进行草地识别与分类是不可行的。为此,可利用物体在不同波段中光谱响应的差异及综合多波段数据来提高识别物体的能力。本文利用TM数据7个波段数据及其之间相加构成的21组波段组合,共28组数据,通过比较不同草地类型不同波段组合之间的差异,得出不同草地类型的判别规则(表1)。

表1 不同草地类型的判别规则Tab.1 Recognition rules of different grassland types

3.3 决策树构建

基于波段组合特征的分类决策树构建流程如下:

1)单一判别规则分类决策树。根据不同草地类型的波段组合特征,将其逐个加入决策树进行分类,同时利用采样点对该特征组合的分类效果进行精度检验。不断尝试各种波段组合,最终得出一种分类效果相对较好的单一判别规则的决策树(图4)。

图4 基于单一判别规则的决策树分类Fig.4 Decision tree classification based on single discrimination rule

2)多重判别规则分类决策树。根据第一步构建的单一判别规则的决策树,得出源区草地类型的初步分类结果;通过实测点的精度检验,发现分类后每种草地类型均存在较大程度的错分现象,需要在后续处理中对判别规则进行优化。根据草地波段组合特征的统计结果,同一种草地类型,对其判别的波段组合有好几种,仅使用单一的判别规则将不能很好地区分草地。在初步分类的基础上,对每种草地类型进行精度检验,统计每种草地类型中错分较多的类型;然后进一步分析错分类型和该类型草地的波段组合特征,选择出差异较大的判别规则添加到该类草地的节点上,从而进行草地类型的细分。

3)通过反复尝试各种波段组合并进行精度分析,重复步骤2,直至每种草地类型的分类精度达到要求,从而得出多重判别规则的分类决策树(图5)。

图5 基于多重判别规则的决策树分类Fig.5 Decision tree classification based on multiple discrimination rules

在图4,5的分类决策树中:①MNDWI=(TM2-TM5)/(TM2+TM5),式中MNDWI为改进的归一化差异水体指数(Modified NDWI,简称为改进水体指数)。MNDWI可以进一步增强水体与其他地类的反差,有利于提取水体。经过实验,当 MNDWI>0.57时,对水体和冰雪的提取效果较好。②TM6为热红外波段,对地物温度反映敏感,而云顶的温度比其他地物都低,通过设定合适的阈值,就能达到很好的云层提取效果。通过反复试验,当TM6<109时,即可提取出云层范围。③NDVI对植被信息反映灵敏,可以有效区分植被和裸岩沙地,当NDVI>0.024时,植被提取效果较好。④借助DEM数据,可以进一步将植被区划分为高海拔植被区和实验区,以5 000 m为阈值,对植被区进行划分。⑤藏北嵩草识别规则为(TM1+TM3)<(TM4+TM5)(图4)和(TM2+TM3)<(TM4+TM5)(图5);固沙草识别规则为(TM1+TM5)<(TM2+TM7)(图 4)、(TM2+TM7)<(TM3+TM5)、(TM1+TM2)<(TM2+TM3)、(TM2+TM3)>(TM4+TM5)及(TM2+TM3)<(TM3+TM4)(图5);矮嵩草和小嵩草混生草甸识别规则为(TM1+TM5)<(TM4+TM6)(图4)和(TM1+TM2)>(TM2+TM3)(图5);变色锦鸡儿、金露梅灌丛识别规则为(TM1+TM5)>(TM4+TM6)(图 4)和(TM2+TM3)>(TM3+TM4)(图5)。

3.4 精度分析

分类精度评价是通过建立地面验证数据的混淆矩阵或误差矩阵,计算各种分类精度测度指标(如Kappa系数、生产者精度、用户精度和总体精度)来进行的[12]。Kappa系数的估计值计算方法为

式中:r为误差矩阵中地物的类型数;N为验证像元总数;xii为误差矩阵中主对角线上的元素,即各类中被正确分类的像元点数;xi+为第i行的总观测数(矩阵右边的栏外汇总数);x+i为第i列的总观测数(矩阵底部的栏外汇总数)。为了与决策树分类效果做比较,利用实测数据对源区图像进行传统最大似然法监督分类。建立两种分类结果的混淆矩阵(表2,3),并比较其分类精度。

表2 2009年基于决策树分类的草地类型识别精度分析Tab.2 Precision analysis of grassland type recognition based on decision tree classification in 2009 (个)

表3 2009年基于最大似然监督分类的草地类型识别精度分析Tab.3 Precision analysis of grassland type recognition based on supervised classification in 2009 (个)

通过表2,3的对比可以看出,决策树分类的总体精度和Kappa系数分别达到62.5%和0.493,高于监督分类的总体精度 47.1%和 Kappa系数0.268。因而本文采用的决策树分类方法在精度上较传统监督分类方法有更好的效果。

本文将决策树分类得出的4种草地类型矢量数据分别与1993年1∶100万植被类型图对应的植被类型图斑进行了叠加,分析其分布范围及特征是否与植被类型图相吻合。以藏北嵩草为例,图6中红色部分为决策树分类得出的藏北嵩草分布范围,蓝色部分为1∶100万植被类型图中对应的藏北嵩草分布范围,可以看出决策树分类得出的藏北嵩草分布范围与1∶100万植被类型图的图斑叠合得较好,说明本文采用的方法在源区草地类型识别方面具有较好的效果。

图6 藏北嵩草分类结果与1∶100万植被类型图叠加显示Fig.6 Overlaying display of classification results of Kobresia littledalei and 1∶1 000 000 scale vegetation type map

3.5 遥感草地类型图绘制

根据构建的波段组合判别规则,利用决策树分类法对源区遥感图像进行草地类型识别,得到源区的遥感草地类型图(图7)。

图7 2009年源区遥感草地类型图Fig.7 Grass types map of the source region by remote sensing in 2009

对草地分类结果进行统计分析,得到源区遥感草地类型的分布状况(表4)。

表4 2009年海拔4 400~5 000m草地类型面积统计Tab.4 Area statistics of grassland types distributed at the elevation ranging from 4 400 m to 5 000 m in 2009

根据表4的统计结果可以看出,在海拔4 400~5 000 m范围内,各类型草地面积总计4 924.63 km2。其中,分布面积最大的主要为固沙草草原,达3 111.73 km2,占该海拔区草地总面积的 63.19%;其次为矮嵩草和小嵩草混生草甸,面积为980.43 km2,占该区草地面积的19.91%;再次为变色锦鸡儿和金露梅灌丛,面积为607.80 km2,占该区草地面积的 12.34%;藏北嵩草最少,面积为224.67 km2,仅占该区草地面积的4.56%。

4 结论

1)不同类型的草地由于生境不同,而且受其背景土壤类型和水分的干扰,在一定程度上又加大了不同草地类型之间的光谱可分性,利用遥感图像的不同波段组合特征进行草地类型识别能够达到较好的效果。本文对雅鲁藏布江源区的草地进行分类,结果表明:在海拔4 400~5 000 m范围内,草地类型主要以固沙草草原为主,其次为矮嵩草和小嵩草混生草甸,再次为变色锦鸡儿和金露梅灌丛,藏北嵩草面积最少。

2)总体来看,利用地物波段组合特征的差异进行分类,在分类效果上有了很大提高,弥补了传统的最大似然监督分类方法的不足。基于波段组合特征的决策树分类法具有较高的识别精度,分类的总体精度可以达到62.5%,Kappa系数为0.493。与监督分类相比,决策树分类的总体精度提高了15.4%,Kappa系数提高了0.225。

3)本文采用的决策树分类法仅是基于地物图像的光谱特征、波段间的相互运算以及高程等信息,并没有加入其他分类特征,分类精度还不够显著。若在以后的决策树模型中加入纹理等信息,则决策树分类法的优势会更明显,分类精度会更高。

4)受采样点数量限制,无法满足采样样地到遥感图像像元的空间尺度转换,因而本文在遥感反演过程中并没有考虑空间尺度转换以及混合像元分解等问题,需要后期野外调查补充大量的野外样地数据。

[1] 中国科学院青藏高原综合科学考察队.青藏高原科学考察丛书:西藏植被[M].北京:科学出版社,1988:261,311-313.

[2] 中国科学院青藏高原综合科学考察队.青藏高原科学考察丛书:西藏草原[M].北京:科学出版社,1992:21-23.

[3] 中国科学院青藏高原综合科学考察队.青藏高原科学考察丛书:西藏土壤[M].北京:科学出版社,1985:298.

[4] 中国科学院青藏高原综合科学考察队.青藏高原科学考察丛书:西藏冰川[M].北京:科学出版社,1986:106-107.

[5] 何 萍,郭 柯,高吉喜,等.雅鲁藏布江源头区的植被及其地理分布特征[J].山地学报,2005,23(3):267 -273.

[6] 孙 明,沈渭寿,李海东,等.雅鲁藏布江源区风沙化土地演变趋势[J].自然资源学报,2010,25(7):1163 -1171.

[7] 杨逸畴.雅鲁藏布江河谷风沙地貌的初步观察[J].中国沙漠,1984,4(3):12 -16.

[8] 李辉霞,鄢 燕,刘淑珍,等.西藏高原草地退化遥感分析——以藏北高原典型区为例[M].北京:科学出版社,2008:75-99.

[9] 刘 雯,骆剑承,沈占锋,等.多尺度植被信息提取模型研究[J].计算机应用研究,2009,26(6):2398 -2400.

[10]朱继蕤,侯宇丹.基于遥感影像的城市植被信息提取研究[J].仪器仪表与分析监测,2010(1):12 -15.

[11]单 捷,岳彩荣.基于光谱特征的决策树分类方法研究——以昆明市东北部地区为例[J].西北林学院学报,2010,25(6):222-226.

[12]常庆瑞,蒋平安,周 勇,等.遥感技术导论[M].北京:科学出版社,2004.

The Identification of Grassland Types in the Source Region of the Yarlung Zangbo River Based on Spectral Features

SUN Ming1,2,SHEN Wei- shou1,XIE Min3,LI Hai- dong1,GAO Fei4
(1.Nanjing Institute of Environmental Sciences,Ministry of Environmental Protection,Nanjing 210042,China;2.Institute of Meteorological Disaster Mitigation of Guangxi/Remote Sensing Applying and Experiment Base of National Meteorological Satellite Center,Nanning 530022,China;3.Guangxi Climate Center,Nanning 530022,China;4.Qinhuai River Hydraulic Management Agency of Jiangsu Province,Nanjing 210001,China)

With the Landsat5 TM images of the source region of the Yarlung Zangbo River as the datum source,according to the different features of spectral combination of the grassland,and in combination with the 1 ∶1 000 000 vegetation type map as well as DEM and NDVI data,the authors set up the rules of grass identification and conducted researches on grass recognition based on decision tree classification.Some conclusions have been reached:① Due to difference in habitat types,good results of identifying grass can only be achieved by using different spectral combination features;② Compared with traditional supervised classification,the decision tree classification based on spectral combination features has higher precision of identification,the overall classification accuracy has been improved by 15.4%and the Kappa coefficient has been increased by 0.225;③ In the region with elevation ranging from 4 400 m to 5 000 m,the grassland area of Orinus thoroldii is the largest,followed by the mixed meadow of Kobresia humilis and Kobresia pygmaea,and then by the bush of Caragana versicolor and Potentilla fruticos,with Kobresia littledalei having the smallest area.

spectral feature;decision tree classification;remote sensing;source region of the Yarlung Zangbo river;grassland types

TP 751.1

A

1001-070X(2012)01-0083-07

10.6046/gtzyyg.2012.01.15

2011-05-04;

2011-06-09

国家环保公益性行业科研专项(编号:200709045,200809010,200909050)资助。

孙 明(1986-),男,助理工程师,主要从事遥感在生态环境中的应用研究。E-mail:msunies@163.com。

沈渭寿(1958-),男,研究员,博士生导师,主要从事生态环境保护与荒漠化防治研究。E-mail:shenweishou@163.com。

(责任编辑:邢 宇)

猜你喜欢
源区决策树波段
受焦化影响的下风向城区臭氧污染特征及潜在源区分析
最佳波段组合的典型地物信息提取
三江源地区1961-2019年降水量时空变化特征
安徽沿江地区早白垩世侵入岩成因及其找矿意义
冬小麦蒸散源区代表性分析
决策树和随机森林方法在管理决策中的应用
基于PLL的Ku波段频率源设计与测试
小型化Ka波段65W脉冲功放模块
L波段kw级固态功放测试技术
决策树多元分类模型预测森林植被覆盖