张秀敏,盛 煜,南卓铜,赵 林,周国英,岳广阳
(1.中国科学院寒区旱区环境与工程研究所 冻土工程国家重点实验室,甘肃 兰州 730000;2.中国科学院寒区旱区环境与工程研究所,甘肃 兰州 730000;3.中国科学院寒区旱区环境与工程研究所 青藏高原冰冻圈观测试验研究站,甘肃 兰州 730000;4.中国科学院西北高原生物研究所,青海 西宁 810001))
植被作为一个重要的生态因子,是反映生态环境和气候变化的敏感指示器,而植被类型又是进行植被研究的基础[1]。由于自然界植被类型的复杂多样性,传统利用人工进行实地调查的方法将耗费大量人力和物力[2],尤其对于一些环境恶劣及交通不便的高山地区,如我国的青藏高原。由于山区地形的复杂性,使山区植被分类成为植被研究的一大难题[3],近年来卫星遥感技术的发展为区域及全球植被变化和分类研究提供了新方法,利用遥感技术进行植被分类的关键在于图像分类方法,如何将大量的遥感信息有效地应用于较高精度的分类中,一直是人们努力的方向[4]。植被指数(VI)作为一个重要的遥感参数,能够敏感地反映出植被覆盖度、生物量等生物物理性质,已成功地应用于植被分类、农作物估产、土地覆盖、气候变化等各项研究中[4-20]。常用植被指数包括归一化差值植被指数(NDVI)和增强型植被指数(EVI)。近年来,国内外学者利用植被指数数据,采用不同的分类方法对不同区域的植被分类进行了广泛的研究。目前分类方法主要有传统的监督和非监督方法,这些方法仅仅依据遥感影像中地物光谱进行分类,且不考虑遥感影像的时相信息,难以解决混合像元问题;同时难以集成现有的坡向、高程等地理数据,难以解决地物“同物异谱,异物同谱”的问题,造成分类精度较低[17]。随着科学技术的发展,最新智能算法——决策树,凭借其算法的灵活性和快速性,在植被分类中得到广泛的应用。如Yang等[18]利用决策树的方法对加拿大西南部的一个农场的农作物和耕地进行了分类,总体精度为89%;Mallinis等[19]基于决策树的方法利用QUICKBIRD影像完成了地中海的森林植被类型图,并且分类精度较高。齐红超等[17]在基于C5.0算法的决策树基础上,利用NDVI数据来区分植被和非植被信息,完成了武威市的土地利用图;陈君颖和田庆久[2]基于高分辨率IKONOS影像采用决策树的方法完成了南京市区的植被类型图;韩涛[20]利用TM遥感图像通过一种简单的决策树分类方法,成功地对祁连山典型地区的针叶林和灌木草进行了分类,并对分类结果进行检验。
以上基于决策树方法的植被分类研究多是选择恰当的植被指数阈值对物候差异性较显著的森林植被和农作物进行了分类研究,对于同一区域,具有相似时序VI谱线特征的像元往往被认为是同一种植被类型来处理的[19],因此取得了较好的分类结果。但是对于高寒环境下的青藏高原具有相似VI时序特征的高寒草地,利用决策树分类算法尝试完成高寒草地植被分类的研究尚不多见,而高寒草地作为高原分布最为广泛的植被类型,包括高寒草甸、高寒草原和高寒沼泽草甸等各种类型,是进行高原各项植被研究的物质基础,包括高寒草甸、高寒草原和高寒沼泽草甸等各种类型。再者,国内外学者多是利用NDVI应用于植被分类研究中,已有研究表明,NDVI对植冠背景的影响较为敏感,当植被覆盖度小于15%或大于80%时,由于土壤背景的影响与饱和度问题,会使冠层反射率发生变化,从而导致NDVI对植被检测的灵敏度下降[21-22]。而EVI数据是在NDVI的基础上开发的新的植被指数,它进一步减小了气溶胶的影响,同时考虑到土壤背景的影响,是综合处理土壤、大气及饱和度问题的增强型植被指数[23-24]。因而在理论上,对高植被覆盖区或受土壤背景影响较大的地区,如青藏高原,采用EVI代替NDVI数据来研究植被分类更具有适用性。地球观测系统的中分辨率成像光谱仪(MODIS)传感器凭借高时间分辨率、高光谱分辨率、适中的空间分辨率和全球免费接收的特点,使植被指数在区域及全球植被分类研究中具有极其重要的价值。因此,以青藏高原温泉区域为研究区,利用野外调查数据和遥感数据,综合分析不同植被类型的MODIS/EVI时序曲线特征和地理分布特征,建立知识库并探讨决策树分类算法进行高寒草地植被分类的可行性,以期为高寒草地植被分类的研究提供一种新的途径。
1.1研究区概况 研究区位于青海省玛多县、兴海县、都兰县及玛沁县交界处的温泉区域(图1a),地理范围为99°06′~99°42′ E,35°6′~35°42′ N,总面积约2 520 km2,区内海拔介于3 430~5 300 m,平均海拔为4 327 m。区内主要有鄂拉山和姜路岭两山脉分布,呈西北-东南走向,和青康公路方向垂直,形成一系列相间排列的山地和断陷盆地,主要有温泉谷地和苦海滩地(图1b)。根据研究区附近花石峡气象站的观测资料[25],该区年平均气温为-3.2 ℃,年极端最高气温为18.5 ℃,年极端最低气温为-32.5 ℃;年降水量500~600 mm,属寒温带大陆性气候。研究区内河流纵横,植被发育良好,植被类型主要有高寒草甸、高寒草原、高寒沼泽草甸和高寒灌丛。
1.2研究数据 本研究使用的遥感数据为NASA的MODIS /EVI产品(MOD13Q1)、30 m的Land satTM数据和中国西部环境与生态科学数据中心提供的90 m的DEM数据。其中,MODIS/EVI产品的空间分辨率为250 m,时间分辨率是16 d,共223个时相的影像数据(2000年3月5日-2009年10月31日)。为使用方便,将HDF 格式转化为TIFF格式,并把SIN地图投影转换为WGS84经纬度坐标系统。LandsatTM数据包括13 336和13 335两景数据,成像时间为2009年8月11日,在专家的指导下,利用TM数据在室内完成了研究区域的植被分类目视解译图并利用野外99个样地对分类图像进行精度验证,其分类精度为88%。
图1 青藏高原温泉区域的数字高程及采样点分布
在“青藏高原冻土本底调查项目”的支持下,2009年9-10月对温泉区域开展了野外样地数据的采集工作。野外数据采用样线和样方相结合的方法进行取样,为了和空间分辨率250 m的MODIS/EVI数据联系起来,样地尽量布置在植被状况均一、范围广等具有代表性的4种植被类型(高寒草甸、高寒草原、高寒沼泽草甸、高寒灌丛)的区域上。高寒草甸的建群种主要以耐寒、多年生、密丛、短根茎、地下芽的嵩草属植物为主,如高山嵩草(Kobresiapygmaea)、矮生嵩草(K.humilis)、苔草(Carextristachya)和西藏嵩草(K.tibetica)等,其他伴生植物如小叶黄芪(Astragalushulunensis)、火绒草(Leontopodiumleontopodioides)和美丽风毛菊(Saussureapulchra)等也有较为广泛的分布。依据土壤含水量的不同将高寒草甸分为高寒沼泽草甸和高寒草甸。高寒草原主要是以耐寒、抗旱的多年生丛生禾草为建群种所形成的群落,紫花针茅(Stipapurpurea)是调查区高寒草原最为主要的建群种之一,其伴生植物如火绒草、小叶黄耆等在样地中也有较为集中和广泛的分布,高寒灌丛通常生长茂密,覆盖度较大,主要树种有山生柳(Salixoritrepha)、金露梅(Potentillafruticosa)、鬼箭锦鸡儿(Caraganajubata)等。
各样地分别设置1条50 m样线,每条样线上再随机布置5~10个1 m×1 m的样方(间隔为5~10 m)。每个样方记录的内容:植被类型、植物群落结构、植物种类、盖度、分种盖度、平均株高等群落特征。利用手持GPS记录样地中各个样方的经纬度、海拔高度、坡度、坡向,每个样地的位置为样地内所有样方的经纬度平均值。此次野外共采取了99个样地(图1b所示的白色方框),其中高寒草甸(49个)、高寒草原(30个)、高寒沼泽草甸(16个)、高寒灌丛(4个)。
1.3决策树算法 决策树算法是指根据影像的不同特征,以树型结构表示分类或决策集合,产生规则和发现规律[26]。首先利用训练空间实体集生成判别函数,其次根据不同取值建立树的分支,在每个分支子集中重复建立下层结点和分支,最后形成决策树[27]。决策树由一个根结点(R)、一系列内部结点(I)和终极结点(T)组成,每个结点只有一个父结点和两个或多个子结点。决策树算法在遥感分类中的应用是依据规则把遥感数据集一级级往下细分作为决策树的各个分支,终极结点则为分类结果[28],具体分类流程如图2所示。
图2 决策树分类模型[27]
2.1野外测点的代表性 由于交通不便和地理条件的限制,在玛日塘高平原区域(图1b)没有布设植被采样点,从空间分布特征来看,采样点分布具有不均匀性。但是通过对比分析整个温泉区域和采样点的海拔、坡度和坡向分布情况,发现两者具有相近的分布特征,说明这些采样点具有较好的代表性(图3)。但在某些方面仍有差异存在,具体表现在:由于坡度为35°~48°的区域在整个区域所占的比例为0.39%,对测点代表性的影响较小,加之交通不便,因此在坡度超过35°的陡坡没有布设测点;在野外实地踏勘的基础上,在海拔高于4 700 m的地方植被覆盖比较稀疏,地表大部分为裸岩,因此在高于4 700 m的地方没有布设测点;样地坡向和整体坡向的差异主要体现在东北、东及西北3个方向上。
2.2区域内各植被类型的地理空间分布特征 高寒草甸主要分布在3 900~4 500 m的高程带上,坡度主要集中于0°~18°的区域,其中有2个测点处于陡坡,并在各个坡向都有分布;高寒草原主要分布在3 600~4 400 m的稍有起伏的缓坡和平坦地区(0°~15°),有3个测点位于陡坡,坡向除东北,东都有分布。高寒沼泽草甸分布于4 100~4 400 m的平地以及缓坡上(0°~20°),坡向分布与高寒草原类似。高寒灌丛分布集中于4 000~4 300 m的稍有起伏的缓坡上(0°~15°),主要集中于北坡、西北坡、东北坡3个坡向上(图4)。
图3 样地和整个区域的坡度、坡向、海拔对比
图4 不同植被类型采样点的海拔、坡向、坡度分布
2.3区域内各植被类型的EVI时序曲线特征分析 为了消除极端气候事件对植被的影响,利用10年长时间序列EVI数据进行分析;根据样地经纬度提取相应像元EVI的方法,所获数据代表的是局部尺度上的植被分布情况,对于具有植被类型及植被状况均一和分布范围较广等特点的区域,采取了3×3格网的邻域处理方法能更好地反映植被的生长状况。在这一前提条件下,首先计算同一时相遥感影像数据10年的EVI平均值,以99个野外样地为中心,取3×3格网的平均值作为野外样地的EVI值,最后计算每一时期同种植被类型所有测点的EVI平均值,得到了每种植被类型的EVI时序曲线(图5)。各植被类型均具有相似的物候特征,自5月24日左右进入返青期,生长迅速,EVI增加明显;8月12日左右到达盛草期,EVI达到最大值;10月31日进入枯黄期,EVI明显下降。由于受青藏高原特殊的高寒环境下极端低气温的影响,其他时期为各种植被类型的休眠期,EVI值没有明显的变化。不难发现,不同植被的差别主要反映在EVI数值的差异,即3个时期4种植被的EVI均值具有可分离性,尤其在盛草期时表现明显。
图5 不同植被类型的EVI时间序列曲线图
对4种植被类型各时期所有测点进行EVI误差分析发现(图6),虽然每一生长期任意2种植被类型的平均EVI值是不同的,但是整个EVI分布区间有重叠性。以8月12日盛草期的4种植被类型的EVI为例:高寒草甸的EVI最小值为0.12,EVI平均值为0.34,EVI最大值为0.50;高寒草原的EVI最小值为0.14,均值为0.25,最大值为0.38;高寒沼泽草甸的EVI最小值为0.28,均值为0.39,最大值为0.51;高寒灌丛的最小值为0.27,均值为0.35,最大值为0.43。假设某一种植被类型的EVI值为0.30,很难判定它的类别归属问题。
图6 不同植被类型的增强型植被指数(EVI)误差分析图
3.1分类结果 分析可知,对于具有相似物候特征的植被类型,仅依据EVI均值进行分类,会存在错分的现象。由于受水热条件的影响,同种植被类型或不同植被类型分布在不同的地貌单元,从而各种植被类型具有地理空间分布特征的差异性,因此尝试以EVI数据分区为基础,同时考虑各种植被类型的地理空间分布特征,最后采取决策树的方法来完成该区域的植被分类图。
在盛草期(8月12日)时,4种植被类型的EVI均值之间具有最大的可分离性(图5)。因此,以盛草期的EVI影像为基础进行植被分类研究。利用中国西部环境与生态科学数据中心提供的1∶10万的土地利用图,选取表征低覆盖草地和裸地的大量点并提取相应点的EVI值,通过比较两者的EVI均值,最终确定了植被和非植被临界EVI值为0.14,即EVI>0.14的像元为植被,否则为非植被。当EVI>0.5时,可以认为像元完全被高寒沼泽草甸所覆盖(图6)。在保证每个EVI区间有几种植被类型一定数量样地的前提下,采用等间距的方法将EVI划分了6个区间,即0.14~0.25、0.25~0.30、0.30~0.35、0.35~0.40、0.40~0.45和0.45~0.50,然后统计分析每个EVI区间内每种植被类型的坡向、坡度和海拔的分布特征,最后总结出分类规则。
1)在0.14~0.25区间,高寒草甸和高寒草原分布,通过统计比较发现,高寒草甸主要集中分布在海拔高于4 300 m的西南和西坡地带,而高寒草原在其他地带广泛分布。
2)在0.25~0.30区间,高寒草甸、高寒草原和高寒沼泽草甸3种植被类型分布存在,统计每种类型的地理空间分布特征,其中高寒草甸主要分布在海拔高于4 300 m的阴坡地带;高寒沼泽草甸分布在海拔低于4 000 m的地表条件湿润的南坡,西南坡和西坡地带,其余地带为高寒草原分布。
3)在0.30~0.35区间,高寒草甸和高寒草原2种植被类型分布,统计对比2种植被类型的地理空间分布特征,其中高寒草原主要分布在海拔低于4 000 m的南坡、西南坡和西坡地带,其余地带为高寒草甸分布地带。
4)在0.35~0.40区间,4种植被类型都有分布,统计分析4种类型的地理空间分布特征,其中高寒草甸主要分布在东、南、西北坡向地带,高寒草原主要分布在西南坡向,高寒灌丛主要分布在西坡向,其余地带为高寒沼泽草甸分布带。
5)在0.40~0.45区间,高寒草甸、高寒沼泽草甸及高寒灌丛分布,高寒草甸主要分布在海拔高于4 000 m的东北坡向及坡度小于10°的东南坡向地带,高寒灌丛主要分布在西坡向地带,其余地带为高寒沼泽草甸的分布地带。
6)在0.45~0.50区间,高寒草甸和高寒沼泽草甸分布,高寒草甸主要分布在阳坡地带,其余地带为高寒沼泽草甸分布地带。
在EVI数据分区的基础上,借助海拔、坡度和坡向的地理信息,生成了每个EVI区间的判别函数(表1),在这些判别函数的支持下,最终构建了温泉区域的高寒草地植被分类的决策树(图7)。
在遥感软件ENVI的支持下,利用以上温泉区域植被分类决策树得到了研究区的高寒草地植被分类结果图,并对分类结果进行后处理,将小于3个像元的小图斑合并于周围大图斑中,得到的最终分类结果(图8)。植被类型以高寒草甸和高寒草原为主,两者的面积占整个区域的80%以上。高寒草甸和高寒沼泽草甸主要集中分布在丘陵低山的半阴坡以及地表积水的洼地地区;高寒草原主要分布在地势平坦的玛日塘高平原地区;由于阴坡太阳辐射和蒸散发强度较弱,高寒灌丛主要分布在鄂拉山和姜路岭的阴坡地区。
3.2精度评价 精度评价是遥感数据分类过程中一项不可缺少的工作,通过精度分析,分类者将改进分类模式提高分类精度;使用者根据分类精度,能正确、有效地获取分类结果中的信息[29]。本研究通过TM影像目视解译和实地调查相结合,在保证每个类别都有一定数量样本的前提下,从分类结果随机抽取283个样本进行评价,采用误差矩阵和Kappa系数对分类结果进行评估,表2为分类精度评价的结果,总体分类精度为72%,Kappa系数为0.6。相比物候差异性较显著的植被分类而言,分类精度相对较低,主要是由于在青藏高原特殊的高寒环境下,该区域的几种植被具有相似的生长规律即物候性相似造成的。总体来说,基于决策树方法的植被分类结果在温泉区域具有一定的可行性,这为以后的高寒草地植被分类的研究提供了一种新的途径。从每种植被类型的生产精度方面而言,高寒草原的分类精度最高,高寒灌丛的分类精度最低;使用精度方面,高寒沼泽草甸的精度最低,说明高寒沼泽草甸和高寒灌丛出现错分漏分的现象较多。可能是由两方面的原因造成的:1)两者的样本点太少;2)EVI值分布区间较接近。高寒沼泽草甸有16个样点,而高寒灌丛只有4个样点,在生成决策规则时,可能缺乏反映情况的真实性和本研究采用的简单随机采样法有关,可能是没有抽取到足够数量的样本。在盛草期时,高寒沼泽草甸EVI值域为0.28~0.49,而高寒灌丛的值域范围为0.27~0.43,两者的EVI值域比较接近,因而造成高寒沼泽草甸和高寒灌丛的分类结果不理想。
表1 决策树的判别函数
图7 决策树分类方法流程图
图8 温泉区域的植被类型图
表2 植被类型分类精度评价
本研究以青藏高原温泉区域为研究区综合分析了各种高寒草地植被类型的EVI时序特征和地理分布特征,采用决策树的方法进行植被分类研究,并对分类结果进行了精度评价,说明该方法在温泉区域具有可行性。
对于季相节律性和物候特征差异不显著的高寒草地植被类型的分类研究,仅仅利用EVI的均值进行植被分类存在一定的误分现象,但是结合植被的地形特征数据,采用决策树的方法能有效地识别出各种植被类型,并获得了较好的分类结果。同时本研究利用野外样地每一时序10年的EVI均值数据来分析分布特性,这种处理长时间序列数据的方法更能反映植被的实际生长状况以及消除极端事件对植被的影响。决策树方法在温泉区域具有可行性,为以后的高寒草地植被分类的研究提供了一种新的途径,但能否应用于青藏高原其他地方有待于进一步研究。
尽管此方法在研究区取得了较好的分类结果,但仍存在着由于算法参数选择所引起的算法稳定性问题,如采样点的数目问题而引起的判别函数缺乏真实性和全面性。由于研究区的高寒灌丛和高寒沼泽草甸在野外实际工作中采点数目少,导致误差较大,因而在以后的研究中应注重样地数目的均匀性来进一步提高决策树方法的分类精度。
致谢:本文得到青藏高原多年冻土本底调查研究项目资助,野外工作得到吴吉春、陈继、史健宗、石伟、刘杨等的帮助,在此表示衷心感谢。同时感谢中国西部环境与生态科学数据中心为本研究提供研究区域的数字高程模型以及NASA提供的250 m的EVI数据和30 m的Landsat TM数据(https://wist.echo.nasa.gov/api)。
[1]李晓兵,史培军.基于NOAA/AVHRR数据的中国主要植被类型NDVI变化规律研究[J].植物学报,1999,41(3):314-324.
[2]陈君颖,田庆久.高分辨率遥感植被分类研究[J].遥感学报,2007,11(2):221-227.
[3]竞霞,王锦地,王纪华,等.基于分区和多时相遥感数据的山区植被分类研究[J].遥感技术与应用,2008,23(4):394-397.
[4]顾娟,李新,黄春林.基于时序MODIS NDVI的黑河流域土地覆盖分类研究[J].地球科学进展,2010,25(3):318-326.
[5]华维,范广洲,周定文,等.青藏高原植被变化与地表热源及中国降水关系的初步分析[J].中国科学:D辑,2008,27(4):732-740.
[6]赵冰茹,刘闯,刘爱军,等.利用 MODIS-NDVI进行草地估产研究——以内蒙古锡林郭勒草地为例[J].草业科学,2004,21(8):12-15.
[7]周兆叶,储少林,王志伟,等.基于 NDVI 的植被覆盖度的变化分析[J].草业科学,2005,25(12):23-29.
[8]李霞,崔霞,黄晓东,等.北疆不同草地类型MODIS植被指数的时空变化研究[J].草业科学,2007,24(9):5-11.
[9]王兮之,杜国桢,梁天刚,等.基于RS和GIS的甘南草地生产力估测模型构建及其降水量空间分布模式的确立[J].草业学报,2001,10(2):95-102.
[10]王莺,夏文韬,梁天刚,等.基于MODIS植被指数的甘南草地净初级生产力时空变化研究[J].草业学报,2010,19(1):201-210.
[11]王晓爽,胡卓玮,赵文吉,等.基于EVI 植被指数的大尺度草地多源信息综合分类研究[J].草业科学,2011,28(1):10-17.
[12]马轩龙,李文娟,陈全功.基于GIS与草原综合顺序分类法对甘肃省草地类型的划分初探[J].草业科学,2009,26(5):7-13.
[13]Wardlow B D,Egbert S L.Large-area crop mapping using time-series MODIS 250m NDVI data:an assessment for the US Central Great Plains [J].Remote Sensing of Environment,2008,112:1096-1116.
[14]Hansen M C,DeFries R S,Townshend J R G,etal.Towards an operational MODIS continuous field of percent tree cover algorithm: Examples using AVHRR and MODIS data[J].Remote Sensing of Environment,2002,83:303-319.
[15]Zhan X,Ohlberg R A,Townshend J R G,etal.Detection of land cover changes using MODIS 250 m data [J].Remote Sensing of Environment,2002,83:336-350.
[16]Wessels K J,DeFries R S,Dempewolf J,etal.Mapping regional land cover with MODIS data for biological conservation:Examples from the Great Yellowstone Ecosystem,USA and Para State,Brazil [J].Remote Sensing of Environment,2004,92:67-83.
[17]齐红超,祁元,徐瑱.基于C5.0决策树算法的西北干旱区土地覆盖分类研究——以甘肃省武威市为例[J].遥感技术与应用,2009,24(5):648-654.
[18]Yang C C,Prasher S O,Enright P,etal.Application of decision tree technology for image classification using remote sensing data[J].Agricultural Systems,2003,76(3):1101-1117.
[19]Mallinis G,Koutsias N,Tsakiri-Strati M,etal.Object-based classification using Quick bird imagery for delineating forest vegetation polygons in a Mediterranean test site,ISPRS[J].Journal of Photogrammetry and Remote Sensing,2008,63:237-250.
[20]韩涛.用TM资料对祁连山部分地区进行针叶林、灌木林分类研究[J].遥感技术与应用,2002,17(6):317-321.
[21]宋杨,万幼川,申绍洪,等,基于傅立叶变换的混合分类模型用于NDVI时序影像分析[J].武汉大学学报,2007,32(5):406-409.
[22]赵英时.遥感应用分析原理与方法[M].北京:科学出版社,2003.
[23]刘玉洁,杨忠东.MODIS遥感信息处理原理与算法[M].北京:科学出版社,2001.
[24]王正兴,刘闯,陈文波,等.MODIS增强型植被指数EVI与NDVI初步比较[J].武汉大学学报(信息科学版),2006,31(5):407-410.
[25]丑亚玲,盛煜,韦振明.多年冻土区公路路基阴阳坡温度及变形差异分析[J].岩石力学与工程学报, 2009,28(9):1896-1903.
[26]Quinlan J.Introduction of decision trees [J].Machine Learning,1986,1(1):81-106.
[27]李德仁,王树良,李德毅,等.论空间数据挖掘和知识发现的理论与方法[J].武汉大学学报(信息科学版),2002,27(3):221-233.
[28]Friedl M,Brodley C.Decision tree classification of land covers from remotely sensed data [J].Remote Sensing of Environment,1997,61(3):399-409.
[29]赵萍,傅云飞.基于分类回归树分析的遥感影像土地利用/覆被分类研究[J].遥感学报,2005,9(6):708-716.