吴梓尚 ,林 辉 ,孙 华 ,林 欣
(1.中南林业科技大学 林业遥感大数据与生态安全湖南省重点实验室,湖南 长沙 410004;2.中国地质大学 信息工程学院,湖北 武汉 430074)
基于MODIS影像的森林类型决策树分类方法研究
吴梓尚1,林 辉1,孙 华1,林 欣2
(1.中南林业科技大学 林业遥感大数据与生态安全湖南省重点实验室,湖南 长沙 410004;2.中国地质大学 信息工程学院,湖北 武汉 430074)
以4种MODIS时序数据为基础,以湖北省为研究区,开展区域森林类型快速提取的分类方法研究。将湖北省的森林植被划分为针叶林、阔叶林、混交林、竹林、灌木林和非林地6种地类,通过分析不同森林类型一年内的生长差异,根据各植被指数的均值建立了研究区各森林类型的分类参数,选取2010年MODIS数据产品NDVI第10期、NDVI第12期、NDVI第15期、EVI第10期、LAI第16期、LAI第17期数据,建立了针叶林、阔叶林、混交林、竹林、灌木林、非林地的决策树分类模型,并对研究区进行了分类。结果表明:植被指数均值曲线具有一定的区域地类代表性,分类参数对不同森林类型具有较强的分异性;将分类结果与第八次全国森林资源清查结果相比较,森林类型分类总体精度为85.45%,KAPPA系数为0.770 1,效果较好,说明通过MODIS数据进行区域的森林类型提取是可行的。
遥感;影像;分类;决策树;MODIS
森林在地球生态循环及能量交换中起到了关键的作用,其动态变化有着重要的研究价值。不同地区森林类型的分布空间异质性与无序性较强,传统的森林分类方法(地面调查、实地测量)存在工作量大、更新周期长、更新速率低等诸多缺点。随着近年来遥感技术的高速发展,大范围的遥感影像森林类型判别成为可能,特别是分辨率250 m的全球MODIS数据更掀起了一轮环境变化监测及研究的高潮。在近20年来,基于影像的分类算法与理论,大多利用目标物的光谱反射特性开发各种算法加以分类,而因素造成的“同物异谱,异物同谱”问题,制约了基于光谱特征的统计模式分类方法精度。为此,多年来,结合像元级的空间光谱特征辅以遥感信息以外的待分类区的各种特征信息开发的分类算法逐渐成为一种趋势,并取得了进展。
通过对多时相MODIS数据运用常见监督分类及基于特征组合、逻辑判断等方式建立的决策树算法进行森林植被信息的提取,显著地提高了分类精度。本研究选取湖北省作为研究区域,将区域内森林类型划分为针叶林、阔叶林、混交林、灌木林,以MODIS影像作为数据来探索多时相遥感数据提取主要森林类型信息的方法,以期为中低分辨率遥感数据的区域森林类型信息快速提取提供技术参考。
湖北省位于中国的中部,长江中游,地跨东经 108°21′42″~ 116°07′50″、 北 纬 29°01′53″~33°6′47″,东邻安徽,南接江西、湖南,西连重庆,西北与陕西接壤,北与河南毗邻。东西长约740 km,南北宽约470 km。全省国土总面积约18.59万km2,占全国总面积的1.94%。在中国植被区划中,湖北省隶属于亚热带常绿阔叶林区域,东部常绿阔叶林亚区域,包括北亚热带常绿、落叶混交林地带和中亚热带常绿阔叶林北部亚热带两个地带。因而湖北省植被不仅显示出由北亚热带常绿、落叶阔叶混交林向中亚热带常绿阔叶林过渡的特征,而且植物种类丰富,起源古老,孑遗植物多,具有相当数量的中国特有种,植物区系地理成份复杂,并与世界各地广泛联系。
图1 研究区位置Fig. 1 Geographic position of study area
研究所用的 MODIS 时序数据在美国宇航局(National Aeronauticsand Space Administration,NASA)官方 MODIS网站(https://ladsweb.nascom.nasa.gov/data/search.html)下载,分别为 NDVI(MOD13Q1,Vegetation Indices 16-Day L3 Global 250m)、EVI(MOD13Q1,Vegetation Indices 16-Day L3 Global 250m)、LAI(MOD15A2,Leaf Area Index/FPAR 8-Day L4 Global 1km) 和 GPP(MOD17A2,Gross Primary Productivity 8-Day L4 Global 1km)4 种类型。
MODIS 原始数据采用 sinusoidal 投影系统进行发布。利用 MODIS 产品专门处理工具 MRT(modis reprojection tool)对MODIS数据进行文件格式转换、图像镶嵌、地图投影和分辨率重采样处理,最终输出图像为WGS-84投影,空间分辨率为250 m和1 km的栅格图像。并对研究区行掩膜裁剪,得到研究区各期NDVI、EVI、GPP和LAI影像。
决策树分类最早为一种计算机编程方法,通过逻辑判断语句从大量、有噪声、模糊、随机的数据中,提取隐含在其中、事先未知、但又潜在有用的信息和知识的过程。
在研究区范围内,随机抽取10 000个样点,利用ArcGIS将预处理所得到的NDVI、EVI、GPP及LAI图像的DN值赋予这10 000个点。将点值进行制表处理,并按照针叶林、阔叶林、混交林、灌木林、竹林及非林地进行排序,可得如下结果:
10 000 个样点中,有效样点9 992个;其中针叶林815个,阔叶林714个,混交林1 936个,灌木林287个,竹林174个,非林地6 066个。提取2010 年 NDVI、EVI、LAI、GPP 这 4 种植被指数产品,然后对每期数据的同一地类提取的植被指数进行均值处理,剔除两倍标准差外的异常点,得到 23 期 NDVI,EVI 指数均值、46 期 LAI,GPP 植被指数的均值。将均值绘制成折线图,结果见图2。
图2 植被指数均值曲线Fig.2 Vegetation index average curve
由图2(b)可明显看出,第10期EVI植被指数能较好区分非林地与其它5种地类。图2(a)可得,第15期NDVI植被指数能较好地分离出竹林地。由图2(d)发现,GPP植被指数对于各地类的分离度过小,故GPP植被指数在湖北省决策树森林信息提取过程中不适用。由图2(c)可以发现,LAI植被指数第20期对于混交林与其它地类的分离度较高。
由以上未经组合的植被指数折线图区分出了非林地、竹林及混交林,但对于灌木林、针叶林及阔叶林的区分效果较差,故需要进行进一步组合分析。
经多次植被指数组合运算试验,发现使用NDVI植被指数及LAI植被指数进行运算之后的结果可较好地区分灌木林、针叶林及阔叶林。将NDVI第10期与第12期进行组合可较好地区分竹林地与其它地类。将LAI第16期与第17期进行组合运算可区分针叶林与阔叶林。
由2.1可得区分各地类所需的植被指数期数,而区分所使用的阈值大小仍需确认,故还需要绘制植被指数密度曲线以确定区分各地类时所使用的阈值大小。
将NDVI第10期、第12期、第15期,EVI第10期,LAI第16期、第17期和第20期单独提取,在ARCGIS中将这7期的图像DN值赋予随机点,根据这10 000个随机点建立植被指数概率密度曲线。植被指数概率密度曲线见图3。
图3 植被指数概率密度曲线Fig.3 Vegetation index probability density curve
由图3可知:EVI第10期影像概率密度曲线所表现出来的差异可分离出非林地和林地,EVI<0.46时区分效果最佳;NDVI15<0.4时可较好区分灌木林;LAI20<1.6可区分混交林;竹林、针叶林及阔叶林经多次试验后发现,当NDVI10<0.68且NDVI12>0.7时可获得对于竹林的区分,其阈值为NDVI10<0.68,NDVI12>0.7;LAI16与LAI17的差值可区分针叶林与阔叶林,阈值LAI16-LAI17<0.2时可划分为针叶林,大于0.2时为阔叶林。
综合以上结果,可建立决策树分类模型(见图4)。
采用决策树分类模型对研究区进行分类,结果如图5所示。
图5可以看出,湖北省西部地区以针叶林、阔叶林及混交林为主,东北部地区以针叶林为主,竹林主要分布在东南角,灌木林零散分布在西部地区但面积较小。与第八次森林资源清查分布结果基本一致。
以湖北省1:25万森林资源分布矢量图为基础,将地类归并为针叶林、阔叶林、混交林、灌木林、竹林和非林地6种形式,并将矢量图转换为带属性的250 m栅格图,使用ENVI中的Confusion Matrix Using Ground Truth Image功能进行基于像元的混淆矩阵精度检验。
由表1可看出,决策树分类方法总体精度为85.45%,KAPPA系数为0.770 1,分类效果达到较好水平。
本研究以4种MODIS数据产品的不同时期影像数据为基础,获取2010年各地类的植被指数变化趋势,确定分离度明显的植被指数时相,通过概率密度曲线计算出决策时相数据模型的最佳判别阈值,以此开展区域森林类型的快速提取。结论如下:
(1)相对于LandsatTM等中高分辨率影像,MODIS由于数据量较小,计算时速度明显更快,因此决策树分类方法更适合于中尺度及大尺度范围内的森林类型分类。
图4 决策树模型Fig.4 Decision tree model
图5 决策树分类结果Fig.5 The results of decision tree classification
表1 各地类混淆矩阵精度检验结果Table 1 Around class confusion matrix accuracy test results
(2)对2010年4种时序MODIS数据进行对比,发现NDVI与EVI在春季的分离度不够明显,进入夏季秋季后植被指数开始出现一定分离度,可以将该时期的影像作为数据源。而对于肉眼区分度不明显的GPP和LAI曲线,可以通过波段组合运算,确定决策树各项阈值参数。
(3)从决策树分类的结果来看,对比第八次全国森林资源连续清查数据,分类结果仅相差3.4%,与第八次全国森林资源清查大体一致。由此可说明决策树的分类精度较好。
(4)从混淆矩阵检验结果可知,针叶林、阔叶林、混交林、竹林、灌木林和非林地的用户分类精度分 别 为:53.03%、53.31%、87.85%、71.53%、86.36%、98.16%。分类总体精度能达到85.45%,KAPPA系数为0.770 1。说明这种方法对于区域性的森林覆盖率信息提取是可行的,适合在全国森林信息提取进行推广,但决策树分类规则及阈值的确定主要取决于对当地的了解状况,阈值一般只适用于研究区域,对于更大尺度的区域需要重新确定阈值。
[1]刘建光,李 红,孙丹峰,等. MODIS 土地利用/覆被多时相多光谱决策树分类[J].农业工程学报,2010,26(10):312-318.
[2]刘勇洪,牛 铮,王长耀.基于MODIS数据的决策树分类方法研究与应用[J].遥感学报,2005,9(4):405-412.
[3]赵 萍,傅云飞,郑刘根,等.基于分类回归树分析的遥感影像土地利用/覆被分类研究[J].遥感学报,2005,9(6):708-716.
[4]宫 攀,陈仲新,唐华俊,等.基于MODIS温度/植被指数的东北地区土地覆盖分类[J].农业工程学报,2006,22(9):94-99.
[5]李 爽,丁圣彦,钱乐祥.决策树分类法及其在土地覆盖分类中的应用 [J].遥感技术与应用,2002,l7(1):6-l1.
[6]温兴平,胡光道,杨晓峰.基于C5.0决策树分类算法的ETM+影像信息提取[J].地理与地理信息科学,2007,23(6):26-29.
[7]陈艳华,张万昌.地理信息系统支持下的山区遥感影像决策树分类[J],农业工程学报,2010,10(10):312-318.
[8]李 彤 ,吴 骅,采用决策树分类技术对北京市土地覆盖现状进行研究[J].遥感技术与应用,2004,19(6):185-487.
[9]莫登奎. 中高分辨率遥感影像分割与信息提取研究[D].长沙:中南林业科技大学,2006.
[10]孙 华. SPOT5在森林资源调查中的应用研究[D].长沙:中南林业科技大学,2006.
[11]王正兴,刘 闯,陈文波,等.MODIS增强型植被指数EVI与NDVI初步比较[J].武汉大学学报(信息科学版),2006, 31(5):407-410.
[12]都金康,黄永胜,冯学智,等.SPOT卫星影像的水体提取方法及分类研究[J].遥感学报,2001,5(3):214-219.
[13]朱洪芬.基于MODIS数据的江苏省植被指数时空变化特征研究[J].山西师范大学学报(自然科学版),2010,24(6):90-95.
[14]孙小添,邢艳秋,李增元,等.基于MODIS影像的决策树森林类型分类研究[J].西北林学院学报,2013,28(6):139-144.
[15]李 爽,张二勋.基于决策树的遥感影像分类方法研究[J].地域研究与开发,2003,22(1):17-21.
[16]申文明,王文杰,罗海江,等.基于决策树分类技术的遥感影像分类方法研究遥感技术与应用[J].遥感技术与应用,2007,22(3): 333-338.
[17]罗朝沁, 林 辉, 孙 华,等. 基于MODIS影像大尺度森林资源信息提取方法研究[J].中南林业科技大学学报, 2015,35(11): 21-26.
[18]和晓风, 林 辉, 孙 华,等. 基于GF-1卫星东洞庭湖湿地类型信息提取[J]. 中南林业科技大学学报, 2015,35(11):10-15.
[本文编校:谢荣秀]
Classification of forest types by tree decision based on MODIS images
WU Zishang1, LIN Hui1, SUN Hua1, LIN Xin2
(1. Research Center of Forest Remote Sensing & Information Engineering, Central South University of Forestry & Technology, Changsha 410004, Hunan, China; 2.College of Information Engineering, China University of Geosciences, Wuhan 430074, Hubei, China)
Based on the four MODIS time series data, get around the class when the vegetation index 2010 trends and identify vegetation index greater degree of separation phase, taking Hubei province as the studying area to carry out regional forest type quick extraction,Implementation of the main forest type classification.Divide the forest vegetation of Hubei province for coniferous forest,broad-leaved forest, mixed forest, bamboo forest, shrub, and non-forest of six types.Through the analysis of different forest types within one year of growth difference. According to the average of each vegetation index established classification parameters of different forest types in the study area,Select the first 10 multi-temporal NDVI, NDVI Article 12, Article 15 NDVI, EVI section 10, LAI article 16,LAI data section 17, established the coniferous forest, broad-leaved forest, mixed forest, bamboo forest, shrub, non-forest’s decision tree model, achieved the identification of the forest type information.Research showed that the vegetation index average curve in this paper has certain representative areas, the classification parameters are different for different forest types.The results compared with the result of the eighth national forest resource inventory, the overall classification accuracy of forest types was 85.45%,KAPPA coefficient is 0.770 1, it shows that it is feasible to extract the forest information through MODIS data.
remote sensing; images; classification; decision tree; MODIS
S771.8
A
1673-923X(2017)09-0080-06
10.14067/j.cnki.1673-923x.2017.09.014
2016-11-12
“十二五”国家高技术研究发展计划(863计划)课题“数字化森林资源监测关键技术研究”(2012AA102001);国家自然科学基金项目(31370639)
吴梓尚,硕士研究生
林 辉,教授,博士,博士生导师
吴梓尚,林 辉,孙 华,等. 基于MODIS影像的森林类型决策树分类方法研究[J].中南林业科技大学学报,2017,37(9): 80-85.