基于MODIS-NDVI时序数据的黄土丘陵区土地覆盖分类研究

2011-05-07 10:59陆广勇杨勤科2王海江
水土保持研究 2011年2期
关键词:植被指数决策树耕地

陆广勇,杨勤科2,,王海江

(1.中国科学院 水利部 水土保持研究所,陕西 杨凌712100;2.西北大学,西安710069)

土地覆盖是全球变化研究的重要内容,其研究为区域和全球尺度的气候和生态过程模型提供了重要的参数。区域尺度的土地覆盖信息主要基于多光谱遥感影像Landsat MSS/TM/ETM+数据提取,但所需数据量庞大,而且关键生长时期的影像会受到云的影响而无法获取,数据更新受限[1]。

土地覆盖变化具有季节性,这种季节变化可以利用植被指数的变化进行定量分析研究[2]。卫星遥感影像能够监测植被的物候变化[3-5],来自遥感影像的区域植被指数NDVI值随时间周期性升高和降低是植被生长周期的典型体现[6]。反映地表覆盖物季节性变化特征的多时相NDVI可以作为土地覆盖的分类特征[5]。

植被指数时间序列的数据源主要包括NOAAAVHRR、SPOT-VGT和MODIS等植被指数数据产品。前两者的合成周期为10d,空间分辨率约为1 km,多用于全球或大区域的研究[3,5,7-8]。MODIS植被指数产品合成周期为16d,但其空间分辨率较高,有500m 和250m 两种分辨率产品[9-11],因此应用研究也越来越多[1,12-16]。

基于植被指数时间序列影像的土地覆盖分类方法可分成非监督分类、监督分类和分层决策树分类3种。盛永伟[3]、李道峰[7]、宫攀[1]等基于气象卫星的NDVI时间序列影像、运用非监督分类法进行了植被覆盖类型分类;刘勇洪等基于MODIS地表反射率、植被指数和地表温度数据产品,选择6种分类特征,通过监督分类,将山东省土地覆盖分成了8类[13];张霞等综合运用ISODATA非监督分类法、决策树法,对华北平原进行了土地覆盖分类[14]。

但是很多研究应用中,土地覆盖的季节性变化规律没有被作为主要的分类特征,而且非监督分类法与决策树法的应用中都是在动态聚类的基础上进行的,物理意义不够明确。目前在地形复杂区(如黄土丘陵沟壑区)基于MODIS植被指数时间序列影像的土地覆盖分类研究较少。本实验综合运用MODIS地表反射率与NDVI植被指数两种数据产品、DEM,结合当地物候特征,分析了土地覆盖植被指数内变化特征,运用植被指数、湿度指数和纹理特征进行分层决策树分类,利用ISODATA法和当地土地覆盖分布特征调整分层决策树结果,为区域环境动态监测、土壤侵蚀评价提供更高时间分辨率的基础数据。

1 研究区域概况

延河流域地处陕北黄土高原中部,地理位置为36°23′-37°17′N 和 108°45′-110°28′E,面 积 达7 684km2。该流域属暖温带大陆性半干旱季风气候,年平均气温9℃,年均降雨量为500mm,其中7-9月降雨量占全年降雨量的60%以上。流域植被区划上属于森林草原地带。由于土壤侵蚀严重,土壤类型以黄土母质上发育的黄绵土为主,土壤质地均一,土质疏松,抗侵蚀能力差。流域内沟壑纵横,地形复杂,植被覆盖率低,属典型黄土丘陵沟壑区[17-18]。

2 研究方法

2.1 数据源

(1)本文采用NASA USGS提供的植被指数数据产品MOD13Q1的归一化植被指数MODIS-NDVI,空间分辨率为250m,合成周期为16d。从2006年1月1日至2006年12月30日,共23个时相影像。

(2)NASA USGS提供的地表反射率产品数据MOD09GA,空间分辨为500m,影像获取时间为2006年9月9日,共7个波段,但第5波段存在坏线,故本实验使用了MODIS的1-4,6-7共6个波段的影像。

(3)2006年9月10日成像的Landsat TM 5图像解译生成的2006年土地利用图(简称LU2006)和矢量化的2000年延河流域土地利用图(简称LU2000)。

图1 延河流域地理位置及地势图

(4)DEM:利用1∶5万地形图和ANUDEM软件生成的10m分辨率DEM,用以生成坡度图。

2.2 数据预处理

(1)基于时间序列谐波分析法(HANTS)对MODIS-NDVI进行滤波。MODIS-NDVI影像局部容易受到云等因素的影响,需要进行平滑处理[15]。本文选择了HANTS对23景MODIS-NDVI进行平滑处理。该方法的核心主要是通过傅里叶变换和最小二乘法,利用谐波重构时间序列数据[19]。通过HANTS滤波后,植被指数时间序列更加光滑(见图2),更有利于有效揭示物候周期性变化规律,便于地表覆盖信息提取[19-20]。

图2 平滑处理前后典型土地覆盖类型NDVI时间序列曲线

(2)延河流域植被年内变化可划分为休眠阶段、恢复阶段、生长季节、退化阶段4个时段[18]。基于IDL语言编程,计算平滑后全年和生长期(GD,growth duration)MODIS-NDVI时间序列的最大值(max、GDmax)、最小值(min、GDmin)、差值(最大值-最小值,D、GDd)。(3)对平滑后的全年 MODIS-NDVI影像进行主成分分析(PCA)。基于反映年内植被覆盖差异较大耕地信息PCA第二组分,在3×3窗口下,进行纹理特征局部平滑(Homogeneity,Homo),以便提取耕地信息。

(4)利用ENVI系统的GLT(Geometry Lookup Table)对 MOD09GA和 MODIS-NDVI进行几何校正[21]。将滤波后的 MODIS-NDVI及其生成数据、MOD09GA进行Albers等面积投影。并以DEM为基准,首先将TM 5影像和2006年土地利用图等进行空间配准,然后基于配准后的TM 5影像对MODIS-NDVI、MOD09GA进行配准。空间配准的误差都控制在一个像元以内。

(5)基于 MOD09GA提取了影像的湿度指数(NDMI,Normalized Difference Water Index)[13],其表达式如式(1)。

式中:ρ4,ρ6——经过标准化处理的 MODIS可见光绿色波段(第4波段)和短红外波段(第6波段)。波段ρ6处于水的吸收带,对湿度、含水量信息尤为敏感,而ρ4对水体的反射率较高,因此利用NDMI提取水体的外边界。

2.3 影像分类方法

不同的土地覆盖类型具有不同的植被时间序列曲线。根据当地的年内植被变化特征,基于植被指数响应曲线特征,进行影像分类。本文综合运用MODIS数据的时间、光谱、空间信息,选取了植被指数NDVI、湿度指数、纹理特征作为分层决策树的分类特征,基于阈值进行分层决策树分类,然后运用ISODATA法分类别进行动态聚类,调整决策树分类结果,最后利用DEM调整耕地类型,最终形成土地覆盖类型图。

(1)分析NDVI时间序列曲线,参考LU2000、LU2006和植被年内变化特点[18],选择各个指标阈值,进行分层决策树分类,并生成各土地覆盖类型掩膜。如图3所示,耕地的NDVI曲线在生长期内(第113~289d)上升和下降梯度最大,波峰明显,差值最大;典型林地的NDVI值全年都较大,在生长期内最小值略小于0.4;草地也存在较明显的波峰,但其变化梯度小于耕地,且峰值一般小于林地和耕地;而居民地和水体NDVI年内变化较小,因为居民地内往往与一些植被(如城市绿地)混合,所以居民地的NDVI值略大于水体。根据各种土地覆盖的时间响应曲线特征,选择合适的阈值,进行决策树分类。

(2)基于决策树分类类型掩膜,利用迭代自组织数据分析法(ISODATA法),对 MODIS-NDVI图像进行动态聚类(非监督分类)[14],参考土地利用图和MOD09GA多光谱影像,调整决策树分类结果。MODIS-NDVI主要反应植被信息,因此,基于MODIS-NDVI时间序列影像对林地、高覆盖草地进行非监督分类。在植被盖度较低区域,NDVI指标反应植被盖度不够灵敏,单纯依靠NDVI时间序列难以正确识别土地覆盖类型[6],因此基于地表反射率影像MOD09GA,对低覆盖草地、水体与居民地进行非监督分类。

图3 决策分类树示意图

(3)退耕还林(草)实施后,延河流域内大于25°的坡耕地基本都进行了退耕,因此基于DEM形成的坡度图,将以上遥感分类结果中大于25°的耕地调整为草地。考虑到所用数据源分辨率比较低,因而本次研究将要划分的土地利用类型为耕地、林地、草地、居民地和水体5类。

3 结果分析

3.1 空间格局与数量统计分析

基于上述分类方法得到延河流域2006年土地覆盖分类结果,结果见图4。植被分布由东南到西北逐渐减少,与流域年降雨量空间分布一致,林地主要分布在流域的南部,与李正国的研究结果一致[18],占流域总面积的15.9%;草地遍布整个流域,是主要土地覆盖类,占流域总面67.3%,其中约15%的草地是根据坡度土从遥感影像分类结果中的耕地调整而来;耕地主要沿沟道分布,在流域上游也呈现集中分布,为流域总面积的16.5%;居民地与水体两者所占比重不足1%,主要原因是两种流域面积比重较少,分布零散,在250m的影像上,像元混合现象严重[14]。

图4 2006年土地分类结果

3.2 精度分析

选择2006年基于TM的土地利用/覆盖分类图LU 2006进行比较,同时参考LU 2000,进行分类精度评价。精度分析在ENVI 4.7软件下完成,随机选择耕地、草地和林地各覆盖类型的0.1%作为验证像元;由于居民地、水体的像元较少,故每一类各选择10个像元作为验证,5类地表覆盖类型共152个像元,占总流域面积近0.12%[22]。混淆矩阵(见表1)表明总体分类精度为75.00%,Kappa系数为0.620 9,除了居民地,其它4类的用户精度到大于70%,这就说明分类效果良好。用户精度是分类结果可靠性指 标[6],是 最 常 用 的 精 度 指 标[1,13-14,23]。 表 1表明,实际地表的林地和耕地被错分为草地的情况较为严重,分类结果中草地类型被高估,耕地和林地被低估。这主要原因在于延河流域地表破碎,林地、耕地分布不集中,在影像分辨率较粗的情况下,像元内信息趋于平滑。同时,居民地与水体两者地表反射率都较低,反射特征相近,所以两者之间也存在混分现象。居民地(包括交通用地)和水体的斑块一般较小,在粗分辨的遥感影像上很难识别,因此分类结果中两者容易被低估。

表1 误差矩阵

4 结论与讨论

(1)以季节性变化特征作为分类基础,根据植被指数时序曲线、影像纹理和湿度指数等分类特征,进行分层决策树分类,并结合其它辅助数据(如地表反射率、DEM等),按类别进行非监督分类,最后调整土地覆盖分类结果获得土地覆盖分类图,具有一定的物理意义。分类结果与2006年土地利用总体一致性为75.00%,Kappa系数为0.620 9,图像分类结果良好,能为区域环境监测、土壤侵蚀评价提供可靠的年际土地覆盖基础数据。

(2)根据退耕还林后大于25°陡坡上耕地稀少的特点,利用DEM生成的坡度图,调整遥感分类结果中的耕地类型,能在一定程度上减小土地覆盖类型分布破碎对分类结果带来的影响,改善分类效果。

(3)MODIS-NDVI虽然在空间分辨率上较NOAA-AVHRR和SPOT-VGT有了提高,但是在地形复杂、斑块破碎的黄土丘陵沟壑区,在250m的影像上像元混合现象严重,小斑块地类较难识别,导致居民地、水体在分类结果中面积比重小于实际水平。

(4)分类结果中相当一部分耕地和林地被错分为草地,主要原因是当地土地覆盖类型分布破碎,影像分辨率较粗,像元混合现象严重。下一步工作可以结合当地植被的物候特征、分布特点,通过NDVI时间序列曲线的变化特征进行更加细致地定量分析,参考混合像元分解方法,对区域土地覆盖类型进行分类,提高分类精度。

[1] 宫攀,陈仲新,唐华俊,等.基于 MODIS温度/植被指数的东北地区土地覆盖分类[J].农业工程学报,2006,22(9):94-99.

[2] 布和敖斯尔,刘纪远,吴祖南.基于季相及经度特征的中国土地覆盖变化遥感研究[J].地理学报,1998,53(12):52-60.

[3] 盛永伟,陈维英,肖乾广,等.利用气象卫星植被指数进行我国植被的宏观分类[J].科学通报,1995,40(1):68-71.

[4] Jonsson P,Eklundh L.Seasonality extraction by function fitting to time-series of satellite sensor data[J].Ieee Transactions on Geoscience and Remote Sensing,2002,40(8):1824-1832.

[5] 汪权方,李家永.基于时序NDVI数据的中国红壤丘陵区土地覆被分类研究[J].农业工程学报,2005,21(2):72-77.

[6] 赵英时.遥感应用分析原理与方法[M].北京:科学出版社,2003.

[7] 李道峰,田英,郝芳华.基于NDVI数据的黄河流域地表植被覆盖综合分类研究[J].水土保持研究,2003,10(4):88-91.

[8] 卢玲,李新,董庆罕,等.SPOT4-VEGETATION中国西北地区土地覆盖制图与验证[J].遥感学报,2003,7(3):214-221.

[9] Vegetation Indices 16-Day L3Global 500m[EB/OL].https://lpdaac.usgs.gov/lpdaac/products/modis_products_table/vegetation_indices/16_day_13_global_500m/mod13a1.

[10] Vegetation Indices 16-Day L3Global 250m[EB/OL].https://lpdaac.usgs.gov/lpdaac/products/modis _products_table/vegetation_indices/16_day_l3_global_250m/myd13q1.

[11] 王正兴,刘闯,Huetealfredo.植被指数研究进展:从AVHRR-NDVI到 MODIS-EVI[J].生态学报,2003,23(5):979-987.

[12] Guerschman J P,Hill M J,Renzullo L J,et al.Estimating fractional cover of photosynthetic vegetation,nonphotosynthetic vegetation and bare soil in the Australian tropical savanna region upscaling the EO-1Hyperion and MODIS sensors[J].Remote Sensing of Environment,2009,113(5):928-945.

[13] 刘勇洪,牛铮.基于 MODIS遥感数据的宏观土地覆盖特征分类方法与精度分析研究[J].遥感技术与应用,2004,19(4):217-224.

[14] 张霞,孙睿,张兵,等.基于 MODIS植被指数时间谱的华北平原土地覆盖分类[J].农业工程学报,2006,22(12):128-132.

[15] 左丽君,张增祥,董婷婷,等.MODIS/NDVI和 MODIS/EVI在耕地信息提取中的应用及对比分析[J].农业工程学报,2008,24(3):167-172.

[16] 王红说,黄敬峰.基于 MODIS NDVI时间序列的植被覆盖变化特征研究[J].浙江大学学报:农业与生命科学版,2009,35(1):105-110.

[17] 谢红霞.延河流域土壤侵蚀时空变化及水土保持环境效应评价研究[D].西安:陕西师范大学,2008.

[18] 李正国,王仰麟,吴健生.等.不同土地利用方式对黄土高原植被覆盖季节变化的影响:以陕北延河流域为例[J].第四纪研究,2005(06):762-769.

[19] Roerink G M,Menent W.Verhoef.Reconstructing cloudfree NDVI composites using Fourier analysis of time series[J].International Journal of Remote Sensing,2000,21(9):1911-1917.

[20] 王丹,姜小光,唐伶俐,等.利用时间序列傅立叶分析重构无云 NDVI图像[J].国土资源遥感,2005(2):29-32.

[21] 张树誉,王钊,李星敏.提高卫星遥感资料利用率的方法[J].测绘学院学报,2004,21(1):30-33.

[22] 刘咏梅,杨勤科,温仲明.地形复杂地区遥感图像分类方法应用研究:以黄土丘陵沟壑地区坡耕地遥感调查为例[J].水土保持通报,2003,23(4):30-32.

[23] Kumar U N,Kerle T V.Ramachandra.Constrained Linear Spectral Unmixing Technique for Regional Land Cover Mapping Using MODIS Data[J].Innovations and Advanced Techniques in Systems,Computing Sciences and Software Engineering,2008:416-423,DOI:10.1007/978-1-4020-8735-6_78.

猜你喜欢
植被指数决策树耕地
自然资源部:加强黑土耕地保护
我国将加快制定耕地保护法
保护耕地
新增200亿元列入耕地地力保护补贴支出
一种针对不均衡数据集的SVM决策树算法
基于植被指数选择算法和决策树的生态系统识别
AMSR_2微波植被指数在黄河流域的适用性对比与分析
决策树和随机森林方法在管理决策中的应用
河南省冬小麦产量遥感监测精度比较研究
基于决策树的出租车乘客出行目的识别