于文婧,刘晓娜,孙丹峰※,姜宛贝,曲 葳(.中国农业大学资源与环境管理学院,北京 0093; .北京市农林科学院农业综合发展研究所,北京 00097)
基于HJ-CCD数据和决策树法的干旱半干旱灌区土地利用分类
于文婧1,刘晓娜2,孙丹峰1※,姜宛贝1,曲葳1
(1.中国农业大学资源与环境管理学院,北京 100193;2.北京市农林科学院农业综合发展研究所,北京 100097)
摘要:为了实现干旱半干旱灌区地表信息低成本、高效率的动态监测,利用HJ-CCD数据的多时相和多光谱信息,探讨了平罗县土地利用遥感分类方法。首先建立研究区内典型地物的NDVI时间序列曲线,提取反映该区物候模式的时序特征参数;然后对土壤信息丰富的3月份多光谱影像进行主成分变换,选取第1主成分(PC1)作为光谱特征参数,最后基于分类回归树(classification and regression tree,CART)算法进行决策树监督分类。总体分类精度达到92.26%,Kappa系数为0.91,比最大似然法分类结果精度提高了2.58%。研究表明:构建的NDVI时间序列曲线对研究区内的地类具有较强的代表性,提取的时间维和光谱维的分类参数对各地类均有很好地区分性,CART决策树算法分类结果清晰准确且精度较高。该方法为HJ小卫星在干旱半干旱区等区域的深入应用提供科学依据和实证基础。
关键词:土地利用;决策树;分类;HJ-CCD;归一化植被指数(NDVI);时间序列;干旱半干旱灌区
于文婧,刘晓娜,孙丹峰,姜宛贝,曲葳. 基于HJ-CCD数据和决策树法的干旱半干旱灌区土地利用分类[J]. 农业工程学报,2016,32(2):212-219.doi:10.11975/j.issn.1002-6819.2016.02.031http://www.tcsae.org
Yu Wenjing, Liu Xiaona, Sun Danfeng, Jiang Wanbei, Qu Wei. Land use classification in arid and semi-arid irrigated area based on HJ-CCD data and decision tree method[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2016, 32(2): 212-219. (in Chinese with English abstract)doi:10.11975/j.issn.1002-6819.2016.02.031 http://www.tcsae.org
Email:yuwenjing1215@163.com
土地利用/覆被信息是研究全球及区域变化的前提和基础,遥感技术具有宏观、时效、综合、连续等特点,成为获取土地信息变化的重要手段。多数研究利用MODIS的植被指数时间序列和光谱信息进行大范围的土地利用分类[1-7],但是MODIS数据的空间分辨率较低,增加了选取样本工作的复杂程度[8],大量混合像元的存在也限制了其在区域和高分辨尺度上的应用[9]。TM和SPOT等中高分辨率数据受到重访周期和经济成本等条件的限制,难以构建完整的时间序列植被指数曲线[10],因此以中高分辨率数据辅助MODIS数据进行多源遥感影像的土地利用分类的方法得到了一定的发展[11-14]。我国的HJ1-A卫星和HJ1-B卫星均搭载了2台组合幅宽达到720 km的宽覆盖多光谱CCD相机,其空间分辨率为30 m,4个谱段的设置与TM传感器基本一致,A、B双星同轨道面形成2 d重访的高时间分辨率,可实现多时相、大范围的区域遥感监测,已成为国内具有广阔应用前景的中高时空分辨率数据之一。国内已有的基于环境小卫星数据进行土地利用分类与验证的相关研究中,大多数没有利用HJ-CCD数据的时间分辨率优势,只将其空间和光谱特征与MODIS时间序列相结合,部分基于HJ-CCD多时相数据的研究也没有综合考虑植被生长周期而构建合理的时间序列,并提取有意义的时间特征参数[15-20]。因此如何将环境小卫星作为主要数据源,充分利用其时间、空间和光谱维信息,采用有效的方法进行土地利用分类需要更深入的研究,尤其是在农业景观与自然景观相对复杂多样的干旱半干旱灌区。平罗县是宁夏干旱区北部的农业大县和中国重要的商品粮基地县,长期大量引用黄河水的农业灌溉方式导致土壤次生盐渍化较严重,该区的自然景观和土地利用方式也较为复杂。
决策树归纳法是数据挖掘中获取分类规则的主要方法之一。分类回归树(classification and regression tree,CART)是一种结构清晰、实现简单、运行快速和准确性高的决策树构建算法。国内外许多学者基于不同数据源的特征参数探讨了CART决策树算法在区域土地利用分类中的优势[21-25],证明其适合不同尺度、类型的分类特征融合。
本文以平罗县为研究区,获取2010年3月-11月共12景HJ-CCD影像,通过构建NDVI时间序列,提取反映该区自然植被和作物等物候特征的时序特征参数,并结合多光谱信息,进行CART决策树分类研究。旨在为环境小卫星数据今后在干旱半干旱区范围内的土地利用和生态环境质量监测等方面的深入应用提供方法和实证基础。
平罗县是石嘴山市唯一的建制县,地处银北平原中心,东临黄河,西靠贺兰山,位于105°58′~106°58′E,38°36′~39°51′N,地势西南高东北低,自西向东分别为贺兰山区、洪积扇区、碟形洼地、冲积平原、灵盐台地和河滩区。西部山区陡峭,植被稀疏,海拔在1 250~3 400 m;中部沟渠纵横,湖泊繁多;东部黄河以东有部分冲积平原和沙漠,土壤主要以灌淤土、盐土、碱土为主。该区属于温带大陆性干旱气候,春旱多风,夏热多雨,秋季短暂,冬季干冷,年平均温度8.8℃,年平均降水量173 mm,降水主要集中在7-9月,年平均蒸发量1 755 mm,蒸发量最多的是5月份。该县的粮食作物种植面积占农作物面积的80%左右,主要粮食作物为小麦、水稻和玉米,主要的种植模式是一年一熟,也有小麦套玉米等具有一定特点的套种模式。图1为平罗县2009年1:100 000土地利用现状图(无山区和沙地),由宁夏农林科学院农业科技信息研究所提供。
图1 平罗县土地利用现状图Fig.1 Land use map of Pingluo county
2.1HJ小卫星CCD数据及预处理
遥感影像为2010年HJ-1A/1B CCD 数据2级产品,通过中国资源卫星应用中心查询并免费下载。研究区范围内的植被生长期主要集中在3月-11月,因此本文主要下载该时期内包含研究区的成像清晰、无云覆盖的影像。由于植被的最短生长周期至少为3周,所以影像的时间间隔均为20 d左右,共12景(表1)。
表1 HJ-CCD影像数据列表Table 1 HJ-CCD images data list
本文将所有影像裁剪为包含研究区的矩形区域,以1:100 000地形图为基准,采用二次多项式变换和双线性内插方法对5月10日的影像做几何精校正,在ENVI/IDL软件平台中通过编写程序对其他时相的影像进行自动几何配准,RMS控制在0.5个像元以内;通过元数据文件中的定标系数和公式对数据进行辐射定标,利用ENVI4.8软件中的FLAASH大气校正模块进行大气校正,基本参数从原始影像头文件中获取,波谱响应函数从资源卫星应用中心下载;最后利用DEM数据将西部山区掩膜。
2.2NDVI的计算与时间序列的生成
根据NDVI的计算公式
式中ρNIR为近红外波段反射率;ρR为红光波段反射率。在ENVI软件中利用band math功能计算12景影像的NDVI值,并进行波段叠加,得到研究区的NDVI时间序列数据集。
本文通过分析研究区典型地类的NDVI时间序列曲线,提取能够反映地类间差异的物候参数,结合包含丰富土壤信息的光谱参数,利用基于CART的决策树法进行土地利用分类,最后比较并分析该方法与传统的监督分类最大似然法(MLC,maximum likelihood classification)的精度和优势,研究流程见图2。
3.1分类体系和样本的选取
本文根据研究区的自然环境和土地利用特点,综合考虑土地利用图的分类体系和遥感数据的分辨率,对研究区建立一级和二级结合的分类体系,将土地利用类型分为水浇地、水田、沙地、盐碱地、林地、建设用地和水域,水浇地根据作物熟制又分为一年一熟和一年两熟(表2)。
图2 技术流程图Fig.2 Technology flow cart
表2 土地利用分类体系Table 2 Classification system of land use
样本的选择对分类信息的获取和分类规则的建立起关键作用,为确保样本的准确性,综合以下方法均匀选取一定数量的样本:1)分析历史土地利用图,确定各地类样本的分布及比例;2)目视解译HJ-1/CCD影像和Google Earth高分辨率影像,进一步确认样本类型和区域;3)检验HJ小卫星NDVI时间序列曲线,对目视解译仍无法确认的样本,通过地表的动态变化信息判定其最终的类别。样本的采集遵循代表性和完备性的基本原则,样本单元个数约占像元总数的2%,最后将样本随机分为2部分,比例为3:1,分别作为训练样本和验证样本。
各地类的典型NDVI时间序列曲线(图3)表明,水域的NDVI值在0附近有较大波动,其他地类各时相的NDVI值均大于0;耕地的NDVI曲线在生长季有明显的1或2个波峰,林地的生长季较长且NDVI曲线波峰幅度较小,各植被的生长周期、NDVI最大值、最小值和变化速率各不相同;除水域外,未利用地和建设用地等非植被的NDVI曲线都较平稳,沙地的NDVI均值和变化最小,盐碱地和建设用地的曲线较相似。基于Jeffries-Matusita距离和转换分离度(transformed divergence)计算所选样本的可分离度,一般认为样本之间的最小距离大于1.8表示其可分离性好。各地类样本在NDVI时间序列上的J-M距离除建设用地和盐碱地只有1.44,其他均大于1.8,说明利用NDVI时间序列可以很好地区分大部分地类,但是其对于建设用地和盐碱地的区分还有一定的难度。
图3 各地类样本的NDVI时间序列曲线Fig.3 NDVI time series curve of each land type
3.2时间序列特征参数提取
1)NDVI最大值(NDVImax):植被与非植被的NDVI最大值差别较大,植被均大于0.5,非植被均小于0.3。
2)NDVI最小值(NDVImin):水域的NDVI最小值小于0,其他地类均大于0。
3)NDVI极差值(NDVIrange):非植被的NDVI曲线无明显波峰,极差值相比植被较小,沙地几乎无植被覆盖,极差值最小。
4)7月29日(第7时相)与5月10日(第3时相)的NDVI差值(NDVI7-3):5月10日,研究区的水稻秧田为水体和稻种的混合,水稻大田为翻耕后的裸土,两者的NDVI值都接近于0,水田的生长速率最快,NDVI值在7月29日达到峰值,利用该参数可以将水田与其他地类区分开。林地与一年一熟制水浇地的NDVI值在第3时相均达到0.2以上,且两者增长速率较慢,该参数值较小;一年两熟制水浇地的NDVI曲线在第7时相为2个生长周期之间的波谷,该参数值为负值。
5)10月4日(第10时相)与7月29日(第7时相)的NDVI差值(NDVI10-7):一年两熟制水浇地的NDVI值在第7~第10时相从波谷到达第2个峰值,该参数值为正;其他作物在该时段处于成熟期至收获期,NDVI曲线呈将下降趋势,该参数值为负;林地一直处于生长旺盛期,NDVI值变化不大,该参数值接近于0。
6)10月4日~11月8日(第10~12时相)的NDVI均值(NDVI10~12mean):林地由于生长周期长,NDVI曲线下降缓慢,该参数值最大;一年两熟制水浇地在该时期处于第2个生长周期,与收获期已结束的其他作物相比,该参数值较大。
3.3多光谱特征参数提取
NDVI主要反映地是植被信息,对非植被和低植被覆盖区的区分性不强,虽然建设用地和盐碱地的NDVI特征参数都很相似,它们的土壤信息却有很大差异,如盐碱地在可见光近红外波段的光谱反射率比建设用地高。在3月份,研究区地表几乎无植被覆盖,且正值返盐高峰期,土壤信息较丰富,所以对3月份的多光谱影像进行主成分变换,实现数据压缩和信息增强,变换后第1主成分PC1的贡献率达到95.07%,说明其包含了绝大部分的地表信息。计算NDVI时间序列和PC1波段组合后各类样本的J-M距离,建设用地和盐碱地的可分离度达到1.73,其他地类之间的分离度也有不同程度的提高,说明多光谱特征参数PC1对地类的区分有重要作用,所以将其作为一个波段参与分类。
3.4CART决策树分类
CART是由Breiman于1984年提出的一种决策树算法,此后又得到了不断地改进。该算法的基本原理是通过对由测试变量和目标变量构成的训练数据集的循环二分形成二叉树形式的决策树结构。CART决策树在生长过程中,采用经济学中的基尼(Gini)系数作为选择最佳测试变量和分割阈值的准则,并采用交叉验证的方法进行树的修剪,最终生成一棵兼顾复杂度和错误率的最优二叉树[26-27]。基尼系数的数学定义如下
式中p(j/h)为从训练样本集中随机抽取一个样本,当某一测试变量值为h时属于第j类的概率;nj(h)为训练样本中该测试变量值为h时属于第j类的样本个数;j为类别个数。本文以训练样本作为目标变量,用时序参数和PC1作为测试变量进行学习,得到的决策树共102个叶节点,该决策树可以表示为“If-Then”形式的产生式规则(表3)。
表3 CART决策树分类规则Table 3 CART decision tree classification rules
4.1分类结果
最终的分类结果如图4所示(无山区)。研究区内的主要耕地类型为一年一熟制水浇地,集中分布在北部和中部;一年两熟制水浇地数量较少,主要分散在研究区北部和南部;建设用地主要为农村居民点和西北部的城区、工矿用地;水域以黄河、湖泊和养殖水面为主;盐碱地和沙地主要分布在研究区东部、北部以及水域周围;水田主要分布在研究区西部和南部,黄河沿岸的部分水田对应土地利用图中的不稳定耕地和盐碱地,说明该区域的耕地土壤盐渍化程度较高;林地主要分布在黄河西侧,与土地利用图中的盐碱地相对应,说明平罗县为治理盐碱地已开展了植树造林的生态措施。从整体上看,分类结果图与土地利用图中相应地类的分布区域和范围基本一致,说明利用该方法对研究区进行土地利用分类效果较好。
图4 平罗县土地利用分类图Fig.4 Land use classification map of Pingluo county
4.2分类精度检验
利用验证样本建立混淆矩阵,对分类结果进行精度验证(表4),总体分类精度达到92.26%,Kappa系数为0.91,水田的分类精度最高,达到98.23%,沙地、一年一熟制水浇地和水体的分类精度均在90%以上,一年两熟制水浇地、林地、盐碱地和建设用地的精度均大于80%。
混淆矩阵表明,林地被错分为耕地的情况比较明显,这是由于林地主要种植在黄河沿岸土壤盐渍化程度严重的区域,多数为灌木林和疏林地,受土壤、气候等自然条件及种植密度的影响,生长季后期NDVI值较小,易与收割后的耕地相混淆;盐碱地与建设用地的混分现象也较严重,由于两者的NDVI时间序列曲线相似,且盐碱地多分布在城市和工矿用地的附近,部分与农村居民点相互交错,形成大量混合像元,导致两者之间容易被错分。部分耕地由于土壤质量和灌溉条件等原因,也存在与其他地类的混分现象。
土地利用类型Land use types林地Forest land水田Paddy沙地Sand盐碱地Saline-alkali soil水域Water一年两熟制水浇地Double crops irrigated land建设用地Construction land一年一熟制水浇地One crop irrigated land样本Samples精度Accuracy/%林地 609 0 0 3 0 16 4 77 709 85.90水田 0 3500 0 0 0 0 2 61 3563 98.23沙地 0 0 1491 49 0 0 0 0 1540 96.82盐碱地 0 0 53 1376 0 0 232 11 1672 82.30水体 0 0 0 91 1390 0 0 0 1481 93.86一年两熟制水浇地 10 0 0 0 0 383 15 32 440 87.05建设用地 0 0 0 237 1 0 1011 4 1253 80.69一年一熟制水浇地 3 72 0 42 0 23 79 3552 3771 94.19
4.3与其他方法的比较
相比仅利用NDVI时间序列参数,加入PC1波段后的分类精度有显著提高,总体分类精度提高6.05%,建设用地和盐碱地的精度分别提高26.34%和12.14%。CART方法相比最大似然法(MLC),总体分类精度提高2.58%(表5)。最大似然法分类结果中的建设用地和水域均有一定程度的“扩张”现象,CART方法的分类结果比最大似然法更精确,有效改善了最大似然法中的错分现象,两种方法的局部对比如图5。
表5 不同波段/方法分类精度比较Table 5 Classification accuracy comparison of different bands/method %
图5 CART决策树法与最大似然法分类结果局部对比Fig.5 Local contrast of CART and MLC classification results
本研究综合利用HJ-CCD数据多时相和多光谱信息,利用决策树方法,实现了对平罗县快速、有效、经济的区域土地利用遥感分类,主要结论如下:
1)构建的NDVI时间序列能够准确表达地表动态信息,通过横向、纵向分析不同类型NDVI时序曲线的差异,提取反映区域物候信息的时间维特征参数,对研究区地类具有很强的分异性。
2)研究区土壤盐渍化程度严重,地表组成复杂交错,3月份多光谱影像的第1主成分PC1包含丰富的土壤信息,引入该光谱维特征参数可以改善仅利用NDVI对低植被覆盖区分类的不足。
3)CART算法能够快速、有效地获取特征参数的分类规则,生成树的结构合理清晰。决策树方法比最大似然法的分类精度更高,结果表达更准确。
HJ-CCD数据的处理、典型地类NDVI时间序列曲线的建立、时间维及光谱维分类参数的提取与CART方法的利用,都具有良好的适用性及稳定性,可为HJ小卫星数据在区域地表信息提取中的应用提供一定的基础与参考。本研究还存在一些不足之处,有待在今后的工作中加以完善。首先,NDVI易受土壤背景噪声干扰,而增强型植被指数EVI能同时校正土壤和大气影响,对植被的分辨能力更强,所以本研究将进一步探讨2种植被指数的综合应用。其次,研究区地类复杂交错,易形成混合像元,对分类结果的精度造成一定影响,所以利用光谱混合模型对混合像元进行分解将成为本文今后研究的重点。
[参考文献]
[1] 刘勇洪,牛铮,徐永明,等. 基于MODIS数据设计的中国土地覆盖分类系统与应用研究[J]. 农业工程学报,2006,22(5):99-104. Liu Yonghong, Niu Zheng, Xu Yongming, et al. Design of land cover classification system for China and its application based on MODIS data[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2006, 22(5): 99-104. (in Chinese with English abstract)
[2] Brian D Wardlow, Stephen L Egbert, Jude H Kastens. Analysis of time-series MODIS 250m vegetation index data for crop classification in the U.S. Central Great Plains[J]. Remote Sensing of Environment, 2007, 108(3): 290-310.
[3] 孙艳玲,杨小唤,王新生,等. 基于决策树和MODIS数据的土地利用分类[J]. 资源科学,2007,29(5):169-174. Sun Yanling, Yang Xiaohuan, Wang Xinsheng, et al. Landuse classification based on decision tree using MODIS data[J]. Resources Science, 2007, 29(5): 169-174. (in Chinese with English abstract)
[4] 马俊飞,吕昌河,王茜. 基于MODIS NDVI时序数列的柴达木盆地土地覆盖分类研究[J]. 干旱区地理,2008,31(3):442-448. Ma Junfei, Lü Changhe, Wang Qian. Land-cover classification of the Qaidam Basin based on MODIS NDVI time series data[J]. Arid Land Geography, 2008, 31(3): 442-448. (in Chinese with English abstract)
[5] 郑长春,王秀珍,黄敬峰. 多时相MODIS影像的浙江省水稻种植面积信息提取方法研究[J]. 浙江大学学报:农业与生命科学版,2009,35(1):98-104. Zheng Changchun, Wang Xiuzhen, Huang Jingfeng. Mapping paddy rice planting area in Zhejiang Province using multi-temporal MODIS images[J]. Journal of Zhejiang University: Agric & Life Sci, 2009, 35(1): 98-104. (in Chinese with English abstract)
[6] 刘庆凤,刘吉平,宋开山. 基于MODIS/NDVI时序数据的土地覆盖分类[J]. 中国科学院研究生院学报,2010,27(2):163-169. Liu Qingfeng, Liu Jiping, Song Kaishan. Land cover classification based on MODIS/NDVI times series data[J]. Journal of the Graduate School of the Chinese Academy of Sciences, 2010, 27(2): 163-169. (in Chinese with English abstract)
[7] 王志慧,李世明,刘良云,等. 基于MODIS NDVI时间序列的土地覆盖分层分类方法研究[J]. 遥感技术与应用,2013,28(5):910-919. Wang Zhihui, Li Shiming, Liu Liangyun, et al. Hierarchical land cover classification based on MODIS NDVI time-series[J]. Remote Sensing Technology and Application,2013, 28(5): 910-919. (in Chinese with English abstract)
[8] 陈思宁,赵艳霞,申双和. 基于波谱分析技术的遥感作物分类方法[J]. 农业工程学报,2012,28(5):154-160. Chen Sining, Zhao Yanxia, Shen Shuanghe. Crop classification by remote sensing based on spectral analysis[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2012, 28(5): 154-160. (in Chinese with English abstract)
[9] 刘睿,冯敏,孙九林,等. 基于环境减灾卫星CCD数据与决策树技术的植被分类研究[J]. 地理科学,2012,32(12):1488-1495. Liu Rui, Feng Min, Sun Jiulin, et al. The vegetation classification based on HJ-CCD data and decision tree[J]. Scientia Geographica Sinica, 2012, 32(12): 1488-1495. (in Chinese with English abstract)
[10] 郝鹏宇,牛铮,王力,等. 基于历史时序植被指数库的多源数据作物面积自动提取方法[J]. 农业工程学报,2012,28(23):123-131. Hao Pengyu, Niu Zheng, Wang Li, et al. Multi-source automatic crop pattern mapping based on historical vegetation index profiles[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2012, 28(23): 123-131. (in Chinese with English abstract)
[11] 王莉雯,牛铮,卫亚星. 基于MODIS NDVI的新疆土地覆盖类型划分与潜在荒漠化区域探测[J]. 干旱区地理,2007,30(4):573-578. Wang Liwen, Niu Zheng, Wei Yaxing. Land cover type classification and potential desertification area detecting in Xinjiang based on MODIS NDVI imagery[J]. Arid Land Geography, 2007, 30(4): 573-578. (in Chinese with English abstract)
[12] 郝卫平,梅旭荣,蔡学良,等. 基于多时相遥感影像的东北三省作物分布信息提取[J]. 农业工程学报,2011,27(1):201-207. Hao Weiping, Mei Xurong, Cai Xueliang, et al. Crop planting extraction based on multi-temporal remote sensing data in Northeast China [J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2011, 27(1): 201-207. (in Chinese with English abstract)
[13] 潘耀忠,李乐,张锦水,等. 基于典型物候特征的MODIS-EVI时间序列数据农作物种植面积提取方法:小区域冬小麦实验研究[J]. 遥感学报,2011,15(3):578-594. Pan Yaozhong, Li Le, Zhang Jinshui, et al. Crop area estimation based on MODIS-EVI time series according todistinct characteristics of key phenology phases: A case study of winter wheat area estimation in small-scale area. Journal of Remote Sensing, 2011, 15(3): 578-594. (in Chinese with English abstract)
[14] 许青云,杨贵军,龙慧灵,等. 基于MODIS NDVI多年时序数据的农作物种植识别[J]. 农业工程学报,2014,30(11):134-144. Xu Qingyun, Yang Guijun, Long Huiling, et al. Crop information identification based on MODIS NDVI time-series data[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2014,30(11): 134-144. (in Chinese with English abstract)
[15] 邬明权,王长耀,牛铮. 利用多源时序遥感数据提取大范围水稻种植面积[J]. 农业工程学报,2010,26(7):240-244. Wu Mingquan, Wang Changyao, Niu Zheng. Mapping paddy fields inlarge areas, based on time series multi-sensors data[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2010, 26(7): 240-244. (in Chinese with English abstract)
[16] 王琳,景元书,杨沈斌. 基于多时相遥感数据提取水稻种植面积的研究[J]. 中国农业资源与区划,2013,34(2):20-25. Wang Lin, Jing Yuanshu, Yang Shenbin. Study on extraction of rice cropping area using multi-temporal remote sensing data[J]. Chinese Journal of Agricultural Resources and Regional Planning, 2013, 34(2): 20-25. (in Chinese with English abstract)
[17] 贾明明,宗明,张柏,等. 综合环境卫星与MODIS数据的面向对象土地覆盖分类方法[J]. 武汉大学学报•信息科学版,2014,39(3):305-310. Jia Mingming, Zong Ming, Zhang Bai, et al. Land cover classification of compositing HJ-1 and MODIS data base on object-based method[J]. Geomatics and Information Science of Wuhan University, 2014, 39(3): 305-310. (in Chinese with English abstract)
[18] 杜娟,杨国范,翟光耀. 基于环境小卫星的半干旱区土地利用信息提取[J]. 国土资源科技管理,2014,31(4):61-67. Du Juan, Yang Guofan, Zhai Guangyao. Land use information extraction of semi-arid region based on HJ satellites[J]. Scientific and Technological Management of Land and Resources, 2014, 31(4): 61-67. (in Chinese with English abstract)
[19] 仲波,马鹏,聂爱华,等. 基于时间序列HJ-1/CCD数据的土地覆盖分类方法[J]. 中国科学:地球科学,2014,44(5):967-977. Zhong Bo, Ma Peng, Nie Aihua, et al. Land cover mapping using time series HJ-1/CCD data[J]. Science China: Earth Sciences, 2014, 44(5): 967-977. (in Chinese with English abstract)
[20] 李鑫川,徐新刚,王纪华,等. 基于时间序列环境卫星影像的作物分类识别[J]. 农业工程学报,2013,29(2):169-176. Li Xinchuan, Xu Xingang, Wang Jihua, et al. Crop classification recognition based on time-series images from HJ satellite[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2013,29(2): 169-176. (in Chinese with English abstract)
[21] 赵萍,傅云飞,郑刘根,等. 基于分类回归树分析的遥感影像土地利用/覆被分类研究[J]. 遥感学报,2005,9(6):708-716. Zhao Ping, Fu Yunfei, Zheng Liugen, et al. Cart-based land use /cover classification of remote sensing images[J]. Journal of Remote Sensing, 2005, 9(6): 708-716. (in Chinese with English abstract)
[22] 王大鹏,王周龙,李德一,等. 综合非光谱信息的荒漠化土地CART分类[J]. 遥感学报,2007,11(4):487-492. Wang Dapeng, Wang Zhoulong, Li Deyi, et al. The extraction of desertification information using CART under Knowledge Guide[J]. Journal of Remote Sensing, 2007,11(4): 487-492. (in Chinese with English abstract)
[23] 刘建光,李红,孙丹峰,等. MODIS土地利用/覆被多时相多光谱决策树分类[J]. 农业工程学报,2010,26(10):312-318. Liu Jianguang, Li Hong, Sun Danfeng, et al. Land use/cover decision tree classification fusing multi-temporal and multi-spectral of MODIS[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2010, 26(10): 312-318. (in Chinese with English abstract)
[24] 齐乐,岳彩荣. 基于CART决策树方法的遥感影像分类[J].林业调查规划,2011,36(2):62-66. Qi Le, Yue Cairong. Remote sensing image classification based on CART decision tree method[J]. Forest Inventory and Planning, 2011, 36(2): 62-66. (in Chinese with English abstract)
[25] 左玉珊,王卫,郝彦莉,等. 基于MODIS影像的土地覆被分类研究:以京津冀地区为例[J]. 地理科学进展,2014,33(11):1556-1565. Zuo Yushan, Wang Wei, Hao Yanli, et al. Land cover classification based on MODIS images: Taking the Beijing-Tianjin-Hebei region as an example[J]. Progress in Geography, 2014, 33(11): 1556-1565. (in Chinese with English abstract)
[26] Breiman L, Friedman J H, Olshen R A, et al. Classification and Regression Trees[M]. California: Wadsworth International Group, 1984: 1-358.
[27] Yohannes Y, Hoddinott J. Classification and Regression Trees: An Introduction[M]. Washington D C: International Food Policy Research Institute, 1999.
Land use classification in arid and semi-arid irrigated area based on HJ-CCD data and decision tree method
Yu Wenjing1, Liu Xiaona2, Sun Danfeng1※, Jiang Wanbei1, Qu Wei1
(1. College of Resources ɑnd Environmentɑl Sciences, Chinɑ Agriculturɑl University, Beijing 100193, Chinɑ;
2. Institute of System Comprehensive Development, Beijing Acɑdemy of Agriculture ɑnd Forest Sciences, Beijing 100097, Chinɑ)
Abstract:HJ satellites with the characteristics of high temporal resolution, high spatial resolution and large coverage, can provide the regional land use/cover classification with high accuracy. Pingluo county is in the arid and semi-arid area of northwest China, the climate and human irrigation activities caused complicated land use/cover type and serious soil salinization in the study area. In order to achieve the dynamic monitoring of land surface information with low cost and high precision, a regional land use supervised classification based on the classification and regression tree (CART) algorithm was developed and discussed in Pingluo county using the multi-temporal and multi-spectral information of HJ satellite CCD data. Firstly, high quality HJ-1 CCD data (the interval was about 20 d) were selected, and preprocessed including geometric correction, radiometric calibration and atmospheric correction. The normalized difference vegetation index (NDVI) were calculated and overlapped together. Secondly, the land use types including double crops irrigated land, one crop irrigated land,paddy, sand, saline-alkali soil, forest land, construction land and water were adopted for the two-level classification system,and the training samples were selected to obtain the typical NDVI time-series curve of each land type. Then, the characteristic parameters (including maximum, minimum, range, the difference between the value of the July 29 and the May 10 phases, the difference between the value of the October 10 and the July 29 phases, the mean value of the October 4 to the November 8 phases) which could reflect the phonological pattern in the area were extracted through the analysis of the NDVI time-series curves. Thirdly, the principle component transform of a multi-spectral image in March with ample soil information was performed for improving the separation between the construction land and saline-alkali land when the first principal component (PC1) was chosen for a parameter band for classification. Finally, a CART decision tree classification was implemented by combining the multi-temporal and multi-spectral parameter bands in the area. The decision tree had a total of 102 leaf nodes and could be expressed as “If…Then…” forms. The results showed that the overall precision of this classification method was 92.26%. The Kappa coefficient was 0.91. The accuracy of the paddy field was the highest which reached 98.23%. The accuracies of sand, one crop irrigated land and water were all greater than 90%. Double crops irrigated land, forest land, saline-alkali land, construction land were all greater than 80%. The participation of PC1 had made great contributions in improving the classification accuracy, especially for construction land and saline-alkali land, their accuracy increased 26.34% and 12.14%, respectively. The overall accuracy of CART decision tree classification was increased 2.58% than maximum likelihood classification. The classification accuracy of vegetation improved the most. The results of CART decision tree classification were more accurate and meticulous than maximum likelihood classification (MLC), and it effectively correct the obvious wrong classification results in MLC. The study indicated that the established typical NDVI time series curves based on HJ-CCD data had strong representativeness for each land use type in this region. The extracted time and spectrum dimensional parameters could distinguish between most of the land categories well. The results of CART decision tree classification were more clear and accurate than MLC. The proposed methods in this study had certain feasibility and applicability, and could provide empirical basis for the further application of HJ-1 CCD data in land use/cover and environment monitoring in different scale area, and also give informational and technical supports for the multilevel and comprehensive land resources and environment management by using HJ satellite as the main data source.
Keywords:land use; decision trees; classification; HJ-CCD; NDVI; time series; arid and semi-arid irrigated area
通信作者:※孙丹峰,男,山东海阳人,博士,教授,主要从事资源环境信息技术与土地利用/覆被研究。北京中国农业大学资源与环境学院,100193。Email:sundf@cau.edu.cn
作者简介:于文婧,女,内蒙古呼伦贝尔人,博士生,主要从事土地利用/覆被遥感应用研究。北京中国农业大学资源与环境学院,100193。
基金项目:国家自然科学基金资助面上项目(40871103,41071146)
收稿日期:2015-06-02
修订日期:2015-11-10
中图分类号:TP79;S127
文献标志码:A
文章编号:1002-6819(2016)-02-0212-08
doi:10.11975/j.issn.1002-6819.2016.02.031