张凤太, 赵卫权
(1.贵州师范学院 地理与旅游学院,贵阳 5500032; 2.贵州科学院 山地资源研究所, 贵阳 550018)
多元信息支持的岩溶区土地利用信息提取方法构建
张凤太1, 赵卫权2
(1.贵州师范学院 地理与旅游学院,贵阳 5500032; 2.贵州科学院 山地资源研究所, 贵阳 550018)
土地利用信息是重要的基础数据,其准确程度将对其后续应用工作的结果产生重要影响。岩溶区地形复杂、地表覆盖类型多样,使用目视解译和传统监督分类的方法都存在一定的局限。通过结合遥感影像和植被指数、湿度指数、地形等多元信息,结合主成分分析方法,利用决策树实现上述多元信息建模,进而以实地调查样点为目标函数获取决策树的分类决策参数阈值,从而构建了多元信息支持的岩溶区土地利用信息提取方法。经试验区的模型应用和样点验证表明,该方法获取的土地利用信息基本符合典型岩溶区土地利用比例和分布特征,总体分类精度达到82%。该方法能够加深对多维遥感信息的认识,充分挖掘出其中隐含的信息,并根据这些信息提高岩溶区土地利用信息提取的精度,尤其能体现出岩溶区地貌特征对土地利用空间分布的影响。
遥感; 土地利用; 多元信息; 岩溶区
随着遥感技术和地学分析模型的深入发展,利用遥感和GIS技术对区域的土地利用或地表覆盖信息进行提取及动态监测,成为最迅速可靠和理想有效的手段之一[1]。目前岩溶区土地利用信息提取的方法仍以人工目视解译、人机交互解译等传统方法为主[2-3]。岩溶区往往海拔高且相对高差大、地形复杂、地表覆盖类型多样,在土地利用信息提取中,传统的单纯基于遥感影像光谱特征的方法就显得有所不足。此外,岩溶区地形复杂和地表景观多样性的特性,使得影响遥感影像分类精度的混合像元、光谱特征变异问题变得更加突出,导致喀斯特地区土地利用信息提取的不确定性增加[4]。随着遥感技术的发展,利用高空间分辨率的遥感影像虽然能一定程度上改善上述问题,提高土地利用信息提取精度,但是目前基于高空间分辨率遥感影像的岩溶区土地利用信息提取仍然以人工目视解译为主[5-6],此方法耗时耗力,且不同人员的解译结果没有可比性,时间上也没有连续性。因此如何在保证一定精度前提下,快速有效地获取岩溶区土地利用信息,便成为一个重要的问题。
由于利用多元信息耦合对土地利用信息进行提取,可以融合遥感影像以外的多种知识,且不需要先验统计假设条件,因而在遥感信息提取和影像分类中有着广泛的应用[7-8]。多元信息耦合的方法通过多元信息复合,可以充分地发掘与利用遥感影像及其它信息要素中隐含的丰富知识,能一定程度上提高土地利用信息提取的精度[9]。该方法一定程度上改善了基于光谱特征等单一信息提取土地利用或地表覆盖信息容易造成的常见问题,如同物异谱、同谱异物、错分、漏分等。该方法目前已被广泛用于土地利用或土地覆盖信息提取中,取得了较好的效果[10-12]。此外还被用于植被分类、草地分类、湿地分类其它领域,其效果得到了广泛认可[13-15]。
岩溶区地表景观复杂多样,遥感影像往往存在同谱异物和同物异谱的问题,因此在岩溶区很难仅凭图像光谱特征获得土地利用信息。土地利用格局是在多种自然和社会经济因素的共同作用下形成的,并与这些因素的分布格局、组成状况、丰缺程度等存在一定的关系,岩溶区地貌特征、土壤类型、气候条件、经济水平等因素都对区域土地利用格局产生重要影响。依靠多元信息复合可以更充分的发掘与利用遥感影像数据中隐藏的丰富知识,以提高遥感影像分类的精度[16]。因此,如何应根据岩溶区特点,选择典型主导因素作为岩溶区土地利用信息提取的依据,构建多元信息支持的岩溶区土地利用信息快速提取方法,成为本文的研究问题。
基于上述对岩溶区土地利用格局的认识,要获得更准确的岩溶区土地利用信息,应在遥感影像光谱特征的基础上,结合其它能够表征岩溶区土地利用特点的要素及影响土地利用格局的主导因素等多元信息。本文在遥感和GIS技术支持下,以SPOT遥感影像光谱特征为基础,结合地形、植被覆盖程度等多元信息,构建多元信息支持的岩溶区土地利用信息提取方法。
该方法首先根据岩溶区自然条件和社会经济状况的特点,以相关理论和文献为依据,合理选择岩溶区土地利用信息提取的支持信息要素;其次建立各支持信息要素的波谱响应曲线,依据该曲线的区分度选择各用地类型的决策支持信息要素;第三,构造样区作为目标函数,通过多次调参以获得各支持信息要素的决策规则阈值范围;最后,根据野外采集样点进行精度验证。
1.1 试验区概况
本研究选择覆盖典型岩溶区90 km×90 km范围的SPOT5遥感影像为例,经纬度范围为24.545°—25.042°N,108.612°—109.162°E,获取时间为2012年6月。该范围主要覆盖广西罗城县境内,位于广西北部,河池市东部,云贵高原苗岭山脉九万大山南麓。该区域属亚热带季风气候,气候温和,光照充足,雨量充沛。年平均气温19.8℃,年均降雨量1 400~1 800 mm。该区域地形多样,结构复杂,山岭绵亘,岩溶广布,地貌类型是典型的岩溶峰丛峰林地貌景观,拥有众多的溶洞、漏斗和地下暗河。
1.2 信息要素选取
SPOT5的高分辨率几何仪空间分辨率为10 m,重访时间是3~5 d。数据含多个波段,合成的影像图色、形、纹信息丰富,解译识别标志清晰,地类可解度高。尤其是建设用地与农用地、未利用地间色、形、纹及空间配置结构差异大,标志清晰,易于识别。二级地类间由于地表植被特征、岩土体特征、内部结构特征、地貌特征及其所处区域空间配置特征的差异,其遥感影像的色、形、纹解译识别标志亦清晰[17]。基于SPOT5遥感影像的高分辨率与可获周期短的特性,目前SPOT5遥感影像已被广泛应用于土地利用调查。研究选取SPOT5多光谱的近红外(Ms1)、红色(Ms2)、绿色(Ms3)、短红外(Ms4)4个波段,作为决策支持要素。
遥感影像各波段之间通常存在高度相关的情况,其DN值以及目视效果往往很相似,区分度不大。主成分分析(PCA)就是一种去除波段之间多余信息,将多波段的信息压缩到比原波段更有效的少数几个转换波段的方法。基于主成分分析中的K-L变换方法对SPOT遥感影像的四个波段进行主成分变换。结果表明,前两个主成分的累积方差贡献率达到94%,因此选择前两个主成分PCA1和PCA2作为决策支持要素。
地形因子影响着地表的能量和物质分配[18-19],进而影响区域土地利用的空间分布格局[20]。坡度和坡向影响关键农业要素的分布,高程在一定程度上影响土地的开发利用,因此地形因子深刻影响着土地利用类型的分布[21]。典型岩溶区地形条件复杂,地表起伏大。地表起伏及破碎的地貌特征一定程度上造就了多样化的地表覆盖,岩溶区的地形条件对土地利用格局有重要影响。因此,本研究以DEM数据为基础,采用高程、坡度、地表起伏度作为决策支持要素。
植被本身就是地表覆盖要素之一,不同的植被覆盖度,又能在一定程度上反映出土地利用和地表覆盖类型。遥感影像可以采用不同的空间尺度和较长的时间连续观测,现在已成为研究地表植被覆盖变化状况的重要数据,归一化植被指数(Normal Difference Vegetation Index, NDVI )是用于不同尺度植被动态监测及其对气候因子响应研究的有效手段[22]。因此选取NDVI作为决策支持要素。由于SPOT遥感影像具有较高的空间分辨率,本研究采用Rouse等提出的从SPOT数据反演得到研究区NDVI数据的方法(公式1):
NDVI=(NIR-R)/(NIR+R)
(1)
式中:NIR——近红外通道反射率;R——红色通道的反射率。
其中:-1≤NDVI≤1,负值表示地面覆盖为云、水、雪等,对可见光高反射;0表示有岩石或裸土等,NIR和R近似相等;正值表示有植被覆盖,且随覆盖度增大而增大。
土壤湿度在陆面和大气交互作用中起着重要作用。岩溶区由于土层薄,保水能力差,土壤水分往往就成为植物生长的限制性因子。土壤水分不仅影响自然植被类型的分布和长势,也会影响到人类的土地利用方式,因此将土壤湿度作为决策支持要素。采用归一化湿度指数(NDMI)来表征土壤湿度,该指数根据短波红外波段受水吸收带的影响,对湿度、含水量信息非常敏感,且绿波段对水体发射较高的特点,选用这两个波段经标准化处理构建而成,表达见公式2[23]:
NDMI=(Band1-Band4)/(Band1+Band4)
(2)
综上所述,本部分共选取了SPOT5遥感影像的近红外(Ms1)、红色(Ms2)、绿色(Ms3)、短红外(Ms4)4个波段、PCA1、PCA2、高程、坡度、地表起伏度、NDVI、NDMI共11个决策支持要素。
1.3 样点野外调查
由于本研究在构造分类决策规则时需要用到大量的野外调查样点,同时在结果验证阶段也需要用到野外样点进行验证,因此需要通过野外调查工作获得一定数量的调查样点数据。通过野外调查及GPS定位获得样点,样点的属性包括经纬度及地表覆盖类型,并拍摄地面实况照片,形成遥感影像图的判读样片。样点的土地利用类型包括水域、有林地、灌木、草地、耕地、建设用地、裸地。共获得200个土地利用样点,其中100个用于构造分类决策规则,100个用于后期结果验证。
1.4 信息耦合与决策
不同的决策支持要素对不同土地利用类型的识别程度是不同的,因此采用波谱特征响应的方式来选择用何种要素来识别何种土地利用类型。通过读取100个训练样点上除地形外的八项决策支持要素的平均DN值,构造这八个决策支持要素的波谱特征响应(图1—3)。
图1SPOT影像四个波段波谱特征响应图2两个主成分的波谱特征响应图3NDVI和NDMI的波谱特征响应
根据对波谱特征响应的区分度分析可知,b2和PCA1两项决策支持要素在裸地上的平均DN值与其它用地类型的DN值差别较大,即b2和PCA1两项对裸地的区分度均大,因此可首先依据b2和PCA1将裸地提取出来。用同样的方法,根据对光谱特征响应的分析,可继续得到依据b4和NDVI可将水域提取出来,依据NDVI和PCA2可将建设用地提取出来。
在区分出裸地、水域、建设用地后,继续对光谱特征响应分析后发现,上述八项决策支持要素的DN值对草地、耕地、灌木、林地的区分度均不大。这主要是因为研究区处于亚热带,水热条件较好,草地、耕地、灌木、林地四种地类上普遍植被覆盖条件均较好,均表现出类似的地表覆盖特征,因此难以根据遥感影像进行区分。鉴于地形因素对岩溶区土地利用格局有重要影响,因此进一步引入地形因素辅助提取出草地、耕地、灌木、林地。
研究以野外采样获得的样点为目标函数,采用人工调参的方式,获取土地利用分类判断规则。构造分类规则的原则是,根据波谱特征的区分程度安排决策顺序,先将容易提取、区分度大的地类提取出来,然后再依次提取其它地类。具体做法是,根据文献和相关先验知识设定各决策支持信息要素的分类决策阈值, 多次运行决策树,并在每次运行后将结果与野外样点进行对比,根据对比进度逐步调整决策参数阈值,直到分类精度不能显著提高为止,采用此时的分类决策参数阈值作为该决策树模型的阈值。经过多次运行决策树和调参,获得所有决策参数阈值。
研究采用决策树算法实现上述多元信息的耦合与土地利用分类决策[24-25],通过IDL语言编程实现决策支持信息要素中的波谱均值、指数值组合作为算法中训练样本集合中的属性进行融合,以构造决策树判别函数自动提取研究区的不同时期土地利用信息。
2.1 面积比例与空间分布
土地利用提取的结果共获得7种土地利用类型,其中面积最大的是灌木林地,占研究区总面积的31.7%;其次为草地,占研究区总面积的25%;林地和耕地面积也较大,分别占研究区总面积的22.1%和19.2%;面积较小的是水域和建设用地,分别为0.9%和0.78%;面积最小的是裸地(表1)。灌木林地主要分布在研究区的中部,地貌类型主要为岩溶峰丛洼地;草地与灌木林地或者耕地交错分布,尤其是人类活动扰动较大的地区;林地主要分布在研究区西北部的山区,该区域人类开发活动较少,水土条件适宜,利于植被生长;耕地主要分布在研究区西部大片连续的平缓地带,在县城周边也有分布。综上所述,从各土地利用类型面积比例与空间分布规律来看,本研究的土地利用信息提取结果基本符合典型岩溶区土地利用比例和分布特征。
表1 研究区各土地利用类型面积与比例
2.2 精度分析
将野外实地调查获得的所有样点中的100个样点作为验证样点,经样点验证,总体提取精度达到82%。总体而言,该方法分类精度较好,与传统监督分类相比,既达到同等甚至更高的精度,又较目视解译而言减轻了许多工作量。其中提取精度最高的是林地,精度为91%,林地提取精度较高的主要原因在于,研究区林地的分布较为集中,主要分布于研究区西北部的土石山区,容易从地形因子上进行控制并较为准确地提取出来。容易发生混淆的是灌木和草地,分类精度分别为57%和53%。由于研究区灌木和草地分布特征接近,都主要分布在岩溶峰丛洼地;此外由于岩溶区水热条件适宜,各种禾草长势较好,也难以通过光谱特征区分开来,因此准确提取的难度较大。耕地和草地也较多地存在混淆的情况,分类精度分别为61%和65%。由于研究区种植作物为玉米、水稻等,从外形特征和光谱特征都与岩溶区广泛分布的禾草较为相似,因此容易出现错分,这种错分主要出现在岩溶平原、岩溶洼地周边过渡地带。水域错分的特征是和裸地混淆,导致提取出来的河流不连续,主要由于岩溶区河流普遍较小,河流落差大、滩地多,在河道较窄的地方容易将水域划分成裸地,造成河道不连续。
本研究以决策树分类方法为基础,选取SPOT5遥感影像的近红外(Ms1)、红色(Ms2)、绿色(Ms3)、短红外(Ms4)4个波段、PCA1、PCA2、高程、坡度、地表起伏度、NDVI、NDMI共11个决策支持要素,采用经验判断和目标样点调参的方法,综合确定决策阈值,从而构建了多元信息支持的岩溶区土地利用信息快速提取方法。
与人工目视解译和人机交互解译相比,本方法的优势在于,能够在岩溶区地表破碎,景观斑块数目多、边界形状复杂的情况下,快速提取能满足一定精度要求的土地利用信息。而由于岩溶区普遍存在的地表破碎情况,采用人工目视解译和人机交互解译的办法往往需要耗费巨大的人力,从遥感影像中逐个提取出数量庞杂的斑块,当工作区面积较大,位于岩溶峰丛洼地等地表极端破碎区时,虽然其精度有保证,但是工作量是不可想象的。
与监督分类、非监督分类等单纯基于影像光谱特征的方法相比,本方法通过引入地形要素,一定程度上解决了岩溶区遥感影像解译同物异谱、同谱异物的问题,尤其体现在岩溶峰丛、峰林等地貌单元的阴影部分。监督分类、非监督分类等方法在提取峰丛、峰林等地貌单元的阴影部分土地利用类型时,往往容易将这些部分错分为水体,而本方法通过地形特征的判别,较好地解决了这一问题。
与神经网络等基于训练样点的方法相比,该方法不完全依赖训练样点,而是基于广泛的岩溶区土地利用分布格局先验知识,从而能避免由于样点选取不当造成的结果偏差。神经网络等基于训练样点的方法,需要大量的采样点,在岩溶区复杂地形条件下,往往很难保证获得空间上均匀分布,类型上普遍涉及的样点,由于样点的不合理,会对土地利用信息提取结果造成较大影响。本方法不完全依赖采样点,能减少野外采样的工作量,而且本方法主要基于多元信息和先验知识,能够避免采样点选取不当造成的偏差,丰富的先验知识和决策支持信息使本方法在岩溶区复杂地形条件下更为适用。
本方法的不足之处在于,受先验知识的可靠程度和决策支持要素选取合理性的影响,土地利用提取结果精度往往低于人工目视解译。由于引入的决策支持要素空间分辨率不一致,遥感影像以外的决策支持要素空间分辨率通常较低,导致土地利用信息提取结果空间分辨率也较低。岩溶区地表构成破碎,人类活动扰动强烈,土地利用影响因素复杂,因此不同研究区所需要的决策支持要素组合不同,其决策阈值也不同,导致前期建模阶段需要投入较大的精力。此外,本研究由于前期野外工作不足,采样点不够丰富,代表性差,导致精度评价部分各土地利用类型的精度评价不够充分。
[1] 原立峰,杨桂山,李恒鹏,等.基于TM/ETM绿洲城市土地利用时空演变分析:以新疆奎屯市为例[J].水土保持研究,2013,20(4):34-43.
[2] 许月卿,罗鼎,冯艳,等.西南喀斯特山区土地利用/覆被变化研究:以贵州省猫跳河流域为例[J].资源科学,2010,32(9):1752-1760.
[3] 周旭,安裕伦,张斌,等.CBERS-CCD数据土地利用/覆盖信息提取最佳波段选择:以贵州喀斯特山区为例[J].遥感技术与应用,2009,24(6):743-748.
[4] 岳跃民,王克林,张兵,等.喀斯特石漠化信息遥感提取的不确定性[J].地球科学进展,2011,26(3):266-274.
[5] 郭海祥,安裕伦.基于中高分辨率的石漠化治理工程监测:以普安县地泗河小流域为例[J].贵州师范大学学报,2013,31(1):7-10.
[6] 陈利,林辉,孙华,等.基于SPOT-5影像的冷水江市岩溶区石漠化时空演变研究[J].中南林业科技大学学报,2012,32(8):22-27.
[7] 王晓爽,胡卓玮,赵文吉,等.基于EVI植被指数的大尺度草地多源信息综合分类研究[J].草业科学,2011,28(1):10-17.
[8] 钱育蓉,于炯,贾振红,等.基于决策树的典型荒漠草地遥感分类策略[J].西北农林科技大学学报:自然科学版,2013,41(2):159-166.
[9] 吴健生,潘况一,彭健,等.基于QUEST决策树的遥感影像土地利用分类:以云南省丽江市为例[J].地理研究,2012,3(11):1973-1980.
[10] 翁中银,何政伟,于欢.基于决策树分类的地表覆盖遥感信息提取[J].地理空间信息,2012,10(2):110-112.
[11] 杨曦光,黄海军,严立文,等.基于决策树方法的海岛土地利用分类研究[J].国土资源遥感,2012,24(2):116-120.
[12] 王金亮,邵景安,李阳兵.基于多元方法耦合的高强度人为扰动复合区土地利用信息提取[J].地理科学进展,2012,34(4):777-786.
[13] 刘睿,冯敏,孙九林,等.基于环境减灾卫星CCD数据与决策树技术的植被分类研究[J].地理科学,2012,32(12):1490-1495.
[14] 周伟,杨峰,钱育蓉,等.天山北坡草地遥感分类及其精度分析[J].草业科学,2012,29(10):1526-1532.
[15] 孙俊杰,马大喜,任春颖,等.基于多时相环境卫星数据的南瓮河流域湿地信息提取方法研究[J].湿地科学,2013,11(1):60-67.
[16] 曹丽琴,李平湘,张良培,等.基于多地表特征参数的遥感影像分类研究[J].遥感技术与应用,2010,25(1):38-44.
[17] 吴荣涛,詹莉,朱嘉伟.SPOT5遥感数据在土地利用更新调查中的几何精度分析[J].测绘科学,2006,31(5):129-130.
[18] 田辉,文军,马耀明,等.复杂地形下黑河流域的太阳辐射计算[J].高原气象,2007,26(4):667-676.
[19] 张杰,李栋梁,何金梅,等.地形对青藏高原丰枯水年雨季降水量空间分布的影响[J].水科学进展,2007,18(3):320-326.
[20] 张方方,齐述华,舒晓波,等.南方山地丘陵土地利用类型的地形影响GIS分析:以江西省为例[J].地球信息科学学报,2010,12(6):784-489.
[21] 孙丽,陈焕伟,潘家文运用DEM剖面土地利用类型的分布及时空变化:以北京延庆县为例[J].山地学报,2004,22(6):762-766.
[22] 历华,柳钦火,邹杰.基于MODIS数据的长株潭地区NDBI和NDVI与地表温度的关系研究[J].地理科学,2009,29(2):262-267.
[23] 江振蓝,沙晋明.基于MODIS的福建省植被生态环境遥感本底值研究[J].水土保持研究,2007,14(4):11-15.
[24] 刘朋钢,杨海龙,高甲荣,等.基于气候变化和地形湿度指数的锡林浩特市水土流失趋势分析[J].水土保持研究,2012,19(4):131-137.
[25] 王大鹏,王周龙,崔青春,等.基于决策树的龙口市土地利用/覆盖分类研究[J].水土保持研究,2008,15(1):114-121.
LandUseInformationExtractionMethodBasedonMulti-informationSupportinKarstArea
ZHANG Feng-tai1, ZHAO Wei-quan2
(1.DepartmentofGeographyandTourism,GuizhouNormalCollege,Guiyang550003,China;2.InstituteofGuizhouMountainResourcesResearch,GuizhouAcademyofSciences,Guiyang550018,China)
Land use information is the important basic data, whose accuracy will have a significant impact on the subsequent researches. Given the complex terrain and heterogeneous land cover types, there are certain limitations in using visual interpretation and supervised classification methods to obtain land use information in karst areas. In this paper, we coupled remote sensing images with vegetation index, humidity index, terrain and other information, in combination with principal component analysis method. The process mentioned above is conducted through the decision tree modeling method. Decision parameter threshold of the decision tree is obtained by taking field samples to formulate the objective function. Then the land use information extraction method under the multi-information support in karst area is built. The results show that land use information obtained is in line with the characteristics of proportion and distribution of land use in typical karst areas, and overall classification accuracy reached up to 82%. This method can deepen the understanding of the multi-dimensional remote sensing information, fully tap the implied information, and improve the extraction accuracy of the land use information in karst area as well. In particular, it can reflect the influence of topographic features on the spatial distribution of land use in karst area.
remote sensing; land use; multi-information; karst area
2013-09-18
:2013-12-03
国家社科基金项目“西部少数民族地区发展模式创新研究”(10CJY044);贵州省科学技术基金项目“基于农户视角的喀斯特峰丛洼地生态恢复替代性生计模式选择研究”(黔科合J字[2012]2294)
张凤太(1979—),男,山东沂南人,博士研究生,副教授,研究方向为区域经济、景观生态、生态系统健康与管理等、E-mail:zhfthero@126.com
TP79
:A
:1005-3409(2014)04-0312-05