马红利 李祥武 白穆 刘玲玲 雷刚
(1.国家测绘地理信息局陕西基础地理信息中心 陕西西安 710054;2.西安科技大学测绘科学与技术学院 陕西西安 710054)
近年来,由于人类长期无序生产和生活活动已经影响到全球绝大多数地区地表覆盖现象,使之原有自然环境受到破坏或者转化为生产和生活用地,这种行为造成了生态环境急剧恶化。应用先进的遥感和地理信息系统技术开展地表覆盖变化研究对于环境保护和生态建设具有重要的指示意义[1-3]。
本文通过研究资源三号卫星影像数据和环境减灾卫星影像数据地表覆盖分类结果的一致性,以高分辨率分类结果为参考数据,重点分析中分辨率影像数据在不同地表覆盖类型方面与参考数据之间的分类结果一致性,有助于今后在高分辨率卫星数据无法覆盖区域内,为使用中分辨率卫星数据获得的成果提供适用程度参考。
本文选取陕北榆林部分区域作为研究对象,东西和南北距离均为30km,主要覆盖横山县和靖边县,地理位置东经 108°58′~109°20′,北纬 37°38′~37°57′。榆林地区位于陕西省最北部,位于毛乌素沙漠和黄土高原的过渡区,属暖温带和温带半干旱大陆性季风气候,是一个游牧与农耕文化交融的区域,所以地表覆盖类型也呈现出多样性,生态环境系统脆弱,地表覆盖变化监测对于当地环境保护和生态建设具有重要的指示意义。
研究区数据来源于国家测绘局陕西基础地理信息中心,主要选用以下四种数据:(1)资源三号卫星影像数据,时相为2012年11月14日;(2)环境减灾卫星影像数据,时相为2012年11月8日;(3)野外调绘数据;(4)1∶5万基础地理信息数据。后两种数据作为目视解译的参考数据。资源三号卫星影像和环境减灾卫星影像的光谱波段信息见表1。
表1:光谱波段信息
依据研究区地表覆盖和土地利用类型,结合目视解译和实地调查,确定研究区主要包含 9大类,即耕地、园地、林地、草地、房屋建筑群、构筑物、人工堆掘地、荒漠与裸露地和水体。各类型及其定义详见表2。
表2:研究区土地覆盖类型及其含义
数据分类前处理在ENVI和ArcGIS软件中完成,主要包括几何校正、图像配准、图像融合、图像裁剪和投影变换。
在几何纠正中,本文主要采用控制点图像对图像的几何校正方法。本文主要采用二次多项式法进行校正,资源三号全色影像数据几何校正精度控制在 3个像元内,环境减灾卫星影像数据几何校正精度控制在1个像元内,坐标系统采用CGCS2000,投影采用高斯—克吕格投影。将资源三号多光谱数据与其全色数据进行图像配准和图像融合。按照研究区矢量边界裁剪栅格数据,结果如图1。
图1 影像数据(左:资源三号影像数据,右:环境减灾卫星数据)
支持向量机(Support Vector Machines,SVM)是Vapnik等人在多年研究统计学习理论基础上对线性分类器提出了另一种设计最佳准则[4-5],根据有限样本信息在模型复杂性(即对特定训练样本的学习精度)和学习能力(即无错误地识别任意样本的能力)之间寻求最佳折衷,以期获得最好的推广能力[6]。无论从总体精度还是从具体地类的分类精度来看,多源影像SVM分类精度较高,说明基于SVM的多源影像信息分类方法的实用性和优越性[7]。SVM已广泛应用于土地覆盖图像分类中[8]。在此,本文提出基于SVM方法,根据研究区地物特征对环境减灾卫星影像进行对比度增强处理,提高图像对比度,这样有利于目视样方解译。然后对处理好的环境减灾卫星数据运用ENVI4.5遥感软件进行监督分类[9],具体分类流程如下两方面。
5.1.1 训练样本的确定
本文在选取训练样本之前,先采用非监督分类中的K-Mean方法将影像分为12类,作为后期训练样本选取的参考,进而提高样本的分类精度。分类样本选取的好坏直接影响分类结果的精度,选取样本之前先对研究区范围内影像上的各种地物要有准确的判读,对不确定地物借助Google Earth和野外调绘样本进行判读。样本的选取要遵循如下原则:尽量选取纯净像元;像元尽量分布均匀并且覆盖研究区范围;像元个数尽可能多。
所选训练样本的可分离度在 1.8以上,说明样本的可分离度比较高,影像的分类结果也较高。
5.1.2 环境减灾卫星影像地表覆盖数据分类
训练样本选定后,根据所选样方对研究区进行分类,在ENVI中选择支持向量机的分类器方法对环境减灾卫星影像数据进行监督分类,得到分类好的地表覆盖分类数据[10]。
在分类完成后,需要对分类后数据进行后处理,主要包括聚类处理和目视修正。聚类处理将3×3的像元进行合并,即将小于3个像元的类别就近合并。目视修正主要修改混分误分现象,如山区林地一般比较多,叠加 DEM在目视修正中帮助判读;对于很明显错分类别,可以采用涂改方法;对于像元碎多,涂改方法效果不佳,本文利用结合NDVI特征对影像进行波段运算,纠正错分类别,从而提高影像的分类精度。
由于影像分辨率30米,对于研究区出现的小面积地类(人工堆掘地,构筑物)可以忽略,林地和园地在影像上区分难以区分,统一归为林地,最后分成六类:房屋建筑群、林地、水体、耕地、草地和荒漠与裸露地。最终形成环境减灾卫星影像分类成果图如图2。
图2:环境减灾卫星影像分类结果图
本文对资源三号卫星影像数据分类时,按照基础测绘生产的工作流程,应用1∶5万基础地理信息数据和实地调查数据,按照相同的地表覆盖分类体系,采用目视解译的方式对数据进行地表覆盖信息提取。目视解译包括作业判读和检查判读,需保证各类型边界精确和分类准确。该分类数据作为分类结果的“准真值”,用于验证环境减灾卫星影像数据分类的精度,所以要对其提取结果进行后处理工作,包括去除小图斑和拓扑检查及处理,用以保证数据质量的精确性。去除小图斑考虑到环境减灾卫星影像数据的分类类型最小图斑为三个像元,将资源三号卫星影像分类结果数据小于2700平方米的图斑进行就近合理归并,使得分类结果具有整体合理性;拓扑检查和处理在于排查多边形面重叠和多边形面缝隙的问题。最后对资源三号信息提取结果进行了成果检查,结果如图3。
图3 资源三号卫星影像分类结果图
本文选取资源三号高分影像数据分类结果作为研究区地表覆盖分类结果的“准真值”,其分类结果的验证样本来验证环境减灾卫星数据分类结果的可靠性。验证样本的选取与训练样本选取标准一致,且各类型像元数目要达到训练样本的70%。
混淆矩阵计算结果显示:环境减灾卫星影像数据地表覆盖分类结果的总体分类精度达到 90%,kappa系数为 0.86,说明分类结果精度较高。混淆矩阵计算结果见表3。
与参考数据相比,连续大片分布的林地和耕地的分类精度较高,而分布较分散且细碎的图斑分类精度较低,比如房屋建筑群和草地,但从研究区总体分类来看,可以相对准确地反映该地区的真实地表覆盖信息。
地表覆盖分类结果的精度分析中,分类精度由制图精度和用户精度来衡量。结果显示:林地的制图精度和用户精度相对其他地类最高,即漏分和错分现象都较少;荒漠与裸露地的制图精度较高,耕地和水体的制图精度较一般,而房屋建筑群与草地的漏分现象较严重,制图精度最差;荒漠与裸露地和房屋建筑群的用户精度较一般,即错分误差较大,而其他地类的用户精度都较高。如图4和图5。
表3:混淆矩阵
图5:分类误差情况
图4:分类精度情况
上述分析表明,地表覆盖各地类的错分误差较小,进而证明依据调绘样本库选取的样本较准确,总体分类精度较高,当然也存在个别地类漏判较严重的现象。对照分类结果图(图2和图3)分析,研究区大片都是林地,小面积的草地、房屋和耕地夹杂在其中难以准确区分,漏采较多,宽度在 30m内的水体和房屋存在漏分,耕地与裸地也存在部分混分现象。分析漏判、错判原因有两方面:一是环境减灾卫星影像数据的分辨率在30m,对于小于单个像元面积的图斑存在混合像元现象,如对面积小的独立房屋无法识别,并且由于地表粗糙度大,不能纯粹反映地表覆盖的某一类型,如耕地与裸地混分、耕地与林地混分、草地与林地混分。二是对于研究区零星分布的狭长细小的条带难以准确确定边界,混杂在其他地类中,且要避免此类现象建立普适的分类规则库有难度。
(1)对资源三号影像数据和环境减灾卫星影像数据参照最新样本库采用非监督分类和监督分类相结合方法进行分类和后处理,提高了分类精度。并灵活运用高分辨率影像分类结果作为分类的准真值,验证中分辨率影像用于地表覆盖大类分类精度的适度可靠性。
(2)基于分类结果统计出各地类的分类精度,对照分类结果图分析错分原因,总体来看环境减灾卫星影像数据分类结果较好,证明利用多源遥感数据进行地表覆盖分类的可行性。从分类结果来看,研究区林地覆盖范围最大,分类精度也较高,这与国家退耕还林和环境保护政策实施密切相关;通过影像分析研究区的水域情况,该地水源较少。通过得到的一系列相关信息,可为后续监测工作奠定基础。
(3)环境减灾卫星影像数据对地表覆盖分类研究具有适宜性,但由于地表粗糙度大和空间分辨率低的限制,导致对小于一个像元大小的地类分类的局限性。因此,在后续工作中还有待做深层次研究,包括分类方法的研究、影像的判读和评价积累更加丰富的经验并充实对评价方法的分析研究,提高分类精度。
[1]周兆叶,储少林,王志伟,等.基于NDVI的植被覆盖度的变化分析[J]草业科学,2008, 25(12):23-29.
[2]李琳.北京郊区植被覆盖度变化动态遥感监测[D]北京:北京林业大学,2008.
[3]周淑琴,吴发启,荆耀栋.毛乌素沙地南缘植被覆盖度动态监测——以陕西省靖边县为例[J]安徽农业科学,2007,35(27):8550-8551, 8573.
[4]VapnikV N.The Nature of Statistical Learning Theory, Springer Verlag[M]New York, 1995.
[5]Cortes C Vapnik V.Support Vector Networks[J]Machine Learning, 1995, 20(3):273-297.
[6]张锦水,何春阳,潘耀忠,等.基于SVM的多源信息复合的高空间分辨率遥感数据分析研究[J]遥感学报,2006, 10(1):49-57.
[7]贾萍,李海涛,林卉,等.基于SVM的多源遥感影像分类研究[J]测绘科学,2008, 33(4):21-22.
[8]Foody G M, Mathur A.A Relative Evaluation of Multiclass Image Classification by Support Vector Mathines[J]IEEE Trans.Geoscience and Remote Sensing, 2004, 42:1335-1343.
[9]赵文吉.ENVI遥感影像处理专题与实践[M]北京:中国环境科学出版社,2008.
[10]赵春霞,钱乐祥.遥感影像监督分类与非监督分类的比较[J]河南大学学报,2004, 34(3):90-93.