林 鹏,阮仁宗,陈 远,柴 颖,陶 婷
(1. 河海大学 地球科学与工程学院,江苏 南京 211100;2. 南京金智视讯科技有限公司,江苏 南京 211100)
面向对象的城镇土地覆盖信息自动提取方法
林 鹏1,阮仁宗1,陈 远2,柴 颖1,陶 婷1
(1. 河海大学 地球科学与工程学院,江苏 南京 211100;2. 南京金智视讯科技有限公司,江苏 南京 211100)
以安徽省滁州市城区为研究对象,采用面向对象的分类思想,在建立误分割指数进行多尺度分割评价的基础上,提出了一种首先利用遗传算法对光谱特征、几何特征、空间特征等进行最优特征集提取,再结合支持向量机算法进行自动提取的分类方法,并对分类结果进行了精度评价。结果表明,该方法的精度达到了90.43%,证明了其可行性。
土地覆盖;面向对象;误分割;支持向量机
土地覆盖反映了人与自然相互影响、交叉作用最直接与最亲密的关系,对区域生态和环境的研究有巨大影响[1-2],是评价生态环境的重要指标之一[3]。随着国民经济的快速发展,土地覆盖状况变化速度与程度的加剧,寻求一种适合国情的能快速准确地获取土地覆盖信息的方法就显得尤为重要[4]。随着遥感平台的多样化和遥感图像分辨率的提高,遥感技术已成为土地覆盖信息提取的重要手段[5]。目前,土地覆盖的信息提取主要有基于像元和面向对象两种方法[6]。随着高光谱影像的采用,图像中所包含的地物信息更加丰富。基于像元的分类方法仅利用光谱信息而忽略了空间位置、几何形状等其他特征;面向对象的分类方法根据像元间的异质性,通过定义一定的阈值将像元组合成相对同质的对象,并以对象作为基本的分类单元;其综合利用了影像的光谱特征、几何特征,避免了对象破碎,提高了影像的分类精度。但是,面向对象的分类方法中,参与分类的特征阈值多使用经验方法进行选取,对目视判别要求较高且容易对后续分类造成误差累积;而对于地物表面相似的不同地物来说,人工特征阈值分类结果往往并不理想[7-10]。
研究区选取位于滁州市的武店镇,总面积为10.44 km2(图1)。采用数据的是ZY-3卫星高分辨率遥感影像,成像时间为2014-03-24,有4个多光谱波段和1个全色波段。其中,多光谱影像空间分辨率为5.8 m,全色影像空间分辨率为2.1 m。
通过选取地面控制点对遥感影像进行几何校正,误差小于1个像元;采用Gram-Schmidt Pan Sharpen算法,利用全色波段数据对多光谱数据进行增强。此外,本文引入了野外实测样点,共测点211个,采集时间为2014-03-29。所有的样本点均利用GPS获得,精度约为1 m,记录样本的种类、覆盖度和位置等属性。
图1 研究区的地理位置图(审图号:GS(2014)3416)
本文在建立误分割指数进行多尺度分割评价的基础上,提出了一种先利用遗传算法在多重特征中进行最优特征集提取,再结合支持向量机(SVM)算法进行自动提取的分类方法。
2.1 地物类别的确定
根据对遥感影像的目视判读、野外实地调查数据和研究区内地物分布情况,结合现行的分类体系,将研究区内地物划分为道路、建筑、植被、水体、裸地和其他,其中植被主要以种植作物的耕地为主。
2.2 多尺度分割
多尺度分割算法是一种区域生长算法。它基于影像对象的特征,针对不同土地覆盖类型的尺度效应,解决产生斑块与真实地物边界拟合问题。分割对象的平均异质性最小化与像素的平均异质性最小化是影像分割的标准[11]。当异质性大于等于给定的尺度时,区域就会停止生长,区域内像元将合并形成对象。异质性的计算公式为:
式中,wcolor为光谱异质性权重;wc为数据层权重;σc为数据层上光谱标准差;wcpt为紧致度异质性;l为对象长度;b为目标多边形最短边;n为像元个数。
对于多尺度分割,分割尺度的确定至关重要,是后续分类精度的重要保证[12]。本文为确定分割尺度,选择以10为单位递增从10~100共10个尺度进行分割。在研究区中选择样本,利用目视解译的方式在分割结果图像上进行判别,并计算样本区内误分图斑的数目和面积,见表1。
表1 误分割图斑面积和个数统计
由表1可知,分割尺度越大,误分割图斑的数量会减少,但误分割的总面积会增大。为综合考虑两种因素,对误分割图斑个数和误分割图斑面积进行归一化处理,建立误分割指数模型,以期得到最佳分割尺度使得误分割指数达到最小值。
式中,n为归一化后误分割图斑数;r为归一化后误分割图斑面积;ESI为误分割指数。通过表1数据,最后得到结果如图2所示。因此,本文选择20为最佳分割尺度,并根据类似方法,最终确定形状因子为0.4,紧致度因子为0.5。
2.3 特征选择
图2 ESI曲线图
经过多尺度分割后的影像对象产生了新的特征信息,相较于单个像元无疑含有更多的信息量。面向对象方法可以利用的特征除影像光谱特征外,还有纹理特征、几何特征、上下文特征等[7-8]。根据已有研究成果,结合研究区实际,初步选择以下特征:四波段光谱均值、亮度、标准差、比率、同质性、对比度、角二阶性、熵、方差、面积、长宽比、密度、形状指数、NDVI、NDWI、SAVI和RVI等。若运用上述全部特征进行分类会导致维数过于庞大。同时,对于不同地物来讲,部分特征在分类中的贡献并不高。所以,最佳特征集的构建就显得尤为重要[13]。本文采用遗传算法来选择合适特征完成最佳特征集的构建。
遗传算法是一种典型的随机搜索算法[14]。该算法将“适者生存”理念创新性地引入到搜索算法当中,并通过遗传操作使优秀成分不断保留下来,直至最后达到最优解[15]。遗传算法提取最优特征的过程如图3所示。
图3 遗传算法流程图
本文将所有选择特征作为其长度值,代表某一组合。编码方式采用二值串“0”“1”进行染色体表达,以表征是否选用对应特征(图4)。本研究运用随机函数产生40个染色体组成初始种群,最大繁殖代数为100,交叉繁殖率为0.7,变异率为0.1。当迭代到一定代数后,若最佳个体始终未发生改变,则停止运算。
图4 染色体编码
当迭代出现新一代后,去除基因为“0”的特征项,样本内数据以类内类间距离为可分性判据计算适应值,并保存染色体,继续迭代,直至满足停止条件。通过计算,在繁殖51代时最后得到12个特征的最佳特征组合,分别为:四波段光谱均值、亮度、NDWI、NDVI、熵、对比度、同质性、密度和长宽比。
2.4 SVM
SVM基于结构风险最小化的原则,通过泛化性理论控制超平面的间隔度量抑制过合,用最优化理论提供的数学技术找到优化这些度量的超平面,从而建立一个超平面。其过程是通过适当的内积核函数决定的[16]。实际求解最优化问题和计算分类平面时,只需计算核函数k(x, y)。在目前众多较为理想的核函数中,径向基函数是使用最为广泛的一种。径向基核函数通过参数控制,可近似取得线性核函数以及Sigmoid函数的性质,具有相当广泛的适用性[17-18]。本文选用径向基核函数,结合研究区影像,在基于分割结果的基础上选择训练区进行对分类器训练。首先在训练区中,基于对象对6类地物每类选择6~9个训练样本;然后将遗传算法的特征选择结果作为地物分类时所需计算的属性;最后选用SVM方法进行分类,classifier kernel type 选择RBF,即径向基核函数。
2.5 基于像元的地物分类
为了对本文提出方法的精度和效果进行评价,利用基于像元的最大似然分类法进行地物提取,将研究区分为道路、建筑、植被、水体、裸地和其他6类,每类选取200~300个样本作为训练样本,并将分类结果同面向对象的分类结果进行对比分析。
将分类结果与原图(图5)进行对比,不难看出面向对象的分类结果中,地物分布较连续且基本保证了完整性。而基于像元的分类结果中,虽然大部分地物分类正确,但整体地物连贯性较差,且存在椒盐现象。为对结果进行定量分析,采用混淆矩阵的方法对分类结果进行精度评价。根据200个实地考查点数据,结合滁州市凤阳县2014年土地利用规划图,通过目视解译随机撒点的方法,在遥感图像上随机选取600个样本点,即样本总数达到800个。利用验证点数据对分类结果进行了精度评价。通过建立混淆矩阵,分别用生产者精度、用户精度、总体精度和Kappa系数等指标评价其精度(表2)。
图5 分类结果图
表2 面向对象的分类精度评价
采用相同的检验样本对基于像元的分类结果进行评价,并将相同地物的分类结果总体精度与Kappa系数进行对比,如表3所示。
表3 不同分类方法精度比较
从表3数据可以看出,本文提出的分类方法总体精度达到了90.43%,Kappa系数为0.87,明显高于基于像元分类结果的75.21%。从单个类别分类情况来看,两种分类方法对植被、裸地、水体都有较为精确的分类。但在道路、建筑和其他类的提取中,基于像元的分类精度明显低于面向对象的分类。分类提取结果中,植被、水体以及裸地的分类精度都达到了85%以上;道路与建筑的分类精度较低。在面向对象的分类方法中,道路、建筑两类中有较多误分情况,主要是因为城区内建筑物密集且纵横交错,在影像特征上与道路相似,不论从光谱特征还是几何特征上来都很容易将二者误分。在农村居民点附近,由于道路由高速路变为柏油路,导致道路影像的亮度值变低而难以与周围地物区分。在植被区中,道路类型变为农村土路,部分道路被误分为植被。建筑物因其同道路光谱特征相
似且与道路交错,发生了较多误分;同时城区内地物众多,建筑密集复杂,光谱特征丰富,导致误分较为严重。但是,基于像元的分类方法中,单一使用光谱特征更加难以区分道路和建筑,二者在分类结果上混分更加严重。与基于像元的分类方法相比,本文提出的分类方法精度更高,分类结果更加精确。
本文旨在寻找一种可以自动提取土地覆盖信息的方法。通过对结果进行的分析,可以得到以下结论:①面向对象的分类方法和基于像元的分类方法对植被、水体的提取有相似的精度,但在道路与建筑分类中,面向对象的分类方法精度明显高于基于像元的分类方法。②引入误分割指数模型,综合考虑对象分割问题,有效避免了因为误分割而导致的分类精度问题。③利用SVM的自动分类方法,在很大程度上减少了因人工阈值选取不当而导致的误差问题,并综合利用特征信息提高了分类精度。④在特征选取上使用遗传算法,根据优胜劣汰的原则使输出结果最优化,不但减少了因人工参与导致的误差,而且有效避免了维数灾难的问题。
但本文仍存在一些不足:在对影像的尺度选择上,缺少对单类地物最佳尺度的选择;对于误分割尺度模型的建立缺乏科学的评判依据;整个过程难以实现自动化;在SVM分类时,对于核函数的选择没有深入探究;对参与分类的样本数及样本点个数对分类精度的影响没有作进一步讨论,这些都是今后待解决的问题。
[1] Voltersen M, Berger C, Hese S, et al. Object-based Land Cover Mapping and Comprehensive Feature Calculation for an Automated Derivation of Urban Structure Types at Block Level[J].Remote Sensing of Environment,2014,154:192-201
[2] XUN L,WANG L. An Object-based SVM Method Incorporating Optimal Segmentation Scale Estimation Using Bhattacharyya Distance for Mapping Salt Cedar (Tamarisk spp.) with QuickBird Imagery[J]. GIScience & Remote Sensing,2015,52(3):257-273
[3] Pielke R A, Dalu G A, Snook J S, et al. Nonlinear Influence of Mesoscale Land Use on Weather and Climate[J]. Journal of Climate,1991,4(11):1 053-1 069
[4] 赵庚星,李玉环,徐春达.遥感和GIS支持的土地利用动态监测研究:以黄河三角洲垦利县为例[J].应用生态学报,2000,11(4):573-576
[5] Rogan J, CHEN D. Remote Sensing Technology for Mapping and Monitoring Land-cover and Land-use Change[J]. Progress in Planning,2004,61(4):301-325
[6] Frohn R C, Reif M, Lane C, et al. Satellite Remote Sensing of Isolated Wetlands Using Object-oriented Classification of Landsat-7 Data[J]. Wetlands,2009,29(3):931-941
[7] QIU X, WU S S, MIAO X. Incorporating Road and Parcel Data for Object-based Classification of Detailed Urban Land Covers from NAIP Images[J].GIScience & Remote Sensing,2014,51(5):498-520
[8] OUYANG Z T, ZHANG M Q, XIE X,et al. A Comparison of Pixel-based and Object-oriented Approaches to VHR Imagery for Mapping Saltmarsh Plants[J].Ecological Informatics,2011,6(2):136-146
[9] YUE A, ZHANG C,YANG J,et al. Texture Extraction for Object-oriented Classification of High Spatial Resolution Remotely Sensed Images Using a Semivariogram [J].International Journal of Remote Sensing,2013,34(11):3 736-3 759
[10] Baatz M, Schape A. Object-oriented and Multi-scale Image Analysis in Semantic Networks[A]//In:Pro of 2nd International Symposium on Operationalization of Remote Sensing[C]// Enschede, Netherland, 1999:16-20
[11] Baatz M, Benz U, Dehghani S. eCognition Developer 8.0.1-User Guide[Z]. Germany:Trimble,2010
[12] 黄亮,左小清,冯冲,等.基于Canny算法的面向对象影像分割[J].国土资源遥感,2011,23(4):26-30
[13] 李利红,张华国,厉冬玲,等. 基于多尺度纹理和光谱信息的海岛土地利用遥感分类方法研究[J].海洋学研究,2013,31(2):35-44
[14] 冯莉,李满春,李飞雪.基于遗传算法的遥感图像纹理特征选择[J].南京大学学报(自然科学版),2008,44(3):310-319
[15] 吴健生,林倩,李卫峰,等.基于特征选择的土地整理地物识别规则的动态提取[J].遥感技术与应用,2013,28(5):799-805
[16] 张峰,薛艳丽,李英成,等.基于SVM的多源遥感影像面向对象建筑物提取方法[J].国土资源遥感,2008,20(2):27-29
[17] Keerthi S S, LIN C J. Asymptotic Behaviors of Support Vector Machines with Gaussian Kernel[J].Neural Comput,2003,15(7): 1 667-1 689
[18] LIN H T, LIN C J. A Study on Sigmoid Kernels for SVM and the Training of Non-PSD Kernels by SMO-type Methods, Technical Report[R].Department of Computer Science, National Taiwan University,2003
P237
B
1672-4623(2017)01-0098-04
10.3969/j.issn.1672-4623.2017.01.030
林鹏,硕士研究生,主要从事地理信息和遥感技术应用研究。
2015-06-01。
项目来源:中国科学院战略性先导科技专项资助项目(XDA05050106)。