地貌形态类型面向对象分类法的改进

2016-05-25 00:37丹,刘利,丁浒,张雯,齐
地理与地理信息科学 2016年2期
关键词:面向对象分辨率尺度

田 丹,刘 爱 利,丁 浒,张 雯,齐 威

(1.南京信息工程大学地理与遥感学院,江苏 南京 210044;2.南京师范大学虚拟地理环境教育部重点实验室,江苏 南京 210023)

地貌形态类型面向对象分类法的改进

田 丹1,刘 爱 利1,丁 浒2,张 雯1,齐 威1

(1.南京信息工程大学地理与遥感学院,江苏 南京 210044;2.南京师范大学虚拟地理环境教育部重点实验室,江苏 南京 210023)

提出一种改进的基于随机森林因子重要性分析和灰度共生矩阵纹理的地貌形态类型面向对象划分方法。以中国1∶100万DEM为数据源,利用相关分析和雪氏熵值法筛选确定地貌分类的地形因子组合,并利用随机森林分类树评价各地形因子的重要性,将求得的各因子重要性数值作为面向对象多尺度分割各图层的阈值,最后基于灰度共生矩阵纹理信息构成分类样本的知识库进行地貌分类。全国地貌分类以《中国及毗邻地区1∶400万地貌图》为精度评价标准,结果显示该文提出的分类方法总体精度为71.4%,比ISODATA非监督分类法精度提高5.7%,比常用的面向对象分类法精度提高15.7%;陕西省地貌分类以《中华人民共和国1∶100万地貌图》为精度评价标准,分类的总体精度为72.9%。通过分析该文方法对不同分辨率DEM分类精度的影响,得出分辨率越高总体精度越高。

地貌分类;面向对象分类;随机森林;灰度共生矩阵

0 引言

地貌是自然地理环境的基本要素之一。地貌分类是数字地形分析的基础,同时也是地貌制图研究的依据以及地貌分布规律研究的前提,故其在生产实践和科学研究中都具有重要价值[1-3]。

但前人研究显示目前面向对象的地貌分类精度仍不高,多尺度分割算法阈值的确定存在主观性。因此,本文以中国1∶100万DEM为数据源,探索地貌形态类型面向对象自动划分方法的改进。

1 实验数据

本文采用国家地理信息中心生产的1∶100万DEM数据,该数据是在我国1∶5万及1∶10万基本比例尺地形图上,按照28.125″(经差)×18.750″(纬差)的格网间隔,高精度读取方里网交点高程所构建的1 km栅格分辨率的地面高程数字矩阵[15]。该数据采样精度较高且能从宏观反映我国地形的起伏变化特征[16],数据高程0~8 848 m,标准差为1 147.1 m。受数据所限,本文以《中国及毗邻地区1∶400万地貌图》作为全国尺度精度评价的依据。为验证本文提出的分类方法对于小尺度的适用性,本文还以《中华人民共和国1∶100万地貌图》陕西省分幅作为分类结果精度评价标准。

2 实验方法

本文技术路线见图1。首先,筛选并提取地形起伏度、地表粗糙度、高程、高程变异系数、坡度变率、光照晕渲图和全累计曲率7种地形因子作为地貌划分因子组合;其次,将随机森林分类树计算得到的因子重要性作为阈值,对组合结果进行多尺度图像分割;选取灰度共生矩阵(GLCM)纹理信息构建分类知识库,利用最邻近分类法进行地貌自动分类;最后以《中国及毗邻地区1∶400万地貌图》为基准,对分类结果进行精度评价。

图1 技术路线Fig.1 The technology flow chart

2.1 地貌分类因子的确定

将多种地形因子结合能够较为完整地反映地貌实体的形态特征[17,18]。本研究选取了在数字地形分析中常用于地貌分类的宏观地形因子:高程、地形起伏度、地表粗糙度、地表切割深度、高程变异系数;以及微观地形因子,坡度、坡度变率、全累计曲率。此外,地貌晕渲图可产生地形表面阴影效果,能够增强地面的起伏感,也作为地貌形态类型划分的指标。

不同地形因子从不同角度表达地貌形态特征和空间特征,其间往往存在相关性,相关性强的地形因子所反映的地貌形态信息具有较大重叠,故在进行地貌形态类型划分时势必会造成信息的冗余,故应筛选相关性弱的地形因子组合进行地貌划分。在对上述9种地形因子进行相关系数筛查前,为避免量纲的影响,先对其进行标准化处理,使其值域落在0~255之间。得到9种地形因子相关系数见表1,其中,坡度、地表切割深度和地形起伏度3个地形因子间存在高度相关性,故应选择其中一种地形因子与其余6种因子组合以进行地貌形态类型的划分。本研究采用雪氏熵值法对坡度、地表切割深度和地形起伏度3个地形因子进行取舍:

(1)

式中:S为n维数据子集的熵;|Ms|为n维数据子集的协方差矩阵行列值,该值越大则该影像的熵越大,越有利于影像分类。

将坡度、地表切割深度和地形起伏度分别与其他6种地形因子组合,利用式(1)计算熵值S,得到3种组合的熵值分别为:26.89、26.86、27.20,即地形起伏度与其他6种地形因子的组合能够获得最大的熵值,也即地形起伏度、地表粗糙度、高程、高程变异系数、坡度变率、光照晕渲图和全累计曲率为地貌分类的最佳因子组合。

2.2 地形因子重要性的计算

面向对象影像分析思想的核心是将影像对象作为最小处理单元,其核心技术是影像分割与特征空间聚类。分割一般从像素级开始,采取自下而上迭代的区域融合方法,将光谱和空间特征同质性高的相邻像素合并[19],将分割后的影像对象按照最大隶属度值划分到某一确定的类别中,从而完成分类。在分割开始前,当输入信息源是单一图层即单通道影像时,仅利用单个图层进行分割,当输入信息源是多通道复合影像时,则需对每一图层设置权重后再进行多尺度分割。通过上述分析,本文筛选了7种地形因子作为地貌形态划分的因子组合,并将每一个地形因子作为一个图层输入组合成7波段特征影像,在进行多尺度分割时需设置7种地形因子的权重,由于每种地形因子表征不同地貌类型的能力不同,在地貌分类中的重要性亦不同,重要性高的地形因子赋予较高的权重,故在对地形因子赋权重值前需先定量计算地形因子的重要性。本文提出一种基于随机森林分类因子重要性估计的多尺度分割图层阈值确定方法。

(2)

计算得到各地形因子重要性度量如图2,将重要性数值取整后作为各图层的阈值进行多尺度分割,通过多次实验后将分割尺度设为90,最终得到的多尺度分割结果如图3所示(见封2)。

2.3 基于GLCM的面向对象分类

本文采用标准最邻近分类器进行地貌类型的划分,在类层次结构中插入7个类别:平原、丘陵、低山、低中山、高中山、高山和极高山,为每一类别选取GLCM纹理性构建分类特征空间,并选择样本。

图2 各地形因子重要性度量Fig.2 Importance measure for each terrain factor

DEM模拟的数字地形表面,本质上是一个空间场模型,而由于内插技术的存在,DEM栅格高程间存在较强的空间自相关性,GLCM模型以估计二阶组合条件概率密度函数为基础,描述在θ方向上相距为d的一对像元灰度值分别为i和j的出现概率,将像元间的空间关系用空间距离、角度等为参数引入纹理分析模型中,并由此揭示图像的纹理特征,故该模型能够顾及像元间的空间自相关性,是行之有效的针对DEM进行纹理分析的方法[22]。在构建特征空间时为充分利用GLCM的方向性,选择全方向工具,对7个地形因子图层分别构建同质性(Homogeneity)、对比度(Contrast)、差异性(Dissimilarity)、熵(Entropy)、角二阶矩(Ang.2nd moment)、中值(Mean)、标准差(StdDev)和相关度(Correlation) 8种GLCM纹理参数特征,组成特征空间知识库,然后为特征空间选择训练样本。在初次分类时,为了充分利用对象间的异质性,训练样本选择数量不能过多,由图3可知,三大平原区对象面积较大且较完整,训练样本选择的数量较少,而西部横断山脉和喜马拉雅山脉附近的高山区和极高山区的对象面积较小且较破碎,故训练样本选择的数量要多于平原丘陵区。

由于GLCM计算量较大,时间复杂度较高,在执行分类前,还需进行特征空间最优化的选取。特征空间最优化即计算特征空间中所有分类的样本间的欧式几何距离,将能产生最优类间距的特征组合作为最优特征组合,这里最优类间距定义为不可分类间最小距离的最大值[23](图4)。图4表示不同维数的特征空间对应的类间距,当特征组合维数为9时取得最大类间距0.176,此时的特征空间为:光照晕渲图的熵、差异性和对比度,坡度变率的相关度,地表粗糙度的相关度和熵,地形起伏度的熵和同质性以及高程变异系数的相关度。将这9种特征作为地貌形态类型划分的特征空间组合。

图4 特征组合维数类间距Fig.4 The separation distance of feature combination dimension

利用最优特征空间对影像进行初次分类,得到的结果易出现错分、漏分现象,且多发生于高中山、高山和极高山等纹理信息较为近似的区域,因此基于初次分类的结果去掉效果不佳的样本,并更正错分样本,再次进行分类。需要注意的是,由于特征空间最优化是基于样本的,故增加或删除样本需要重新计算最优特征空间组合,如此迭代3~4次得到最终分类结果(图5,见封2)。

2.4 精度检验

2.4.1 分类精度检验 为对分类结果进行精度检验,以《中国及毗邻地区1∶400万地貌图》除去黄土高原区与沙漠区以外的基本形态类型地貌区域为基础,对分类结果与之对应部分的全部共8 569 210个像素构建混淆矩阵进行精度评价(表2)。由表2可知,低中山类的用户精度最高(84.1%),低山类用户精度最低(47.7%),表明分类结果中低中山类具有最高的可信度,而低山地貌类型的分类结果可信度最低;制图精度最高的是平原地貌(83.7%),最低的是低山地貌(50.2%),表明平原的地貌特征明显,而低山的地貌特征不明显且易与其他地貌类别(如低中山和丘陵)相混淆。实验总体精度71.4%,Kappa系数0.67,分类结果完整度好,精度较高。

表2 精度评价结果Table 2 Accuracy evaluation of classification result

2.4.2 总体精度检验 将本文分类方法的分类精度与前人基于ISODATA非监督分类法[16]以及文献[18]面向对象分类法的分类精度进行对照,结果显示,本文分类方法在精度上具有明显优势(表3),比ISODATA非监督分类法精度提高5.7%,比常用的面向对象分类法精度提高15.7%。将本文分类方法应用于陕西省地貌分类,以《中华人民共和国1∶100万地貌图》为精度评价标准,总体精度为72.9%。

表3 总体精度与Kappa系数对比Table 3 Comparison of classification accuracy and Kappa

2.4.3 本文方法对不同分辨率DEM分类精度的影响 为验证本文方法对不同分辨率DEM分类精度的影响,以SRTM (Shuttle Radar Topography Mission) DEM(90 m分辨率)为数据源,在我国西南山地地貌较为复杂的区域选取研究区进行地貌分类;同时将SRTM DEM重采样成500 m和1 000 m,采用本文分类法分别进行地貌划分及精度评价(表4)。由表4可知,随着数据分辨率降低,地貌分类精度逐级下降,SRTM DEM(90 m分辨率)分类结果总体精度和Kappa系数最高。分辨率均为1 000 m情况下,SRTM DEM分类总体精度高于国家基础地理信息中心DEM数据,这可能是由于国家基础地理信息中心DEM数据插值的原因,存在精度问题,在计算参数时不准确。

表4 不同数据格式不同分辨率DEM分类精度对比Table 4 Classification accuracy comparison of different DEM formation and resolution

3 结论与讨论

本文以国家基础地理信息中心1∶100万DEM为数据源,通过定量化分析确定了适宜进行地貌划分的地形因子组合;在进行多尺度分割时,通过构建随机森林分类树计算因子重要性的方式确定各地形因子的分割阈值;利用GLCM纹理信息构建特征分类知识库,对分类知识库进行筛选得到最优特征组合,进而对多尺度分割得到的对象进行分类。实验结果表明,该方法得到的分类结果较完整、精度较高,分类过程主观性低,且实现过程简单。此外,与现有面向对象分类方法进行对比,本文方法在精度上具有明显优势。

通过分析本文方法对不同分辨率DEM分类精度的影响,随着数据分辨率降低,地貌分类精度逐级下降,SRTM DEM (90 m分辨率)分类结果总体精度和Kappa系数最高。但SRTM DEM(90 m分辨率)数据量较大,进行多尺度分割且基于纹理的地貌分类非常耗时;同时本文在执行多尺度分割操作时通过多次实验确定分割尺度,实验过程略微繁琐,如何根据不同的地形因子组合自适应确定分割尺度以及针对SRTM DEM(90 m分辨率)设计相应的分类方法将是下一步研究工作中的重点。

[1] 李炳元,潘保田,程维明,等.中国地貌区划新论[J].地理学报,2013,68(3):291-306.

[2] 高玄彧.地貌基本形态的主客分类法[J].山地学报,2004,22(3):261-266.

[3] GERCEK D,TOPRAK V,STROBL J.Object-based classification of landforms based on their local geometry and geomorphometric context[J].International Journal of Geographical Information Science,2011,25(6):1011-1023.

[4] BENZ U C,HOFMANN P,WILLHAUCK G,et al.Multi-resolution,object-oriented fuzzy analysis of remote sensing data for GIS-ready information[J].ISPRS Journal of Photogrammetry and Remote Sensing,2004,58(3):239-258.

[5] 胡惠萍.面向对象分类技术的景观信息获取[D].长沙:中南大学,2007.17.

[7] MANAKOS I,SCHNEIDER T,AMMER U.A comparison between the ISODATA and the eCognition classification methods on basis of field data[J].IAPRS,2000,33:133-139.

[8] BLASCHKE T.Object based image analysis for remote sensing[J].ISPRS Journal of Photogrammetry and Remote Sensing,2010,65(1):2-16.

[9] VAN NIEKERK A.A comparison of land unit delineation techniques for land evaluation in the Western Cape,South Africa[J].Land Use Policy,2010,27(3):937-945.

[11] MYINT S W,GOBER P,BRAZEL A,et al.Per-pixel vs.object-based classification of urban land cover extraction using high spatial resolution imagery[J].Remote Sensing of Environment,2011,115(5):1145-1161.

[12] CIARAN R,LAN W,NEIL A,et al.A semi-automated method for mapping glacial geomorphology tested at Brei amerkurj kull,Iceland[J].Remote Sensing of Environment,2015,163:80-90.

[13] SHRUTHI R B V,KERLE N,JETTEN V,et al.Quantifying temporal changes in gully erosion areas with object oriented analysis[J].Catena,2015,128:262-277.

[14] 宋晓阳,姜小三,江东,等.基于面向对象的高分影像分类研究[J].遥感技术与应用,2015,30(1):99-105.

[15] 宋佳.基于DEM的我国地貌型类型自动划分研究[D].西安:西北大学,2006.9.

[16] 刘爱利,汤国安.中国地貌基本形态 DEM 的自动划分研究[J].地球信息科学,2006,8(4):8-14.

[17] 汤国安.我国数字高程模型与数字地形分析研究进展[J].地理学报,2014,69(9):1305-1325.

[18] 汪禹芹,李艳,刘爱利.基于面向对象思想的中国地貌形态类型划分[J].遥感信息,2012,1:13-18.

[19] 黄昕.高分辨率遥感影像多尺度纹理形状特征提取与面向对象分类研究[D].武汉:武汉大学,2009.6.

[20] BREIMAN L.Random forests[J].Machine Learning,2001,45(1):5-32.

[21] 雷震.随机森林及其在遥感影像处理中应用研究[D].上海:上海交通大学,2012.

[22] 刘凯,汤国安,陶旸,等.基于灰度共生矩阵的 DEM 地形纹理特征量化研究[J].地球信息科学学报,2013,14(6):751-760.

[23] LALIBERTE A S,BROWNING D M,RANGO A.A comparison of three feature selection methods for object-based classification of sub-decimeter resolution UltraCam-L imagery[J].International Journal of Applied Earth Observation and Geoinformation,2012,15:70-78.

Improvement of Object-Oriented Classification Method for Landform Types

TIAN Dan1,LIU Ai-li1,DING Hu2,ZHANG Wen1,QI Wei1

(1.SchoolofGeographyandRemoteSensing,NanjingUniversityofInformationScienceandTechnology,Nanjing210044;2.KeyLaboratoryofVirtualGeographicEnvironment,MinistryofEducation,NanjingNormalUniversity,Nanjing210023,China)

This paper proposes an improved object-oriented classification for landform types,based on analysis of random forest and gray-level co-occurrence matrix.In the research,based on 1∶1 000 000 DEM of China,terrain factors for terrain classification are selected by correlation analysis and Sheffield′s entropy method.Random forest classification tree is applied to evaluate the importance of the terrain factors,which are used as object-oriented multi-scale segmentation threshold of each terrain factor.Then GLCM is conducted for the knowledge base of classification.Experiments show that the classification method of this paper is up by 5.7% than ISODATA unsupervised classification,and by 15.7% than object-oriented classification method with the landform map of 1∶4 000 000 of China as precision evaluation criteria.On Shaanxi Province,results indicated that the overall accuracy of classification is 72.9% with the landform map of 1∶1 000 000 of China as precision evaluation criteria.By analyzing the influence of the method on the classification accuracy of DEM with different resolutions,the higher the resolution is,the higher the overall accuracy is.

landform classification;object-oriented classification;random forest;gray-level co-occurrence matrix

2015-10-21;

2015-12-29

国家自然科学基金项目(41401471)

田丹(1991-),女,硕士研究生,主要从事数字地形分析方面的研究。E-mail:870814482@qq.com

10.3969/j.issn.1672-0504.2016.02.009

P931;P208

A

1672-0504(2016)02-0046-05

猜你喜欢
面向对象分辨率尺度
财产的五大尺度和五重应对
EM算法的参数分辨率
原生VS最大那些混淆视听的“分辨率”概念
一种提高CCD原理绝对值传感器分辨率的方法
基于深度特征学习的图像超分辨率重建
宇宙的尺度
面向对象Web开发编程语言的的评估方法
峰丛洼地农作物面向对象信息提取规则集
基于面向对象的车辆管理软件的研制与开发
9