章铭芳,杨 敏,周 启
保持分布特征与重要性意义的高程点选取方法
章铭芳1,杨 敏1,周 启2
( 1.武汉大学资源与环境科学学院,湖北武汉430079; 2.四川省第二测绘地理信息工程院,四川成都100017)
群点选取一直是地图综合领域的研究热点,一方面大量的地理现象表达上以群点形式呈现,如高程点、散列式居民地、成群分布的小岛屿群或湖泊群等,选取是主要的综合措施;另一方面群点分布上的多尺度表达也是空间分析、数据挖掘等其他领域感兴趣的内容。
地图综合必须顾及综合对象所在地理空间的环境特征(简称上下文特征)。地图综合本质上是一种空间认知的重要手段,在正确认知地图表达的地理空间基础上,通过抽象概括识别主要的地理特征与规律,即综合概括必须以地理规律为指导,同时综合概括的结果又反映这种地理规律[1]。综合概念模型上通常将上下文特征分析表述为模式识别、结构化分析等,并置于整个综合过程的首要位置[2-4]。具体到群点选取,目标的取舍需要顾及微观上个体的语义特征、中观上群体的分布结构化特征,以及宏观上区域背景的自然、人文特征等。
分析已有的群点选取方法,不管是定额选取模型(选多少)还是结构化选取模型(选哪个),均存在缺乏全面顾及目标上下文特征的问题。定额模型关注于目标表达上的载负量,忽略了分布区域环境特征差异的影响。如著名的开方根模型[5],对于数量相同但所处区域环境特征不同的群点结构,只要综合前后比例尺相同,得到的选取比例就一致,显然是不合理的。结构化选取模型则主要关注于自身体系内的属性等级或几何分布特征的分析,较少涉及深层次的地理特征及地理关系,导致选取资格的评价不够客观全面。如早期针对居民地选取的空间比率法、重力模型法、相关系数控制法、圆增长法等[6-7],主要考虑了居民地的属性等级与距离关系;后期则出现了诸多旨在保持群点空间分布特征的选取方法,如凸壳圈层结构保持的化简方法[8]、最小生成树( MST)聚类分组的典型化方法[9]、Voronoi图模型下分布范围及分布密度保持的化简方法[10],以及利用遗传算法[11]、自组织神经网络[12]等优化思想实现的选取方法,但忽略了具体环境下个体目标间的重要性差异。YAN等[13]在文献[10]的基础上提出一种群点选取的普适算法,将点目标的专题重要性与空间分布密度结合考虑,但是并没有结合具体的实例进行深入的分析。
地形图上的高程点即标有高程数值的信息点,通常与等高线配合表达地貌特征的高程信息。高程点分布表达上具有丰富的上下文特征,除个体高程属性上的差异外,一方面与重要地形特征单元(如山峰、鞍部及山谷等)、河流、道路等自然或人文要素目标间的分布关系,使得个体高程点在地理性质上具有不同的重要性意义;另一方面区域地形的起伏变化,使得高程点群在空间分布上呈现不同的疏密关系。本文以高程点为例,在文献[10]和[13]的研究成果基础上,结合高程点的上下文特征,提出一种保持空间分布特征与重要性意义的高程点选取方法。
1.选取过程概念模型
结合高程点的上下文特征及选取基本原理方法,提出选取过程概念模型,如图1所示。定额选取上要顾及区域地形地貌特征,由开方根定律计算基本选取比例,然后进行适当调整。如山地区域往往是地形分析感兴趣的区域,存在大量地形信息表达上具有重要性意义的高程点,选取比例可适度调高;相反,地形平坦区域则可调低选取比例。结构化选取则需要考虑两方面因素:①保留具有重要性意义的个体高程点,如处于地形特征的山峰、谷地、鞍部上,或与河流、道路等重要地理目标邻近的高程点;②保持空间分布上的疏密关系,高程点分布上的疏密关系间接反映了区域环境特征,如与平坦区域相比,地形起伏的山地区域高程点分布更为密集,选取后仍要反映这种特征。下文重点围绕高程点结构化选取问题,从上下文特征分析、结构化选取模型和选取结果评价几个方面展开讨论。
图1 高程点选取过程概念模型
2.上下文特征分析
( 1)具有重要性意义的高程点分析
个体高程点所处局部区域上下文特征的不同,使其在应用分析中体现出不同的重要性意义。下文区分几种典型的具有重要性意义的高程点类型,并简单介绍分析识别方法。
1)地形特征高程点。山峰、鞍部、洼地等地形特征是地形分析感兴趣的,如图2所示,山峰是局部区域制高点视野最为宽阔、鞍部处于山峰之间是路径选择的必经区域、洼地局部地势最低是水源存在的高频区域,因此地形特征上的高程点提供的高程信息具有特殊意义。识别方法上可由等高线生成栅格DEM模型,针对每个高程点设置以该点为中心的R×R栅格窗口,然后分析中心栅格点与周围其他栅格点的高程关系进行判断[14-15]。
图2 地形特征高程点
2)重要地理目标附近的高程点。重要地理目标如道路、房屋、河流等是地图表达分析的重要对象,邻近区域的高程信息更为用户所关注,如道路两侧的高程信息是交通运输中需要考虑的一个重要因素。该类型高程点可通过邻近区域搜寻得到,如河流目标按一定搜寻半径作缓冲区,然后实施空间查询得到缓冲区域内的高程点。
3)分布范围上的关键高程点。分布范围作为高程点群的重要空间分布特征,表现为一个由外围点构成的多边形,如图3( a)所示,其中有的点删除后分布范围发生明显变化,类似于曲线结构的骨干点,称为分布范围上的关键高程点。识别方法可借鉴曲线压缩的思想,利用Dauglas算法按矢高ε对分布范围多边形进行压缩,保留的点即为分布范围上的关键高程点。
( 2)高程点群空间分布特征分析
群点空间分布特征一直是空间分析的重点内容,相关研究从统计分析、视觉识别等不同角度定义了分布密度、分布中心、分布轴线、分布范围、离散度等诸多描述参量。具体到高程点群,分布范围和分布密度是其空间分布特征的两个主要描述参量。文献[10]基于群点Delaunay三角网及Voronoi图模型给出了上述两个参量的定义及分析方法,其中分布范围表现为一个由外围高程点构成的多边形,可在一定视觉距离控制下通过对三角网边实施“剥皮”操作得到;单个高程点的分布密度ρi则定义为包含该点的Voronoi多边形面积的倒数( 1/Si)。
值得注意的是,外围点对应的Voronoi多边形是发散的,如图3( b)所示,无法计算分布密度。可由组成分布范围多边形的每个点向外扩展,扩展方向为范围多边形重心与该点连线的延展方向,扩展距离为该点与周围邻近点距离的平均值,最后得到一批新的虚拟点,然后重新构建Voronoi图模型,此时除虚拟点外的其他点都对应一个封闭的Voronoi多边形,如图3( c)所示。
图3 高程点群空间分布特征
3.Voronoi图支撑下的渐进式选取模型
根据每个高程点的重要性意义和分布密度计算选取概率,然后在选取定额的控制下,基于高程点群Voronoi图模型以一种渐进式删除的方式实施选取。具体过程如下:
1)依据方根模型计算选取基本比例,根据地形地貌特征进行适度调整,得到高程点选取的数量ns。
2)根据类型不同赋予每个高程点相应的语义重要性权值vi,构建高程点群Voronoi图模型,计算单个高程点分布密度ρi,然后根据下式得到高程点的选取概率pi,并按概率值由小到大排列得到高程点集合E{ e1,e2,…,en}。
3)实施抽样删除,即依次取集合E中的高程点元素ei,若ei被“固化”,跳过取ei+1;否则标记为“删除”,同时将与该高程点1阶邻近的其他高程点“固化”,如图4所示。
图4 高程点的单次抽样删除
4)完成第t次抽样后,舍弃标记为“删除”的高程点,计算剩余高程点的数量nt,若nt<ns,执行步骤2) ;反之,执行步骤5)。
5)比较|nt-ns|和|nt-1-ns|,取其中较小者对应的抽样结果作为最后的选取结果。
4.选取结果评价
( 1)语义信息评价
统计分析选取前后重要性意义不同的各类高程点数量变化情况,考察具有重要性意义的高程点是否更多地得到保留。为便于直观分析,定义平均语义重要性权值珋v,珋v值越大,则表明保留的具有重要性意义的高程点越多。
( 2)空间分布特征评价
包括分布范围变化和分布疏密关系保持两个方面的评价:前者定义重叠面积率ρs表示为选取前后范围多边形重叠区域面积与选取前范围多边形面积的比率,ρs越大则分布范围保持得越好;后者采用密度分布图的可视化手段进行考察,即以灰度值线性反映单个高程点的分布密度,然后在对应Voronoi图多边形区域进行可视化渲染。
试验数据如图5( a)所示,共包括2081个高程点,分布区域山地特征明显,区分地形特征高程点(Ⅰ型)、沿河流道路分布的高程点(Ⅱ型)、分布范围上的关键高程点(Ⅲ型),以及其他一般意义高程点(Ⅳ型)。表1为各类型高程点分布数量,图5 ( b)是具有重要性意义高程点(Ⅰ、Ⅱ、Ⅲ型)的分布图。计算单个高程点选取概率时,4种类型高程点的语义重要性权值v依次设置为4、2、4、1,并对分布密度值和语义重要性长度值按线性关系进行归一化处理。
图5 不同选取比例下的高程点分布
表1 原始高程点群中各类型高程点数量分布
为检验算法的有效性,对不同选取比例下保留高程点的空间、语义信息进行分析,选取比例取自结构化选取过程中每次遍历删除完成的时间节点。图5( c)—( f)分别为完成1次、2次、3次、4次遍历后保留的高程点分布。从空间分布特征上看,选取前后高程点群分布范围多边形面积重叠率分别为99.91%、99.19%、99.65%、99.48%,基本保持了原始空间分布范围。图6( a)—( f)分别为不同选取比例下高程点的分布密度灰度图,表明高程点群主体上的空间分布疏密关系也较好地得以保持,其中比较图6( b) (仅选取重要性意义高程点的分布密度灰度图)与图6( f),两者保留的高程点数量相近,但是后者在分布疏密关系保持上明显优于前者。从语义信息上看,图7分析了高程点整体删除比例与各类型高程点自身删除比例间的变化关系,可以发现当整体删除比例较小时,主要删除的是一般意义高程点(Ⅳ型),但随着整体删除比例的加大,具有重要性意义的高程点(Ⅰ、Ⅱ、Ⅲ型)也逐渐被删除且趋势越来越明显。图8则分析了高程点平均语义重要性值与整体删除比例间的变化关系,表明随着整体删除比例的加大,保留的高程点中具有重要性意义的高程点比例越来越大。以上关系表明高程点的语义信息也得到了较好的保持,即保留了更多的重要性意义高程点。
图6 不同选取比例下的高程点分布密度灰度
图7 高程点整体删除比例(横坐标)与各类型自身删除比例(纵坐标)变化关系
图8 保留高程点平均语义重要性值(纵坐标)与整体删除比例(横坐标)变化关系
通过试验可以发现,高程点选取的两个基本原则(即保留具有重要性意义的个体高程点和保持高程点群空间分布疏密关系)一定选取比例范围内存在相斥性。当选取比例较小时,两个原则可以兼顾;但随着选取比例的逐步加大,强调保留重要性意义个体的同时势必影响分布疏密关系的保持,反之亦然。两者间的协调需综合考虑区域的地理环境特征及实际应用需求,最后确定一套合理的各类型高程点语义重要性权值v。
本文针对地形图上的高程点选取问题,提出了一种顾及个体重要性意义与空间分布特征的选取方法,从概念和逻辑层面上围绕上下文特征分析、选取算法模型及结果评价3个方面展开了深入探讨。试验分析表明,该方法可以有效地满足高程点选取的几个基本原则,具有较强的应用价值。
由面向几何特征综合向面向地理特征综合已经成为地图综合领域研究的主要趋势,也是地图综合技术面向应用服务,实现自动化、智能化的关键步骤。这种转变实现的关键在于两个方面:一是地理背景下综合对象的上下文特征体系构建;二是如何将综合对象的上下文特征与通用的综合算法模型有效地结合。本研究可以作为上述问题的一个实例探索,提供一些有价值的思路。
本研究存在的问题及下一步工作:①高程点的定额选取仍以传统开方根模型为主,需要结合区域地形地貌特征进行模型扩展;②结合选取比例变化,深入分析保留具有重要性意义高程点和保持高程点群空间分布特征间的关系,为不同类型高程点的重要性权值等参数设置提供参考依据。
[1] 齐清文,刘岳.GIS环境下面向地理特征的制图概括的理论和方法[J].地理学报,1998,53( 4) : 303-313.
[2] BRASSEL K,WEIBEL R.A Review and Conceptual Framework of Automated Map Generalization[J].International Journal of Geographical Information Systems,1998,2( 3) : 229-244.
[3] 毋河海.地图信息自动综合基本问题研究[J].武汉测绘科技大学学报,2000,25( 5) : 377-384.
[4] SHEA S,MCMASTER R.Cartographic Generalization in a Digital Environment: When and How to Generalize[C]∥Proceedings of 9th International Symposium on Computer-Assisted Cartography.[S.l.]: NSF,1989.
[5] TOPFER F,PLLEWIZER W.The Principles of Selection: a Means of Cartographic Generalization[J].The Cartographic Journal,1966,3( 1) : 10-16.
[6] LANGRAN C,POIKER T.Integration of Name Selection and Name Placement[C]∥Proceedings of the 2nd International Symposium on Spatial Data Handling.Washington D.C.:[s.n.],1986.
[7] VAN KREVELD M,VAN OOSTRUM R,SNOEYINK J.Efficient Settlement Selection for Interactive Display[C]∥Proceedings of AutoCarto 12.Bethesda:[s.n.],1995.
[8] 毋河海.凸壳原理在点群目标综合中的应用[J].测绘工程,1997,6( 1) : 1-6.
[9] REGNAULD N.Contextual Building Typification in Automated Map Generalization[J].Algorithmica,2001,30( 2) : 312-333.
[10] 艾廷华,刘耀林.保持空间分布特征的群点化简方法[J].测绘学报,2002,31( 2) : 175-181.
[11]蔡永香,郭庆胜.基于Kohonen网络的点群综合研究[J].武汉大学学报:信息科学版,2007,32( 7) : 626-629.
[12]邓红艳,武芳,钱海忠,等.基于遗传算法的点群目标选取模型[J].中国图形图象学报,2003,8( 8) : 970-975.
[13] YAN H W,WEIBEl R.An Algorithm for Point Cluster Generalization Based on the Voronoi Diagram[J].Computers and GeoSciences,2008,34( 8) : 939-954.
[14] PEUCKER T,DOUGLAS D.Detection of Surface Specific Points by Local Parallel Processing of Discrete Terrain Eleration Data[J].Computer Graphics and Image Processing,1975,4( 13) : 411-420.
[15] WOOD J.The Geomorphological Characterisation of Digital Elevations Models[D].[S.l.]: Leicester University,1996.
A Method of SPOT Heights Simplification with Spatial Distribution Properties and Significance Individual Preserved
ZHANG Mingfang,YANG Min,ZHOU Qi
针对地形图上的高程点,提出了一种保持群分布特征与个体重要性意义的选取方法。一方面结合等高线表达上的地形特征、河流道路等重要地理目标区分个体高程点的重要性意义;另一方面基于Delaunay三角网及Voronoi图模型提取高程点群分布结构化特征,在此基础上评估单个高程点的选取概率,并以一种渐进式删除的方式实施选取。试验表明,该方法在保留具有重要性意义个体高程点的同时,也可以较好地保持原有的空间分布特征。
地图综合;高程点化简;上下文特征
国家基础科学人才培养基金( J1103409) ;矿山空间信息技术国家测绘地理信息局重点实验室开放基金( KLM201304)作者简介:章铭芳( 1994—),女,主要研究方向为空间数据集成、更新及可视化。E-mail: 525079849@ qq.com
P28
B
0494-0911( 2015) 11-0047-05
章铭芳,杨敏,周启.保持分布特征与重要性意义的高程点选取方法[J].测绘通报,2015( 11) : 47-51.
10.13474/j.cnki.11-2246.2015.0344
2014-11-02