空间数据融合技术在编制数字现状图中的应用

2021-07-05 09:38唐忠成何元禹
地理空间信息 2021年6期
关键词:面状数据源实体

唐忠成,何元禹,张 允

(1.广州市规划和自然资源自动化中心,广东 广州 510030)

摸清城市用地现状,全面调查区域内用地和公共设施现状情况,并按统一的技术标准,编制数字化用地现状图,建立现状用地数据库是进行城市生态环境、人口承载、历史文化和社会经济发展水平等现状评价的基础。数字化用地现状图既是城乡现状评价的基础资料,也是城市空间规划编制的重要现状资料。

数字化用地现状图内容包括域内各类土地利用现状、公共设施和交通设施,其中土地利用现状包括耕地、园地、林地、牧草地以及其他的农用地,自然水域和保留地等不同用地类型的分布和空间界线等[1]。按照地理空间特征和GIS数据表达要求,这些内容以面状和点状要素表达。本文在深入研究国土、规划各类数据的业务和内在逻辑关系的基础上,探讨了如何利用空间数据融合技术,编制数字化用地现状图,其难点是面状要素的矢量数据融合技术。

1 数据源分析

国土、规划管理部门积累的数据主要包括基础地理数据、业务数据、各专项调查数据,这些数据来自于不同的应用平台,工作任务、获取手段、技术标准、来源等均不同,导致数据标准、空间基准、制图规范存在差异[2]。

1.1 数学基准差异

数据源的数学基准因业务、应用要求等不同,导致如坐标系统、空间尺度、比例尺等存在差异。国土部门的数据按国土资源管理的要求,采用西安坐标系,地方规划管理部门的数据采用的是地方坐标系统。二者之间必须通过坐标转换,统一到数字化用地现状图目标坐标系统中。

1.2 数据异构

数据异构主要指数据结构上的差异。国土业务数据按土地分类国家标准对非建设用地分类描述,规划数据按城市建设用地分类标准对建设用地分级分类描述。因数据内容、系统要求、数据生产方式等影响,国土和规划的数据结构存在较大差异。

1.3 时态差异

数据的时态是数据现势性的最重要指标。数据来源广泛,生产前期未统筹规划,各部门的数据生产时间、周期以及更新频率无法统一。理清各数据源的时序,按时序确定数据的采信优先顺序可提高目标数据的现势性。

2 数据之间的关系

分析数据之间的关系,目的是为了评估数据源对目标数据的使用价值或贡献度,从而制定各类数据源采信规则。数据之间的关系包括数据源之间的关系,以及数据源与目标数据的关系,体现在数据源的时态关系,表达内容以及内容之间的逻辑关系、表达方式、属性结构关联等方面[3]。

国土规划业务数据与调查统计数据之间存在着错综复杂的逻辑关系,如国情普查数据表达的内容包含着非建设用地和建设用地数据内容;非建设用地和建设用地数据空间关系上成互补关系;设施点和建设用地面的用地性质必须匹配,而且在数据表述,属性字段值之间也相互关联。分析数据之间的关系,根据数据源对目标数据的贡献度确定数据采信规则;分析属性结构的异同,属性字段值的表达和语义,确定目标数据的属性值的获取方式,在数据融合的过程中以软件工具的方式贯彻这些规则,可以实现快速编制数字化用地现状图。数据之间的关系如图1所示。

图1 数据之间的关系图

3 空间数据融合的关键技术

空间矢量数据的融合主要包括两方面:几何特征融合和属性融合,其中几何特征融合主要解决的是面状实体在不同数据源中地理位置和形状不一致问题。不同数据源的面状实体要素匹配是数据融合的关键。

面状实体要素匹配是基于面要素的空间相似性的[4]。存在于不同的数据源同一目标地块面要素的几何图形、拓扑关系和语义具有相似性,比如地块的位置、面积、形状等相似性指标,分别以M、N、W表示。

3.1 面实体位置相似性指标算法

以面实体的几何中心点位置作为唯一标识[5],A、B两个面实体的位置相似性采用两实体几何中心点欧几里得距离计算,计算公示为:

式中,O为面实体的几何中心点;Dmax(PA,PB)为A、B两实体边界上任意两点间的最大距离;M值越小,面实体位置越相似。

3.2 面实体面积相似性指标算法

式中,S为A、B实体的面积;Max(SA,SB)为待匹配面实体中面积最大值;N值越小,面实体面积越相似。

3.3 面实体形状相似性指标算法

首先将待匹配的数据源比例尺变换一致,由面实体的质心按固定的角度向面边线做n个向量,计算待匹配的A、B两面实体相同角度的向量模V,求出两个面实体模差的绝对值之和W,n取值越大,计算量越大,面实体匹配结果的可信度越高。W越小,A、B两个面实体的形状越相似。

3.4 识别多源数据中的同一目标面状

以面实体的3个相似性指标作为依据,根据不同数据源的特征,确定其指标权重,最后求出位置、面积、形状的加权平均值,值越大,待匹配的两个面实体相似性越高,被匹配融合的概率也高。

4 数字化用地现状图编制

由图1可以看出,用地现状图的过程数据由非建设用地和建设用地构成,它们之间为包含与被包含的关系。因此利用各数据源,先进行空间矢量数据融合,再调整属性数,得到非建设用地和建设用地数据,二者合并接边处理后生成用地现状图。根据目标数据对设施点的类别和规模要求,按采信规则,从相关数据源中提取符合要求的设施点,然后与建设用地相匹配,检校设施性质与用地性质的一致性,进行属性数据融合后得到设施现状数据。图2为现状图编制的技术路线。

图2 编制用地现状图技术线路

4.1 统一数据基准

1)数学基准。通过坐标转换,将数源据坐标系统统一到规划编制要求的地方城建坐标系统上,统一计量尺度和单位。

2)现状图精度。图形精度依赖于数据源的数学精度和图斑大小。图斑大小是各类不同属性的地块最小用地面积的统计规模,即小于最小用地面积统计规模时,应对地块进行合并处理。用地现状的主导地类设定为建设用地中的城乡居民建设用地、交通设施用地、非建设用地中的水域和农林用地[6]。用地现状图图斑大小确定的原则是能准确统计区内主导地类的规模和空间分布,其确定的具体方法是:检索数据源中主导地类的最小图斑面积,将主导地类的最小图斑面积确定为面状实体合并的阀值[7]。在本文的实践中,根据主导地类面积检索结果,城乡居民建设用地中的绿地类图斑面积最小,仅为10 m2,取10 m2为图斑合并阀值,即地类面积最小10 m2是将会被合并。

4.2 数据源采信规则设计

建立数据采信规则主要从数据源对目标数据的贡献度、数据源的现势性和精度3个维度考虑。对不同类别数据源的贡献度、现势性和精度进行评分和赋予不同权重,计算加权平均值求和,由大到小采信前三的数据进行数据融合。以建设用地数据的数据源的采信规则设计为例,如表1所示。

表1 采信规则设计

4.3 空间矢量数据融合

以数字化用地现状图的建设用地层为例,应用空间矢量数据融合技术,人工检视辅助进行矢量数据融合。按照采信规则,分别遍历图1中所示的与建设用地相关的7个数据源,计算各数据源的综合得分,从用地审批数据、土地利用现状调查数据和地籍数据中识别到具有高空间相似性得面状实体要素(如图3)。采信优先顺序由高到低是:图3a用地审批数据、图3b土地利用现状数据、图3c地籍数据。通过图形关系协调、合并、更新等操作,得到了面状要素空间矢量数据融合结果,如图3d所示。

图3 面状要素空间矢量数据融合示例

4.4 属性数据融合

数据匹配解决目标数据各图层之间属性匹配问题。数字化用地现状图各图层是高度相关的,图层之间、同一图层的属性与空间位置之间有着严密的逻辑关系,如公共和交通设施的设施类别与土地利用现状用地性质的一致性,设施图层的行政区划字段值与设施实际的空间位置的一致性。首先根据现状调查的总体目标和数据应用需求,确定数字化用地现状图各图层的属性结构,梳理各数据字段之间的关系,然后制定属性字段值的获取规则。

采用基于规则的属性映射方法生成属性数据。分两步进行:建立源数据属性和目标数据属性之间的映射和转换规则,如字段值复制、分解提取、字段值转换及合成等;对源数据数据进行计算,获得目标数据所需的字段值并将字段值写入对应图层属性表中。

5 结 语

在广州市的全域数字化地现状图编制过程中,综合评估数据源的质量、业务关联性等因素,应用计算机技术开发软件工具,实现多源数据自动融合,快速编绘数字用地现状图初步成果,再以人机交互方式,对初步成果进行检查,最终获得高精度数字化用地现状图成果数据。该成果为广州市国土空间规划编制提供详实准确的用地和设施的现状信息,有力的支撑了国土空间规划编制。

猜你喜欢
面状数据源实体
利用ArcGis实现森林资源管理“一张图”线转面的方法探讨
前海自贸区:金融服务实体
顾及遥感影像特征的面状地物轮廓简化
Web 大数据系统数据源选择*
实体的可感部分与实体——兼论亚里士多德分析实体的两种模式
基于不同网络数据源的期刊评价研究
两会进行时:紧扣实体经济“钉钉子”
振兴实体经济地方如何“钉钉子”
基于真值发现的冲突数据源质量评价算法
基于快照差的面状地理要素增量信息表达模型