地理实体与政务专题数据关联融合方式研究

2018-08-30 00:44张建英刘高
城市勘测 2018年4期
关键词:政务关联实体

张建英,刘高

(1.嘉兴市规划管理局,浙江 嘉兴 314000; 2.武大吉奥信息技术有限公司,湖北 武汉 430223)

1 引 言

当前,政务大数据建设在各地方政府中得到空前重视,各地政府纷纷投入巨大资源建设政务大数据。政务大数据的一个显著特征是具有典型的空间特性和时间特性。因此,如何解决政务专题与空间信息的关联,实现政务专题数据的实时空间化,成为当前研究的一个热点。

空间信息具有唯一性,是空间信息能够成为关联和承载其他政务信息的载体,这个载体,具体体现为地理实体数据。地理实体数据实现了地理信息的对象化,是地理信息能够像其他信息一样由当代计算机技术进行处理和分析,从而推动了空间信息和专题信息的融合。使政务信息的关联和大规模空间分析和挖掘成为可能。

2 地理实体数据

2.1 地理实体

地理实体是指现实世界中具有共同性质的自然或人工地物,是具有社会意义的最小地理单元。地理实体数据是在原有基础地理数据基础上,按照一定的标准与规范抽取、转换而获取,它是专题数据进行融合挂接的载体,是时空信息平台的时空地理基础[1]。

空间特征的描述与表达 表1

地理实体数据最基本的特征是其空间特征,在空间特征表达上,采用点、线、面形式来描述和表达数据,如表1所示。每一个地理实体根据其在自然环境中的形态选择表现形式,可同时采用多种表现形式。

2.2 地理实体数据组织

(1)点状数据几何表达基本规则

地理实体的点状数据以地理位置标识点表达,地理位置标识点的定义规则如下:①区域实体点状数据的地理位置标识:行政区划的政治、经济、文化中心所在地的点位;行政区划内标志性建筑物的点位;面状区域的重心点点位。②线状实体点状数据的地理位置标识:线状实体中心点的点位;线状实体中心线系列点的点位;线状地物(河流、山脉等)的标志点。③点状实体点位数据的地理位置标识:门(楼)址标牌位置或建筑物内任意点的点位;标志物中心点的点位;自然地物的中心点或标志点。

(2)线、面状数据几何表达基本规则

地理实体数据的几何表达应遵循以下规则:①以线表达的水系、交通等要素应保证线段的连续。例如,面状河流或道路应提取骨架线或中轴线,并与相接的线状河流或道路构成连通网络,遇有桥梁使河流或道路中断时,应在断开处添加线段使河流或道路保持连通。②以面表达的政区、院落、房屋等要素应保证面的封闭。例如,表示院落时应提取构成院落轮廓的边线并构建封闭面。③正确处理要素间的空间关系,保证要素间空间关系的合理与逻辑一致。例如,以河流为界的界线数据,表示界线的线应当与表示河流的线在空间上一致。

(3)数据一致性处理

地理实体数据可能存在多种几何图形表现形式,数据之间的一致性,通过实体标识码进行维护。凡具有相同实体标识码的几何对象,均认为其是一个实体的不同表现形式。

(4)数据逻辑组织

地理实体数据以空间连续、内容分层的方式进行逻辑组织。地理实体的图形数据由单个或多个点、线、面几何对象组合而成,它具有特定的地理意义与空间唯一性,能够与相关社会经济信息进行挂接,满足信息交换共享的需要。地理实体数据采用标识码来唯一标识每个对象。

4.血矛线虫病。捻转血矛线虫宿主的感染主要在温暖季节,在温暖季节血矛线虫病发生较多,本次呈慢性经过, 直至动物死亡。

地理实体的属性由基本属性、扩展属性、专业属性三部分组成。

基本属性:指确定其唯一性而应具有的属性,作为所有地理实体的必不可少的内容存在;基本属性提供地理实体与其他扩展和专业属性关联的信息。扩展属性:指地理实体所关联的具有共享性质的社会经济属性,凡专业管理部门有明确标准管理的,采用行业标准。专业属性:指专业部门根据管理需要赋予实体的专业性、行业性的属性内容。

2.3 地理实体数据建设

现状地理实体建设思路为:根据相关标准,在矢量、三维、地名地址等数据的基础上,细化包括房屋、道路、水系、院落等在内的重要地理单元的划分颗粒度,以现实世界中可以独立的对象作为空间单体的最小表达模型,并赋予唯一的标识ID。

历史地理实体建设思路为:按照地理实体标准规定,通过现状地理实体数据与已收集的多种历史数据比对,将现状地理实体数据中已采集的数据修正其产生和消亡时间,将已消亡的地理实体进行补充采集,形成具有一定时间序列、统一时空基准的地理实体数据库,地理实体数据生产和建库流程如图1所示。

图1 地理实体数据生产和建库流程图

3 政务专题数据建设

3.1 空间化要求

政务专题数据空间化是通过专题数据与地理实体的关联融合所实现的,采取“软件自动化+人工干预”的处理方式,空间化的成果数据输入到政务专题数据库中。

政务专题数据与地理实体的关联可采用以下几种方式:①政务专题数据中含有地址项,但地址信息不标准,将地址信息标准化之后,根据标准地址进行关联。②政务专题数据中含有位置坐标项,通过与地理实体位置信息进行空间分析关联匹配。③政务专题数据中含有实体名称项,通过实体名称进行关联。④政务专题数据中含有实体标识码项,通过实体标识码进行关联[2]。⑤政务专题数据中含有个人的身份证号或企业的统一社会信用代码,通过身份证号或统一社会信用代码与其他已空间化的数据进行关联[3]。

专题数据空间化须遵循以下要求:①专题数据须检查拓扑关系,与背景要素(道路面、建筑物、植被、水系图层)拓扑关系保持一致。②专题数据各信息点要素相对空间位置关系正确,无重复或遗漏。③对于精确匹配上图的政务专题数据,专题数据在底图上的位置与相应POI或地址的位置须保持一致。

3.2 技术流程

政务专题数据空间化包括数据清洗整理、地名地址匹配、空间信息挂接三个部分,具体如图2所示。

图2政务专题数据空间化的技术流程图

3.3 专题数据空间化

首先进行数据清洗整理:单位提供接入的政务数据格式、结构均不相同,为了能更准确地进行地名地址匹配,须对政务专题数据进行清洗整理,依照数据自身情况,共5种不同的处理方法:①空间数据:无须处理,可直接用于各类应用。②已汇总Excel表格数据:调整字段格式,保证其可以在导入GIS软件后正确显示。③已汇总文本数据:导出为Excel表格形式,调整格式。④未汇总表格或文本数据:汇总为Excel表格形式,调整格式。⑤数据库格式数据:先行在数据库进行整理,导出为csv数据,并转换为Excel表格数据。

然后进行地名地址匹配:基于地理实体数据库,利用地名地址建库工具,创建标准地名地址数据库索引,发布地名地址匹配服务,提供地名地址匹配的能力。地名地址匹配,支持两种方式:①地址匹配。将专题数据中的地址信息与标准地址进行匹配,挂接坐标值。②地名匹配。将专题数据中的地名信息与地名地址进行匹配,挂接坐标值。可支持的城区地址描述结构为:[行政区划]+[街路巷]+[门牌号]+[小区/单位]+[楼栋号]。可支持的郊区地址描述结构为:[行政区划]+[乡镇]+[村庄名]+[组/队]+[门牌号]。

最后进行空间信息挂接:获取匹配上的地理实体标识码信息,并补充到政务专题数据属性中,即可完成专题数据空间化。

3.4 专题数据管理

政务专题数据和地理实体数据一样,具有可以唯一标识地理对象的属性字段。通过这个字段,最终实现政务专题数据的空间化——政务专题数据能够随时根据这个唯一标识关联字段找到对应地理实体,从而获得它的空间信息。

空间化后的政务专题信息,纳入时空信息大数据管理系统进行统一存储和管理。

对入库的政务专题数据按照相应的标准进行分类存储,可以通过多维度的分类方法对数据进行分类,提高数据存储以后的应用效率,对所整合后的数据进行统一存储。

3.5 数据关联融合应用效果

通过地理实体与政务专题数据的关联融合,可以实现空间展示每栋房子关键的各类专题数据,通过热力图,渲染图等展示用电用水活跃生活居住区,活跃办公区,建议停车位规划位置等。

空间化后的政务专题信息,以地理空间为桥梁,可建立数据之间广泛的关联关系[4,5]。

图3嘉兴市城市脉动效果图

4 结 语

政府测绘地理信息部门对本地区地理实体数据利用主要是满足国家、省级和本地区的需求。在基于地理实体数据利用的同时,由于政府测绘地理信息部门和国土、交通、水利等行业部门积累的大量基础地理实体数据或政务专题数据标准不统一、形式和内容也存在差异,还需要对测绘地理实体数据和政务专题数据进行整合加工和必要的改造,使其符合地理实体数据认知的表达要求,构建通用数据库样本库以及本地区的框架数据库、基本比例尺数据库和专题数据库,生产满足国家、省级和本地区需要的各类专题产品[6]。

建立共享与交换机制、时空大数据与政务信息的融合会更好地服务城市空间治理现代化,各类政务专题数据的汇聚和关联,是通过地理实体数据实现的。地理实体数据库与人口库、法人库和经济库合称为城市四大基本库,作为四大基本库之一,地理实体库提供地理对象的划分、标识、唯一性维护等功能。通过地理实体库的建设,建立起具有唯一标识体系的空间地理基础信息,为各类专业信息提供空间位置信息和空间定位能力[7]。新型地理实体是城市大数据的核心,为跨部门数据融合、智能化应用开拓了一条新路径。

猜你喜欢
政务关联实体
不惧于新,不困于形——一道函数“关联”题的剖析与拓展
前海自贸区:金融服务实体
“一带一路”递进,关联民生更紧
奇趣搭配
实体的可感部分与实体——兼论亚里士多德分析实体的两种模式
两会进行时:紧扣实体经济“钉钉子”
振兴实体经济地方如何“钉钉子”
智趣
政务
政务