刘江涛
(深圳市规划国土房产信息中心,广州 深圳 518034)
随着我国各地数字地理空间框架建设日益完备[1],大规模、多样化和快速更新的城市数据已经构成了“大数据”的必要条件[2]。然而,这些数据资源虽然数量庞大且丰富多样,但往往分散在相互割裂的专业领域和系统中,不同领域的数据生命周期也各不相同,存在空间信息层次割裂、非空间信息难以空间化、空间信息与非空间信息缺乏上下文关系,难以建立有效数据关联等一系列问题[3-5]。针对以上问题,本文围绕土地、建筑、房屋和人(法人)四大实体,探讨面向“地—楼—房—人”一体化大数据集成关键技术和思路。
传统各部门电子政务系统是相互割裂的,地理空间框架建设解决了空间数据共享问题,“一门一网式”政务信息化改革,有望打通行政服务的统一[6]。然而,面向城市规划、建设和管理实际业务需要的,跨部门和跨领域的城市空间统一标识、统一管理、统一管理和统一服务仍存在技术和机制难题。如图1所示,本文面向土地、建筑、房屋和人(法人)四大领域,以“地-楼-房-人”一体化集成框架为关键技术载体,探讨解决以下工程技术问题:
图1 “地—楼—房—人”一体化集成框架Fig.1 The "land-building-house-people" integration framework
1)一体化数据模型:解决不同来源、不同业务的数据统一编码和建模的标准问题。
2)城市空间统一编码中心:解决跨部门空间实体统一编码和标识问题。
3)多维数据融合及自动建模:解决“地-楼-房”业务审批主线中,业务数据空间几何、结构或指标等丰富的空间语义之间的集成问题。
4)非空间信息自动寻址:解决自然语言描述的非空间信息与富业务语义空间实体关联问题。
5)数据协同更新:解决城市统一数据采集、汇交、甄别、审查、确认和共享利用问题。
如2所示,针对城市建设管理、社会经济、行业发展等各类信息空间化及在不同空间尺度上空间协同的需要,围绕土地、建筑、房屋和人(法人)四大实体,从土地“批准—供应—使用—补充—监察”,建筑“设计—报建—施工—验收—使用”,房屋“预售—交易—登记—租赁—使用”,人(法人)“登记—活动”等四个领域的数据生命周期出发,将具有自然语义的不规则空间语义和业务对象实体进行关联,增强剖分空间与实体目标间映射对应的适应性,形成可以满足多尺度应用需求的空间编码体系。按照市—区—街道—社区—基础网格—宗地—建筑物—房间八个尺度将城市地理空间进行划分,并为每个城市空间赋予了唯一编码,并以空间编码为核心,与空间坐落(网格)、空间坐标、地址门址以及各类属性动态关联和有效约定,并将空间维度和业务维度纳入统一模型体系,既满足不同精度空间划分的需要,也满足不同业务信息管理的需要,为城市各行业的编码关联起来提供基础。各行业编码均可以在空间编码体系的相应尺度上找到对应空间区域,实现各行业编码及其信息的关联共享,以及城市规划建设管理工作的统筹和协调。
图2 “地—楼—房—人”一体化数据模型Fig.2 Data model of“land-building-house-people”
以“地—楼—房—人”数据模型为标准,以地楼房空间实体为核心,整合规划报建、建筑普查、竣工验收、预售查丈、遥感监测和房屋租赁等多来源数据,建立全市统一的空间编码数据库,通过数据工程保证存量数据在标准和语义上的一致性。统筹规划部门、测绘部门、社会管理和违法监察等部门,制定空间统一编码和更新机制。通过规划报建、外业踏勘、社区巡查和违法监察等多种方式发现城市空间变化内容,采用全市唯一的编码生成器,维护不同来源、不同业务建筑和房屋数据编码数据的一致性,通过编码中心系统实现对建筑编码的统一管理。城市空间编码统一中心贯穿空间实体报建、建设、变化和消亡的全生命周期,对于合法报建空间实体,在报建之初由编码生成器根据报建位置生成预编码,并在房屋查丈中扩展房屋编码以及在竣工验收中生成永久建筑物编码;对于未报建实体,通过遥感监测或社会巡查发现新增建筑物,由工作人员在系统中标注新增建筑物位置,经编码生成器预编码,并在后续违法监察或建筑普查的精确测量并生成永久编码。
梳理“地—楼—房”相关土地确权、用地审批、规划报建、规划验收和房产登记等业务环节产生的各类数据关系,在土地确权阶段获取地籍数据、在用户审批阶段获取规划设计要点、在规划报建阶段获取三维报建模型、在规划验收阶段获取建筑验收和房屋验收CAD文件,房屋登记阶段获取房屋产权人信息,根据“地—楼—房—人”数据模型,建立不同数据之间的语义关联,如建筑信息关联楼层数、层高、层平面图;房屋信息关联户型的图形要素以及房屋编码、建筑面积、使用面积、分摊面积、房屋性质、房屋类型、用途、产权状态、所在楼宇编号属性等信息。利用规则建模技术实现三维管理单元的构建[7-8],利用三维地籍拓扑构建技术实现三维产权体的构建[9]。针对CAD文件,提取CAD模型中包括几何、物理、规则等丰富的建筑空间和语义信息,以及CAD模型内部要素间相互关联关系,同时基于语义信息实现复杂三维模型的简化,自动实现基于CAD模型的室内三维模型构建[10]。构建的三维产权体、立体控规体、建筑模型、室内模型与数字深圳现有三维场景实现无缝的整合,实现在同一场景下对三维地籍、立体控规、建筑模型和室内模型的集成浏览查询和冲突检测分析。
针对公共教育、劳动就业、社会保险、社会服务、医疗卫生、住房保障、文化体育等业务中产生的大量用自然语言表述的非空间信息,在传统地址编码技术的技术上[11],结合“地-楼-房-人”一体化数据模型,建立自然语言与统一编码和空间实体之间的关系,实现了自动寻址引擎及在线匹配服务。引擎综合比对公安门址与建筑物普查门址信息,创建门牌数据索引,其数据组织结构可以分为:一级索引、二级索引和门牌号数据,索引与建筑物编码关联,将门址信息纳入“地-楼-房-人”数据模型,并通过HASH方法,实现门牌号的高速检索。采用计算语言学理论和方法,在“中文自动分词”算法的基础上实现基于“正向最大匹配分词”的分词算法,保障分词的精度和准确。区别传统地址匹配方法,地址与坐标的转换,基于“地-楼-房-人”模型的,实现具有业务语义的自然语言与不同层次空间实体的关联。
在“地-楼-房-人”一体化数据模型的基础上,针对“地-楼-房-人”数据,分别建立数据来源的数据价值分类、数据更新模型、数据动态更新机制,对于不同的数据来源分析其各个数据项的可信度,不同来源的相同数据项根据数据来源的数据项可信度来建立数据更新模型,实现多种来源数据通过一套统一的更新规则更新到地楼房人数据库。以协同更新系统为核心,实现各个政府部门及时汇交数据、甄别评估数据,专门的管理部门对地楼房人数据进行数据逐条入库审查、确认,并实现地楼房人之间的相互数据关联,全市的地楼房人的业务管理部门和专题数据管理部门在一体化协同更新系统中实现数据的采集、汇交、甄别、审查、确认、共享利用,保障地楼房人数据是动态性和完整性,系统包括地籍动态更新、房屋动态更新、人口和法人动态更新等部分。
本项目采用各类开源大数据组件实现大数据加工及管理技术框架,框架对通过自动寻址、协同更新和多维融合等集成途径获取的各类空间和非空间数据进行统一封装,在实现分布式的索引、存储和计算的同时,实现数据安全、数据质量、数据集成、调度建库和集群管理功能,通过对数据整合的全过程监控,为数据的安全和数据质量提供保障。
研究相关成果投入试运行以来,已初步形成利用近2万人的出租屋网格综合管理员,发现建筑变化,并结合建筑规划验收数据核实补充建(构)筑物的工作机制,截止2016年底,平均每月通过租赁巡查,更新建筑物约400栋,通过竣工测量更新月200栋,实现全市2000万身份证,220万法人组织机构代码证与建筑编码的关联,推进了传统批量更新向面向业务的增量式日常更新的转变。随着“地-楼-房-人”一体化数据集成框架的逐步应用,有望实现跨多部门的数据协同更新,保障多领域地楼房人数据是动态性、完整性和一致性。
本研究是数字城市向智慧城市转型升级期间的重要城市工程,打通规划报建、竣工验收、预售查丈、房产登记、租赁登记和个人信息登记等多个跨部门业务环节,本文关键技术的综合应用,可以实现多领域空间信息与业务信息的整合、进而支持基于空间的深度业务应用集成,为城市数据资源的深度挖掘、揭示深层次空间模式奠定基础。