基于主数据治理的房屋基础库建设和应用展望

2022-12-26 13:41:42深圳市城市建设档案馆刘一
中国建设信息化 2022年23期
关键词:数据模型房屋编码

文|深圳市城市建设档案馆 刘一

1.引言

随着数字政府和智慧城市建设的不断深入,房屋业务场景越来越趋于向跨部门、跨行业和跨领域的业务融会贯通方面发展,相关需求日益迫切[1]。由于涉房屋的业务系统众多,且长期以来分散建设,缺乏整体规划,存在数据冗余、割裂和孤立等现象,异构业务系统之间的集成十分困难且代价高昂等问题[2]。

本文旨在研究城市统一房屋基础库的设计、建设和服务方法,实现城市房屋数据的集中管理、安全规范、充分共享、全面服务,汇聚和整合多种数据来源的海量异构数据,建立房屋基础数据体系,形成权威的房屋主数据资产,全面支撑公共住房、房地产市场、物业管理、住房保障、租赁市场、流动人口租赁管理、老旧小区改造、地下室安全管理等应用,以及从房屋规划、建设、验收、登记到房屋交易、运维、拆除灭失的全生命综合协同管理。

2.房屋主数据模型设计

2.1 现状分析

深圳市房屋数据主要来源于规划和自然资源部门的不动产登记系统,社会治理部门的网格管理系统,以及住房建设部门的共住房基础信息平台、房屋租赁管理信息系统、房地产信息平台、产业用房租赁平台等业务系统。不同来源的房屋数据在基本属性,空间属性,权属属性,现状属性等信息方面具有差异性特征。例如网格管理房屋具有数据量大,属性采集项多的特点;不动产登记房屋数据的业务属性强,准确性高,并具有法律效力;住建相关系统中房屋数据业务类别和数据应用场景丰富,有较强的业务联动需要。

2.2 主数据特征

主数据是指具有高业务价值的,可以在组织内跨越多个业务部门被重复使用的数据,是单一、准确、权威的数据来源[3]。与传统房屋业务型和分析型数据相比,房屋主数据具备以下几个特征:

标识唯一性:针对不动产登记编码、BIM 房屋分类编码,实有房屋编码等差异化房屋业务编码体系,建立全市唯一的房屋编码体系和房屋实体的唯一标识规则,支持多领域数据的关联融合和数据的统一管理。

长期有效性:房屋主数据贯穿于房屋设计、建设、运营、管理和服务等全生命周期,房屋主数据所代表的业务对象长期存在并具有高价值特征。

业务稳定性:房屋主数据描述房屋业务的关键信息,无论业务过程如何复杂和持久,除非主数据特征发生变化,否则主数据本身的属性不会随业务过程而被修改。

模型一致性:针对竣工验收CAD 数据、不动产登记证照数据、室内测量三维模型数据、工程建设BIM 模型数据以及各类传统业务关系数据等模型异构难题,设计支持几何、语义、图像和属性等多种模型特征的房屋实体模型,保证主数据在不同领域关键特性的一致性。

2.3 主数据设计

房屋主数据模型描述了一组约束(规程)、方法和技术解决方案,用于保障房屋全生命周期内基础数据和跨业务相关数据的一致性和联动性。如图1 所示,房屋主数据的概念模型,以房屋实体为中心,从模型语义、几何、主题、模型等维度对于房屋进行抽象。针对房屋数据在规划、建设和运营的过程中,在组织内或组织间会产生大量的数据内容的难点,设计支持时态化的数据格式,不同时态的模型可以聚合成全周期房屋模型和信息链,不同阶段支撑不同的业务应用,以及跨领域数据分析。在房屋主数据模型中,核心特征包括:

房屋几何特征:指经过竣工验收并进行了不动产登记的法定几何数据,该数据具备严格的不动产几何定义,不以其他业务为转移。

房屋语义特征:指经过房屋政务审批或者房屋信息登记等语义内容,例如房屋面积、结构等客观存在的房屋物理特征。

房屋主题特征:指不同领域形成的房屋主题信息,主题信息在特定领域的房屋周期内,具体领域共性特征。例如房屋的权力人、租赁人等。

房屋模型特征:指利用实景三维或BIM 等技术建立的实体化的三维模型数据。房屋三维模型与其几何特征在拓扑关系方面保持一致关系。

房屋拓扑特征:指房屋与房屋之间关系,例如房屋楼盘表通过表格的形式表达的房屋与房屋之间的临近关系,三维分层分户图在三维空间中体现了房屋与房屋之间的拓扑关系。

图1 房屋主数据概念模型

3.数据治理架构和流程

3.1 数据治理架构

深圳市智慧住建项目采用“1+2+3”总体框架,包括1 个基础平台,2 大工程(BIM工程和数据工程),和3 大应用(智慧建造、智慧安居、智慧政务)。房屋基础库是智慧住建数据工程主数据库的核心组成部分,其为住建业务板块的各类应用提供统一的数据底板,打通了房屋业务关联与数据联通,建立统一的标准规范与监管体系。

如图2 所示,房屋基础库建设包括数据源层、数据汇聚层、数据治理层、基础数据层和业务数据等5 个层次。

数据源层:存储于各单位数据库或其他城市公共基础数据库的房屋相关数据,主要来源包括不动产登记数据、网格管理房屋数据、公共住房、房屋租赁、房屋安全和房地产等相关数据。

数据汇聚层:通过数据库连接、服务接口调用等方式汇聚跨部门和跨行业的房屋数据将市规划和自然资源部门、社会治理部门等房屋数据进行汇聚,在城市大数据中心形成各部门的原始主题数据。

数据治理层:通过数据抽取、转换和清洗,对汇聚数据按照数据质量管理要求进行质量稽核、一数一源梳理,形成面向通用需求和业务需求的各类数据集合。

基础数据层:对于房屋基础库的房屋固有基础信息,例如房屋编码、房屋用途、房屋性质、楼层数据、建筑面积、房号、单元号、住宅房型等进行统一管理,形成智慧住建的统一数据底座。

图2 房屋基础库总体架构

业务数据层:通过相应的业务、应用规则从基础库中抽取形成扩展表。与各业务系统联通,支持业务回写更新数据,业务数据层主要为各类业务提供业务支撑。

3.2 数据治理流程

(1)统一编码。房屋主数据以房屋编码为唯一标识,在划分房屋单元时赋码建立。因房屋拆分、合并等导致房屋变更,产生新的房屋单元,应编制新的房屋编码。每一栋建筑物房屋赋予统一的数字编码,成为建筑物房屋唯一的“身份号码”[4]。

(2)探索性数据分析。分析数据基本情况,包括各类数据的数量、数据精度、来源、空间坐标系、更新途径、更新时间、数据标准结构、属性值字典表等。分析不动产登记房屋数据与网格管理实有房屋数据之间关联关系,包括两者之间楼栋编号、楼栋名称、层号、房屋编码、房号等属性的关联关系。

(3)模型选定分析。在探索性分析的基础上,分析基础房数据模型,包括不动产登记数据模型、房屋调查数据模型、房屋测绘数据模型和房屋BIM 数据模型等。分析房屋模型高价值和业务稳定的语义、几何和属性特征,例如房屋拆分和合并会导致房屋变更,产生新的房屋单元,应编制新的基础房编码。

(4)推断分析。根据数据分析确定的基础情况对所定模型或估计的可靠程度和精确程度作出推断。主要包括数据重复、关键属性数据为空、属性数据存在乱码或特殊字符、属性数据包含空格等问题。将作业过程中发现的问题进行汇总并提出可行的解决方案。

(5)房屋数据特征分析。房屋主要特征包括面积、户型、结构、用途、房屋性质等。房屋基础库不针对特定业务领域,因此可以在不同的应用场景中明确不同业务分类。若房屋经过不动产登记,则以不动产登记优先确定主数据属性的稳定性,若未经过不动产登记,则通过网格管理的建筑调查或其他专项调查采集的房屋数据为主确定主数据属性。

(6)数据预处理。在进行数据整合之前,对不动产登记中心数据和网格管理房屋数据进行梳理,包括剔除数据中存在的重复数据,并对乱码数据、特殊字符、非法字符等进行处理,避免因数据格式而造成无法挂接。

(7)数据管理。根据两套数据的数据分析结果,可先对同一空间位置下且满足以下条件的房屋数据建立关联关系:建筑名称相同或名称主体相同;房屋所在楼层相同;房号相同或房号主体相同;房屋所在建筑总层数相同;面积差额小于任一方数据房间的10%.

(8)外业核查。对于数据整合过程中需要外业核实处理的房屋数据,建立数据救济和数据核查机制,进行外业核实修订。具体包括:分幢不一致且无法通过内业建立对应关系的楼栋;房号不一致且无法通过内业建立对应关系的房间;其他需要实地考察的楼栋和房间。

3.3 数据更新流程

房屋主数据通过协同更新系统实现跨部门协同式动态更新[5],协同更新系统核心流程包括:

(1)数据接入。通过服务接口的方式接入不动产登记房屋、网格管理房屋等数据,动态获取增量数据,并且做相应的标准化处理。

(2)数据处理。根据本文描述的数据治理流程,形成ETL 脚本和规范性数据处理模块,横向处理不同来源的数据,纵向实现数据的管理融合,对于无法自动实现的数据,转由人工判别处理,启动救济机制。

(3)统一赋码。采用全市统一取码器对于新增房屋进行统一的编码。

(4)数据入库。更新数据进行抽取和数据融合,融合成功后入房屋基础库,并标记更新,同时对数据映射关系表进行更新。

4.数据应用展望

4.1 业务支撑

如图3 所示,业务数据可以基于主数据进行业务扩展,满足特定领域数据需要,房屋基础数据库建立与各业务系统数据流转双向业务服务接口,房屋基础库的建设可以有效支撑公共住房、房屋租赁、产业用房、房屋安全、不动产登记、房地产信息等业务系统,满足数据变更和提供数据查询服务。房屋主数据库变更将直接推送到各业务库,通知房屋扩展数据做好变更处理工作。业务数据变更将通过服务接口向主数据库提起变更申请,对于更新审核通过的数据,将按照房屋基础库入库规则同步更新至房屋基础库中,对于审核不通过的数据,将推送回各业务部门进行核实并反馈结果。

4.2 应用实践

本文提出的基于主数据治理的房屋基础库建设,已在深圳市多个领域进行了应用实践。在房屋全生命周期管理方面,实现了近千个建设项目。从数据层面可实现从立项到后期运维的全生命周期信息监管。在危房风险影响评估和责任溯源,通过主数据实现物业小区、房屋、商事登记、产权登记等数据的快速关联查询,可以高效排查建筑物周边的风险源,确定该建筑物的建设、施工、监理和勘察设计等责任主体,对工程质量进行责任倒查。在公共住房管理方面,将“房屋主数据库”与市场监督部门“商事登记库”以及“房屋租赁备案库”建立关系,将公共住房房源与上述两类数据进行关联匹配,支撑智能筛选出疑似违规转租和违规利用公共住房注册企业等行为。

基于主数据库的房屋基础库建设目前仍在起步阶段,因为涉及大量跨部门、跨领域和跨行业的数据交换和整合工作,在不同领域主数据的内涵和外延仍存在一定争议,需要在未来与相关部门围绕主数据的高价值和稳定性等特征,进一步优化数据模型、架构和治理流程。

图3 内部数据流

猜你喜欢
数据模型房屋编码
基于SAR-SIFT和快速稀疏编码的合成孔径雷达图像配准
UMAMMA历史房屋改造
现代装饰(2020年12期)2021-01-18 05:37:44
房屋
文苑(2020年10期)2020-11-22 03:28:43
《全元诗》未编码疑难字考辨十五则
子带编码在图像压缩编码中的应用
电子制作(2019年22期)2020-01-14 03:16:24
转租房屋,出现问题由谁负责?
金桥(2018年2期)2018-12-06 09:30:40
Genome and healthcare
面板数据模型截面相关检验方法综述
加热炉炉内跟踪数据模型优化
电子测试(2017年12期)2017-12-18 06:35:36
奇怪又有趣的房屋