徐晓东,张石磊,李韡,陶玉波,张荣
(1.内蒙古引绰济辽供水有限责任公司,内蒙古自治区 兴安盟 137400;2.水利部水利水电规划设计总院,北京 100120 3.北京东华合创科技有限公司 北京 100089)
水利工程是国民经济基础设施的重要组成部分,在水旱灾害防御、水资源合理利用、生态环境保护、推动国民经济发展等方面具有不可替代的重要作用。一直以来,水利工程建设管理程序复杂、信息量庞杂、容易产生一定的管理漏洞和死角。通过新一代信息技术与建设管理的融合应用,推进智慧水利工程建设,可以促进水利部门管理效率的提高,促进水利工程管理制度和管理模式完善,推进水利工程治理能力的现代化。
引绰济辽工程是国务院确定的“十三五”期间实施的172 项节水供水重大水利工程之一。水利部发布《数字孪生水利工程建设技术导则(试行)》,要求水利工程建设单位建设数字孪生L3 级数据底板,把促进工程信息化引领工程建设与管理,作为高质量发展的重要驱动力,信息化建设中的数据治理工作更是重中之重。本文通过研究引绰济辽工程建设期的数据治理工作,提炼治理方法,并在此基础上进一步深挖数据价值,促进工程“四预”及工程数字孪生场景落地。
水利工程数据生命周期需要历经四个过程:采集与汇聚、治理与整合、分析与呈现、沉淀与销毁,见图1。
图1 水利工程数据生命周期图
全域采集各类数据,多种方式汇聚数据。数据采集是指数据从系统外部输入到数据内部的过程,水利工程的数据采集对象点多面广,主要包括:工程基础数据(如工程名称、组织机构、人员、受水范围、工程标段分区、工程建(构)筑物等)、工程建设过程中的各类监测数据(如人、机、料、法、环等)、工程管理数据(如进度管理、质量管理、安全管理、资金管理等)、空间数据(如工程GIS、DEM、DOM、BIM、倾斜摄影等)。
去伪存真综合治理,扩展挂接充分整合。在此阶段,对汇聚的数据集进行治理,去掉空值数据、治理数据范围异常、枚举值异常、单位不一致等数据,检查数据(库)的时效性、正确性、一致性与完整性,并进行补充完善。
数据仓库价值分析,主题应用多维呈现。这一阶段,对治理的数据集进行分析、呈现,现代数据的呈现主要旨在借助图形化手段,清晰有效地传达与沟通信息,可以利用图形、图像处理、计算机视觉及用户界面,通过表达、建模以及立体、表面、属性及动画的显示,对数据加以多维呈现。
冷热分类沉淀归档,价值缺失介质销毁。该阶段根据价值密度、访问频次、使用方式、时效性等级,将数据划分为热数据、温数据、冷数据和冰数据,并对分类后的数据进行沉淀归档。随着数据量急剧增长,从价值成本角度,存储超出业务需求的数据未必是个好的选择,因此数据的销毁不可或缺。对于数据的销毁,应该有严格的管理制度,建立数据销毁的审批流程,并制作严格数据销毁检查表。只有通过检查表检查,并通过流程审批的数据才可被销毁。
数据治理方法论可简要总结为在组织和技术的共同保障下,实施“聚、治、存、管、用”五个核心步骤。
数据技术标准是数据治理的指导性文件,制定统一数据技术标准,可以有效消除业务数据杂、乱、差,打造高质量数据资产。数据技术标准的建立主要是对数据分类、数据编码和数据质量进行整体规划,可实现工程各类数据的完整性、有效性、一致性、规范性、开放性和共享性管理,并对模型建立、数据格式等进行规范化指导,从而为数据治理工作打下坚实的基础,为数据资产管理活动提供规范有效依据。具体数据技术标准如下:
(1)分类标准:将工程对象划分为基础数据、监测数据、业务数据以及多媒体数据四大类。其中基础数据划分自然水体、水利工程、监测测站、设备设施、工程管理,包括流域、河流、水库工程、水文监测站、安全监测仪器、建设单位等。
(2)编码标准:工程对象的编码标准包括流域水系型编码标准、行政区划型编码标准和特殊类型编码三大类。其中流域水系型编码标准由2 个代码段构成,包括8 位所属流域(水系)分区代码和4位顺序码;行政区划型编码标准由2 个代码段构成,包括6 位所属行政区划代码和6 位顺序码;特殊类型编码主要适用于安全监测站、安全监测点、设备设施类对象、单位、管理组织、人员、行政区划、水土保持区划、项目、标段、合同等工程管理类对象。
(3)质量标准:质量标准分为数据库表字段级标准、文件级标准和数据级标准三大类。
数据质量对数据价值的意义至关重要。数据质量的好坏极大程度上影响着业务的发展情况。好的数据质量是驱动企业业务蜕变发展的基础。在企业级的数据治理项目中,数据质量管理是其中重要的一环。数据质量体系是指对数据质量进行约束的技术和行为标准集合,技术标准包括诸如针对单属性字段的格式、符号、取值上下限等规范,针对多属性间的关联验证规范;行为标准包括根据业务场景进行人为的数据质量判断的标准,及数据生成后数据质量的日常监测标准,如由专业人员维护并判断其专业领域数据的质量。数据质量体系包括六个方面的内容,分别是唯一性、完整性、准确性、规范性、一致性和及时性。
数据安全体系是指数据在全生命周期过程中的安全管控的标准集合,可以分为数据梳理与敏感数据识别、数据安全认责、数据分类分级、数据分权访问、数据安全管理。
数据共享体系的构建,可以通过各业务专题数据分析和挖掘模型,生产具有共性需求的水利分析和挖掘产品,为构建业务应用、辅助决策、综合运维和公共服务提供产品数据服务。
智慧水利工程数据来源广泛,需要将来自不同设备和系统的数据整合起来。同时,还需要实现不同平台间的互通和对接,数据集成是基于分散的信息系统的业务数据进行再集中、再统一管理的过程,是一个渐进的过程。步骤包括数据源识别和收集、数据清洗和转换、模式匹配和映射、数据集成和加载以及数据验证和测试。
在数据汇聚过程中,引绰济辽工程汇聚了工程智慧建管系统、工程智慧生态系统、综合事务管理系统、工程综合监测系统、工程智慧运维系统、工程智慧调度系统、工程智慧体验系统、智慧决策以及单点登录与统一用户认证等多个业务系统数据资源,形成数据汇集库,作为数据统一治理的基础。
在数据治理过程中,在全域数据采集的基础上,对数据的标准、质量、生命周期、安全隐私、元数据以及共享等进行全方位管理。建立统一水利对象体系,建立统一编码规则、构建统一服务共享体系,完成包括自然水体、水利工程、监测测站、设备设施、工程管理等5 大类数据体系,提供各业务共享。
在数据存储与管理过程中,通过数据采集与治理,最终建成数据资源池,资源池主要包括基础数据、空间数据、BIM 数据、监测数据、业务共享数据、多媒体数据6 类核心数据。同时,在此基础上,根据共享利用需要,又将实现元数据及资源目录数据抽取生产。
在数据应用过程中,通过数据资源模型的构建,设计建立统一基础、监测、业务、多媒体、GIS 及BIM 数据模型,以统一水利对象为基础,抽取基础核心、通用共享的主要对象属性,建立统一数据模型,汇集、整合各个业务系统数据,打造基础信息库、监测信息库、业务共享库、多媒体库、GIS 数据库及BIG 数据库,为各业务系统间提供数据共享。
数据应用的主要创新有:通过对数据归一处理和数据聚合计算形成主题库,为工程应用提供数据服务,辅助工程建设与运行管理;通过聚、治、存形成工程数字资产,构建工程数字资产平台,实现数据科学管理使用。
3.2.1 工程总览看板
数据可视化是对大型数据库以及数据仓库里的各类数据用图形图像方式表示,如解析复杂结构的数据或者是生成最初的视图,以及显示分析结果,并作为数据分析过程中非常重要的阶段[1]。本项目通过全生命周期BIM+GIS 系统平台与BIM 模型、GIS 数据等进行关联,实现工程建造动态的可视化查询、展示、分析。利用“建设看板”可视化大屏,从宏观业务管理指标,到细化的数据报表,再到具体的业务系统功能,形成数据+系统的联动体系。
建设看板的核心数据来源于工程各个信息化子系统。由于工程建设项目具有参建方众多、信息流动频繁等特点[2],数据源分散、数据库异构、数据形式多样、高质信息密度低,是工程管理和决策中面临的难题。因此从整体出发,逐一分析工程各类信息,从繁杂的数据中提炼高质量数据及核心指标,融汇为投资、进度、安全及质量看板。在此基础上,对这四个看板内容进行再精炼,最终得到工程总览看板。
3.2.2 工程数据资产
工程数字资产数据治理是对工程项目各阶段的数据、文档、模型等工程数字资产数据,进行信息采集、整合、分类、映射等的过程[4]。项目依托BIM、GIS、大数据等先进技术[5-7],实现项目全要素一体化管理,搭建形成工程数字资产平台,对引绰济辽工程建设过程中对象分类、进度管理、质量管理、投资管理、设计管理等以及工程运行期中的安全监测、环境监测、水雨情监测等实现数字化、信息化和智能化管理,并形成相应的工程电子档案。通过“统一编码、统一管理、统一服务”,实现全生命周期工程数字资产的管理和共享服务,提高了数据的利用效率,更好地发挥数据的价值,也为保障施工安全、科学控制建设进度、确保工程建设质量、提高工程建设管理水平提供支撑。随着信息化建设的不断深入,项目过程中会产生大量的数据,通过数据共享平台,对现有数据服务细分,得到自有服务组、基础对象查询服务、建设期数据查询服务、运行期数据查询服务四大块数据服务组,并标明了各种数据的服务路径、请求方法以及服务类型,不仅可以实现数据共享和相互调用,还可以提高水利管理效率和精度。引绰济辽工程建设期工程看板图见图2,数据资源服务平台见图3。
图2 引绰济辽工程建设期工程看板图
图3 引绰济辽数据资源服务平台图
综上所述,为更好地完善水利工程管理制度和管理模式,推进水利工程治理能力现代化,数据治理已成为水利工程建设期的必要手段。同时,借助BIM、GIS、大数据等新一代信息技术,水利工程建设期数据治理的效率和精度得到更大程度地提升。今后仍需不断地对数据治理工作进行深入地研究与探索,以满足时代不断前进与发展的需求■