周 超,唐海华,罗 斌,李 琪
(长江勘测规划设计研究有限责任公司,湖北 武汉 430010)
实现水利信息化、智慧化建设是我国水利补短板、强监管的重要工作[1–2],其重点在于推进水利大数据的发展建设[3]6–7,将水利数据资源作为智慧水利总体方案水利大脑“一云一池两平台”的关键组成[4]2。目前国内各项水利大数据中心的设计与建设[5]10–15[6–8],使其在数据信息采集、传输汇集、大数据资源、深度挖掘等方面的技术实力得到了极大的提升[9–11],同时需要对海量数据进行分析,进一步发掘其价值,真正实现水利智慧应用的目标。
水利大数据资源是水利数据智慧化分析应用服务的基础,而其中数据汇集与管理均需要成熟的管理体系保障[5]7–9[12–13],不能仅依赖于技术水平的提升。但现阶段,国内水利行业的数据管控体系并未完全形成,导致未真正汇聚大数据资源。首先,水利大数据的形成需要涉水管理节点数据的有效汇集,但由于缺乏适应水利行政及业务运行的实际数据管控体系,水利单位数据汇集管控的实际执行仍旧困难;其次,水利主管部门对于内部管理的数据缺乏统筹,盲目、无序地将分散数据汇集储存于一个数据中心,其本质只是数据量的堆积,难以形成具有深度专业信息挖掘价值的大数据资源。
针对这些问题,本研究面向水利部、流域、省、地市级及各水利工程等构成的复杂行政与业务结构[14],为适应国内数据“总中心-多级应用”的建设发展长远格局[4]2,重点对我国水利大数据汇集形成与管控的顶层体系开展研究,针对多权限层级之间的大数据汇集过程管理和单个大数据汇集节点内的多水利专业业务数据管控 2 个方面进行讨论设计。此研究探讨提出了一种合理的国内水利机构数据管理权限,旨在促进水利大数据资源形成有效汇聚方式,为开展我国智慧水利的大数据资源整合等工作提供参考方案。
按照国内水利管理权限划分,国家各级水行政主管单位、各类水利工程业主单位分别掌握各自管辖范围内的水利数据,将这些主体作为研究的基本对象,针对这些单位之间的数据管理、汇集方式,构建出支持不同层级的多源数据汇聚体系,形成水利数据的分级汇集与管控结构,如图 1 所示。
本研究涉及水利数据中心、数据应用汇集节点等,主要按照国家水利业务的核心主体考虑,如图1 所示,依据行政等级分为:1)国家级,对应水利部;2)流域级,对应各大流域的水利委员会;3)省级,对应各省的水利厅;4)地市级,对应各地方的水利(务)局;5)水利枢纽工程级,对应水利工程业主单位,主要根据其直属的行政管理单位确定其数据汇集层级。
图1 水利数据分级管控体系
基于数据管理主体划分,参与汇集管控的数据可分为以下两大类:
1)水利职能部门数据。主要包含其部门下属建设的水文监测站网的监测数据,以及权限内收集的下级汇交水利数据。
2)水利工程单位数据。主要包含水利工程的运行数据,以及其建设的区域内水文监测站网的监测数据。
结合分析,可将水利机构、工程业主单位,按行政权限、业务运行等建立直接或间接的数据汇集管理方式:
1)基于行政管辖权限的数据管理。即直属管理,要求被管理单位将所有水利数据直接提交/汇集至直属的上级管理权限单位,主要体现为水利工程业主或运行单位向管理部门提交运行与监控数据。
2)基于区域管辖权限数据管理。即统筹管理,根据区域管辖权限,自下而上、逐级管控的管理方式,要求被管理单位需要提供/汇集关键数据或指标至管理权限单位,主要体现为地市、省、流域、国家等逐级向上汇总。
3)基于运行业务需求的数据管理。即协商管理,数据汇集与交互主体之间,主要根据业务需求进行数据的交换,可以跨越区域或职能权限。主要存在于同类管理主体之间,如下游水库业主运行单位对上游水库业主运行单位提出数据需求。
根据水利管理的权限进行执行,但特殊性在于1 个流域机构可能涉及多个省,同时亦常见 1 个省属于多个流域的情况。
1)根据国家水利机构管辖权限直接划分,权限由上至下依次为水利部、流域水利委员会、省级水利厅、地市级水利(务)局。
2)地市级以下区、县、乡等更低层次的数据权限,可划为地市级统一管控,也可向下细化分级。建议各地方能根据实际管辖范围的下级数据汇集节点数量、总量具体分析,总体量不大时可由地市统筹管理。
3)被管辖机构的数据一般应根据要求全部提交至管辖部门机构。
4)当所在省份属于多个流域时,省级水利厅应将数据按照不同流域划分,按照流域机构区分数据的汇集提交数据。
按以下原则执行,排列在前优先级更高:
1)国家级重点、龙头节点工程的运行及监测数据,如三峡、丹江口水库等的数据,在业主运行单位的数据管理体系下进行收集维护,由水利部统筹管理,所在流域水利委员会直属管理。
2)流域级联合调度所涉及重点工程的运行及监测数据,在业主运行单位的数据管理体系收集维护,由所在流域水利委员会直属管理。
3)跨流域工程运行及监测数据,在业主运行单位的数据管理体系收集维护,由水利部直属管理。
4)其余水工程,如大型、中型、小型水库的运行及监测数据,在业主运行单位数据中心收集维护,一般由所在地方水利局直属管理,所在省水利厅统筹管理。
根据水利数据的各类分级汇集管控的运行方式,由于直属、统筹及协商等管理方式的存在,管理单位可以从不同的下级数据源获取同一项水利数据。因此可通过对这些多源头数据交叉对比,判断权限下属的主体单位提供的数据一致性,通过验证数据准确性,进一步监督数据管理体系下的数据汇集过程。
同时,各数据提交节点,应对本节点内获取、汇集、管理的数据准确性,时效性,一致性等做出检验。
第一章节所述各层级的数据汇集与管理节点内部,均可利用信息技术,构建基于大数据存储体系的结构化、非结构化和流数据库,形成大数据运行环境。要实际形成有价值的水利大数据,则应在对汇集的数据进行管理时遵循统一标准的管理模式,水利数据资源应按照源、基础和主题等数据构建多层级数据体系[3]8,对于汇集的数据进行合理的数据管控。水利数据汇集与管理节点的数据管控与存储体系,对汇集的水利大数据进行管理,提升数据汇集应用的便利性、可维护性。
数据分类管控体系总体设计原则如下:
1)按照水利基础对象、专业业务 2 类数据进行管理。
2)2 类数据库可以根据数据维护频率、专业相关度等因素考虑,进一步分级分类管理。
3)各种数据均与水利对象关联,水利对象是数据管理的主线,为减少分类检索中的冗余,各级对象与一个上级对象相关联。
4)管理体系基础对象的管理数据,由当前汇集节点统一管理,保证数据在本级及其下关联的集节点中的一致性。
5)管理体系专业业务的管理数据,在不同的下级汇集节点内可以有数据冗余。
依据上述原则,以面向流域级数据中心的数据管控为例,提出水利大数据汇集应用节点的数据分级管理结构体系,如图 2 所示。其他类型数据管控,可参考类似模式设计。
基础对象管理数据库如图 2 上半部分所示,由各级具有数据汇集管理能力的节点统一维护管理,且上级管理权限主体与下级提供主体保持数据同步更新。
图2 水利数据专业分类管控体系
本部分数据管理的目的是统筹水利相关业务,采用分层分类的形式,统一维护管理各个专业或业务所涉及的水利实体对象与基本信息。此部分信息主要包含水利对象编码、名称、所属流域、所属河流、所属工程、描述信息等,用于各种对象的身份信息管理和相关的拓扑结构定义。
依据流域中水利对象的抽象层次细分,上下层间形成附属关系,从上至下分为:
1)一般对象含流域、行政区划、管理单位等,是数据资源逻辑中的顶层节点。
2)水利对象与水利工程含河流、湖泊、水利枢纽、控制站、蓄滞洪区等具体对象,其属性与所属的流域、行政区划、管理单位相关联。
3)水利对象工程建筑,含大坝、泄洪道、发电工程等,属于水利枢纽或其他水利工程下的附属建筑类型,根据属性与建筑所属的水利工程等相关联。
4)专业资料索引是对 2.2 节中专业业务专题库中各类资料的目录索引信息,不涉及具体资料数据,通过属性字段各类基础对象相关联。
专业业务管理数据库如图 2 下半部分所示,由各级具有数据汇集管理节点下属的水利业务执行主体自主维护管理,主要存储的是以水利业务分类的结构化和非结构化数据。各专业业务部门统筹自身相关数据资源,针对不同的专业分类,维护管理各专业涉及的资料类数据,业务分类与索引分类一致,可含水资源、水生态/水环境、水灾害、水工程、水监督、水行政、水公众服务、综合决策、综合运维等业务。每个专业业务可按更下一级的专业进行细分,按照子专业进行细化管理。
考虑不同单位可能因项目区别或获取时间差异等因素,导致各自掌握的专业资料存在重复或差别,此部分数据由各单位自主管理。接受这些非同源数据汇总的上级管控主体,承担其数据标准化职责,保障这些数据对外进一步汇集时呈总体一致。
以三峡与葛洲坝水库为水利工程对象节点,以宜昌市水利和湖泊局、湖北省水利厅、长江流域水利委员会(以下简称长江委)、水利部等为水利主管单位,构成一个含不同权限、业务的数据管理案例,并以此例分析说明本研究提出的数据汇集方式与过程。
以上单位和部门所组成的,基于权限分级管控的数据汇集过程管理体系如图 3 所示。
图3 水利数据依据分级管控的示例
1)葛洲坝水库。地处宜昌,在本案例中,由宜昌当地主管数据,并且进一步将水库运行关键数据汇集上报至湖北省水利厅。
2)三峡水库。一方面,水库地处宜昌,是长江联合调度关键工程节点,同时属于国家重点工程,因此为长江委直属管理数据,水利部统管数据,三峡业主运行单位需要将水库相关数据总体汇集至长江委,同时长江委需要将三峡水库的运行情况关键数据汇集上报至水利部;另一方面,三峡水库作为葛洲坝水库的上游水库,其下泄过程直接影响葛洲坝的入库过程,由于调度时效性要求,葛洲坝水库可与三峡水库进行数据协商管理,由三峡水库直接提供其影响葛洲坝运行的关键数据,在三峡水库保证其各种途径汇集上报数据一致性的前提下,避免数据的多级流转,提高数据应用效率。
3)宜昌市水利和湖泊局。为宜昌市区域的水利主管单位,全面管理葛洲坝水库的调度运行数据及宜昌区域其他水利数据,并将其中关键过程及指标数据提交至湖北省水利厅统筹管理。
4)湖北省水利厅。为湖北省全流域区域的水利主管单位,全面管理范围内水利数据,包括宜昌及其他地方的监测、水利工程及设施运行管理的数据,并将其中的关键过程及指标数据提交至长委统筹管理。
5)长江委。为长江流域全流域区域的水利主管部门,全面管理范围内水利数据,包括各类监测、水利工程及设施运行管理的数据,并将其中的关键过程及指标数据提交至水利部统筹管理。
6)水利部。为全国水利的主管部门,经各流域上报,统筹管理含长江流域等的七大流域水利数据。
同时,以湖北省水利厅所管理维护的水利数据节点为例,其内部依据专业分类管理的数据体系如图 4 所示。
图4 水利数据依据专业分类管控的示例
湖北省水利数据节点,其中的基础对象管理数据库及专业业务管理数据库中的业务划分数据结构,均与图 2 设计的对应部分保持一致,按照湖北省内水利对象类型抽象分类,并按照水利业务分类的通用结构设计并进行管理。
更下级的专业划分数据结构,以水库工程管理业务中的勘察设计工作为例,可向下细分为水文、地质、测绘、规划、枢纽、施工、机电、移民、环境、建筑、航运等类型,如图 4 中下半部分所示;并可根据需要,根据专业资料进一步分类管理,如水文资料分类为气象、洪水、径流、泥沙等,规划的资料分类为工程规模、经济评价、水库调度等。
本研究面向国内水利大数据建设,思考讨论提出了一套针对国家、流域、省、市和库站等不同类别与层级的数据管理与交换体系,依据各水利机构的数据管理权限构建一种自下而上的水利数据汇集体系,以推动实现水利大数据资源汇聚,具体研究了多层权限下、不同数据节点之间的大数据汇集管理,以及数据汇集节点内多专业业务分类大数据管理方式,同时结合案例分析进一步说明,对目前国内未来推进的水利大数据中心建设与管理具有一定参考价值。