刘媛媛
(松辽水利委员会水文局(信息中心),吉林 长春 130021)
水利部党组把推进智慧水利建设作为推动新阶段水利高质量发展实施路径,要求细化智慧水利建设具体措施,加快构建智慧水利体系。“数字孪生流域”的建设基础是完善、准确、高时效的数据[1,2]。为明确信息资源管理的责任主体,解决水利数据治理中存在的问题,夯实“数字孪生流域”“智慧流域”数据基础,在深入调研的基础上,参照水利部、长江委等单位成果和经验[3-6],结合工作实际,松辽水利委员会网信办组织起草编制了《松辽委资源整合“一数一源”责任清单》(以下简称“责任清单”)。“责任清单”的主旨是明确各类数据资源的管理责任主体,解决信息数据资源混乱问题,由各责任主体负责责任范围内的数据在委数据资源池中心库的一致性和准确性,保障数据更新和尽可能完整,为全委水利数据资源的整体建设和持续更新提供保障。
依托防汛抗旱指挥系统工程、水资源监控能力建设等项目和部分自主开发业务系统建设,全委已建成涉及26类水利对象,30余个图层的数据资源。总体上看,结构化数据较少,且按业务分块形成多源分散存储,编码和数据属性值存在差异,无法直接交互共享。大量业务数据以纸质或者电子表格形式保存,按工作管理由个人保存。数据底数不清、一数多源、权责不清,基础测绘成果和遥感影像数据匮乏,未得到有效利用。
1)地理空间数据获取难。县级及以下行政区划数据变动频繁,各业务部门需求时效性、颗粒度差异大,地方行业标准化程度不高,业务监督工作对行政类基础信息核对重视不够,难度较大。
2)水利基础空间数据更新难。自然流域和行政流域数据划分标准存在差异,数据更改较难追溯。部分河流在流域水治理管理工作中,作为独立管理对象,如嫩江、西辽河等,这些河流在以往的大型项目中被整合或修改,难以支撑实际工作。
3)水利业务对象数据准确度有待提高。数据编码各成体系,局部管理重叠,同一对象名称存在多个相似别名,基础参数在规划研究和业务管理中采用的数据不一致。非直管工程数据更新难,数据来源不稳定、更新不定时、范围和精度不确定性较大。蓄滞洪区、灌区等综合型水利管理对象缺少区内相关管理对象数据。取水口、取水监测站点和取水户数据体系繁杂,数据变动频繁,但更新确认慢,且受管理要求限制,无法获得数据全集,管理难度大。部分小水库销号后,未能及时更新水利管理对象类型及生命周期信息。
4)逻辑对象管理有待明确。与作为实体的水文监测站相比,河道断面作为逻辑对象,具有省界断面、水生态监管断面、重要水文断面、防汛断面、调度断面、监管断面等多重业务属性,对应不同的管理方式和业务数据,同时还需要明确与对应监测站点的类和对象对应关系。
5)其他在流域治理管理中需要的数据暂无来源。
6)业务资料。业务资料以非结构化数据为主,存储零散、版本多,全文检索无法确认资料的时序版本和唯一性,集中管理面对的工作惯性较大,整理难度极大。
数据是新发展阶段最重要的生产要素。数据是基础,应用是上层建筑。要构建数字流域,提升“四预”支撑能力,首先须要打牢统一的数据基础。流域管理工作由各部门、单位共同开展完成,信息部门提供贯通融合的技术支撑,本地没有数据、数据不一致,就无法支撑通过信息化手段自主开展业务工作。在深化流域水利改革和特色管理工作发展中,必须具备数据基础,“中心库”“一张图”等技术抓手才能发挥作用。流域数字底版,只有在基础地形空间数据上集成各类基础、监测和业务数据信息,并满足一定时间内的准确性和完整性要求,才具有可用性。本地化并且是可靠、完整并持续更新的数据,才可支撑自主应用系统建设和持续运用。目前,数据资源整合、“一张图”等尚未在松辽委体现出应用优势,其重要原因就包括数据基础不足、更新缺乏保障、交换存在障碍,没有形成统一数据基础、统一数据使用、统一数据成果再应用的有机循环。目前调研收集到的数据分为两大部分,一是工作过程中产生的业务数据,二是水利基础数据。业务数据一部分在非本地运行部署的应用系统中生产、保存;一部分为报告,属非结构化数据。两者中都还包含了大量流域管理工作中直接或间接获取到的外部数据。对于水利基础数据,主要是使用者,不是数据的原始生产者,但业务管理的数字驱动、事务性驱动,即数字化升级、融合贯通都必须具备这个数据基础,需要相关部门、单位依据其三定职责来主导数据的获取、确认和使用。确定“一数一源”和相关责任主体,是推动松辽委水利数据资源整合和建设落实并可持续的必要工作,是数字流域的重要建设基础。
数据资源整合是信息化建设推进首要的、必须完成的任务和重要基础,表象上整合的是资源,实质上整合的是规则,在根本性上需要靠制度规章来推进和落实管理。通过“责任清单”明确数据维护主体和职责,推动落实全委水利信息资源建设“全委一盘棋”,以数据建设为突破点,为强化流域统一规划、统一治理、统一调度、统一管理提供有效底板基础,避免数据“打架”。数据资源整合的现状难点在于各类材料、规划、数据库成果中的数据自成体系、内容冲突、缺乏衔接,数据不一致给数据的使用带来大的问题。同时,数据的统一传输交换、存储、更新和共享都难以推动和维系。“一数一源”是共享基础数据的基本原则。每一条基础数据都应该有且只有一个采集责任主体,这个责任主体对数据的一致性和准确性负责。确定“一数一源”和相关责任主体,有利于解决数据冲突,确保数据资源的一致性。
流域管理工作在一定程度上处于业务应用末端,不是监测感知主体,在数据交互、数据再利用和应用模式上的控制自主性还不强、需求还偏弱,数据管理规则基本空白。数据是业务信息的载体和重要体现,通过建立、传递、利用和转化等环节贯穿业务全过程,承载业务实现,对业务模式和业务生态提供循环动力。需求推动的实质是数据推动,形成业务线上协同的前提是建立具备一致性、可靠性、准确性的数据基础,明确稳定、合规、适用的数据更新来源和更新方式。确定“一数一源”和相关责任主体,有利于对数据的生产、传输、共享、再造进行科学、合规、实用、可行的管理,是构建数据管理机制的前提。
《数据安全法》规定,各部门、单位对本部门、单位工作中收集和产生的数据及数据安全负责。建立“一数一源”责任清单,有利于下一步明确相关部门、单位在数据资源管理工作中的责任,有利于推动数据安全管理制度建立。
“责任清单”的主要编制依据是“三定”方案、水利部有关行业标准和相关单位已有成果经验,并根据实际工作情况和需要调整。数据分类的主要依据是水利部近年颁布的有关水利对象分类和数据库行标,包括SL/T213-2020《水利对象分类与编码总则》、SL/T809-2020《水利对象基础数据库表结构及标识符》,还参考了水利部、长江委等单位已印发的制度及水利部“一张图”应用成果等成果经验。
结合有关工作,在应用系统使用、数据资源掌握和需求等方面开展了内、外部广泛调研。调研结果显示松辽委数据共建共享基础相对较弱。1)业务部门对职责范围内掌握及需要的数据界定还不很清晰。2)结构化数据少、一致性不强。调研出的25个数据库中涉及23类水利基础对象,普遍缺少设计文档,一些监测数据库已停止更新。空间数据主要来源于水资源项目前置库,与自身基础属性也不能完全匹配。3)很多业务数据存储于电子文档和纸质报告中,一些业务工作未进行本地数据留存。4)数据壁垒还在一定程度上存在。在调研工作基础上,起草编制了“责任清单”初稿,并开展了2次征求意见。删除了目前业务工作中不直接管理和使用、不能获取和维护的渠(沟)道、穿堤建筑物等对象,补充了水文预报数据,补充完善了数据内容的细化和分类,调整了部分数据载体和更新方式,在数据责任划分方面初步取得了一致性。
“责任清单”内容项目主要包括数据类型,数据内容及范围,数据可能存在的载体格式,在现状下的建议、遵循标准及方案和可能的更新维护方式,数据责任单位。增加了“已掌握数据情况(包含来源库)”项目列,对通过调研和整合工作已掌握的数据情况进行了说明,帮助各有关部门、单位了解数据类对应的数据内容,作为相关部门、单位的数据参考。
在结构上,“责任清单”面向对象管理。责任主体单位负责某一类数据的空间数据和非空间数据的管理,以确保数据对象的完整性和实体一致性。在数据分类方面,划分为5个大类、22个中类和78个小类,在保持数据体系性的同时,使数据分类更加清晰和细化。
“一数一源”的推进应建立共识、理清数据更新来源、细化责任分工,需要一个过程。“责任清单”需要数据资源整合及共建共享方面的管理办法予以支撑。目前,松辽委水利基础数据资源结构化底子薄弱,多项数据在今后的建设、使用和更新方式目前还不能确定,需要在实施中进一步调整完善。目前“责任清单”已正式印发,其有效的落实实施,以及由网信办牵头,协同各部门开展共同的持续的完善,才能为“数字孪生流域”“智慧流域”等工作奠定可持续的有生命力的坚实数据基础。