钱 峰,张志新
(水利部信息中心,北京 100053)
水利信息资源是各级水行政主管单位(部门)(以下简称各单位)在履行职责过程中产生或获取的信息资源,作为一项基础性、战略性政务信息资源,一直以来在国民经济和社会发展中都发挥着重要作用。近年来,随着水利信息化步伐不断加快,国家防汛抗旱指挥、水资源管理信息、地下水监测信息等系统,以及全国水土保持监测与管理系统等重大信息化项目陆续建成并投入运行,结合第一次全国水利普查工作获得的专项成果和长期以来水利部门的日常工作积累,形成了海量的水利信息资源。截至 2018 年底,全国省级以上水利部门存储的各类信息资源约有 1 600 多项,数据总量约为 2.5 PB。由于我国水利管理机构层级较多,业务范围广,业务差异性大,当前在各单位之间,甚至在其内部,都在一定程度上存在着数据资源不清、共享困难等突出问题,尤其是数据壁垒的存在,严重制约了水利信息化发展进程。当前亟需梳理整合数据资源,打破数据壁垒,实现数据共享,形成数据合力,从根本上促进水利信息化又好又快发展。
水利信息资源目录是水利信息资源整合共享的基础和依据。自水利部于 2013 年启动水利信息化资源整合共享工作以来,长江水利委员[1]、黄河水利委员会[2]、太湖流域管理局、湖北省水利厅等单位已开展并基本完成水利信息资源目录编制,但是在目录编制范围、资源分类、元数据项、编码规则等方面采用的标准并未统一。为加快推进水利信息资源整合共享,水利部于 2020 年 1 月印发实施了《水利信息资源共享管理办法(试行)》[3](以下简称《办法》),对水利信息资源目录的内容、编制范围、编制途径和维护更新等提出了明确要求,同年 10 月发布了《水利信息资源目录编制指南(试行)》[4](以下简称《指南》),对相关内容进行了细化。为深化对《指南》的认知和理解,指导水利行业信息资源目录的具体编制工作,促进水利信息资源目录体系的全面建立,有必要对《指南》进行解读剖析。
水利信息资源目录是按照一定规则对水利信息资源的元数据进行编目,形成的具有一定逻辑结构的水利信息资源清单。在编制水利信息资源目录时,需要采用统一的水利信息资源分类体系和编码规则,以保障各单位之间水利信息资源的交换与共享。
1.1.1 分类体系与依据
水利信息资源分类体系由水利对象、业务、行政、业务阶段、资源组织形式等 5 个维度分类组成,是一种多维分类体系。其中:水利对象分类依据 SL/T 213—2020《水利对象分类与编码总则》[5]进行分类,业务、行政、业务阶段等分类与 SL 701—2014《水利信息分类》[6]协调一致,资源组织形式分类参照 SL/T 799—2020《水利数据目录服务规范》[7](以下简称《目录服务规范》)执行。
1.1.2 类别划分
水利对象分类以水利对象相对稳定的本质属性或特征作为分类的基础和依据,将水利信息资源涉及的水利对象分为江河湖泊、水利工程、监测站(点)和其他管理对象,共 4 个一级类,可细分至二级。
业务分类按照业务领域将水利信息资源划分为水文、水资源、水环境、水利工程、农村水利、水旱灾害防御、水土保持、移民和其他等一级类,可细分至二级。
行政分类按照行政领域将水利信息资源划分为综合办公、政策与法规、财务与审计、人事与教育、国际合作、科技管理、监督、纪检与监察、机关管理和其他等一级类,可细分至二级。
业务阶段分类按照业务阶段将水利信息资源划分为规划、前期、建设、运行阶段和其他等一级类,可细分至二级。
资源组织形式分类按照资源组织形式将水利信息资源划分为对象、数据库(表格集)、数据表(表格)、矢量、栅格和其他等一级类,可细分至二级。
根据《办法》第十二条对目录编制内容的要求,水利信息资源元数据项,均应包含名称、摘要、关键字、类别、提供方、资源维护单位、格式、属性、更新频率、共享类型、共享条件、共享方式、发布日期。
按照《目录服务规范》规定的对象、数据库(表格集)、数据表(表格)、矢量、栅格、其他这6 类水利信息资源元数据项的最小集,按照《指南》要求还应包括以下内容:
1)对象类水利信息资源的元数据项,还应包含但不限于对象代码;
2)数据库(表格集)类水利信息资源的元数据项,还应包含但不限于获取途径、文件大小、数据库网络地址、数据表数量、初始日期、最新日期;
3)数据表(表格)类水利信息资源的元数据项,还应包含但不限于获取途径、数据记录数量、初始日期、最新日期;
4)矢量类水利信息资源的元数据项,还应包含但不限于获取途径、要素类型、空间坐标系、比例尺、空间覆盖范围、初始日期、最新日期;
5)栅格类水利信息资源的元数据项,还应包含但不限于获取途径、栅格影像类型、栅格分辨率、成像日期、空间覆盖范围、影像景数;
6)其他资源组织形式类的水利信息资源的元数据项,还应包含但不限于获取途径、文件大小、初始日期、最新日期。
水利信息资源代码由 9 位提供方代码和 10 位特征分类代码及至少 1 位顺序码 3 个部分组成,代码结构如图 1 所示。
图 1 水利信息资源代码结构
编码规则具体分析如下:
1)BBBBBBBBB 为提供方代码。国家级、流域级、省级单位及上述单位的下属各级单位应按下列规则分别进行编码:
a. 国家级和流域级单位的提供方代码可进一步细化为 5 个层级。第 1 层级为国家和流域级,共2 位,从 00 开始顺序编码;第 2~4 层级为下属各级,按照每层级 2 位的规则,从 01 开始顺序编码;第 5 层级按照每层级 1 位规则,从 1 开始顺序编码。
b. 省级单位的提供方代码可进一步细化为 4 个层级。第 1 层级为省级,共 2 位,采用省级单位所属行政区划代码,按 GB/T 2260—2007《中华人民共和国行政区划代码》执行;第 2~4 层级为省级单位的下属各级单位,第 2~3 层级按照每层级 2 位的规则,第 4 层级按照每层级 3 位的规则。省级单位的直属单位层级代码应从省级单位的下一层级开始编码,从 51 开始顺序编码,不宜超过 80。
2)YYZZZZZZZZ 为特征分类代码。YY 代表水利信息资源的固定分类,采用 2 位数字表示,00代表业务类,01 代表行政类,10 代表综合类,11 代表其他类;ZZZZZZZZ 代表水利信息资源内容属性类目扩展代码,可进一步细化为 4 个层级,宜由各单位根据其下辖的水利信息资源内容特征进行定义。
3)[[……]M] M 为顺序码。[[……]M] M 是本单位内各特征分类中水利信息资源的唯一标识代码,与水利信息资源一一对应,采用不定长编码,原则上从 1 开始,第 1 个水利信息资源的顺序码为1,第 2 个水利信息资源的顺序码为 2,余类推。
根据《指南》,水利信息资源代码由水信息基础平台自动生成。自动生成主要是针对顺序码部分,对于提供方和特征分类的代码,还需要各单位通过填报或者在水信息基础平台目录系统中选择等方式予以明确。
2017 年 7 月,国家发展和改革委员会,中共中央网络安全和信息化委员会办公室印发的《政务信息资源目录编制指南(试行)》(发改高技〔2017〕1272 号),对政务信息资源代码进行了规范:“政务信息资源代码结构由前段码、后段码组成。前段码由类、项、目、细目组成,作为政务信息资源的分类码;后段码为政务信息资源的顺序码。”[8]
根据《指南》的适用范围,水利信息资源目录中收录的信息资源隶属于政务信息资源目录分类中的,部门信息资源的类、国务院的项、水利部的目,皆已明确。因此,水利信息资源代码仅需对政务信息资源目录分类中的细目和顺序码进行编码。
《政务信息资源目录编制指南(试行)》对政务信息资源代码中的细目和顺序码的编码规则如下:
1)细目。细目采用不定长度,原则上用阿拉伯数字表示,供信息资源提供方进行具体的信息资源分类。细目可根据需要设置多级分类。
2)顺序码。顺序码采用不定长度,原则上以 1为起始,用连续的阿拉伯数字表示。
水利信息资源代码中提供方代码与特征分类代码的组合,即 BBBBBBBBBYYZZZZZZZZ,共19 位,与政务信息资源代码中的细目对应;顺序码,即 [[……]M] M,至少 1 位,与政务信息资源代码中的顺序码对应。
水利信息资源目录编制流程包括类目设置、资源调查、编制报送、审核汇总等 4 个阶段。
水利信息资源目录编制采用自上而下的工作原则。因此,在编制水利信息资源目录时,首先,需要按照中共中央办公厅、国务院办公厅《关于推行地方各级政府工作部门权力清单制度的指导意见》等文件要求,结合本单位“三定方案”确定的政务职权、工作依据、行使主体、运行流程、对应责任等,梳理形成本单位的权力和责任清单(以下简称权责清单)。然后,对照权责清单逐项分析本单位水利信息资源可能涉及到的水利信息分类,并从水利信息资源分类体系中选取相应的类目,完成类目设置工作。
所有经类目设置选取的类目,将共同组成本单位水利信息资源的类目设置结果。各单位应将本单位的类目设置结果下发到本单位所有业务主管部门,为后续资源调查工作提供参考。
在进行水利信息资源类目设置时,为确保水利信息资源共享,水利信息资源分类的一级类、二级类的类目,应从水信息基础平台发布的水利信息资源分类的一级类、二级类的类目中选取。如水信息基础平台发布的水利信息资源分类不满足需求,应根据实际需要,在水信息基础平台目录服务系统中申请增加类目。各单位申请增加的类目,应与其在水利信息分类体系中所属类别和层级中其他已有类目的名称不重复,指代范围不重叠,并尽量在粒度上与之保持一致。新增类目需要通过水信息基础平台审核,才能用于水利信息资源类目设置。
资源调查应覆盖本部门包括直接或通过第三方依法采集、授权管理的,以及因履行职责需要依托政务信息系统形成的信息资源等在内的所有水利信息资源。
各业务主管部门根据本单位水利信息资源类目设置成果,按照“一数一源”原则,全面开展水利信息资源调查,形成本部门的水利信息资源清单。如业务复杂,涉及多个业务部门,业务主管部门应将水利信息资源类目下发到相关业务部门,并组织相关业务部门完成水利信息资源调查。
3.3.1 编制
各单位应依据“一数一源”原则,对各业务主管部门的水利信息资源清单进行汇总整合,在此基础上形成本单位的水利信息资源清单。各单位技术支撑部门将依据本单位的水利信息资源清单,按照《指南》要求,编制水利信息资源目录。各单位应对水利信息资源目录编制成果进行复核、审查,并将不满足要求的成果及时退回至相关业务主管或技术支撑部门,督促其修改完善。水利信息资源代码中特征分类的内涵和编码规则与《目录服务规范》中的相关内容一致。在确定特征分类前,需要先明确水利信息资源的类别这一元数据项的内容。
1)固定分类的选择。建议依据水利信息资源的来源,先将从其他单位交换而来的水利信息资源归到其他类。然后,对不属于从其他单位交换而来的水利信息资源,如仅涉及业务分类,则将其归到业务类,如仅涉及行政分类,则将其归到行政类,再将不属于上述 2 种情形的水利信息资源归到综合类。
2)水利信息资源内容属性类目扩展。业务类和行政类应分别按照 SL 701—2014《水利信息分类》中的业务和行政分类逐级扩展,综合类应按照跨本单位不同水利业务和行政的综合水利信息资源内容逐级扩展,其他类应按照从其他单位交换而来的其他水利信息资源内容逐级扩展。
3.3.2 报送
各单位编制完成水利信息资源目录后,应及时报送至上级单位,并同步开展在水信息基础平台的在线填报工作。相应的权责清单也应同步报送,以便为后续水利信息资源目录审核提供参考和依据。水利信息资源目录报送应优先采用系统对接的方式,如采用文件方式,所报送的水利信息资源目录文件应采用目录编制工具导出的统一格式,或者采用 et,xls,xlsx 等电子表格格式。报送流程和相关建议如下:
1)数据对接。《办法》明确要求各单位将属于无条件共享类的江河湖泊、水利工程、监测站(点)和其他管理对象等基础信息,逐级汇交至水利部水信息基础平台(以下简称部水信息基础平台)。因此,建议各单位在报送水利信息资源目录前,做好相关数据对接,确保水信息基础平台能够按照水利信息资源目录顺利调取相关信息资源。
建议将属于无条件共享类的水利信息资源及相关的服务,与水利信息资源目录进行对接,为后续用户共享水利信息资源提供便利。如条件允许,可将所有水利信息资源与水利信息资源目录进行对接。通过数据对接,实现水利信息资源目录与水利信息资源之间的联动更新。
2)数据(服务)上图。完成了数据对接的水利信息资源,如具备上图条件,或在水利信息资源目录中备案了地图服务,建议将这些数据(服务)与全国水利一张图对接,实现数据(服务)上图。通过数据(服务)上图,实现水利信息资源目录、全国水利一张图与水利信息资源的联动贯通,保障水利信息资源的常用常新。
水利信息资源目录审核应遵循“一数一源”原则,待审核水利信息资源目录中的水利信息资源不可重复记录。在具体实施过程中,主要参照《指南》有关要求,在以下 3 个方面,对水利信息资源目录进行审核:1)水利信息资源分类的一致性;2)水利信息资源目录内容的准确性、完整性、全面性;3)水利信息资源元数据项及其内容的规范性、一致性。
水利信息资源目录汇总工作也要遵守“一数一源”的原则。在汇总整合过程中如发现重复的水利信息资源目录,应由负责汇总的单位组织相关单位(部门)去重。
水利信息资源目录应依托水信息基础平台建立并提供服务。根据水利信息资源目录编制与管理需要,水信息基础平台应包含但不限于以下功能:对各单位组织机构、水利信息资源分类体系和元数据项、用户信息等的管理与维护更新,水利信息资源代码的自动生成,权责清单上传、管理,目录填报、审核、汇集,模板下载、上传、审核与自动关联,目录发布,目录权限管理,目录查询、统计,以及与其他目录服务系统的联通。
按照《办法》要求,水利部机关通过部水信息基础平台完成水利信息资源目录的编制、审核、发布和维护更新等工作;其他各单位根据本单位实际情况,可直接使用水利部的或自建本单位的水信息基础平台,完成本单位水利信息资源目录的编制、审核、发布与维护更新等工作。自建本单位水信息基础平台的,应与部水信息基础平台对接,将本单位水利信息资源目录逐级汇交至部水信息基础平台。要顺利开展并完成水利信息资源目录编制、审核、发布,做好维护更新,无论是部水信息基础平台,还是各单位自建的水信息基础平台,都需要提前做好准备。
目前,部水信息基础平台的目录服务系统(以下简称部目录服务系统)已具备水利信息资源目录管理能力,能够为水利信息资源目录编制、检索和使用提供平台支撑。
由于部水信息基础平台对用户的管理采用分级管理模式,即各级分设管理员,负责本级及下级填报员、审核员与普通用户的管理,拟利用部目录服务系统进行水利信息资源目录编制的单位,首先应由本级管理员建立(维护)本单位及其下属单位的水利信息资源目录组织机构树,并根据需要配置填报员、审核员,然后再开展相关工作。
部目录服务系统通过分类管理、元数据关联、目录汇集等多种方式形成水利信息资源目录,经审核后对外发布,并通过授权满足不同用户对目录的浏览和检索。部目录服务系统主要由目录生产、管理和查询 3 个功能模块组成。具体数据流程如图 2所示。
图 2 部目录服务系统数据流程图
4.2.1 目录生产
目录生产过程如下:
1)目录分类管理。按照水利对象、业务、行政、业务阶段、资源组织形式等多个分类维度对水利信息资源目录进行管理和维护。
2)目录生成。通过目录生成程序或人工录入2 种方式生成水利信息资源目录。
3)元数据关联。目录生成后,可以关联元数据,1 个目录可以关联 1 个元数据,也可以关联元数据集,任何元数据都可以被多个目录关联。用户在使用目录时,通过关联的元数据即可查询到对应的水利信息资源。
4.2.2 目录管理
对提交的水利信息资源目录进行审核、发布、授权,主要包括以下功能:
1)目录审核。目录生成后,需提交至相关审核员,对目录的一致性、准确性、完整性、全面性和规范性进行审核。
2)目录发布。将通过审核的水利信息资源目录内容导入发布库,发布水利信息资源目录,供用户浏览和查询。通过退回功能,能够将已发布的水利信息资源目录的状态调整为待发布,同时这部分水利信息资源目录将被退回到审核流程中进行重新修改和审核。
3)目录权限管理。可针对不同用户级别分别授权,满足不同用户对目录浏览、检索的权限要求,主要包括以下 2 种设置功能:a. 授权访问设置,包括设置哪些资源目录可以被直接访问,哪些必须通过访问申请、审核后才能被访问;b. 数据交换设置,主要是设置哪些资源目录可以被进行数据交换。
4.2.3 目录查询
目录查询包括以下功能:
1)多维度目录查询。根据数据资源目录分类的不同维度进行资源目录的查询。
2)列表查询。通过列表的方式进行资源目录查询。
3)信息资源访问。根据目录资源权限设置,在一定的权限范围内访问相关的信息资源。
近年来,本着边建设、边应用的原则,水利部信息中心在部水信息基础平台的支撑下,持续开展了大量的水利数据资源整合共享相关工作。其中:利用部目录服务系统,初步完成水利部机关包含55 类约 1 100 万余个水利对象在内的水利数据资源目录编制工作,相关工作将继续推进。
部目录服务系统已实现与长江水利委员会、黄河水利委员会、淮河水利委员会等流域管理机构,以及湖北水利厅、新疆生产建设兵团水利局等水行政主管部门数据资源目录服务系统的无缝集成和互联互通,并通过系统对接的方式,同步整合了长江水利委员会约 262 万个、黄河水利委员会约 61 万个、淮河水利水利委员会约 19 万个、湖北水利厅约5 万个、新疆生产建设兵团水利局约 6 万个的数据资源目录内容。目前,部目录服务系统中目录条目数量已超过 535 万个。随着与其他流域管理机构和省级水行政主管部门数据资源目录服务系统的对接,该数量将继续增长。
在目录编制与共享的同时,部目录服务系统中大部分目录内容都与相应的结构化、非结构化或半结构化数据进行了关联。在此基础上,部水信息基础平台实现了对 PB 级数据的统一,并为水利部等50 余家单位提供了水利信息资源共享服务。
水利信息资源目录是实现水利信息资源统筹管理、协同共享的基础和依据。要实现全水行政主管单位(部门)间水利信息资源目录间的对接联通,形成跨业务、部门、单位、层级的服务共享能力,需要各单位按照统一的水利信息资源分类标准和元数据规范,采用统一的编码规则编制水利信息资源目录。本研究对《指南》采用的水利信息资源分类体系、目录元数据项设置和代码编制规则进行了深入解析,同时也介绍了水利部信息中心在目录编制和共享服务方面的工作和成果,希望能够从理论和操作层面深化各单位对《指南》和目录编制工作的理解,指导各单位按照《办法》要求开展水利信息资源目录编制和汇交工作,为全面构建水利信息资源目录体系夯实基础,为水利信息资源全面融合共享提供有效支撑。