孔维豪,刘洋,陈霜,朱鹏飞,蔡煜琦,李晓翠,刘琳莹,王思宇
(1.核工业北京地质研究院 中核集团铀资源勘查与评价技术重点实验室,北京 100029;2.核工业二四三大队,内蒙古 赤峰 024006;3.核工业二〇八大队,内蒙古 包头 014010)
中共中央、国务院于2020 年4 月9 日公布《关于构建更加完善的要素市场化配置体制机制的意见》,进一步确认将数据纳入生产要素范畴,并提出推进政府数据开放共享、提升社会数据资源价值、加强数据资源整合和安全保护3 条具体建议。数据继土地、劳动、资本、企业家才能之后成为新的生产要素,推动人类社会进入数字经济时代。
经过60 多年中国核工业地质局及各地勘单位的共同努力,在全国圈定了49 个铀成矿区带,积累了大量全国性铀矿地质数据,以及部分海外铀矿地勘数据,并以不同形式分布存储于核工业地质局与成员单位档案馆、部门或个人。数据涵盖的学科领域包括地质、遥感、物探、化探、钻探、测绘等,其中部分专题数据和成果还建立了相应专题数据库或综合性数据库[1]。
“十四五”期间,核工业地质局开展“三新”找矿,实施铀矿勘查会战,但所需数据资源需要全面查阅、清洗和集成,同时出现大量重复采集和重复处理的问题,未能及时快速响应勘查会战要求。由此可见,当前铀矿勘查数据资源管理方法、流转形式、应用服务模式,均难以适应新时期铀矿勘查数字化战略需求。在国家、集团与中铀数字化战略背景下,提升勘查数据品质与服务能力,加速铀矿勘查数据资源动态流转,全方位释放存量数据价值,是大势所趋。
为了推动铀矿勘查科技创新能力提升,2019—2020 年期间,核地研院依托龙灿二期项目研发了二连应用示范铀地质云平台,集成了二连盆地中东部地质矿产、物化探、遥感等多元异构数据,初步满足了项目组对铀矿地质数据资源的基本需求[2-4]。2021 年,中国铀业有限公司完成了勘查领域信息化顶层设计,其中初步规划了“应用平台-应用系统”的建设规划,指导中国铀业十四五乃至未来的信息化建设。“数字化铀矿勘查服务平台”作为中国铀业4 大统建信息化平台之一,总体目标要实现铀矿勘查数据资源、业务应用资源的统一集成管控,满足数据管理共享和业务协同工作的需求,整合平台能力以服务于铀矿勘查、科研和管理业务应用场景,支撑中国铀业“横向协同、纵向贯通”的集成应用和功能实现[5-6]。
核工业地质局60 多年勘查历史,积累了极为丰富的勘查数据源,同时,铀矿勘查生产与科研过程,一直在产生新的数据,然而,这些数据并未得到有效共享应用,释放其应有的价值[7-8]。制约铀矿地质勘查数据共享应用的问题包括但不限于以下几个方面:
1)铀矿勘查数据资源家底不明
全国铀矿勘查数据资源分布存储于众多单位、项目组或个人系统中,至今没有形成全部勘查数据资源家底的明细清单,更难以具体到勘查区铀探矿权资产的精细刻画。甚至在同一单位部门、项目组内部,对勘查工作区有什么数据、在哪里、找谁要、可用性如何,均比较模糊,这对部署、实施勘查生产与科研项目较为不利,极为容易发生重复性数据采集,导致勘查成本增高。
2)铀矿勘查数据资源检索不便
无论是全国、还是具体的勘查工作区,数据地图作为勘查数据资源浏览、查询的导航,数据资源目录是用户进行数据互动的重要桥梁,但目前缺乏便捷的勘查数据检索查询通道。首先是对勘查工作区存量数据资源的查询检索困难;其次,即使已检索到该勘查数据资源的存在,勘查工作区有该类数据存在,但由于数据分布存储于独立的系统中,同时因数据许可审批机制问题,获得数据周期极长,用户检索数据的效率极低。
3)铀矿勘查数据再利用难
铀矿勘查数据资源再利用,存在严重不足。由于各类勘查数据生产系统的历史原因,以及铀矿勘查大数据的固有特征,在不同系统中,存在同一数据的标准规则不一致现象,大量勘查数据资源的可追溯与可解析性较差、再利用难。如样品分析数据的原始取样记录缺失;大量专题图的空间要素关系混乱,图面内容直观可看、也可进行人工目视解释,却难以进行计算机开发应用,大量专题图中的地质要素空间分析难以实施。
4)铀矿数据资源各类接口不畅
包括技术与非技术层面的数据接口不通畅,导致铀矿勘查数据流转缓慢,甚至数据流动不起来。在技术层面,各类专题数据分析与制图系统、资源评价预测系统、三维地质建模系统等,其绝大部分工作时间浪费在输入数据的准备阶段,包括格式转换、数据抽取等预处理。在非技术层面,数据生产者、提供者、消费者之间对接严重不足;同时,数据资源的产权、许可、安全等规章制度不健全。
5)铀矿勘查数据底层逻辑合理性问题
在目前各类铀矿勘查数据生产系统与业务系统,其数据架构、数据分类、数据模型等底层逻辑,缺少统一规范[9]。尤其是元数据模型的缺失或不合理,各类系统的数据资源管理与应用服务能力不足,同时,对铀矿勘查大数据的汇聚集成带来了巨大挑战。
数据是信息的可再解释的形式化表示,以适用于通信、解释或处理(人工或自动)。数据资源是指在平台中存在的各类数据,包括基础地质、铀矿产勘查相关的数字信息以及电子化数据。通过对数据的积累和整合,可以形成完整、准确、一致和易于共享的数据资源库,为用户提供丰富、全面可靠的数据支持。数据资源的共享可以提高数据利用效率,促进勘查工作协作,加快科研和决策的进程,发掘和利用勘查数据的价值。
数据资源作为建设数字铀矿地质勘查的生产要素之一,是铀矿勘查数字化转型的基座,是铀矿勘查业务开展的依赖,也是铀探矿权资产的精细刻画。统筹开展铀勘查数据资源建设,实现勘查数据的快查、可得、易解、好用,全面释放数据资源的业务价值,对保障铀矿勘查“业务同台、数据同源、信息同根”、提升铀矿勘查效率和找矿精准性、推进铀矿勘查数字化转型、形成铀探矿权资产、提升铀矿勘查市场竞争力等,具有重大的现实与长远意义。
数字化铀矿勘查服务平台对不同来源、不同类型、不同时代产生的地质信息资源数据,按照全国49 个铀成矿区带进行了组织(图1),并参照中国地调局的元数据标准,建立了较为完善的铀矿勘查元数据模型,实现了数字化铀矿勘查相关电子数据的统一规范、标准化管理、多层级迭代更新与数据共享等功能,满足多源异构数据的高效管理与应用需求[10]。并依托分布式存储环境提供数据管理功能,满足结构化数据、非结构化数据和空间数据的管理、调阅需求,实现对原始数据的有序管理,做到了铀矿勘查数据的可追溯、可找寻、可访问、可交互、可再用。
图1 时空数据管理界面Fig.1 Spatial and temporal data management interface
根据《中国核工业集团有限公司数据安全分类分级指南(征求意见稿)》的相关要求,数字化铀矿勘查服务平台也遵循相应原则。数字化铀矿勘查服务平台以浏览器和服务器架构模式(即B/S 架构)对数据资源、数据目录进行可视化呈现和交互式操作(图2)。参照中国地质调查局的数据分类标准,将数据资源划分为基础地质、矿产地质、地球物理、地球化学、水文地质、地质钻孔、工作程度和遥感8 大一级目录,并充分结合铀矿地质调查中所运用的工作手段,以矿产地质作为一级分类,划分二级、三级分类,可以有效涵盖铀矿地质勘查和科研工作中的各类数据(表1)。
表1 数据资源分类一览表Table 1 List of data resource classifications
图2 数据资源目录界面Fig.2 Data catalog interface
当前铀矿勘查数据质量以及数据资源的可集成性、可发现性、可用性、易用性等系列问题,是制约铀矿勘查数字化转型的主要瓶颈之一。通过铀矿勘查单位部门协同治理,形成可开放共享的数据资源目录,以明确的产权、安全的许可机制、便捷的服务模式,加快数据资源的高效流转应用,全面盘活铀矿勘查数据资源、全方位打通数据链路、充分激发数据共享应用价值,有助于整体推进铀矿勘查数字化转型。
钻孔数据作为铀矿地质勘查最重要的基础数据,是数字化铀矿勘查服务平台重点管理和服务内容,因此要确保数据质量,以满足钻孔数据管理、检索和地质信息提取等功能的实现[11]。数字化铀矿勘查服务平台提供了钻孔数据质检工具,兼容坤迪铀钻孔数据库,并提供投影转换、质检规则自定义、质检日志等模块,为用户提供方便快捷的一站式质检。通过质检的钻孔数据库,可以通过平台数据导入模块(图3),一键上传至平台PostgreSQL 数据库中[12]。对于铀矿地质勘查中的地质图、物化探、遥感等数据资源,由于数据格式和数据结构不一致,无法按照统一数据模型进行入库。对于该类数据资源,平台也提供了以单文件形式上传的功能,确保数据资源可存、可查、可用。同时,平台也积极探索与地质图、物化探、遥感等数据资源的专项业务系统的对接工作,最终实现数据资源的一站式服务。
图3 数据资源导入界面Fig.3 Data import interface
数字化铀矿勘查服务平台部署于中核集团商网环境,中国铀业所有地勘单位均可通过商网计算机进行访问和使用。数据资源均为非密数据,目前平台提供标准图幅地质图件305 幅、预测类图件158 幅、建造构造类图件100 幅、钻孔数据4 275 个等,并由二连应用示范铀地质云平台迁移历史数据4 957 个。
3.1.1数据服务
数字化铀矿勘查服务平台按照数据“谁生产、谁入库”的原则,各地勘单位通过平台提供的统一数据管理系统和技术要求,对勘查数据进行分类组织、整理、标准化并入库,形成统一标准化的铀矿勘查数据目录清单。同时,平台提供数据审计等数字化手段方式,为每一个数据登记造册,确保“谁上传、谁下载、谁查看”等日志信息准确无误,按照“谁使用,谁负责”的原则,任何用户要确保对平台的数据进行合法合理使用,不得上传或泄露任何敏感信息,不得转予第三方,切实维护数据提供者的合法权益[13]。
平台共享服务方式包括在线和离线两种方式,数据本身具备在线条件的,原则上都应采用在线方式,不具备相应网络条件的可采用离线方式。无论何种方式,均需要在数字化铀矿勘查服务平台上注册数据信息,即填写元数据信息,并通过申请审批功能获取数据操作相应权限(图4,图5)。平台为每个地勘单位提供“数据审批员”角色,负责本单位在平台中的数据审批工作。审批角色由各单位信息化负责人担任,也可以由各单位组织审批小组承担数据审批职责。
图4 地质图件的元数据信息Fig.4 Metadata of geological map
图5 数据申请审批界面Fig.5 Data request and approval interface
3.1.2在线地图服务
数字化铀矿勘查服务平台面对不同的业务需求,需要提供不同层次的在线服务,并应具有较强的可扩展性,同时服务的类型必须多样化[14]。为了满足不同用户、不同层次的勘查业务需求,平台以WebGIS为技术手段,通过服务注册功能提供了“基于开放标准,同时兼顾扩展和功能性”的服务类型和服务接口,可以动态地从分布式的空间信息系统(如物化遥数据管理系统、铀矿勘查大数据管理平台等)中集成多种服务到数字化铀矿勘查服务平台中,将他们进行统一的管理、维护、监控、分享及权限控制。平台通过对开放地理信息服务标准(OGC)的支持,利用Java 语言的反射机制和Spring Boot 提供的HTTP 请求服务转发能力构建服务引擎,兼顾系统的扩展性和兼容性,实现异构服务的托管、整合及管理控制,从而实现在平台中对各种服务类型的统一管理(图6,图7)。
图6 OGC 服务发布支撑技术框架Fig.6 Architecture for OGC service publishing
数字化铀矿勘查服务平台始终坚持以“安全、可靠、开放的数据共享机制”为导向,实现各地勘单位和部门之间的信息交流,促进业务合作与在线协同。计划在2023 年底前完成数字化铀矿勘查服务平台正式上线运行,构建以核工业地质局为中心的平台部署与服务模式,各局属地勘单位通过“一张网”(中核集团商业应用网),可以访问并使用平台的数据资源和应用服务,同时积极收集用户使用情况反馈、用户需求等方面的信息,为下一步升级优化积累经验(图8)。
图8 平台部署与服务模式Fig.8 Platform deployment and service pattern
数字化铀矿勘查服务平台通过采取必要的数据安全策略,确保数据处于有效保护和合法利用的状态,以及具备保障持续安全状态的能力[15]。除了建立定期数据备份机制、加强人员数据安全意识培训和定期安全评估之外,还应该通过以下管理措施和技术保障,以支撑数字化铀矿勘查服务平台长期健康稳定运行。
1)加强合法合规
遵守国家和个人隐私法律法规,确保数据的合法使用和传输。数字化铀矿勘查服务平台依据国家《科学数据管理办法》和《中华人民共和国数据安全法》等,以数字化软件系统严格保障用户的数据安全,并对数据管理、数据共享和数据应用进行约束,以维护中国核工业地质局数据所有者权益。
2)加强数据安全管理
制定严格的数据安全管理规定和措施,确保数据的采集、处理和使用符合国家和个人隐私法律法规的要求[16],为了加强数据安全管理工作,《数字化铀矿勘查服务平台数据管理与共享办法(讨论稿)》正在编制中。
3)采用集团商网部署方式
基于中核集团未来信息化发展要求,平台采用中核集团商网环境部署方式,以便最有效保障网络安全和数据安全。核工业地质局及各地勘单位可通过本单位的商网电脑随时访问,并将使用到的基础底图数据、依赖软件通过离线方式部署于数字勘查分中心的信息化机房。
4)采用数据加密技术
采用MD5(Message-Digest Algorithm 5)对数据进行加密处理,把一个任意长度的字节串变换成一定长的16 进制数字串,防止数据库中信息泄露;同时为了防止恶意破解,限制密码长度不少于6 位。该方法有效确保了信息传输完整一致,数据在传输和处理过程中不会被恶意攻击或篡改。
5)采用身份验证令牌技术
token 是服务端生成的一串加密字符串,作为客户端进行请求的一个“令牌”。平台采用身份验证令牌作为用户登录访问/下载资源的凭证,只有通过验证的用户才可以访问/下载平台的资源;用户下载有权限的数据资源时为了防止其他用户获取到url 后也可以下载或根据数据名称查找服务器中数据所在位置,下载的url 后面需要有token 并将数据名称进行加密,解密数据名称并校验成功token 后才能正常下载。为了保证时效性,若用户超过一个小时未操作平台则该用户自动注销;若用户在一个小时内操作平台,则会对当前用户的令牌进行续签。
6)采用基于角色的权限控制
基于角色RBAC(Role-Based Access Control)模型的分配方式是一种间接分配方式,其将用户跟权限之间建立一个集合,然后将用户通过角色与权限进行管理,这种方式只需要将用户跟角色建立关联,在给用户分配权限时,只需要给用户关联角色即可。当角色权限需要变更时,直接调整角色权限即可,拥有该角色的用户权限也会同步进行动态调整。
数字化铀矿勘查平台基于RBAC 模型构建“用户-角色-权限”访问体系,平台目前分配了游客、普通用户、运维管理员、数据审批员、单位管理员等角色,对不同的角色分配不同系统、页面、菜单、按钮的不同权限,保证平台资源访问的安全性。
7)采用面向对象的数据审计
平台针对用户关心的数据资源,实现对“谁查看、谁上传、谁下载”等用户操作数据的信息审计功能。系统记录用户的登录系统的详细操作日志,并提供日志查询、删除、导出功能。日志信息包括:用户名、类型、模块、时间、IP 及用户操作明细等内容,并可以提供直观的可视化图表及导出功能。
系统通过设置登录失败次数限制、登录时长限制等,防止系统被恶意攻击;同时可以通过设置白名单和黑名单对某些恶意IP 限制访问平台。
针对铀矿勘查数据管理与共享困难的问题,在前期二连应用示范铀矿地质云平台的基础上,基于开源架构研发了基于统一架构、研产一体的“数字化铀矿勘查服务平台”,提出了一套数据资源共享管理办法,同时梳理了数字勘查中的数据资源和安全策略,建立了一套较为健全的数据产品体系和服务产品体系,实现铀矿地质勘查数据集成管理、可视化表达、查询检索、专题图制作、统计分析、共享交换和安全管理等方面的功能,最终形成“快速存储、方便查询、灵活调用、共享发布、动态更新、分析应用”的数据资源管理和服务共享平台。
数字化铀矿勘查服务平台初步解决了数据共享的问题,下一步工作建议组建勘查联合团队,摸清我国49 个成矿区(带)数据家底,联合开展数字勘查标准规范体系建设,进一步加强数据资源建设的投入,共同实现平台的推广应用。数字勘查分中心深入铀矿勘查一线,与地勘集团密切配合,通力协作,持续加强铀矿勘查数字化转型,为新时期铀矿找矿取得新突破提供信息技术支撑。
同时,随着国家对网络安全、数据安全的重视,在未来中长期工作中,数字化铀矿勘查服务平台在数据安全和隐私保护方面需要持续加强监管水平。在信息化专家的指导下,通过采取一系列的安全措施和合法合规要求,确保平台数据安全与隐私保护。
对于中核集团和中国铀业来说,搭建数字化铀矿勘查服务平台并不是最终目的,而是一种致力于在线协同化数据资源共享与应用服务的技术变革。最重要的是利用“大平台”的理念更好地适配勘查业务变革,汇聚铀矿地质多源数据,构建数字勘查全生命周期的大数据应用一体化平台,数字化赋能支撑中核铀业高质量发展。
致谢:
感谢四代勘查项目地质组、数字勘查分中心、核工业二四三大队、核工业二〇八大队对数字化铀矿勘查平台建设给予的支持和帮助。感谢审稿专家的宝贵意见和建议。