吴小平,王黔驹,颜世强,连 健,许百泉,丁克永
(1.中国地质调查局发展研究中心,北京100037;2.全国地质资料馆,北京100037)
地质资料是地质工作服务社会的主要载体,是地质工作成果的重要体现。地质资料反映了地球的物质组成、结构、构造、地形地理、地质环境、地球演化等客观要素,是研究地学发展变化的资源宝库,是经济社会可持续发展不可缺少的基础信息资源。目前,我国在地质资料服务方面长期存在资料信息分散、综合研究不够、服务渠道不畅、服务能力不强等问题,使地质资料信息的巨大潜在价值未能得到充分发挥。为充分发挥地质资料信息的服务功能,国土资源部将推进地质资料信息服务集群化产业化作为提高地质资料管理与服务水平的重要抓手,提升地质资料信息服务找矿突破战略行动和社会大众的能力和水平[1-3]。
地质资料信息服务集群化产业化(以下简称“两化”)是通过充分运用信息化等技术手段,按照统一的规范和标准,对地质资料信息进行深度加工和整合,提高地质资料信息的集中度和关联度,形成分布式、多层次能满足不同需求的地质资料信息服务能力,开发多类型的服务产品,拓展服务领域,扩大服务规模,推进地质资料信息服务产业发展[4-6]。
以现代信息技术为基础、以地质资料信息服务为导向、以汇聚地质资料数据资源为核心、兼顾地质资料信息服务产业化发展方向的要求,重点研究与地质资料信息服务密切相关的关键技术,重点考虑能够构建经济合理、安全可靠、简单实用、易维护、易扩展的软件体系框架的关键技术路线和解决方案,重点分析关键技术的相互关联和应用接口,在此基础上,提出地质资料信息服务两化的关键技术体系框架。
地质资料信息服务两化关键技术体系框架是从技术角度阐述地质资料两化技术体系的总体构成以及各组成内容之间的关系,既包括地质资料管理与服务各个阶段的需要的关键技术,又反映其相互关系,技术体系框架要适应地质资料业务基本工作流程和两化工作需要,以方便管理者及研究人员根据推进两化的需要确定采用或者研究的关键技术,为地质资料信息服务两化工作提供技术参考模型。因此,关键技术体系框架的设计需遵循以下原则。
专业性:关键技术必须是针对地质资料信息服务两化建设特定目标和要求的有关信息技术,以需求为导向、应用为目标进行统筹考虑,并能在实际应用中不断补充与完善。
实用性:关键技术必须针对解决目前两化建设的瓶颈问题,并能够结合实际问题给出解决方案,要结合地质资料信息化的基础条件,充分考虑关键技术的经济效益和技术实施成本、时间等各种因素。
规范性:要尽量采用具有标准规范接口的组件技术,每个组件应该具有自组织和自维护功能,具有良好的封装特性,注重技术的适用性,便于推广应用。
公开性:应考虑采用公共版的空间数据和地图,例如,用谷歌三维地图和天地图三维地图,特别是在地质资料可视化查询中,应该考虑空间数据的公开性。
地质资料信息服务两化关键技术体系框架是根据地质资料信息服务业务流程而设计的关键技术架构体系,两化关键技术框架体系可划分为数据汇聚、资源共享、服务支撑、应用服务四个层次,以及政策法规与标准规范体系、通信与信息安全保障体系两大支撑手段。地质资料信息服务集群化产业化关键技术总体框架如图1所示。
底层是数据汇聚层和资源共享层,以实现对地质资料进行汇交收集和组织管理,为开展地质资料信息服务提供数据资源支持。上层包括服务支撑层和应用服务层,是在基础数据集的基础上开发各类专题服务并形成专题产品,实现地质资料信息的深度开发和服务的集群化,以通过互联网向社会公众、团体、机构、企业提供各类的应用服务。
地质资料按照形成方式分为成果、原始、实物地质资料三类;按照专业类别包括基础地质、石油天然气地质、水文地质、环境地质、物化遥地质、海洋地质等信息。数据汇聚层由各种地质资料数据、数据库及相关的软件和硬件组成,凸显底层环境的支撑作用。具体内容包括各种地质资料数据,以及用于地质资料数据保管、存储、传输和处理的软硬件设施资源。
数据汇聚层涉及到的关键技术主要为数字化技术、海量数据存储与管理技术、RFID技术、数据库管理技术。数字化技术是资料信息化建设的重要基础性技术,是支撑地质资料信息化建设的关键;海量数据存储与管理技术重点解决海量数据资源的存储与高效管理问题,消除数据存取瓶颈,保障数据安全,提升数据管理水平;RFID技术即射频识别技术,利用RFID技术通过对纸质资料实体建立电子标签,实现地质资料实体的全过程管理,降低成本和提高服务水平,提升地质资料库房现代化管理水平;数据库管理技术重点解决数据的统一组织和管理,按照规范结构建立数据仓库,实现对地质资料数据的处理、分析和理解。
资源共享层是充分利用已有数据资源,消除数据差异、信息孤岛,为实现信息共享和资源协同使用,主要是基于语义的描述与发现,实现语义共享和数据集成整合。数据集成是通过规范接口把多源、异构、多维、多学科的数据在逻辑上,或物理上有机地重新组织,为用户提供全面的数据共享[7-8]。涉及到的关键技术包括分布式地质资料信息共享服务技术、多源异构数据集成管理技术、数字产品统一标识技术、涉密地质资料处理技术、元数据管理技术、数据共享与传输技术等。
图1 地质资料信息服务集群化产业化关键技术总体框架
分布式地质资料信息共享服务技术是通过建立有效的数据共享和管理机制,解决数据共享难题,减少重复投入,在更广泛领域内实现更多种类型(结构化和非结构化数据)的数据资源共享,为不同用户提供一个快速查询检索和交互平台,降低系统集成费用;多源异构数据集成管理技术是将不同来源、不同尺度和不同精度的空间数据集成并融合在一起,解决跨平台共享问题,实现异构空间数据的交换和共享,为政府决策、专题研究等提供实用的基础信息和进行深度开发,更好的发挥各类数据的作用;数字产品统一标识技术主要目的是唯一标识地质资料数字对象,以促进的资源的深度访问,保持数字对象在不同系统中的一致性;涉密地质资料处理技术主要解决地质资料的安全利用和公开使用问题,利用信息技术对保密地质资料进行处理,提高地质资料公开利用程度;元数据管理技术是采取有效的方法来描述、组织和管理海量数据,提高查询检索效率,是解决数据管理问题必须考虑的关键要素;数据共享与传输技术是面对海量的地质资料数据,探讨解决数据存储、在线快速浏览和实时传输等问题。
服务支撑层提供丰富的地质资料单元服务和组合服务,为上层的应用服务提供服务产品和服务接口。服务支撑层的服务可以视为遵循协议和规范的一组操作接口,服务的实现体现在接口上,而接口实现的基础是服务规范。服务层应提供信息发布服务、公共管理服务、计算资源服务等多种功能,它们的主要差别取决于被封装的业务功能和服务对象。涉及到的关键技术包括地质资料全文检索技术、地质资料数据挖掘技术、三维建模及可视化技术、数字版权保护技术以及相关信息服务、web服务规范等。
地质资料全文检索技术是综合了分词、索引、查询等技术而形成的技术体系,实现对地质资料中的任意内容信息查找出来,提高地质资料查全率,方便用户使用;地质资料数据挖掘技术是通过数据挖掘发现地质资料中隐藏的有价值的信息,建立各种资料之间的关联分析、分类聚类、预测分析,便于宏观决策,提高地质资料的利用率,促进数据产品的深度开发;三维建模及可视化技术是通过适当的数据结构建立相关地质特征的数学模型,将复杂的地质构造情况、地质体的形态以三维的形式表现出来,获得直观易懂的图形化数据服务,提供面向专业应用的服务;数字版权保护技术是保护在网络环境下数字化地质资料的知识产权,保护地质资料生产者合法权益。
应用服务层提供多元化、多方位信息服务渠道,扩展延伸地质资料信息服务集群化模式,是以信息门户形式向用户提供面向不同方面的科研环境和公众服务平台。具体可以针对各种应用需求进行扩展,面向专业用户提供可定制的用户界面,编程模型、仿真工具、监控和管理等工具及API,面向公众应用提供信息查询检索、数据浏览、下载等服务。应用服务层涉及到的关键技术主要是地质资料一站式服务、云计算技术以及移动互联技术等。
地质资料一站式服务是一种服务模式,通过集成整合服务流程或内容,以客户为中心,使原本需要跨部门、跨领域得到的地质资料信息能够经单一入口即可实现的方便快捷的服务方式,实现系统化服务;地质资料云计算技术是利用云计算技术实现地质资料信息资源配置动态化,需求服务自助化,以网络服务为核心,不断拓展地质资料信息服务方式;移动互联技术是利用智能移动终端将相关地质资料目录等信息推送到移动服务平台,并可根据用户需求定制服务和更新服务内容,提高用户获取信息的便捷性。
图2 地质资料信息服务集群化产业化关键技术业务关系
从地质资料汇交、保管、服务业务流程来看,关键技术体系框架各组成部分之间不是孤立的,其业务关系和支撑业务运行的关键技术是相互关联,互为支撑的(图2)。在数据汇聚方面,通过数字化技术将各类地质资料(包括纸质资料、原始资料、野外采集资料等)数字化;经过数据检查、校验和修复后,按照数据类别入库进行管理,同时需加强数据安全与质量管理,并对海量数据进行存储和备份。
地质资料数据通过信息提取、整合和格式转换等形成地质资料元数据和各类专题数据,结合元数据和统一标识符技术形成地质资料唯一注册标识符,便于进行地质资料元数据的发布和查询及追根溯源。各类专题数据库通过融合集成、脱密形成更加丰富主题数据库,对各类数据库实现版权(保护)登记,形成地质资料产品提供利用。由此在数据层面,形成一个集成整合后的多层次、多类别的地质资料数据集。
由元数据构成的元数据目录服务是目前数据共享服务的主要手段,它将为一站式服务提供服务导航,提供对各类数据的查询检索;信息检索是用户获取所需信息的主要方式,在其基础上进行数据挖掘将为用户提供更深层次的综合信息和数据产品;地质资料中涉及大量的空间数据,传统的二维展示方式已不能满足人们对空间数据的直观需求,各种地质资料数据集成后通过三维建模及三维可视化技术实现地质体的三维模型展示。结合特定的工作流、模型库、方法库和SOA(REST)等聚合形成为主题数据集服务的综合服务,如城市地质、专项调查、重要成矿区带等,进行地质资料的深度开发,同时可衍生各类专题产品。通过建立数据共享服务平台,将各类数据产品通过Web服务发布到互联网,为各类用户提供服务。
本文从资料汇集、加工、保管、服务等方面阐述了地质资料信息服务两化建设中涉及的主要关键技术,研究了其业务支撑关系,提出了以资料数据汇聚、资源共享、服务支撑等为主要内容的地质资料信息服务集群化产业化关键技术体系框架。下一步还需结合信息技术的发展突出关键技术在地质资料信息服务中的实践与应用,进一步完善关键技术体系框架,为推进地质资料信息服务两化工作提供技术支撑,提高地质资料管理与服务水平。
[1]严光生.中国地质资料管理与服务进展情况分析[J].中国矿业,2012,21(1):14-16.
[2]姜作勤,马智民,杨东来,等.地质信息服务体系框架研究[J].中国地质,2007,34(1):173-178.
[3]肖长先,王遹其,田兆雪.市场经济国家地质资料信息服务研究[J].中国矿业,2010,19(S1):102-106.
[4]姚华军,贺冰清,曹献珍.推进地质资料信息服务集群化和产业化的研究[J].中国国土资源经济,2009(9):4-7.
[5]王黔驹,颜世强,丁克永,等.推进地质资料信息服务集群化产业化的初步思路与构想[J].中国矿业,2011,20(12):20-23.
[6]上海市规划和国土资源管理局.关于上海地质资料信息服务集群化和产业化探索与实践[J].国土资源信息化,2010(1):67-71.
[7]李军,费川云.地球空间数据集成研究概况[J].地理科学进展,2000,19(3):203-211.
[8]陈传彬,邬群勇,陈崇成.基于GML的多源异构空间数据集成框架研究[J].测绘科学,2005,30(5):53-55.