郭猛猛
(安徽省勘查技术院,安徽 合肥 230031)
2014年11月,我国首个地质大数据平台在西藏地调院试运行。该平台以大数据技术为依托,通过开发适应多种类、表现形式多样的地质大数据的关键技术,实现了地质大数据的一键式存储、组织、管理、快速检索与智能挖掘等。
2015年贵州地质科技园正式开园,成为国内第一家以地质元素为主题,以地质大数据、地质大生态引领发展的科技创新园区;2016年贵州省建设国家大数据(贵州)综合试验区,成为首个国家级大数据综合试验区。
2015年山东省投资2个多亿,第一期投资6 000万建设智慧地矿工程。该工程是将GIS、大数据、云计算等现代信息技术与地质工作相结合,采集近60年来覆盖山东省15万km2范围内的地质原始资料和成果数据,实现地矿数据从数字到信息、从信息到知识、从知识到应用的转化,从而达到地质科普、服务决策、模式复制、地质工作方式创新的目的。
2017年2月,湖北省地质局以构建“湖北省地质局地质大数据平台建设”进行项目专题调研,并于2018年6月份开始基础建设采购。
2017年广东省投资约4 900万以集聚广东全省地质数据构建综合的大型数据中心为核心建设智慧地质。现广东省智慧地质工程尚处在数据中心建设初步阶段。
2017年11月,中国地质调查局“地质云V1.0”正式上线运行。中国地质调查局积极贯彻落实党中央及国土资源部大数据与信息化建设总体部署,围绕建设世界一流的新型地质调查局,启动“地质云”建设工作,旨在依托云计算、互联网+、大数据等信息技术,消除数字鸿沟,整合共享数据资源,力争建成国内权威,国际一流地质大数据中心和“地质云”服务平台体系,实现地质信息的开放与共享。
此外,云南、河南、山西等省也相继启动了地质大数据信息化建设工作。
到目前为止,地质方面已经完成了全省1∶20万区调图幅、1∶50万系列地质图、安徽省矿产图、安徽省铁铜矿产分布图、安徽省大别山地区1∶5万片区总结,省内在基岩区开展的1∶5万区调共151幅,新发现矿床(点)约200处,涉及30余个矿种;物探方面完成了全省大部分地区1∶20万比例尺区域重力调查和1∶5万及更大比例尺航磁数据采集;化探方面完成了安徽省蚌埠幅1∶20万新一轮区域化探扫面等成果、18份1∶20万区域化探扫面成果以及1∶50万安徽省区域重砂成果图,撰写了《安徽省区域重砂成果》报告。
安徽省地学数据库建设起步较早,1991年开展了“矿点(床)数据库管理系统”、“物化探异常数据库管理系统”的开发和数据库建设;1994年建立“安徽省岩石地层数据库”;1997年完成了“安徽省1∶50万数字地质图”的编制,建立了相应的地质图空间数据库。1999年,全国地质大调查工作启动,先后完成了“安徽省1∶20万地质图空间数据库”、“安徽省1∶20万自然重砂数据库”、“安徽省矿产地数据库”、“安徽省地质工作程度数据库”等数据库建设。
根据建设目标和内容分析,安徽地质信息化平台主要面向安徽省地矿局内部用户、地质行业用户、政府部门用户和社会公众用户。
(1)地矿局内部用户。省地矿局内部用户除包括管理决策人员外,还包括地质、矿产、水工环等相关基层单位生产人员和科研人员,以及平台的运维人员。
(2)地质行业用户。地质行业用户主要指除地矿局内部用户以外的用户,平台为这类用户提供一定范围内数据的共享服务,以及可能提供的地质数据分析服务等,同时他们也是安徽省地质大数据云平台主要的使用推广对象。
(3)政府部门用户。地质信息是国民经济建设中的基础性资料,广泛应用在城市规划、国土、水利、交通、环境、农业、地震、安全、能源、旅游等众多行业领域,对这些行业的业务工作具有重要的支撑作用。可以预见,未来安徽省地质大数据云平台对接安徽省政务云后,地质信息必然会优先共享给各个行业厅局委办。
(4)社会公众用户。公众用户对本项目的平台和系统没有主观的使用需求,但省地矿局作为地质行业的专业单位,肩负着面向公众提供地质科普,引导公众对地质业务认知的社会责任。
围绕建立全面统一的安徽省地质大数据库和地质大数据服务平台,对安徽省地矿局内的数据资源情况进行了调研分析。通过调研,主要有地质专业数据、项目档案资料、遥感卫星数据三大类数据应进行内部建库归档,并服务于各地矿单位。同时,考虑到重力数据、土地类专题调查类数据等多为涉密数据,故平台中对此类数据应进行整理并存档到基础数据库,在涉密工作环境下使用[1]。
3.3.1 技术需求
(1)异构存储架构的统一管理。平台需要存储的数据具有种类繁多、体量大等特点,不仅有传统的结构化数据,同时具有大量的半结构化数据和非结构化数据,需要在传统关系型数据库存储的基础上,提供大数据的分布式存储,才能满足各种海量大数据存储的需求。为了方便管理,需要实现关系型数据库与分布式存储框架的统一管理、维护,才能够达到地质大数据服务的预期目标,体现出安徽省地质大数据云平台建设的服务效能。
(2)分布式处理框架的统一管理。平台未来整体数据量将达到PB级,含空间数据、非空间数据。平台需要针对不同的应用需求提供不同的大数据处理框架:第一个框架是处理大规模业务数据,包括MapReduce、Hive和Spark等;第二个框架是查询大数据框架,包括GIS Tools for Hadoop等。为了方便管理,需要针对不同处理框架实现统一的生命周期管理、算法作业管理等功能[2]。
(3)地质大数据管理。平台需要基于基础地理信息、地质信息整合各行业的专题数据,形成安徽省统一的地质大数据服务平台行业数据模型,而地质大数据管理功能充分体现了平台的大数据管理能力。平台需要提供针对地理模型的管理功能,包括:元数据管理、历史管理、质量管理、数据备份、数据更新。与此同时,还需要建立长效的数据更新机制,保证数据的现势性、持续性和可用性。此外,地质大数据管理能够提供对底层存储资源的多租户管理、权限分配等功能,为地质大数据行业模型的数据管理工作提供基础支撑。
(4)地理、地质二三维可视化展示。平台从内核实现二三维一体化GIS技术,帮助用户构建实用的、满足深度业务需求的三维GIS应用。要求提供丰富的三维符号,绿植、路灯、道路、水面等要素均可用三维符号展现;提供三维线型符号、自适应管点符号、模型符号实现快速构建三维管线场景。提供水面、粒子、局部动画、太阳阴影、带状跟踪等三维视觉效果,支持骨骼动画模型、节点动画、视频投放到三维场景、碰撞检测等功能,显著提升三维场景浏览的视觉真实感和操作体验。流畅显示1 000 km2以上的精细模型,支持1 000万记录以上的地物矢量化,加载TB级的地形和影像数据,支持直接加载TB级倾斜摄影数据,提供直接加载、动态投影、单体化选择、属性查询、空间查询、三维空间分析等功能。
3.3.2 业务功能需求
(1)地质大数据基础支撑平台。为了更好地利用项目建设的地质大数据库成果,更灵活地服务于业务部门对地质相关信息的可视化要求,需要建立云平台、大数据平台、综合集成管理平台作为基础支撑,实现对地质大数据的存储、访问、管理和服务。
(2)地质大数据资源共享服务。平台建设的核心思想就是基于基础地理信息、地质数据,搭建安徽省地质大数据服务平台实现数据资源的共享。各单位在应用大数据平台提供的服务能力的同时,也可以享受平台提供的数据共享和应用共享服务。因此,需要平台能有效保障共享资源的安全。
(3)基于地质的大数据挖掘框架。为使平台能够满足地矿单位的业务需求与政府部门的宏观决策需求,需要对大量地质、基础地理数据进行空间统计、排序,揭示不同地质对象之间的内在关系、规律和潜在特征信息。为此,平台为用户提供了基于地质的大数据挖掘框架,可以基于大数据的分布式处理框架,高效地进行空间分析和挖掘。同时,为了方便用户使用和定制,平台需要为用户提供可视化的建模环境和基础空间算法库。用户可根据自身业务需求,在可视化建模环境中,建立基于地质空间算法库的大数据分析挖掘模型,实现地质空间大数据分析模型的自由组装和定制。
(4)基于地质大数据平台的应用服务。以地质大数据平台提供的公共服务基础为支撑,围绕地质工作的生产管理、成果应用共享等方面需求,开展多个应用系统的建设工作。目前,根据前期的调研规划,主要建立以下应用系统:地质数据共享服务系统;遥感卫星数据共享服务系统;地质灾害应急协同会商系统;地质大数据运营中心软件系统[3]。
(1)兼容性要求。平台支持多云区域或多数据中心部署,并考虑安徽省政务云兼容性,保障未来迁移工作顺利完成。
(2)可维护性要求。平台中涉及软件提供符合软件开发规范的完整源代码、用户使用手册以及平台维护手册;平台涉及硬件提供完整技术参数、有效的厂家售后、联系方式、硬件维护手册等。
(3)可扩展性要求。平台中各层次之间相对独立,使得各层次都具有一定的扩展性,具体表现为存储与计算可拓展,服务可综合集成且提供二次开发接口。
国家地质信息化建设应摆脱单纯以“数据量”论成效的价值观,重视数据的信息服务价值,有效地开展地质数据综合集成与产品开发,大力发展现代地质资料信息服务,不断提升地质信息资源的开发利用程度,加大信息综合整合力度,使地质工作的各项成果能够及时完整地提供给政府、专业人员和社会公众,增强公益性地质工作的服务功能。同时,应借鉴大数据思维,探索国家基础地质大数据可视化技术,提升信息价值,增强国家基础地质信息化软实力,实现数据价值的最大化。