钱建利,魏炳强,靳文虎,邓孝建
(1.中国地质调查局西安矿产资源调查中心, 陕西 西安 710101;2.中国地质大学(武汉)环境学院, 湖北 武汉 430074;3.中国地质调查局烟台海岸带地质调查中心 山东 烟台 264004;4.中国地质调查局西宁自然资源调查中心, 青海 西宁 810000)
随着数据中台、物联网、人工智能决策分析等高新技术的快速发展和广泛应用,调查-观测-模拟-预测-决策已成为现代地质调查工作的新流程,科研范式正由过去的经验范式、理论范式向模拟范式和数据密集型范式转变[1]。在这种全新范式背景下,2018 年,自然资源部将“自然资源要素综合观测网络工程”列为十二大科技工程之首[2-3]。2019年10 月,自然资源部启动了“自然资源要素综合观测网络工程”建设,由中国地质调查局自然资源综合调查指挥中心承担此项工作[4],旨在通过宏观布局推进科学观测站网的建设[5],揭示山水林田湖草等自然资源要素间演化机理,构建山水林田湖草生命共同体认知、修复、开发、保护、解析知识体系,研究自然资源要素与经济社会要素交互影响的演化规律,揭示自然资源多要素耦合状态下的系统关联,研究要素配置和功能重构技术、快速修复和长期维护技术,建立自然资源功能权衡协同模型、开发模拟预测模型,为解决自然资源领域重大问题,服务国家重大战略、工程决策提供数据支撑[6-7]。
2022 年,全国政协委员龙长兴在全国“两会”上,提交了一份关于加强自然资源-生态环境系统野外观测的提案。分析认为,黄河流域生态保护和高质量发展、长江经济带建设、“双碳”目标等国家战略实施,均需要对自然资源、人类活动与生态系统间的耦合作用关系进行深入研究,需要系统的自然资源-生态环境观测数据,如果观测数据系统性差,支撑作用就会不足[8]。目前,我国现有的自然资源观测数据由不同部门分散管理,数据结构和标准不统一,形成了数据壁垒、信息“孤岛”等弊端,自然资源观测业务急需统一部署、统一标准。本文提出自然资源观测数据融合,就是依托已有数据平台,利用大数据、物联网等技术,以地球系统科学理论为指导,开展多源观测数据的汇聚、整合、集成、管理、共享、服务和应用,破解观测数据综合集成“卡脖子”难题,推动全国层面上各学科融合应用。
随着大数据时代的到来,自然资源要素综合观测数据的融合发展迎来了重大机遇和巨大挑战。开展跨领域、跨部门、多尺度、多要素观测数据融合,全面深度挖掘自然资源观测数据价值[9],既是大数据应用的前景,也是技术挑战[10]。2020 年,孙益等[11]基于物联网和数据中台技术,设计了自然资源要素综合观测一体化平台(以下简称“一体化平台”),明确了主要模块组成和关键技术应用;2021 年,赫银峰等[12]对一体化平台进行了建设实践,详细介绍了一体化平台总体业务架构、主要功能模块、特点及优势,初步实现了部分观测站网数据汇聚。但是,在基于一体化平台基础上,如何实现跨部门、跨领域、多尺度、多要素观测数据融合思考研究还不够。
因此,本文通过梳理国内外关于自然资源数据管理现状,深入剖析国内自然资源观测数据管理方面存在的不足,基于自然资源要素综合观测一体化平台,开展了观测数据融合方面的思考研究,初步探索构建了自然资源观测数据融合体系框架,以期为实现海量多源异构观测数据汇聚融合与管理共享提供启发性思考和实践性帮助。
主要发达国家自然资源管理机构对数据管理的职责非常明确且重视。为了应对大数据时代自然资源领域数据指数级增长所带来的机遇和挑战,全球主要国家纷纷加快自然资源领域综合大数据平台建设(表1),以提升多源异构数据的综合集成与分析能力,力图打造自然资源领域适应新一轮科技革命发展要求的生产力工具[13-16]。总体来看,国外在自然资源数据汇聚融合工作方面主要有以下特点[17-19]:(1)有完善的数据管理与共享政策法规体系,从法律层面为自然资源数据管理汇聚提供保障机制。(2)建设有专门的国家级数据管理机构,并制定有针对性的管理法规和标准规范,主要落实国家层面的法律规定。(3)搭建有综合性的自然资源数据管理平台,按照计划、收集、保障、描述、存储、发现、整合、分析、应用等数据全生命周期管理,将各类自然资源数据信息进行汇集融合发布,提供一站式检索服务。
表1 国外主要国家自然资源数据平台建设和管理现状Table 1 Construction and management of natural resource data platforms in major foreign geological survey institutions
目前,我国各类自然资源观测数据基础较好,相关观测数据采集和管理工作分散在中国科学院、自然资源部、水利部、林业和草原局等不同单位及科研院所(表2)[20],数据管理各具特点。例如中国科学院建设的中国生态系统网络(CERN),制定有自身特点的统一的观测与分析、观测质量管理、观测指标、观测的场地及其设置等系列标准方法,在生态系统观测研究方面做出了巨大贡献;但在数据共享方面,对CERN 各成员单位以及科学院内部用户、科学院以外的国内科研用户的数据服务都是非盈利性的,CERN 各成员单位对国内其他用户提供数据服务时,主要以科技合作方式有偿提供[21]。总体来说,由于各单位及科研院所管理和监管职责不同,观测数据管理自成体系,存在观测数据综合程度低、系统性不够,支撑服务生态文明建设、自然资源统一管理和重大资源环境生态系统问题前瞻性研判与决策等方面与新时代自然资源统一、精准化管理要求还存在不相适应的地方[22-23],主要表现在:(1)各类自然资源观测数据管理分散。当前面临的最突出问题是“九龙治水”的自然资源调查、监测、观测和评价模式尚未解决,多门类自然资源观测数据分散在不同部门管理,缺乏综合性和系统性。加之各管理部门职责交叉等因素,同一管理的对象空间边界不统一或存在重叠,分类体系、指标要素、概念语义等差异仍存在。(2)观测数据相关标准规范不统一。目前,各部门观测数据管理相关标准和规范,既有共性也有各自特点,标准规范之间缺乏统筹和协调,导致数据语义、结构、描述规则等存在差异,数据内容存在交叉、重复和不一致等,一定程度上制约了观测数据集成、融合、交换、管理、共享、服务、互操作等,不利于全面、客观、准确地评价和预判我国自然资源和生态系统现在和未来状况。(3)观测数据共享度、开放度不够。各部门间尚未建立完全可行的山水林田湖草多要素观测数据共享与服务机制,目前只是局部共享、选择共享,数据“孤岛”现象依然存在,难以形成支撑服务山水林田湖草生命共同体理论研究的数据体系。
表2 我国相关领域观测数据管理状况Table 2 Status of observation data management in related fields in China
续表2Table 2 (Continued)
从数据管理方式上看,欧美发达国家将集中解决自然资源数据监测、模拟和数据综合管理的问题作为工作的重中之重。例如美国内政部较早实行自然资源综合管理,实质是综合管理基础上的集中统一管理,所属美国地质调查局正在主导建立“地球一张图”大数据综合处理与应用平台,涵盖从多门类自然资源要素数据的获取、存储、管理和查询,到数据的科学整合与分析挖掘,再到数据信息的多元化应用、定制化产品以及面向预测预报的综合信息服务的全流程工作体系[24],全面支撑美国自然资源可持续开发与保护管理。而我国由于以前自然资源分散管理,各部门独自负责相关自然资源观测数据采集、管理、研究等工作,导致自然资源观测数据综合集成管理不够。
从法规标准保障上看,美国、欧洲等发达国家在自然资源信息化制度与标准建设方面起步早、做得好。例如欧盟在2004 年以立法方式颁布了欧洲空间信息基础设施建设法令,利用3 个层次的34 个数据集规范,建立了欧盟统一的空间信息基础设施,实现资源环境空间信息收集、组织与共享的规范化和标准化,2011 年通过了欧盟议会立法,在推进欧盟成员国之间的数据共享与利用方面取得了良好效果[25]。2018 年,我国发布了《科学数据管理办法》[26],各部门根据自身业务领域和专业特点也制定了相关数据管理和共享办法规定,但从全国考虑关于整个自然资源领域针对性、操作性强的数据管理法规政策欠缺,数据标准体系不够统一。
从基础设施管理上看,欧美发达国家如美国2006 年开始建设“集成信息环境”,基础设施采购和运行走向集中,并持续投入。通过基础设施的整合,改变了分散运行的模式,并且由于基础设施建设统一规划、统一管理,从而使其兼容性更好、更具整体支撑效能,为地球科学研究提供更现代化、高效的基础设施条件。对比国外做法,我国对更广范围构建共享信息基础设施缺乏考虑,存在独立建设、重复建设的现象。
从数据采集汇聚共享上看,发达国家形成了从数据源头到成果集成共享应用的工作模式。例如美国地质调查局建设了庞大的水文、灾害、卫星等监测网络,并不断升级网络与设备,实现海量数据实时采集。在多专业多学科的数据管理方面,美国地质调查局负责管理美国全国的数字地图数据的采集与分发,科学家所使用的数据和技术符合或参考已有的相关国家、国际标准和协议。与之相比,我国自然资源观测数据高效汇聚、成果集成共享方面存在壁垒。
综上所述,以地球系统科学理论为指导,统筹山水林田湖草多要素观测数据管理是科学发展的必然规律,也是国际数据管理研究趋势,数据价值在于更加注重服务自然生态和人类社会和谐发展、可持续发展,研究重点更加聚焦多门类自然资源间耦合作用关系和人地耦合关系。正是这些研究特点和发展趋势决定了建立统一、全面、动态更新的山水林田湖草数据管理平台开展观测数据汇聚融合的紧迫感、重要性。借鉴国外关于数据管理经验做法,构建服务自然资源管理、生态文明体制改革和生态文明建设的观测数据融合体系,实现我国多门类自然资源观测数据的有效整合和充分应用势在必行。
自然资源要素综合观测一体化平台在结构上由物联网中心子系统、展示中心子系统、大数据中心子系统、模型云中心子系统、综合应用管理子系统以及门户网站六大系统构成[5-6],如图1 所示。
图1 自然资源要素综合观测一体化平台结构图Figure 1 Structure diagram of integrated platform for comprehensive observation of natural resource elements
物联网中心子系统。作为无线或有线传感器及传感网络与互联网之间重要本地化中央信息处理中心,支持通过无线或有线网络采集传感网络节点上的物品感知信息,进行格式转换、保存和分析计算。
展示中心子系统。集中展示自然资源要素综合观测数据的各种信息,通过丰富的数据可视化技术,为各级用户提供全面、直观的业务信息。通过采用单点登录、统一用户管理、应用界面集成、数据处理、数据抽取等技术,提供统一、方便快捷、丰富完整的自然资源要素展示平台。
大数据中心子系统。主要将分散存储和管理的自然资源观测数据汇聚融合为集中管理的自然资源要素综合观测一体化数据库,建立统一的数据管理平台与安全机制。实现各类自然资源要素观测数据的统一管理,涉及位置、范围、面积等空间信息统一入库,并提供共享数据出入口,做到数据可溯源,实现数据的汇聚、融合与共享。
模型云中心子系统。自然资源要素的综合分析应用需要各要素相应的分析计算模型作为支撑,采用“基于时间”、“基于事件”和“基于状态”等模式,选用多种具有时空特征的情境进行建模,描述各类资源要素的空间分布、基本属性、相互响应关系、相互隶属关系等问题,对自然资源各要素的概念和相互关系给出回应。
综合应用管理平台。利用自然资源观测数据,通过物联网中心和数据中心的基础支撑,以综合应用模型云为基础,构建自然资源要素观测数据综合应用平台,应用GIS 空间分析及业务应用模型,构建针对不同资源要素和属性的专业辅助分析决策模型,研究自然资源要素的时空演变禀赋,分析不同资源要素间的影响以及耦合作用关系等提供技术平台。
门户网站。这是本系统提供的对外开放平台,用户通过互联网搜索网站名称或者输入网址可进行访问。主要提供实时的相关新闻、科普知识以及模型资源的实时更新信息等。
依托一体化平台开展对各类自然资源历史和实时观测数据汇聚融合,保障海量观测数据的存储、保管、汇交、共享和使用,实现各类观测数据的统一管理、统一检索、统一展示,为目标用户提供方便有效的地球系统科学数据信息服务。同时,利用已有科技手段和模型模拟,通过对观测数据的分级分类、加工整理及分析挖掘,在此基础上进行综合分析预测,产出不同区域、不同尺度下自然资源系统演化规律和生态环境退化机理等科学认知成果,以便开展山水林田湖草生命共同体的现状分析、客观评价,为自然资源统一管理、国土空间规划、国土空间用途管制、生态保护修复、自然资源督察执法等领域的业务工作提供全方位、全过程的数据服务和决策支撑(图2)。
图2 观测数据融合服务自然资源管理示意图Figure 2 Schematic diagram of natural resource management for observation data fusion service
基于对自然资源观测数据融合的思考,探索构建了自然资源观测数据融合体系框架(图3)。自然资源观测数据融合体系是以地球系统科学理论为导向,基于政策法规、组织机制、标准规范和融合技术保障,协调多方部委单位的管理职能,实现多源异构数据汇聚融合和共享服务[27],避免重复研究、降低管理成本、提高观测数据资源价值。该体系包含指导思想、政策法规体系、组织机制体系、标准规范体系、数据融合技术体系、成果服务体系。其中,指导思想是方向,政策法规体系是基础,组织机制体系是保障,标准规范体系是前提,数据融合技术体系是关键,服务管理体系是目标。
图3 自然资源观测数据融合体系框架图Figure 3 Framework diagram of natural resource observation data fusion system
以服务国家自然资源统一管理为主线,以全面提升自然资源数据获取能力和数据保障能力为目标,以各类自然资源观测站网为基础,以地球系统科学理论为指导,坚持创新、协调、绿色、开放、共享的新发展理念,基于自然资源要素综合观测一体化平台,汇聚融合历史与实时、遥感与地面等各类自然资源观测数据,推动观测数据的汇聚互联、集成与共享,全面提升观测数据应用效益和潜力价值,为自然资源综合管理和资源、生态、环境等重大问题研究提供坚实的数据基础和应用保障。
借鉴国外经验,制定发布有针对性的政策法规是开展自然资源观测数据融合的基础,从国家层面促进观测数据汇聚融合工作的落实。目前,相关部委制定了一些观测数据管理办法,但是缺乏法律效力,跨部委约束力弱。因此,实现自然资源观测数据真正汇聚融合统一管理,需要一系列法规制度保障,这些制度结构上是相互关联的,功能上是相辅相成的。具体而言,在2018 年国务院发布的《科学数据管理办法》基础上,有针对性的健全和制定关于自然资源领域观测数据汇聚、数据管理、数据安全与质量、数据共享服务等法律法规,做到观测数据汇聚融合有法可依,从法律层面推动自然资源观测数据汇聚融合。
针对我国自然资源观测数据管理分散,部门、单位分割的“多龙治水”现象,应构建统一开展观测数据融合管理的组织机制体系,落实自然资源观测数据管理的主体责任,并将相关部委纳入管理主体的系统中,从组织机制上推动解决人才联动、学科交叉、数据融合。具体而言,明确自然资源领域观测数据管理机构,统筹负责观测数据管理事宜。建立部委联动机制,主管机构与各部委、科研院所、高等院校等签订一批战略合作协议,明确合作方式和具体内容,分步推动自然资源“历史-实时-预测”综合观测数据的有效汇聚,共同打造具有权威性、知名度的国家自然资源观测数据中心。建立部门协作机制,协同相关部门结合自然资源观测重大需求,形成部门间定期会商制度,研究解决观测数据融合难、共享难等关键问题。完善技术创新型人才激励机制,着力引进和培养一批地球系统科学观测领域领军人才,稳定支持关键核心观测技术研发团队建设,保障技术创新持续发展与应用。设立多部委联合创新基金机制,加大技术创新基金和装备研发基金等资金投入和政策激励,促使形成自然资源大数据、大平台、大应用。
标准规范是否统一是观测数据汇聚融合和共享应用过程中的巨大障碍,研究构建观测数据标准规范体系,进一步统一标准、统一精度、统一基准、统一评价标准、统一观测要求。具体而言,参考已有相关标准规范,增加相应的指导或基础标准规范,明确系列标准内容、相互关系、保障实现所定目标的机制等内容。在此基础上,结合自然资源观测数据融合需求,完善自然资源观测数据与元数据采集技术、多源异构观测数据汇聚整合、观测数据质量管理、观测数据共享与应用以及仪器设备管理等系列专项标准规范,逐步建立能够支撑自然资源观测数据融合的标准规范体系,有效解决观测数据语义与结构差异,实现多源、多时相、多尺度、多分辨率和多种类型数据的融合与管理。
研究利用新一代信息技术,构建适应现代自然资源观测数据融合技术体系,解决观测数据融合技术路障。具体而言,研究时间相异、基准相异、结构相异、平台相异等多源异构性数据人工智能建模算法;开发具有高可靠性、高扩展性和高容错性的智能化数据处理与分析工具;建设基于5G、星链互联和物联网等技术的数据传输网络链路,实现观测数据动态采集、实时传输和智能整合;构建观测数据共享服务技术体系,研究智能搜索与智能感知、多圈层融合数据四维模拟与可视化综合表达、数据交换共享与发布等技术。通过开展数据融合关键技术攻关,提高数据的获取、访问、集成、共享和互操作性,打通山水林田湖草等自然资源观测数据从分散到汇聚技术层面的阻碍。
按照数据-信息-知识-智慧盘旋上升的数据加工理念,在观测数据汇聚、融合、分析挖掘的基础上,形成观测数据融合成果服务体系,构建支撑业务管理的自然资源调查-观测-模拟-预测-决策新范式。具体而言,依托自然资源要素综合观测一体化平台,形成山水林田湖草等自然资源观测数据信息,研究产出观测年鉴、数据分析报告、综合研究报告、政策建议方案、预测预判和决策模拟等整装性、系统性成果,有效支撑自然资源和国土空间格局解析、结构诊断、趋势预测、态势预警等高层次应用,不断提高观测数据资源价值和服务效果,实现自然资源定量化、精准化、智慧化管理和科学决策。
本文通过分析国内外自然资源数据管理现状,结合新时代我国对自然资源统一管理的新需求,进行了基于自然资源要素综合观测一体化平台观测数据融合的思考,相关研究结论如下:
对比分析国内外自然资源数据管理方法,我国在数据管理方式、数据法规标准保障、基础设施管理、数据采集汇聚共享等方面存在差距。
基于自然资源要素综合观测一体化平台,提出从指导思想、政策法规体系、组织机制体系、标准规范体系、数据融合技术体系、成果服务体系6 个方面构建自然资源观测数据融合体系建议。
自然资源观测数据融合是一项复杂的系统性工作,实施的过程中可能会遇到许多操作性、技术性等方面难题需要不断的研究解决。目前,关于自然资源观测数据融合的研究很多,但是还有很多方面内容有待深入探索研究,未来需要考虑自然资源的系统性和整体性,组织开展相关政策法规、标准规范、工作机制等内容的具体设计,围绕观测数据分类、数据融合、处理模型、计算方法、成果表达等环节步骤,深入推进技术协同与技术融合。并通过开展试点示范,验证相关内容的科学性和可行性,以期实现自然资源观测历史数据、现状数据、动态更新数据汇聚融合和开放共享,更好支撑自然资源监管决策、自然资源调查监测评价以及自然资源政务服务等业务需求,为自然资源的一体化管理和国土空间的统一管控提供精准、详实的数据支撑和保障。