(1.北京锄禾环保技术有限公司,北京 100084;2.北京科技大学,北京 100083;3.中国环境监测总站,北京 100012)
科学数据是指人类社会科技活动所产生的基本数据,以及按照不同需求而系统加工的数据产品和相关信息[1]。半个多世纪以来,我国开展了大量的国家科技事业性工作,诸如气象观测、水文观测、环境监测、海洋观测、地震监测、地质调查等,积累了海量的科学数据[2,3]。据不完全统计,在国家科技计划的经费中,约有30%乃至更大的比例用于获取科学数据[4]。
我国环境监测科学数据的获取和积累当前主要靠政府投资完成,包括:政府部门专项计划产出的监测数据;国家各类科技计划、专项理论技术研究产生的监测数据;科研院所、高等院校专业数据库及国际环境组织所拥有的国际监测数据资源乃至个人的数据资源等。通过分析“淮河流域环境与健康监测网”获取的环境监测科学数据,数据特征主要包括以下方面:
(1)多部门。“淮河流域环境与健康监测网”由环保、卫生、水利、农业、建设等多个部门的监测网络组成,监测网的环境监测科学数据资源分别隶属于上述不同部门,同一领域内部的科学数据资源也分别被不同的部门或机构所管理,部门或机构内还分别由不同的课题组或科研人员保存、管理。以环保部门为例,环境科学数据资源由国家环保部门和有关直属单位、地方各级环保部门和下属单位、项目牵头单位和项目各参与单位分别采集、管理和维护。
(2)多目标。由于部门之间的分工不同,环境监测科学数据的使用目标也不相同。如地表水、地下水、饮用水等水质数据对流域内公众生活提供参考,为环保部门指明工作方向;水位流量数据信息为水利部门防汛抗旱提供指导;土壤、农作物和农业面源等数据与农业建设发展息息相关。
(3)多介质。数据是对客观事物的描述,而非事物本身,因此数据必须借助数字或符号才能表现出来,将这些数字或符号寄载于某种物体上。因此按存储介质的不同可将环境监测科学数据分为:纸质数据、磁带数据、磁盘数据、光盘数据和网络数据等多种。同时,根据环境介质的不同,环境监测科学数据可分为:水环境监测数据、大气环境监测数据、土壤监测数据、生态监测数据、污染源监测数据等。
(4)多指标。根据数据的所属部门及目标的不同,环境监测科学数据依据不同的行业标准、规范,有不同的指标体系。卫生部门有评价数据的卫生学指标,环保部门有环境质量评价指标和污染物排放指标等。
(5)多形式。环境监测科学数据的来源不同,决定了数据形式多样性。环境监测科学数据的来源有:利用监测站点(点)获取实际的科学数据(其中包括分布于淮河流域的各类自动监测站);利用各种实验手段获取数据的资源;利用统计方法获取科学数据资源;科学研究活动获取的数据资源等。
(6)多尺度。“淮河流域环境与健康监测网”的研究领域包括整个淮河流域的环境污染和健康防治问题,同时有所侧重的选取淮河流域4个省份15个县市为主要研究范围,还对某些县市进行试点示范研究。因此,多方面的深入研究过程中产生的数据具有多尺度特性,既包含整体流域的数据资源,又有某个监测点位的详细数据资源。
(7)多模式。我国环境监测科学数据的基础性数据已具备了科学严格的采集、整编、刊印管理模式,但由于“淮河流域环境与健康监测网”涉及到多个政府职能部门,各个职能部门对环境监测数据的保存和管理规定不同,管理模式并不统一,彼此之间沟通和协调机制也不健全,造成数据资源管理模式多样,存在科学数据的利用率偏低的现象。
(8)多机制。各类环境监测科学数据资源分布于不同行业的部门、研究院所和企业中,散布于科研单位和个人手中。虽然一些部门已将分散的、数据内容多样的、标准不一致的各类科学数据,经过客观、科学的处理与分析,形成一批能够直接为科学研究与其他公益性活动利用的数据库,但数据库之间的数据结构不统一,数据库技术应用落后于信息技术的发展水平,不同部门数据库的运行机制多样,诸多具有代表性的科学数据难以得到有效利用。
作为基础性公益科学数据的重要领域,环境监测科学数据在我国经济发展的诸多领域都是不可或缺的重要数据资源。环境监测科学数据资源的采集和积累初步形成了以环保等多部门为主体,与科研院所、高等院校互为补充的格局;专门的数据管理机构(组织)初步建成;国际间的数据合作与交换渠道逐步建立。在科技部的支持下,2004年底,原国家环保总局组织启动了“环境科学数据库建设与共享”项目,环境监测科学数据共享作为环境科学数据共享体系的有机组成部分,已逐步形成了涉及土壤、河流、湖库、海水浴场、空气质量、生态等分类的科学数据共享服务体系。2006年,原国家环保总局明确提出了依托“金环工程”总体框架,建设国家环境保护科技资源信息共享平台,形成包括环境监测数据等环境科学数据在内的共享机制和硬件支持环境[5]。
然而长期以来,由于国家信息共享的法规体系尚不健全,全社会也尚未形成基础数据共享的良好机制,再加上国家对基础数据共享工作的投入相对不足,客观上造成环境监测科学数据共享服务能力低下,数据共享工作没有实质性的进展。
由于类似上述问题的存在,“淮河流域环境与健康监测网”的各个部门虽然已经积累并且还将大量积累各种数据,但是这些数据还不能充分满足国民经济建设部门、科学家以及社会公众的需求,其中最薄弱环节就是缺乏有效的数据共享与服务技术体系和服务机制。尽管已基本制定了项目数据管理办法,并建立了一定的技术和非技术基础,但还远不能适应国家发展、社会进步和科学研究对环境监测科学数据共享服务的需求。
以“淮河流域环境与健康监测网”的数据共享情况为例,目前存在几个突出的问题有:
(1)由于环境监测科学数据具有多部门、多尺度的特征,数据通过环保、卫生、水利等多个行业、部门获取,数据缺乏统一管理,缺乏国家层次的宏观管理和协调,导致科学数据一直散存在科学家和科研单位手中,难以充分发挥作用,造成数据的闲置和浪费;
(2)部门之间的环境监测科学数据管理运行模式各不相同,各部门拥有的数据库系统基本上是由建设单位自行收集、整理、加工、开发而成,由于其数据库系统是自建自用,又没有足够的经费投入,使得这些数据库的规模小,内容不全面,而且数据的更新维护得不到有效保证,标准不统一,缺乏规模化整合,缺乏面向科技界、面向社会的数据共享服务平台,严重制约了数据的有效共享;
(3)缺乏共享政策法规和技术标准规范。目前,我国科学数据应用与共享方面的政策法规严重缺乏,没有相应的法规要求占有国有科技数据资源的单位或个人,必须同时承担共享的责任和义务,确保科技资源的保值、增值,因此科研单位普遍缺乏共享的积极性。另外,由于缺乏完善的科学数据共享技术标准,各自产生的科学数据堆积形成了诸多的“信息孤岛”,无法形成可共享的数据资源。
多部门环境监测科学数据共享是以环境监测科学数据为主要对象,建立以共享服务为目标的一整套环境监测科学数据共享政策法规、共享技术标准、共享服务机构,以网络平台为基础,整合改造现有数据资源,建立科学数据汇交验收、共享服务机制,为淮河流域的环境和健康问题改善,为社会公众、科学研究和国民经济建设提供全面的环境监测科学数据共享服务。
总体来说,多部门环境监测科学数据共享是一个完整的体系,涉及到数据资源到政策标准等各个方面的问题,归纳起来大体包含5个基本要素:数据资源、共享技术、组织管理、共享规则和发展需求,它们之间相互关联,相互作用[6]。淮河流域环境与健康监测网的环境监测科学数据共享要素组成图参见图1。
图1 淮河流域环境与健康监测网环境监测科学数据共享组成要素
在科学数据共享体系中,这5个基本要素密切相关,而组织管理的实施、数据资源的建设、共享规则的建立和发展需求的规划最终都需要依托共享技术来实现,依托现代化的网络服务平台,建立面向社会公众和科学研究的共享服务网络体系,完整呈现并提供服务。因此,构建多部门环境监测科学数据共享体要以数据整合和共享服务为中心,重点围绕数据共享政策研究、数据标准规范建设、共享平台开发等方面开展工作。
(1)共享政策是实现环境监测科学数据社会化共享的法律保障,是确保共享工作健康有序开展的前提条件。共享政策法规应包括数据汇交管理制度、共享服务的内部管理制度、面向社会的共享服务承诺制度、科学数据共享分级分类、数据使用许可协议、成果资料提供利用管理规定、共享服务组织和经费的保障制度等。通过国家和行业制度的建立规范明确数据汇交共享法规,强制各数据生产部门打破数据壁垒,实现从数据生产收藏到数据生产共享服务的职能转变。目前,淮河环境与健康监测网初步编制完成了淮河流域癌症综合防治项目数据管理办法。
(2)科学数据共享的技术标准是实现环境监测科学数据共享的技术保障,是共享体系建设中的基础性工作,是规范数据生产、汇交、质量控制、数据分类和共享服务技术性规范。环境监测科学数据共享技术标准应该涵盖:环境监测科学数据分类编码、元数据标准、数据集制作、数据汇交格式、数据存储、验收及质量控制标准等。如淮河流域环境与健康监测网可在国家科学数据共享核心元数据内容和国家科学环境数据中心提供的核心元数据标准基础上,结合淮河流域环境监测科学数据的特点,制定符合流域特点的科学数据共享核心元数据标准。
(3)科学数据是共享服务的核心。只有依据共享技术规范标准,对不同格式、存储在不同介质中的数据资料进行规模化、标准化加工整理和统计,形成具有统一
元数据标准、统一分类编码、统一命名规则的标准规范的数据库或数据集产品,才能被更多的人共享,实现其科学价值。
(4)共享网络服务平台是满足不同用户需求的有效途径,也是发展的趋势。当前国际上的数据共享已在现代计算机网络条件下进行,使得数据共享走向提供及时、内容丰富的新形式[7]。通过采用大规模商用数据库技术,层次化存储管理技术和Web技术,构建体系基本完整、项目较为齐全、质量比较可靠的共享环境监测资料数据库和可视化、分布式的环境监测资料共享网络服务平台,对共享环境监测科学数据进行持久的、实时的更新和维护,并为不同用户提供数据的全面查询、预览,按照用户的级别和数据的分级分类情况,实现数据的在线下载、数据产品的邮寄分发、特殊需求的在线订制等多形式共享服务。
当前,我国环境监测科学数据共享仍处于初级阶段,在理论和技术上都存在一定的问题,要建立多部门环境监测科学数据共享机制还需要多方面得共同努力,使环境监测科学数据充分发挥其科学价值、经济价值和社会价值。多部门环境监测科学数据共享机制的建立是社会、行业信息化发展的趋势,也是科技创新的必然选择。
参考文献:
[1]黄鼎成.科学数据共享工程的总体框架[J].中国基础科学,2003,(1):63-68.
[2]魏淑艳.我国科技资源共享的有效路径研究[J].科学管理研究,2005,23(3):32-35.
[3]刘闯.我国科学数据共享机制建设研究[J].国土资源信息化,2004,(1):5-7.
[4]耿庆斋,蔡佳男等.浅析国外科学数据共享对我国水利科学数据共享的启示[A].第三届全国水力学与水利信息学大会论文集[C].2007:677-681.
[5]国家环境保护总局.国家环境保护“十一五”科技发展规划[R].北京:国家环境保护总局,2006.
[6]陈军,王春卿.关于科学数据共享机制的思考[J].中国基础科学.2003,(1):40-43.
[7]孙枢.地球数据是地球科学创新的重要源泉——从地球科学谈科学数据共享[J].中国基础科学,2003,(1):19-23.