政府科学数据归档研究:以美国国家海洋和大气管理局为例

2024-04-08 19:19孙晓燕国家海洋信息中心中国海洋档案馆王苏李渊玮国家海洋信息中心中国海洋档案馆
浙江档案 2024年1期
关键词:联邦政府数据管理数据中心

孙晓燕/国家海洋信息中心、中国海洋档案馆 王苏 李渊玮/国家海洋信息中心、中国海洋档案馆

1 引言

科学数据是国家科技创新发展和经济社会发展的重要基础性战略资源,是支撑国家科技创新的重要科技资源[1]。科学数据归档是对原始数据及其衍生数据进行存储、归档、管理和提供利用,实现科学数据永久保存。2016年数据归档首次作为1项任务列入《“十三五”全国档案事业发展规划》,2018年国务院颁布《科学数据管理办法》提出要建立科学数据保存制度、配备数据存储和管理设备设施,2021年《“十四五”全国档案事业发展规划》中数据归档任务增加至7项,明确要求“大力推进科学数据与科研档案协同管理”,多项数据归档任务列入国家档案事业发展规划,标志着数据已成为档案的重要来源。

美国在科学数据归档方面走在世界前列,是最早开展科学数据归档研究和实践的国家[2]。20世纪中叶,联邦政府就已着手建立科学数据归档的法律框架和政策体系,奠定了科学数据归档的制度基础。20世纪80年代,里根政府提出收集国家科学基金会支持的科研项目产生的数据并集中提供使用。20世纪末,确立了在国家层面建设国有科学数据中心和信息全社会共享环境的战略部署[3]。梳理美国联邦政府机构科学数据归档相关研究成果和实践过程,发现档案管理员和科研人员之间缺乏有效合作,科研人员不认同科学数据和过程记录的归档保存,档案管理员在科学数据管理中未充分发挥作用是科学数据归档三个方面主要障碍[4-6]。美国国家海洋和大气管理局是联邦政府科研机构的缩影,通过深入分析政府相关管理政策和机构内部的数据归档制度,有助于深入了解美国联邦机构科学数据管理的整体面貌。

2 研究案例——美国国家海洋和大气管理局(NOAA)的科学数据归档

2.1 NOAA及其科学数据中心

NOAA成立于1970年,是一个隶属于美国商业部以科学研究为核心任务的科技部门,辖国家气象局、国家海洋局、国家海洋渔业局、国家环境卫星数据及信息服务中心等6个内设机构,主要关注地球的大气和海洋变化,提供对灾害天气的预警,提供海图和空图,管理对海洋和沿海资源的利用和保护,研究环境保护,支持政府决策、学术研究和其他私营部门的经济活动。

国家环境卫星数据和信息服务中心(NESDIS)是NOAA的数据集中保管基地,承担数据归档和提供利用服务。NESDIS运营三个国家数据中心:国家环境信息中心(NCEI)、国家地球物理数据中心(NGDC)和国家海洋学数据中心(NODC),及一些小规模的“数据中心”。国家数据中心是大型存储库,负责归档、传播和提供职权范围内的数据管理。小规模“数据中心”提供基于项目或特殊业务的专门数据或专业知识,涉及范围广,包括为特定环境参数建立的数据服务节点(例如,国家冰雪数据中心、二氧化碳信息分析中心),为专门研究或专门业务服务的专门数据系统(例如:美国大湖区水文数据)等。

NOAA的科学数据管理和档案政策受联邦立法管辖,包括联邦政府颁布的档案和信息法,联邦档案行政管理机构和总统行政管理机构发布的政策等。NOAA在制定自己的命令和规定时,必须遵守联邦政府及NARA的法令政策。

2.2 联邦政府出台的科学数据归档管理相关的法律政策

2.2.1法律。美国联邦政府的档案管理可追溯到1950年首次通过的《联邦档案法》,后与1978年颁布的《总统档案法》合为2014年《总统和联邦档案法修正案》。该法律阐明了美国联邦政府背景下档案和信息的定义,并授权NARA使用一般文件清单和特别文件清单等工具管理政府信息。虽然它没有具体提到科学数据,但该框架是管理联邦政府形成的所有信息记录的基础。

21世纪通过的立法明显影响了联邦机构科学数据的管理和保存。2001年颁布的《信息质量法》直接影响政府机构生成的电子科学数据的管理。该法案要求机构发布的任何科学数据都必须遵守某些标准,以“确保并最大限度地提高机构发布信息的质量、客观性、实用性和完整性”。尽管该法案没有明确涉及数据保存,但使机构重新考虑他们形成数据及管理数据的方式。2002年颁布的《电子政务法》,确保公民能够通过互联网获取政府信息。这项立法将电子文件和数据纳入《联邦档案法》和其他与政府信息管理有关法律的管辖范围。

2.2.2政策。联邦政府数据管理政策指由政府行政办公室或NARA发布的影响其他联邦机构数据管理的备忘录和指令。联邦政府对数据管理相关问题的关注可追溯至2012年总统行政管理和预算办公室(OMB)发布的《数字政府战略》,通过美国开放数据站点(Data.gov)发布政府应用程序编程接口(API)索引,以便公众便捷获取政府数据,同时要求NARA确保数据隐私和安全,但并未特别关注科学数据。这份文件反映了联邦数据政策领域的一个重要趋势,即科学数据和行政数据之间的区别没有明确界定。访问科学数据的元数据要求与访问行政数据的元数据要求不同,但在这份战略文件中并未体现。

2013年发布的两份备忘录更直接关注科学数据和产生数据的机构。美国科技政策办公室(OSTP)备忘录重点关注年度研究预算超过1亿美元的科研机构,增加对联邦资助的科学研究成果的访问要求,试图通过指导机构制定计划来管理科学数据,以确保“联邦资助研究成果的长期管理”。然而基于该备忘录所产生的计划并没有明确机构如何加强数据访问的具体操作,甚至没有提到数据保存[7]。OMB备忘录M-13-13要求各机构在收集和创建数据的时候要充分考虑下游数据处理和传播[8]。这些传播活动主要涉及科学数据目录,也未直接提到数据保存。

2016年OMB发布《联邦政府信息资源管理》(A-130)通告要求“将信息作为战略资源进行管理”,更直接关注数据保存问题,通告指导联邦政府机构如何管理不同类型的信息资源,从创建、处置、到移交至NARA,明确界定各方责任,A-130也是科学机构寻求数据管理指导的主要政策依据。A-130明确NARA的职责是执行《联邦档案法》要求,并为联邦机构提供有关科学数据管理的指导,还明确要求要促进科学数据的有效利用和提升服务科学研究的能力[9]。

2019年之后,OMB连续发布联邦政府机构数据管理指南,支持制定新联邦数据战略,呼吁机构改进科学数据管理。新数据战略确认机构有责任“根据适用的法律、法规、政策、批准的文件清单和时间表等保存联邦数据”[10]。备忘录M-19-01征求各相关机构对该战略的意见,备忘录M-19-18正式采用该战略并指出,数据保存是联邦数据战略的关键组成,呼吁机构“将数据管理经费纳入年度经费预算,将数据作为战略性长期资产”。政府不仅承认保存科学数据是一项重要目标,且认为有必要进行经费投入确保目标达成。2013年OSTP备忘录没有做出类似规定,只要求机构在现有预算范围内支持更多数据管理工作。

2022年8月OSTP发布关于确保“免费、即时和公平地获取联邦政府机构资助的研究”的备忘录,对2013年OSTP发布的关于公众获取公共资助研究成果的备忘录进行了深化扩展。新OSTP备忘录要求政府资助的研究数据立即提供给公众自由获取和免费使用。新政策取消了获取研究成果12个月等待期,要求科学研究出版物出版后应在指定的数据库中免费提供给公众,任何人都可以立即访问和使用。

2.3 NOAA内部的政策

2.3.1行政命令。NOAA第205-1行政命令“文件管理计划”,建立NOAA档案和科学数据管理基本框架,明确科学记录管理的目标是永久保存有价值的科学资产,并最终移交NARA长期保存。第212-15号行政命令“环境数据和信息管理”,明确管理环境数据的机构内部政策,并通过一系列程序指令实施。这些指令明确了环境数据在其整个生命周期内的管理要求,并确保将其移交至NARA。

2.3.2一般文件清单。一般文件清单和机构特别文件清单构成联邦机构档案记录的主要内容,且明确每项记录的保管时间表,两部分清单列出的记录内容密不可分,对于理解联邦政府科学数据管理方式至关重要。一般文件清单包含联邦政府机构的共有文件材料,不涉及科学数据,而是“特定机构的文件清单中涉及的与任务相关的研究、监测和执行活动的工作记录”,例如日常人事管理文件和一般任务管理文件。

2.3.3特别文件清单。NOAA特别文件清单由多个部分组成,每部分清单标题都包含对相关记录的描述,以及关于保留期限和处置权限的说明。这些条目是联邦记录管理和处置的指示图,机构员工和NARA都会使用这些条目。例如在机构特别记录清单1406-6.1中,概述了大气观测数据的管理要求,不同记录格式的数据处置要求不同,例如“表格式的地面气象观测、雷达观测、卫星观测、气象观测和浮标观测”记录的处置说明是“数据记录每年截止一次,记录保管满75年后的5年内移交NARA”。这表示NOAA在75年时间内可继续使用这些数据,同时也承担科学数据安全保管责任,确保数据最终以安全和可访问方式移交NARA[11]。

2.4 NOAA科学数据归档问题

研究表明,影响NOAA科学数据归档、管理和保存的政策数量多且内容丰富,但在确定数据管理最终权力方面也存在问题。例如,NOAA科学数据归档管理政策制定受NARA“评估政策”影响,NARA是科学数据归档和处置的决策者,科学数据中心在制定数据收集和共享等政策时,应征询NARA评估专家意见,但NARA评估专家普遍缺乏科学知识,影响有关数据保管期限和处置的决策。

面对现今的数字环境,档案保存也存有复杂性。如NOAA特别记录清单1406-05.3描述了海洋表面气象观测记录的处置要求,这些观测数据来源于调查船只和观测浮标,许多是联邦政府最早的气象数据,在记录清单中被定为永久保存。按规定观测记录满75年应在5年内移交NARA,该要求仅适用于纸质文件。此外还规定在文件扫描和验证后,当不再需要审计或作为电子记录的备份,在NARA确认后,扫描记录成为副本,纸质文件可销毁。其中存在一定问题,NARA如何确定纸质材料不再需要作为电子版本的备份?电子档案保存是否足够成熟,确保能永久访问。

此外,NARA已开始管理科学数据,但与联邦政府对科学数据的关注程度的要求还有差距,越来越多的责任落在科研机构上。从NOAA案例可看出,其在科学数据管理方面历史悠久,有专门负责科学数据中心NESDIS,而联邦政府内的其他机构可能没有。经费投入和基础设施建设是实现科学数据管理的基本条件,NARA和联邦政府各机构同样面临挑战,如何在政府层面建立完善的科学数据归档、管理和长久保存框架,平衡科研人员、用户和档案管理员的需求,并确保科学记录长久可用,更多问题还亟待探索研究。

3 联邦政府科学数据归档的特点

3.1 法律政策体系完备

前文分析可以看出,联邦政府出台了系统化的科学数据归档法律框架和政策体系,大致分为三个层面:分别是政府层面出台的相关法律明确科学数据归档的基本框架,行政部门和档案部门制定行政命令明确数据归档的总体导向和要求,科研机构在档案部门的指导和评估下制定具体的操作文件,由此自上而下形成了非常完备的政策体系。政策体系的建设过程是根据实践需求逐步建立和完善的,前期从数据共享利用角度出发,更关注科学数据的可用性和开放,逐步认识到科学数据的长期保存价值,出台关于归档保存的相关政策。非常值得学习的是科研机构内部制定的特别文件清单,针对不同来源不同科学要素的科学数据制定的保管期限、处置周期和管理职责划分等非常详尽、更具有操作性,直接决定数据的处置过程和长久可用。

3.2 强调开放共享

“开放共享”是联邦政府科学数据管理的核心理念,充分和开放地获取数据是所有联邦机构科学数据管理应遵循的基本原则。联邦政府自1990年启动科学数据共享计划,已成为联邦政府的一项基本国策,经过近30年的制度建设,通过各项法律、政策和法令已将科学数据完全、开放、无偿的理念落到实处。2013年出台的政府备忘录中有关科研项目产出成果还设有12个月的等待期,2022年的政府备忘录已经要求科研项目数据无条件即时共享。前文NOAA明文规定除机密数据外所有科学数据都应遵守完全开放和容易利用的基本原则。联邦政府认为科研成果和科学数据的共享,可以节约社会资源,加速科技创新,减少重复投入,扩大联邦政府投资的社会影响力。联邦政府资助项目还将制定数据共享计划,确保项目成果数据长久保存和提供公众利用作为获得项目资助的前提条件,如美国国家自然科学基金委员会(NSF)制定了“数据管理计划”(DMP),要求项目申请时提交项目计划,采取措施促进成果数据共享和传播。

3.3 科学数据中心作用凸显

20世纪90年代联邦政府启动的数据共享计划包括国家级数据中心群与数据信息共享网络建设,并着手建设国家级数据中心,例如NOAA设有国家环境卫星数据服务中心负责数据的管理、归档和服务,美国国家航空和航天局(NASA)设有美国空间科学数据中心(NSSDC)和空间物理学数据运行中心(SPDF)负责天体物理学、空间物理学数据归档保存。联邦政府已经建立多级专业数据中心来实现数据管理,除国家级数据中心外,还有NSF批准和授权成立各类数据管理中心。2007年NSF实施DataNet计划,将高校图书馆建设成为高校科研项目数据中心。密集的科学数据中心网络构成数据归档的坚实基础,并按照法令确定的流向在档案部门汇集。

科学数据具有极强的专业性,要充分发挥科学数据的作用,必须依托各科学数据中心,尤其是国家数据中心。在科学数据最终移交NARA之前很长一段时间内,比如NARA的海洋气象观测记录产生后的75年内都属于科学数据中心的职权范围,要充分发挥科学数据的价值且确保其能最终安全无损移交NARA,科学数据中心作用至关重要,除提供科学数据开放共享服务之外,还要按规定处置和管理,保障科学数据安全保管和长久可用。

4 对我国科研机构科学数据归档管理的启示

4.1 完善科学数据归档法律框架和政策体系

目前国家层面出台对科学数据归档管理具有指导性的法律包括《档案法》《数据安全法》《科学技术进步法》,其中均未直接提到科学数据。《数据安全法》侧重政务数据的保密和安全管理,《科学技术进步法》仅对财政经费支持的科研机构提出要建立资源共享机制。2018年的《科学数据管理办法》是首次在国家层面出台的科学数据管理文件,但目的是促进数据共享,没有直接提到数据归档要求和最终流向等。相关部委制定的科学数据管理文件很多,如《地质资料管理条例》《海洋观测资料管理办法》《气象资料共享管理办法》等,主要关注科学数据的采集、处理、共享和利用,同样未涉及科学数据归档问题。

基于现状,应加强国家层面法规政策的顶层设计,提出科学数据归档相关法律框架和政策体系建议,明确科学数据归档管理的总体要求和数据流向,厘清相关国家档案部门、科学数据管理中心、科研机构等在科学数据归档流程中的职责。各专业领域主管部门制定数据管理制度时要充分考虑数据归档,尤其要在国家档案部门的指导下,组织科研机构制定各学科各要素科学数据的处置程序、归档流程和保管时间表,确保归档工作有据可依。

4.2 强化科学数据开放共享理念

长期以来,我国科学数据共享方面“饱受诟病”,共享状况不尽人意,很多专业领域的数据保密的界限始终不清晰,经常以“保密”需要为由,推迟本应共享的数据。虽然科研人员有共享意愿,但涉及具体共享行动时,往往受制于缺乏政策依据,没有明确可参照的制度执行,缺乏数据共享平台或数据质量等因素,影响数据共享的效果。《科学数据管理办法》首次在国家层面提出“共享是常态、不共享是例外”的科学数据管理指导思想,然而开放共享理念的提升需要一个长期过程,需要从政策、管理到技术等全方面进行完善和改进,需要通过政策驱动营造数据必然共享的氛围,通过制度约束和激励机制调动科研人员的能动性和主观意愿,确保数据开放共享成为共识。

4.3 推进国家科学数据中心群建设

科学数据中心是汇集、管理、开放、共享和提供服务的重要基础设施,建设以国家科学中心为主,各级各类科学数据中心为补充的数据中心群网是实现科学数据有效管理的重要手段。2004年起财政部和科技部联合启动了国家科技资源共享平台建设,截至2022年底已形成20个国家科学数据中心,协调和推进各学科领域的科学数据管理。除国家科学数据中心建设外,还应促进各国家重大研究计划如“国家重点基础研究发展计划(973计划)”“国家高技术研究发展计划(863计划)”等建设综合性数据中心,围绕重点领域、特殊业务等建立特色科学数据中心,还可以借鉴美国经验,以高校图书馆为平台打造高校科学数据管理中心集群,以专业档案馆为平台建设专业领域数据中心集群等。通过数据中心群网建设,促进海量科学数据资源的汇集,夯实数据归档资源基础。

猜你喜欢
联邦政府数据管理数据中心
酒泉云计算大数据中心
企业级BOM数据管理概要
定制化汽车制造的数据管理分析
海洋环境数据管理优化与实践
CTCS-2级报文数据管理需求分析和实现
民航绿色云数据中心PUE控制
美国联邦政府高等教育的治理机构及其组织设计
美国民兵领袖被判68年
美国最高法院支持奥巴马医改法案
基于云计算的交通运输数据中心实现与应用