许百泉,胡小平,朱卫红
(1.北京大学地球与空间科学学院,北京100871;2.中国地质调查局发展研究中心,北京100037;3.中国地质调查局西安地质调查中心,陕西 西安 710054)
NGGDPP—美国国家地质与地球物理数据保存计划
许百泉1,2,胡小平2,朱卫红3
(1.北京大学地球与空间科学学院,北京100871;2.中国地质调查局发展研究中心,北京100037;3.中国地质调查局西安地质调查中心,陕西 西安 710054)
NGGDPP是美国的国家级地球科学数据保存计划,该计划主要由美国地质调查局实施并管理,覆盖了国家地质调查局以及其他内政部保存有地质和地球物理资料和样品的机构。NGGDPP的成员负责对国家地调局和内政部相关机构已经收集的资料和数据进行编目,以便确定这些资料和数据是否需要保存和抢救维护;设计并构建一个国家级的数字地质资料和数据目录;制定计划资金分配指南和建立计划实施的优先权;研究地质和地球物理资料和数据的保存与归档基本标准、流程和数据传送标准等。美国通过NGGDPP的执行,提升了获取和保存实物资料和数据的方式,使得这些信息对于科学的服务更为有效。本文通过介绍NGGDPP,为我国地质资料管理与服务提供参考。
NGGDPP;地质资料;美国
2005年,美国针对能源利用效率、可再生资源、石油和天然气、煤炭、印第安能源、核物质、市政用车和燃料、氢能、环境变化等18个重点科研领域,研究、制定并通过了《能源政策法案》(The Energy Policy Act of 2005,Public Law 109-58,以下简称《法案》)[1]。在每个重点的领域,法案中都制定了详细的标准和计划,保证在未来,我们可以使用安全、廉价和可靠的能源。《法案》的提出,确定了各个重点科研领域的重大计划及其相关参与机构,并为相关计划获取技术与资金支持的渠道提供了法律保障和国家监管。
国家地质与地球物理数据保存计划(NGGDPP)是《法案》中为了鼓励美国各个州级地质调查机构,积极投入到石油和天然气地质调查工作,专门设立的地质与地球物理资料保存计划,由美国地质调查局(USGS)负责执行。按照《法案》第351条规定[1,2],该 计 划 在 美 国 内 政 部 (United States Department of the Interior,DOI)设立秘书处和顾问委员会,选出部分州立机构作为该计划的参加成员,并按照年度给与资金支持;州级地质调查机构则负责改善地质资料的保管环境,保管地质与地球物理数据和标本。USGS及联邦成员研究并制定通用的数据和标本保存标准、流程和协议,努力形成一个全国范围的地学资料和数据保管的合作网络,实现地质资料全国范围内的通用共享、分散保管。
2012年,NGGDPP正式纳入美国核心科学系统[3](Core Science Systems,CSS),并成为 CSS五大关键行动之一,接受美国国家科学基金会(National Science Foundation,NFS)的支持。CSS的另一项关键行动“美国核心科学分析与集成研究(Core Science Analytics and Synthesis,CSAS)”则为该计划提供基于地理空间的数据和信息、标准和方法等一系列的技术性专门知识。目前,NGGDPP不断开发系列工具,进行数据整合与分析,并和其他团队进行协作研究,在CSS五大关键行动中起到了重要的作用,引领者USGS在地学标本数据管理与保存,提高了CSAS对地学数据的集成、分析和可视化能力。
目前,NGGDPP所有的地学资料通过基于网络的国家数字化目录(Internet-based National Digital Catalog)进行统一著录与发布,形成了一个国家级、州级地调机构、学术与科研机构互联互通的数据中心,统一向全国服务。目前这个国家级的数字目录可以提供来自美国地调局和州级地质调查机构等200多万条的地质样品元数据信息。通过NGGDPP,美国提升了获取和保存实物地质资料和数据的方式,提高了地学信息对科学的服务效率。
《法案》规定,美国国家地质与地球物理数据保存计划共有四项基本任务[4]:①对地质、地球物理、工程数据、图件、钻孔和标本进行保存;②提供一个国家级的资料保管目录;③提供技术和资金支持,帮助各州级地质调查机构和内政部相关部门保存资料。对美国地调局和内政部相关机构收集到的资料和数据进行编目,确定这些资料和数据是否需要保存和抢救维护;②设计并构建一个国家级的数字地质资料和数据目录;③制定计划资金分配指南,确定计划实施的优先权;④研究地质和地球物理资料和数据的保存与归档最低标准、流程和数据传送规则等。通过以上四项基本任务,努力实现《法案》规定的三项计划目标[4]:
NGGDPP计划主要由美国地质调查局实施、监督和管理,覆盖了国家地质调查局以及其他内政部保存有地质和地球物理资料和样品的机构。NGGDPP的联邦成员为内政部(DOI)各联邦机构,负责收集与维护地质与地球物理学数据和需要档案保存的样品;NGGDPP州级成员包括州立地质调查局、大学、科研机构和企业等类似的机构。国家地质与地球物理数据保存计划正是通过联合这些不同的机构,共同致力于美国地质资料信息的储存与收集,确保数据的安全贮存及濒危数据的及时挽救。USGS为该计划各个项目的资金分布及项目优先顺序建立开发指导方案,同时建立地质与地球物理数据最低保存及归档标准、规程及条款等,该计划的每个参加成员则依据相关标准设计与制作地质资料的元数据,补充更新国家数字化目录。
NGGDPP通过提供不设上限的科研基金,鼓励其他组织机构积极地参与到相关的项目中。美国地质调查局则运用专门对该计划额外拨付的经费对计划进行管理[5],确保经费平均分配给参与计划的各个机构。其中,联邦成员在每个财政年度获得的活动经费所占份额不超过该财政年度联邦拨款总额的三分之一,而各个州级成员通过1:1的形式,获得联邦财政拨款和非联邦财政的共同支持,具体的数额取决于各州所提供的匹配资金数额。
2007年以来(见图1和表1),能够获得财政补助项目的数量逐年递减,财政拨款总额则保持在60万美元左右;2013年开始,财政补助的项目数量和财政补助金额开始有所回升,并得到了大幅度的增长。2014年度,NGGDPP支持25个项目共计达82万美元,平均每个项目获得的资金支持为2.5万美元。2015年,该计划打算投入83万美元,支持20到35个不同项目的申请。目前,该计划已于2015年3月9日开始接收项目申请,7月15日至9月15日将正式拨款用以资助相关项目。
NGGDPP设有同行评审小组,通过竞争选拔的方式,针对每个年度提交的项目申请,设定该年度财政补助计划[5]。提案的提交者可以是个人、符合条件的联邦或州立机构,同时,该计划鼓励大学或私营企业通过合作关系加入到该计划中,以便充分地利用所有可以获取的资源。评审小组的成员通常由来自内政部和州立地质调查局各5名代表组成。项目的资金可以作为薪金和工资发放给项目运作的全体成员,也可以用于项目中所需物资以及固定设备的采购。
表1 美国州级地质调查机构获得联邦基金资助金额和项目数
图1 美国州级地质调查机构获得联邦基金资助金额和项目数
为保证项目的成功实施,对于项目资金申请的综合评议将会侧重以下四个因素[5]:①项目的价值和技术可行性,以及在规定的期限内可能取得的成果;②项目与NGGDPP和数据长期保存计划(Long-Range Data Preservation Plan)的相关性;③项目负责人和参加成员的能力和近期成果;④预算的合理性,包括联邦与州级资助资金如何按照1∶1匹配。
CSAS为NGGDPP成员提供了先进的ScienceBase数据管理平台[6],通过对许多数据源和信息源的数据进行集成,提供协作性的、动态的科学数据管理框架,进行复杂的集成和分析。ScienceBase既是一个数据管理平台,也是一个综合的数据库,包括现有数据系统的资料、元数据目录和开展创新的科学家名单等。
NGGDPP各成员采用国家通用的科学元数据著录、保存、管理与交换标准[3],制作并提交相关元数据的加工文件,并将信息及元数据添加和编辑到国家数据目录(National Data Catalog)。NGGDPP的门户 网 站 (http://datapreservation.usgs.gov/index.shtml)提供地质资料元数据参考信息的说明,用户通过这些说明,可以了解信息获取和编辑的方法。对于数据提供者,该计划提供信息获取、编辑、制作、网络上传等的标准和要求[4]。
NGGDPP成员,按照NGGDPP公开的元数据标准,首先对本机构的数据进行文件分类和编码,然后NGGDPP授权他们将这些整理好的数据录入国家数字化目录中,数据管理者则对这些数据进行相应的编辑和处理。州级用户可以通过国家数据目录,对这些资料的基本信息进行浏览、添加和更新。最终,公众可以通过选定的地图区域、原始标本类型和数据目录查询等多种方式,查阅资料和标本的详细信息。
NGGDPP对地学信息按照不同州名以文件夹的形式进行编辑和展示。例如:Alaska州所有的地质资料将以一个文件夹的形式存在,这个文件夹中则拥有13个原始标本专题馆藏文件夹,每个馆藏文件夹中则会建立记录相关的标本名称的文件夹。对于每个标本的描述信息,则会以网页和交互式地图的形式进行展示,提供关于标本的所有基础元数据信息。每个标本的元数据信息包括两部分,第一部分是州级地质调查机构提供的有关子文件夹描述、馆藏标本信息和标本采集地点;第二部分则是由NGGDPP编辑制作的CSV或者XML附件。
在信息的制作方面,每个被授权的州级用户,都可以制作本州馆藏地质资料的元数据信息,同时他们可以查阅美国所有州级用户的馆藏地质资料信息作为参考。NGGDPP的元数据信息制作都通过网络操作,且在用户登录页面中有详细的操作说明,用户进行表格式填写即可。样品元数据信息通常包含13个要素,其中规定7个要素为必填,分别是:样品编号(Collection ID)、标题(Title)、摘要(Abstract)、数 据 类 型 (Data Type)、补 充 信 息(Supplemental Information)、坐标(Coordinates)、数据入库时间(Dataset Reference Data)等。其中,样品编号在国家数字目录(NDC)中是唯一的编码,可填“空”,最终在文件上传时,由NDC自动赋值;数据入库时间则采用ISO 8601标准(例如:2010;2010-08;20100801;2010-08-01)。NGGDPP对几项特殊的元数据信息填写做出了重点说明:标题(反映标本保管地点、来源和内容)、保存原因、提供者、时间(系统自动生成)、联系方式和元数据文件(CSV或者XML)编辑等。
数据管理者在CSV或者XML制作完成后,即可将文件上传至NGGDPP,并转送给相关的馆藏机构进行复核,同时提供馆藏机构的官方网站网络访问地址。在NGGDPP进行文件的核对之后,会主动通知数据管理者并告知信息提供者。
国家数字目录(National Digital Catalog)由科学数据库联盟负责管理,是一个基于网络的全分布式系统,许多资料能够经由因特网通过数字形式传输[6]。通过NGGDPP,美国地质调查局对全国范围内的地质资料进行整理、审核,最终实现了对这些归档资料的电子化管理,丰富了国家数字目录地学内容。国家数字目录中的地学信息涵盖了美国各州级地质机构保管的地质和地球物理等各种原始标本的元数据记录,包括岩石标本、薄片、野外记录、照片、地图和数据库等。NGGDPP采用通用的标准和规则来确定并发布描述这些地质资料的元数据,使用户可以更直接和更方便地查找、理解、获得和使用美国任何地方公开有用的联邦和州地球科学数据,并有效地处理专业地球科学家期待的任何查询。
在已有资料的基础上,NGGDPP特别支持了三项基础地学专题研究,并建立了相关的研究和服务中心,分别是位于Denver,Colorado州的岩心研究中心(Core Research Center),负责向来自政府、工业和学术机构的科学家和教员提供有价值的岩石标本;美国地质调查局伍兹霍尔海洋科学中心标本博物馆(Woods Hole Coastal and Marine Science Center Samples Repository),负责管理USGS在伍兹霍尔进行的海岸带和海洋研究形成的地质、生物和地球化学标本;国家冰芯研究实验室(National Ice Core Laboratory),负责储存、管理和研究在极地收集到的冰芯。
同时,用户可以通过https://www.sciencebase.gov/上的NGGDPP Community,进行数据的上传、问题的反馈、资料的专题搜索、标签搜索和空间搜索,实现用户和信息数据、用户和馆藏机构的即时互动和联系,用户可以方便、准确地获取所需资料,资料保管机构可以及时了解用户的需求,制作专题性的服务内容和产品,实现系统和目录的效率最大化。
通过NGGDPP,美国地质调查局改建和新建了全国范围的地质资料信息库,增大了联邦级和州级的实物地质资料库的物理容量和存储处理能力,改善了美国地质资料保管和信息服务能力;制定了地质资料信息“最低保管标准”和“最佳保管措施”,供全国各计划成员参考执行;改善了地质资料信息的制作和网络传输机制;研究制定并推广使用了统一的地质资料维护标准、目录和元数据制作格式,把来自全国不同地质资料馆藏机构的库藏目录汇编成了一套全国统一的地学数据和标本目录,以便公众查询利用。
目前,我国对地质资料实行原始、成果、实物分级、分类及委托保管,缺少针对原始、成果和实物地质资料全国统一的元数据描述标准。原始地质资料的汇交与保管工作刚刚起步;全国各级省(区、市)馆、全国馆、地调局六大区和油气委托等地质资料保管单位在成果地质资料管理和服务的标准上尚未有统一和通用的标准;实物地质资料管理办法正在研究制定中,全国范围的实物地质资料服务尚无统一的标准,针对科研工作和科普宣传的专题性、个性化服务较少,全国范围内的濒危实物地质资料统计和挽救工作尚未开展。所以,地质资料从业人员要加大研究力度,尽快制定全国通用的地质资料保管和服务元数据标准,为下一步开展全国地质资料保管和服务工作做好基础性研究。
2010年,我国开始实施地质资料信息服务集群化产业化工程,构建了“全国地质资料信息集群化共享服务平台”和“全国地质资料目录中心”,以馆藏机构为重点,拓展保存地质资料的基层地勘单位、矿业公司和科研院所,逐步实现全国地质资料信息资源汇聚,但是电子数据传输和更新机制尚未完全建立,无法实时进行,导致用户在查询和使用相关地质资料时,存在资料找不到、资料无法满足需求等问题。所以,地质资料从业人员要在地质资料目录更新与电子数据传输方面,尽快研究合理和切实可行的机制,保证各地质资料馆藏机构和用户,可以随时对已有地质资料进行访问、编辑和分析等;同时,馆藏机构定时或不定时的向公众发布全国或者专业级的地质资料馆藏目录,方便公众及时了解我国地质工作开展情况和地质资料馆藏情况。
我国目前研发的地质资料共享服务平台,提供的大多是馆藏机构已有的基础性地质资料,缺少对用户的使用反馈调查和需求分析,暂时无法满足用户个性化和专业化的资料加工需求,用户只能查找到地质资料的馆藏机构。借鉴国外地质资料信息服务模式,我国应尽快开展基于网络服务平台的地质资料个性化、专业化服务,通过鼓励公众参与到地质资料的提供、共享、分析和利用中来,系统研发人员做好用户需求分析,地质专业人员参与到地质资料信息挖掘和分析中来,做好地质科研与科普宣传互动,及时准确地为用户制定专题性、个性化的服务。
[1]美国能源政策法案[EB/OL].http://www.gpo.gov/fdsys/pkg/PLAW-109publ58/html/PLAW-109publ58.htm.
[2]关于美国国家地质与地球物理数据保存计划[EB/OL].http://datapreservation.usgs.gov/about.shtml.
[3] 核心 科 学 系 统 [EB/OL].http://pubs.usgs.gov/fs/2012/3009/contents/FS12-3009.pdf
[4]美国国家地质与地球物理数据保存计划门户网站[EB/OL].http://datapreservation.usgs.gov/index.shtml.
[5]GRANT PROGRAM ANNOUNCEMENT.No.G15AS00016,For Fiscal Year 2015,UNITED STATES DEPARTMENT OF THE INTERIOR,U.S.GEOLOGICAL SURVEY[R].2015-01-08.
[6]美国国家科学数据库[EB/OL].www.sciencebase.gov.
NGGDPP—national geological and geophysical data preservation program
XU Bai-quan1,2,HU Xiao-ping2,ZHU Wei-hong3
(1.School of Earth and Space Science,Peking University,Beijing 100871,China;2.Development Research Center,China Geological Survey,Beijing 100037,China;3.Xi’an Center of Geological Survey,China Geological Survey,Xi’an 710054,China)
NGGDPP is the United States’national earth science data preservation program.The Program,administered by the USGS,comprises State geological surveys and agencies within the DOI that maintain geological and geophysical data and samples.NGGDPP partnerships are working to Inventory collections of materials and data that exist in State geological surveys and DOI agencies to identify preservation and data-rescue needs;design and begin populating a National Digital Catalog;develop guidelines for distribution of Program funds and establish priorities for Program activities,establish minimum standards,procedures,and protocols for preserving and archiving collections of geological and geophysical materials and data.Through the implementation of NGGDPP,it has improved the access and archiving methods of geological materials and data in the United States,so that the information is more effective for the science and research.This paper intends to introduce NGGDPP in the hope to provide references for China’s geological data management and services.
NGGDPP;geological data;United States
许百泉(1981-),男,博士,主要从事地质资料管理与服务工作。E-mail:xbaiquan@mail.cgs.gov.cn。
TP311.13;P3
A
1004-4051(2015)09-0123-04
2015-02-01
中国地质调查“地质资料信息服务集群化产业化综合研究”项目资助(编号:1212011220335)