ICPSR科学数据中心的建设经验与启示

2017-12-13 06:32王明明王卷乐高孟绪韩雪华王玉洁
中国科技资源导刊 2017年6期
关键词:数据管理数据中心科学

王明明 王卷乐,6 赵 强 高孟绪 李 舸 韩雪华,5 王玉洁

(1. 中国科学院地理科学与资源研究所资源与环境信息系统国家重点实验室,北京 100101;2. 山东理工大学建筑工程学院,山东淄博 255049;3. 中国矿业大学(北京)地球科学与测绘工程学院,北京 100083;4. 国家科技基础条件平台中心,北京 100862;5. 中国科学院大学,北京 100049;6. 江苏省地理信息资源开发与利用协同创新中心,江苏南京 210023)

ICPSR科学数据中心的建设经验与启示

王明明1,2王卷乐1,6赵 强3高孟绪4李 舸1,2韩雪华1,5王玉洁1,2

(1. 中国科学院地理科学与资源研究所资源与环境信息系统国家重点实验室,北京 100101;2. 山东理工大学建筑工程学院,山东淄博 255049;3. 中国矿业大学(北京)地球科学与测绘工程学院,北京 100083;4. 国家科技基础条件平台中心,北京 100862;5. 中国科学院大学,北京 100049;6. 江苏省地理信息资源开发与利用协同创新中心,江苏南京 210023)

科学数据中心是科学数据管理的重要载体之一。在当前大数据和数据驱动科学研究范式的信息化时代,我国在科学数据中心建设上发展迅速但缺乏经验,迫切需要了解和借鉴发达国家的科学数据中心建设方面的先进理念和做法,促进我国的科学数据管理。从网络调研、文献跟踪、实地访谈等方法,对在人文社会科学领域科学数据中心建设方面极具代表性的美国密西根大学的大学间政治社会研究联盟开展调研,从组织机制、政策标准、数据获取、数据归档、数据认证、数据引用和数据服务等方面对其进行了详细阐述并总结其建设经验。进一步结合我国科学数据中心数据管理现状,给出我国数据中心发展的启示,预期为我国学科领域的科学数据中心建设、数据管理和国际化发展等方面提供参考和借鉴。

科学数据管理;科学数据中心;国际经验;发展启示

科学数据(或研究数据)是指在科技活动(实验、观测、探测、调查等)或通过其他方式所获取的反映客观世界的本质、特征、变化规律等的原始基本数据,以及根据不同科技活动需要进行系统加工整理的各类数据集[1]。随着大数据时代的到来,海量科学数据不断产生,科学数据已成为国家的战略资源,以及整个科研活动的基石和保障。科学数据中心是科学数据管理的重要载体之一,其建设方式有自上而下的国家数据中心模式和自下而上的学科领域科学数据中心模式等不同方式。在当前大数据和数据驱动科学研究范式的信息化时代,我国在科学数据中心建设上发展迅速但缺乏经验,迫切需要了解和借鉴发达国家的科学数据中心建设方面的先进理念和做法并获得启示,促进我国科学数据管理。

美国是世界上科学数据拥有量最多的国家[2]。美国已经将科学数据的持续积累和开放利用能力提高到了国家科技战略的高度进行部署,并投入了大量的人力、物力和财力。通过多年持续发展,形成了一系列上至国家级下至各行业部门的科学数据中心,并在科研过程中发挥了重要作用。本文选择美国在人文社会科学领域科学数据中心建设方面极具有代表性的大学间政治社会研究联盟(简称“ICPSR”)作为研究对象,分析其数据中心建设及数据管理的经验,为我国科学数据中心的建设提供借鉴。

1 管理机构与资金来源

ICPSR是一个建立于1962年的联盟机构,隶属于美国密歇根大学的社会研究所,是全球数据管理组织DSA、DDI和WDS的成员。目前,ICPSR在社会科学和行为科学领域存储有超过25万份数据存档文件,6.6万多个科学数据集,涉及教育、老龄化、刑事司法、物质滥用、恐怖主义等40余个领域。ICPSR的组织架构如图1所示。

ICPSR作为数字档案馆建立在密歇根大学社会研究院(ISR),通过协议备忘录(MOA)与ISR达成运作关系[3],密歇根大学、ISR和ICPSR三者相互协作,共同完成ICPSR的任务和目标。(1)财政关系:密歇根大学校务委员通过ISR担任ICPSR的财务代理人,ICPSR采取的所有财务和行政行动均受密歇根大学政策和程序的约束。(2)ISR的职责:ISR向ICPSR提供空间、服务和资源,并为ICPSR提供行政和财务监督。(3)ICPSR员工任命:执行董事由理事会选定,经ISR主任任命为密歇根大学员工。ICPSR普通员工的雇佣由执行董事决定,但要经过ISR和密歇根大学人事管理人员的审查和批准程序。(4)ICPSR员工权利:执行董事和ICPSR管理人员有权代表ISR和理事会开展工作,但要受到ISR和密歇根大学正常规定的约束,并要符合ICPSR的章程。

图1 ICPSR组织架构

ICPSR在管理上采取理事会制度和会员制。(1)理事会成员:理事会由会员机构选举的12名成员组成,每两年选举6名新成员,任期4年。(2)理事会职责:理事会是ICPSR会员机构和管理部门的执行委员会,被授权代表ICPSR行事,不仅参与组织目标的确定以及制定实现这些目标的政策和程序,而且审查工作人员代表ICPSR采取的活动。(3)会议制度:在通常情况下,理事会每年举行3次工作会议,但还会因为一些特殊目的举行特别会议、闭门会议和执行会议等。

ICPSR是高校主导建设的联盟机构组织,目前拥有遍布全球的大约760所会员机构,具有非常丰富的会员管理经验。(1)明确会员入会标准:具有明确教育使命的非营利研究组织可经理事会批准成为ICPSR成员。(2)会员分类管理:ICPSR根据普遍接受的学术机构分类系统(如传统的卡内基高校分类法)将美国本土教育机构分为6个会员等级,美国以外的非营利、政府和学术机构以及商业用户等准会员或订阅用户将根据规模大小和数据资源的使用情况被分为4个级别,根据此分类,制定不同机构的年度会费标准。(3)官方代表(Of fi cial Representatives,OR):OR由会员机构指定,作为ICPSR和会员机构之间的联络人,代表会员参加官方代表会议。(4)明确权利和义务:ICPSR工作人员将努力为每位会员提供公平的服务,但会员要遵守使用数据资源的相关规定。

根据ICPSR“章程”规定[4],ICPSR的主要资金来源为会员年费,以支撑主要的财务活动和服务项目。在理事会的指导和支持下,ICPSR还会寻求除会员费之外的资金,如:订阅费用和与私人出版商合作的费用。此外,ICPSR也申请相关基金项目[5],如:“新型宏观经济数据建设的计算方法”项目得到密歇根大学数据科学研究所、密歇根大学社会研究所、密歇根经济教学与研究研究所等机构的赞助,“科研人员访问受限数据的凭证”项目得到Alfred P. Sloan基金会的赞助,等。

2 政策支持与遵循的国际标准

科学数据管理的政策支持包括宏观和微观两个层面[10]。宏观科学数据管理政策指导构建科学数据管理总体框架,如美国重视科学数据的积累和重用,在法律和政策等层面提出科学数据管理的原则。微观科学数据管理政策主要体现在各个数据中心制定的数据管理政策中。ICPSR为其社会科学数据管理制定了ICPSR数字保存政策框架、访问政策框架、ICPSR保藏发展政策、再分配政策、ICPSR会员资助数据共享政策、可访问性政策、隐私政策、角色与职责政策和ICPSR出售或交换数据政策等多个数据管理政策,旨在确保其科学数据管理工作的合法性、高效性和原则性。

在数据中心建设上,ICPSR遵循以下国际标准。(1)开放档案信息系统(OAIS):是由美国航空航天局(NASA)咨询委员会为空间系统定制的标准,2003年作为ISO标准颁发,目前在世界范围内得到广泛应用。该标准旨在为基于长期保存目的的信息系统建立一个参考模型和基本概念框架,以维护信息系统中数字信息的长期保存和可存取性。ICPSR跟踪响应OAIS相关举措,包括数字档案馆认证、永久标识符、元数据保存和制作人存档接口等,并根据OAIS参考模型制定了符合自己的数据管理流程。(2)数据文档计划(DDI):DDI标准是一项促进描述统计和社会科学数据的国际标准,描述了通过调查和其他观察方法在社会、行为、经济和健康科学领域中产生的数据产品,在整个科学数据生命周期对研究数据进行记录和管理。作为DDI团体中极具影响力的成员,ICPSR严格执行DDI数据标准和DDI元数据标准。DDI标准的执行,有助于增强人、软件系统和计算机网络对数据的理解、解释和使用[11]。(3)数字对象标识符(Digital Object Identi fi er,DOI):DOI是用于唯一标识对象的永久性标识符或句柄的ISO标准。ICPSR为每一项研究分配DOI,同时鼓励此项标准应用于期刊论文以及其他论文。DOI标准的使用,不仅方便了数据使用者,而且有助于数据产生者展示其工作的价值和科学影响力。(4)网页标准:ICPSR网页符合美国联邦政府采用的“第508节标准”,以及“网页内容可访问性指南(WCAG)2.0”(AA级)。“第508节标准”是根据康复法案第508节颁布的,适用于联邦采购的电子和信息技术,包括计算机硬件、软件、网站、电话系统和复印机[12]。网页内容可访问性指南(WCAG)2.0包含了使Web内容更容易访问的各种建议,遵循这些标准有助于增强网页的易读性[13]。

3 数据处理流程

ICPSR根据开放档案信息系统(OAIS)参考模型制定了符合自己的数据处理流程。具体数据处理流程如图2所示。

3.1 数据获取

(1)数据源:一是ICPSR定位于收集社会科学、行为科学和健康科学等共包含27个学科的数据,不收集非社会或非行为研究、具有数据成本和限制访问权限的数据。二是规范数据获取机制,不仅依靠数据归档人主动存储数据,而且依靠工作人员主动搜索数据。三是一个数据资源包括数据文件、文档文件和描述性文件,三者缺一不可。四是规范数据格式,有利于数据用户的使用,如国会图书馆推荐的格式规范。五是数据要符合公认的隐私和保密标准。

图2 数据处理流程图[14]

(2)获取优先级:在使用以上标准识别数据集后,ICPSR工作人员通过评估数据的可用性,安全、隐私和保密事项,版权及法律问题,数据质量,数据格式和财务因素等确定数据集所获取的优先等级。优先等级较高的数据集被立即存储,优先等级较低的数据集则被进一步考虑收益和成本,并在短期内判断是否存储此数据集。

(3)数据获取:社会科学档案馆和其他学科的存储库不同于一般获取静态内容的数据库(如图书馆),其数据获取过程涉及很多方面。ICPSR的数据获取包括接收数据、数据优化处理、审查保密和隐私性、编辑元数据文档等内容。在接收数据阶段:所有数据都要通过电子存档表存入数据库,并被赋予唯一的存档ID,物理材料通过可移动介质(CD-ROM或DVD)传输。最终数据存档者签署存档协议,同时ICPSR向存档者递送收据,以确保数据传输的安全性和合法性。

3.2 数据归档

ICPSR建立了一个巨大的数据仓库,用来支撑社会和行为科学的研究和知识资源积累。针对社会科学领域研究过程中所创建数据的保存、复用等问题和需求,ICPSR制定了“数据保藏发展政策”[6],明确阐述了汇集数据的类型、制定了相应的评估标准[7]、确定了数据集的优先级等。只有符合ICPSR兴趣特征的数据才能被赋予较高优先等级,并优先存储,反之则被赋予较低优先等级,并推迟存储或不存储。为了形成长期数据来源,ICPSR在长期实践中积累经验,总结了数据的主要来源[8],同时也规范化了数据集收集机制。

ICPSR数据中心建设注重数据归档管理,主要包括以下流程。(1)科学数据准备:ICPSR提倡早在数据产出之初就计划数据归档和共享等事宜,以最大限度地发挥数据的作用,并确保数据的长期可用性。根据雅克布和汉弗莱的说法,“数据归档是一个过程,应该开始于成立项目之初,并且纳入到整个项目生命周期中,随时产生并存储数据产品,生成和保存准确的元数据,以确保研究数据的可靠性”,“数据归档应作为科研活动的一部分”。(2)科学数据获取:在科学数据获取阶段,严格执行接收数据、数据优化处理、审查保密和隐私性、编辑元数据文档等相关规定,确保科学数据归档的质量。(3)科学数据存储:ICPSR将所有数据按会员数据集、代理数据集、openICPSR数据集和DataLumos数据集进行分类分级存储管理。为保证科学数据的安全,ICPSR将所有数据文件共存储有6个副本,并且对异地备份数据进行加密处理。另外,ICPSR引入了云计算技术,在2009年第一次用亚马逊的云服务支撑整个网络传输系统。

3.3 数据认证

评估认证对科学数据中心获取各利益相关者的信赖具有重要意义。近年来,ICPSR在数据认证方面做了很多努力,先后通过了可信赖仓库的审计和认证(TRAC)、数据认可印章(DSA)和DRAMBORA等数据中心认证体系。其目的就是确保数据存储过程清晰透明且符合实践要求,并确保数字资产得到应有的保护。事实证明,评估认证能提升科学数据中心的可信赖度,确保数据的长期可获得性,增加科学数据中心工作流程的透明度,而科学数据中心本身也能依照行业标准评估改进工作流程和步骤[15]。

3.4 数据引用规范

ICPSR一直与Data-PASS合作,推动数据引用标准的发展。每一条数据引用必须包含能唯一识别数据集的基本元素:标题、作者、日期、版本、永久标识符(数字对象标识符DOI、统一资源名称URN或句柄系统),如国家健康与营养调查(NHANES)项目数据的引用格式为:“United States Department of Health and Human Services.Centers for Disease Control and Prevention. National Center for Health Statistics. National Health and Nutrition Examination Survey (NHANES), 2005-2006. ICPSR25504-v5. Ann Arbor, MI: Interuniversity Consortium for Political and Social Research [distributor], 2012-02-22. https://doi.org/10.3886/ICPSR25504.v5”[16]。ICPSR对 每 条数据的引用情况进行跟踪统计,并在网上展示这些数据共享后的引用情况[17]。恰当的数据引用能够促进科学的发展,无论是数据生产者、作者还是杂志编辑者,都应遵守数据引用标准,共同营造一个良好的数据引用文化氛围。

4 数据服务

ICPSR数据用户不再局限于会员,数据访问者的身份更加多样,主要包括:研究者、政策制定者、从业者、教师、学生、赞助商和基金会等。为此,ICPSR对其数据资源分级共享,包括完全公开和限制使用等级别,同时专门制定有明确而透明的访问政策框架,以支撑其数据访问和共享活动[9]。

ICPSR为其数据用户提供了“一站式”数据服务系统。(1)可搜索数据库:ICPSR为数据用户提供了科研项目、变量和引文3个可搜索数据库,此搜索引擎包含所有的数据文档,既支持多关键字搜索也支持精确搜索。(2)在线分析工具:为了方便数据用户,ICPSR利用由加州大学伯努利分校计算机辅助调查方法项目开发的调查文档与分析(SDA)软件,提供在线分析数据服务,用户无需下载全部数据,就可对数据进行评估分析。(3)数据利用报告:ICPSR向数据存储者提供有关其数据集的使用报告,报告显示数据被查看和下载的次数,以及数据使用者的学术身份和机构信息。此报告帮助数据存储者了解其数据的社会影响力。(4)暑期培训:自1963年以来,ICPSR一直提供关于社会研究定量方法的暑期培训课程,作为其数据服务的补充。每年有来自全世界350多所学院、大学和组织的30种不同学科的学员参加暑期培训课程。(5)教育资源:ICPSR为本科教师和学生特别创建了一些数据资源,这些资源可以作为家庭作业的基础、课堂或学习的练习、讲座内容和其他相关的教育资源。(6)数据处理工具:ICPSR为数据用户提供丰富多样的数据处理工具,如表1所示。

5 几点启示

我国于1988年加入世界数据中心(WDC,世界数据系统WDS的前身),并于当年成立了9个学科中心[18],2002年启动的国家科学数据共享工程和2004年启动的国家科技基础条件平台建设专项相继推动了一批国家科学数据中心的建设与发展。除了这些自顶而下的科学数据中心建设,国内许多高校、科研机构也建立有学科领域的数据中心。现针对国内科学数据中心的缺点和不足,结合ICPSR的管理和服务经验,提出以下几点启示。

表1 数据处理工具

(1)学科领域的公共存储是科学数据管理的重要载体

ICPSR是典型的社会科学领域公共存储库,接纳本学科领域的各类科学数据集和科技资源。作为公共存储,要强调其学科性、开放性和服务性。首先,学科性是其立足之本,需要不断明确其在本学科领域的引领性,提升其在学科领域的影响力,让更多本学科领域的研究人员愿意把科学数据资源存储在这一存储库内。开放性是公共存储库的基本特征,ICPSR没有行政或者资金约束机构的限制,具有在社会科学领域数据交换和共享的充分自由度,ICPSR的数据资源能够在全球任何地域访问。服务性是一个公共存储库得以长期立足和不断扩大国际影响力的根本,ICPSR通过科学数据标识、科学数据引用统计、科学数据管理和备份等服务举措,首先满足数据资源存储方的基本诉求,进而为科学数据提供专门的质量控制、维护和开发团队,来确保数据能够充分服务于用户。此外,ICPSR通过若干数据周、夏令营、培训班和在线Webinar讲座等形式传播其科学数据管理的做法和成效。这些均是我国科学数据管理中所缺少的。

(2)科学数据管理的生命周期完整、管理过程分工清晰

ICPSR在科学数据管理中具有清晰而完整的数据生命周期。首先是科研人员将本人的科学数据成果提交或汇交到ICPSR。美国国家科学基金会(National Science Foundation,NSF)要求所有的科学研究项目结题前需要将科学数据共享和开放到科学界,许多社会科学领域的科学家首先选择ICPSR作为数据汇交的平台。首先,汇交后的数据经科研人员进行质量审核,以确认该数据能否进入存储库中;然后,对质量合格的科学数据进行分类、编码和编制元数据信息;最后,将数据存入数据存储库,并使其能够被检索、浏览和在分类分级共享政策控制下被开放获取,且收集各界用户对科学数据使用情况进行评估的意见,反馈到数据管理部门。ICPSR这一数据管理过程涉及多个部门,各部门管理分工明确、流程衔接有序,不仅能够保证科学数据管理的质量而且提高了科学数据管理效率,而且有利于在各个阶段进行数据质量的溯源。

(3)完备的科学数据管理政策和标准化体系是数据中心建设的重要基础

ICPSR在科学数据管理方面有一系列的数据管理政策,诸如大学间政治社会研究联盟访问政策框架、保藏发展政策、会员资助数据共享政策、数字保存政策框架等。在标准技术上,ICPSR采用国际标准化组织推荐的OAIS建立数据管理的标准化框架,采用国际DDI标准构建元数据技术规范。在其元数据描述要求中,规定所有数据必须遵从ICPSR的元数据内容要求,包括使用可扩展标记语言(XML)对文档和数据进行结构化处理,元数据中要包含参研人员、资金来源、项目描述等主要元素。ICPSR同样规定了数据的引用格式。其标准化的引用格式包括标题、作者、数据、版本和永久标识符等内容。这些都是其科学数据可以长期保存、利用和增值的重要基础。

(4)科学数据安全管理制度完善、物理设施齐备,重视数据中心认证

ICPSR重视科学数据的安全管理,具有6个数据存储备份,并且依托于亚马逊的云平台建立云备份。ICPSR对于重要的、具有权限控制的科学数据采取物理存储隔离,只有具有相关权限的人员才能通过门禁系统进入这个区域。对于用户访问的网络安全,ICPSR提供有VPN机制对特定用户提供局域网的数据服务。鉴于数据安全问题,ICPSR未在国外进行备份。ICPSR重视数据中心认证,于2011年通过荷二Data Seal of Approval的数据中心认证。ICPSR数据中心各项软、硬环境完善,是ICSU-WDS的国际数据中心之一,并通过ICSU-WDS的数据认证和评估。

(5)科学数据管理的反哺和回报机制完善

ICPSR利用信息技术对科学数据管理和开放服务的效益进行量化和追踪,协调解决数据提供者、管理者、使用者之间的利益关注点,使得科学数据管理成效能够开放透明地反哺和回报各利益相关方。例如,发布带有标识符的科学数据,提供科学数据使用的引用统计等。ICPSR当前引用率较高的数据其引用次数高达850余次。这个数据引用追踪机制是对科学数据资源拥有者和提交者的极大回报,在客观上也促进了优质科学数据资源的社会推广和科学界评价。

[1]司莉,庄晓喆,王思敏,等.2005年以来国外科学数据管理与共享研究进展与启示[J].国家图书馆学刊,2013,22(3):40-49.

[2]刘闯.美国国有科学数据共享管理机制及对我国的启示[J].中国基础科学,2003(1):29-31.

[3]Memorandum of Agreement[EB/OL].[2017-05-14].http://www.icpsr.umich.edu/icpsrweb/content/about/governance/moa.html.

[4]Constitution[EB/OL].[2017-05-14].http://www.icpsr.umich.edu/icpsrweb/content/about/governance/constitution.html.

[5]Data Stewardship and Social Science Research Projects[EB/OL].[2017-05-14]. http://www.icpsr.umich. edu/icpsrweb/content/about/research-projects.html.

[6]ICPSR Collection Development Policy[EB/OL].[2017-05-14]. http://www.icpsr.umich.edu/icpsrweb/content/datamanagement/policies/colldev.html.

[7]Details on Appraisal Critera[EB/OL].[2017-05-14].http://www.icpsr.umich.edu/icpsrweb/content/datamanagement/lifecycle/details.html.

[8]Data Sources[EB/OL]. [2017-05-14].http://www.icpsr.umich.edu/icpsrweb/content/datamanagement/lifecycle/sources.html.

[9]ICPSR Access Policy Framework[EB/OL].[2017-05-14]. http://www.icpsr.umich.edu/icpsrweb/content/datamanagement/preservation/policies/access-policyframework.html.

[10]孟祥保,钱鹏.高校社会科学数据管理的国际经验及其借鉴:以UKDA和ICPSR为例[J].情报资料工作,2013,34(2):77-80.

[11]Data Documentation Initiative (DDI)[EB/OL].[2017-05-02].http://www.ddialliance.org/.

[12]About the Section 508 Standards[EB/OL].[2017-05-02]. https://www.access-board.gov/guidelines-andstandards/communications-and-it/about-the-section-508-standards.

[13]Web Content Accessibility Guidelines (WCAG) 2.0 [EB/OL]. [2017-05-02]. https://www.w3.org/TR/WCAG20/.

[14]OAIS-Based Processes[EB/OL].[2017-05-21]. http://www.icpsr.umich.edu/icpsrweb/content/datamanagement/lifecycle/oais.html.

[15]VARDUGAN M, LYLE J. The inter-university consortium for political and social research and the data seal of approval: accreditation experiences, challenges, and opportunities[J].Data Science Journal,2014(13):83-87.

[16]National Health and Nutrition Examination Survey(NHANES), 2005-2006 (ICPSR 25504)[EB/OL].[2017-05-25].http://www.icpsr.umich.edu/icpsrweb/ICPSR/studies/25504#cite.

[17]Utilization for National Health and Nutrition Examination Survey (NHANES), 2005-2006[EB/OL]. [2017-05-25].http://www.icpsr.umich.edu/icpsrweb/ICPSR/studies/25504/utilization.

[18]王卷乐,孙九林.世界数据中心(WDC)回顾、变革与展望[J].地球科学进展,2009,24(6):612-620.

Experiences and Enlightenment of ICPSR Scientific Data Center Development

WANG Mingming1,2, WANG Juanle1,6, ZHAO Qiang3, GAO Mengxu4, LI Ge1,2, HAN Xuehua1,5, WANG Yujie1,2
(1. Laboratory of Resources and Environment Information System, Institute of Geographic Sciences and Natural Resources Research, Chinese Academy of Sciences, Beijing 100101; 2. School of Civil and Architectural Engineering, Shandong University of Technology, Zibo Shandong 255049; 3. College of Geoscience and Engineering, China University of Mining & Technology (Beijing), Beijing 100083; 4. National Science and Technology Infrastructure Center, Beijing 100862; 5. University of Chinese Academy of Sciences, Beijing 100049; 6. Jiangsu Center for Collaborative Innovation in Geographical Information Resource Development and Application, Nanjing 210023)

Scientific data center is one of the important carriers of scientific data management and its construction methods include state data center model by top-down and disciplines distribution science data center model by bottom-up. In the information age of big data and data-driven scientific research paradigm,china develops rapidly but lacks experience in the construction of scientific data center, therefore In order to promote the management of scientific data in China, it is urgent to understand and draw lessons from the advanced concepts and practices of scientific data center construction in developed countries. The University of Michigan’s Inter-university Consortium for Political and Social Research (ICPSR) has conducted long-term social survey data accumulation, with years of Social Science Variables Database. It is highly representative of the construction of scientific data centers in the field of humanities and social sciences. In this paper, the ICPSR is elaborated and summarized from the aspects of organization and mechanism, policy and standard,data acquisition, data archiving, data authentication, data referencing and data services, through network research, document tracking and field interview. Combining with the status of data management of domestic scientific data center, the paper presents some suggestions for the development of Chinese scientific data center, and is expected to provide reference for scientific data center construction, data management and international development in various disciplinary fields.

scientific data management, scientific data center, international experience, development enlightenment

TP391.7

A

10.3772/j.issn.1674-1544.2017.06.015

王明明(1993—),男,山东理工大学硕士研究生,研究方向:地理信息系统与科学数据管理;王卷乐(1976—),男,博士,中国科学院地理科学与资源研究所研究员,地球数据科学与共享研究室副主任,博士生导师,研究方向:科学数据共享、地理信息系统与遥感应用(通讯作者);赵强(1992—),男,中国矿业大学(北京)硕士研究生,研究方向:3S集成与工程应用;高孟绪(1982—),男,国家科技基础条件平台中心副研究员,博士,研究方向:科技资源管理与共享;李舸(1993—),男,山东理工大学硕士研究生,研究方向:地理信息系统与科学数据管理;韩雪华(1992—),女,中国科学院大学硕士研究生,研究方向:数据共享与知识发现;王玉洁(1992—),女,山东理工大学硕士研究生,研究方向:地理信息共享。

基金项目:国家科技基础条件平台专项课题“科学数据管理与开放共享的模式与方法研究”(2015DDJ1ZZ11);国家科技基础条件平台专项课题“科学数据汇聚的模式与方法研究”(2017DDJ12215);中国科学院学部咨询评议项目“前沿与交叉学科科研信息化发展战略研究”(O7M74940F4)。

2017年5月30日。

猜你喜欢
数据管理数据中心科学
酒泉云计算大数据中心
企业级BOM数据管理概要
定制化汽车制造的数据管理分析
海洋环境数据管理优化与实践
浅析数据中心空调节能发展趋势
CTCS-2级报文数据管理需求分析和实现
点击科学
关于建立“格萨尔文献数据中心”的初步构想
科学大爆炸
科学拔牙