英国高等学校科研数据管理经验探析

2015-02-12 17:03:42张秀霞
图书馆理论与实践 2015年7期
关键词:数据管理研究者英国

[文献标志码]B

[文章编号]1005-8214(2015)07-0067-04

1 引言

ICT技术的迅猛发展极大地增强了数据存储、处理、传输和管理能力,科学研究第四范式即数据密集型的科学发现、e-Science环境下的科学研究更是对数据交流和共享提出了更高的要求,由此使得科研数据管理的重要性凸显。另外,以NSF为代表的科研资助机构对科研项目数据管理的政策上的新要求,更是使得科研数据管理受到前所未有的关注。正是在这样的背景环境下,作为科研主要阵地的高校,包括众多的数据管理研究者和实践者,意识到肩负的重任,投入到高校科研数据管理的理论研究和实践探索中。国外一些高校正在积极开展科研数据管理和服务,并取得了一些进展,其中以英国和美国为代表。本文试图通过对英国高校科研数据管理研究和实践的扫描和分析,总结对我国高校科研数据管理的启示。

关于科研数据目前尚未有统一和标准的定义,不同的情境和组织对科研数据的定义有所不同。本研究中的科研数据概念使用英国皇家协会《作为开放事业的科学》报告中对科研数据的定义:科研过程中真实或假设为真实的定性或定量的陈述或数字,科研数据可能是原始或主数据(如直接来源于测量),或者由主数据衍生而来,但是还没有经过除计算之外的分析或解释。 [1]

2 英国高校科研数据管理研究和实践进展

2.1英国高校科研数据管理环境分析

英国高校科研数据管理的开展与英国科研政策和环境息息相关。2007年OECD发布《OECD公共资助研究数据存取原则和指南》, [2]为政府科学政策和研究资助机构存取公共资助的研究数据提供政策建议,目的就是促进研究者、研究机构及组织的数据存取和共享。2012年英国皇家学会发布题为《作为开放事业的科学》的报告,强调了数据在科研行为和交流中的重要性,并建议大学和研究机构在促进数据管理服务发展方面发挥重要作用,在自身能力和范围内建立数据战略,管理自己的知识资源并支持研究人员的数据需要。

英国工程和自然科学研究委员会(EPSRC)强调研究机构要对研究数据进行有效管理,并将其作为研究环境的一部分,即研究机构需要为其研究者提供相应的研究数据管理培训,保证研究者能够使用研究数据管理基础设施,明确提出到2015年大学必须建成可为研究者提供研究数据管理的基础设施。

公共资助的研究所产生的研究被认为是公共商品,应该被检验和再利用。基于这个原则,英国所有的研究理事会要求其资助的项目必须保证研究数据的再利用,数据存档至少必须保证10年,特殊情况除外。由此可见,良好的科研政策环境推动了英国高校科研数据管理活动的开展。

2.2英国高校科研数据管理的开展

通过文献调研和网络调研,发现英国高校科研数据管理研究和实践主要是基于JISC(英国联合信息系统委员会)及DCC(数字管理中心)的引领和指导下开展的。

JISC非政府部门,作为英国的公共机构,其使命是通过提供战略指导、咨询建议、资金支持和发展机会,引导英国高等教育以及科研机构创造性地使用ICT进行教学、学习、科研及管理,JISC代表高等教育拨款委员会对高等教育领域ICT基础设施、信息管理和技术应用等方面的投资进行全局规划并提供服务。 [3]DCC成立于2004年,是JISC专门针对数字保存论题而设立的全国中心,为英国的数字管理提供通用性的服务,促进数据管理的发展和研究。JISC和DCC设置并依托于英国一流大学,如爱丁堡大学、格拉斯哥大学、巴斯大学等开展工作。从2009年开始,JISC和DCC与一些大学进行合作,目标是促进高校科研数据管理和服务的开展。最初,英国140所高校中只有20所参加DCC的科研数据管理项目,后来越来越多的高校认识到科研数据管理的重要性,发展到40所高校参与JISC和DCC发起的研究数据管理和服务。2011至2013年JISC支持了27所英国大学建立、开展及提高科研数据管理和服务的开展。 [4]

一直以来,JISC把促进和支持科研数据管理和共享作为英国高等教育和研究工作的重点,注重在基础设施建设和实践中拓展和增强高校科研数据管理能力。更重要的是,通过这些项目的探索和实践,积累了大量有益的经验、方法、技术和工具,在JISC和DCC的积极推动下,这些经验和方法得以总结、提升、推广和应用,从而帮助更多的英国高校开展科研数据管理活动。DCC为高校如何开展科研数据管理提供了详细的指南和帮助,指导高校更好地理解计划,理解实施科研数据管理的目的和相关问题,对高校科研数据管理的组成和过程进行解释,对相关人员(包括管理者、服务者、研究者)的角色和职责进行描述。

2.3英国高校科研数据管理的理论成果

在科研数据管理的研究和实践中,JISC和DCC提出了一些理论,主要包括高校科研数据管理的相关概念、原则、作用,科研数据管理生命周期、内容框架等。近年来围绕着数据管理出现了许多数据生命周期模型,主要有DCC数字管理生命周期模型, [5]DCC扩展模型, [6]其中DCC生命周期模型比较通用,抽象出数据管理的8大类主要行为和过程。DCC还提出了高校科研数据管理的内容框架,主要包括科研数据管理政策和战略、业务规划和可持续发展、数据管理计划、数据知识库、数据选择和处理、数据编目、管理动态数据、数据指南、培训和支持等。该框架体现了对高校科研数据管理的顶层设计和内容指导。

2.4英国高校科研数据管理的实践成果

高校科研数据管理需要考虑诸多问题和因素,如政策和战略、沟通和合作、研究者、学科、策略、技术、标准、方法等。英国高校科研数据管理实践在这些方面取得了一定的成果。如在政策方面,爱丁堡大学、南安普顿大学、赫特福德大学、华威大学、格林多大学、北安普顿大学等在JISC和DCC的数据管理政策指导下,纷纷发布自己的高校科研数据管理政策,预示了英国高校对科研数据管理的重视,也体现了政策对高校科研数据管理的重要性。在科研数据管理政策的制定过程中,这些大学特别强调,应将科研数据管理与学校发展战略、学校科研能力的提升密切结合,为研究提供高质量的支持。

JISDC和DCC的引领作用主要体现在为高校科研数据管理提供诸多实用的关键资源,主要包括工具和资源的免费提供、培训和咨询的个性化提供、最佳实践的识别并共享、标准和平台的制定和推荐等。 [7]从2010到2013年JISC和DCC重点转向为英国高等教育及研究机构提供管理工具、提升管理技能、推动管理实践、建立管理战略、加强基础设施建设。

3 英国高校科研数据管理实例

3.1南安普顿大学的数据资产架构(DAF)项目 [8]

数据资产框架(DAF,Data AssetFramework)是实施数据管理初期需要进行的一项重要工作,是指通过调研等方法,对目前本机构科研数据的收集、共享、存储等行为,研究者数据管理和长期保存意识和能力,以及机构内的科研数据管理基础设施等方面进行全面、系统、深入地了解和把握,为制定本校数据管理政策和开展科研数据管理工作奠定基础并提供参考。DAF有利于了解目前的科研数据管理实践情况,并对未来数据管理提供指导,其后来逐渐成为研究部署科研数据管理的一种通用性方法。

在数据管理项目研究和实践中,南安普顿大学很好地运用了DCC提出的DAF方法,严格按照DAF四个步骤开展基础性工作:(1)计划和界定调查目的和范围,即研究准备工作;(2)识别目前现有的数据,并对之进行分类和分析,以决定从何处着手开展数据管理;(3)数据生命周期要充分考虑和理解研究者的工作流程,并识别数据创建和管理实践的弱点和难点;(4)将收集的信息集中进行分析处理并提出建议。

南安普顿大学从三个维度来保证数据管理实施的有效性:一是调查全校研究者拥有的数据类型,目前存在的数据实践,并分析其风险;二是拓展新的数据管理和服务以满足研究者和资助机构的需求;三是促进研究者进行数据管理实践,强化其相关意识,包括短期和长期数据存取方面。通过该项目,南安普顿大学取得了数据管理方面阶段性的诸多新的发现,如将研究者划分为三大类型,归纳出研究者的数据管理通用性行为和需求等。这些发现和成果可用于南安普顿大学随后进行的数据管理工作,如科研数据管理政策的制定等。南安普顿大学科研数据管理工作虽然开始得晚,但得益于DAF项目的良好应用这一好的开端,逐渐成为英国高校科研数据管理的先行者。

3.2牛津大学科研数据管理

牛津大学开展科研数据管理较早,在实施过程中强调数据管理要面向并融入统一的大学基础设施中,将数据管理政策、工具、培训等要素纳入大学的整体基础设施,体现研究数据生命周期的不同阶段的要求,从而使科研数据管理能够更好地为科研服务。 [9]在构建研究数据管理基础设施过程中,牛津大学启动了一个跨机构的合作项目,该项目基于DCC长期保存生命周期模型,结合本校研究人员需求,考虑校园各方情况及反馈,提出了牛津大学科研数据管理和长期保存服务框架,主要包括商业层、政策层、基础设施和工具、支持层和服务层。 [10]商业层是指有关数据管理的运行和费用,政策层包含了有关数据管理的政策和程序,基础设施和工具包括数据管理所需的硬件和软件,支持层是指连接基础设施工具与服务的各种接口,服务层包括围绕数据管理而开展的各项服务,如数据管理计划、数据选择和评价等。这个服务框架最终集成于学校的整个基础设施中,在不同的科研环境中体现科研管理的内容和价值。

4 对我国高校科研数据管理的启示

4.1国家层面机构的指导和引领

从英国高校科研数据管理的发展实践来看,其最大特点是国家层面专业机构的指导和引领,这种指导和引领不但有一定的高度,影响力大,同时也非常专业、实用和有效,具有很强的可行性和指导性。这说明,高校科研数据管理的开展路径,不管是自上而下还是自下而上,如果有高水平专业机构的指导,可以对各高校的科研数据管理活动起到极大的推动和促进作用。

英国高校科研数据管理的起步初期,大多数高校意识不高,鲜有明确的政策、有效的工具、服务组件以及必备的基础设施,各高校的科研数据管理只是为了满足研究相关资助机构的要求,而非着眼于建立可持续的基础设施和研究环境,在制定战略、计划和政策方面也有诸多困惑, [11]但是在JISC和DCC的引领和推动下,尤其是在JISC和DCC提供的大量有益的方法、工具、实例等可操作性指南的参考应用的帮助下,英国高校科研数据管理迅速发展和崛起。值得一提的是,DCC还特别注重面向高校的数据管理宣传,如每年在英国各地举办巡展,宣传科研数据管理的重要性和DCC能够提供的帮助,目的是让积累的经验和工具可以使更多的高校从中受益。

目前我国高校科研数据管理活动缺乏这样的指导和引领,虽然中国高等教育文献保障系统(CALIS)正在进行高校科研数据管理的探索和研究,并开展了一定的实践, [12]但其毕竟只是从图书馆的角度,相对而言,其影响范围和影响力还有待提升,需要更多的部门或机构加入和参与,以更好地推动我国高校科研数据管理研究和实践的发展。

4.2 多方合作

英国高校科研数据管理的发展离不开各种层面的多方合作。一方面,从JISC、DCC本身设置来看,JISC和DCC与一些著名大学具有非常密切的关系,与其他研究机构的合作也很密切,如,DCC于2010年重组三角同盟, [13]将机构地点设置于爱丁堡大学,主要合作伙伴有格拉斯哥大学的人文学科先进技术和信息研究所、巴斯大学的英国图书馆网络工程事物所(UKOLN),以及英国科学和技术设施委员会(STFC)。另一方面,英国高校科研数据管理是建立在各方面人员合作的基础上,包括数据专家、记录管理者、图书馆员、档案工作者、研究人员(作为数据创建者)和政策制定者。如,DCC每两年举办一次科研数据管理论坛, [14]将研究者、数字知识库管理者、图书馆员、信息和研究组织、数据掌管人员、数据中心管理人员、数据科学家、研究资助机构管理者等各方面的数据管理人员召集在一起讨论和解决相关问题。高校科研数据管理涉及各方面、多层面的内容,如政策、技术、组织、管理、人力资源等,离不开各方面人员的合作和协调。

我国高校科研数据管理目前还处于起步阶段,但在某些学科领域的科学数据管理发展得比较成熟,如科学数据共享平台与科学数据组织中的气象科学 [15]、地球科学 [16]、农业科学 [17]、医药卫生科学 [18]、水利科学、天文科学等。虽然在应用环境上与高校科研数据管理服务不一样,但在一些通用或共性的方面还有值得借鉴之处。如果我国高校科研数据管理工作在开展之初就能够重视机构内外的合作,充分利用已有的资源,可使数据管理得到更好的发展。

4.3政策和战略规划的制定和推动

战略规划和政策的制定是英国各高校科研数据管理成功开展的基础和保证。迄今为止,英国的20多所著名大学在其学校网站上正式公布了科研数据管理政策,还有一些大学发布了政策草稿。 [19]这些大学的科研数据管理政策简明扼要,从学校层面和科研管理的高度明确了科研数据管理的目的与原则、角色与责任、相关法律、数据保存、数据访问、数据隐私、知识产权、机构支持等相关内容。这些政策的制定和发布对科研数据管理的开展起到了很好的促进作用。在制定和发布科研数据管理政策的基础之上,各高校还纷纷出台措施保证政策的实施。如爱丁堡大学特别成立了科研数据管理政策实施委员会, [20]其成员来自校内各有关部门,包括科研管理部门、信息技术部门、图书馆和研究机构等。实施委员会基于科研数据管理政策制定切实可行的战略规划和发展路线图,把科研数据管理的目标、阶段、行为、责任、成果等细化到各相关部门相关人员,从而最大程度地保证了政策的有效实施。

我国各个高校还没有明确、系统的科研数据管理政策,在此方面还任重道远。我们可以参考和借鉴英国高校相关政策的制定、发布和实施经验,结合我国实际情况和实际需要尽快建立适合我国国情的科研数据管理政策。

猜你喜欢
数据管理研究者英国
企业级BOM数据管理概要
定制化汽车制造的数据管理分析
海洋环境数据管理优化与实践
英国的环保
高等教育中的学生成为研究者及其启示
CTCS-2级报文数据管理需求分析和实现
欧盟同意英国“脱欧”再次延期申请
中国外汇(2019年21期)2019-05-21 03:04:06
研究者称,经CRISPR技术编辑过的双胞胎已出生。科学将如何回应?
英语文摘(2019年2期)2019-03-30 01:48:40
研究者调查数据统计
中华手工(2018年6期)2018-07-17 10:37:42
英国圣诞节