许丽丽
(黑龙江大学图书馆 黑龙江哈尔滨 150080)
数据密集型科研新范式的发展,使科研数据管理成为科学研究与学术交流的重要部分。英国是最早实施E-Science计划的国家,众多学科数据中心拥有良好的数据管理传统,在一系列资助机构政策和政府项目投资推动下,近年来英国高校的科研数据管理成效显著。本文通过文献调研和网络调查,考察了英国高校科研数据管理的发展状况,并在典型案例分析中,探讨了其发展特点和路径。
2001年,英国政府投资启动了为期六年的“EScience 核心计划”(E-Science Core Programme),旨在通过基础设施和工具的建立,促进E-Science的广泛应用。尽管数据管理并非“E-Science核心计划”一期重点解决的问题,但在大型E-Science项目中数据管理的意义很快显现。2003年,英国联合信息系统委员会(Joint Information Systems Committee,JISC)发布了一项关于E-Science数据管理的报告,该报告指出 “英国尚缺乏政府层面的数据管理和数据基础设施的全面战略”,并提出了一系列发展国家数据能力的建议,重点是由JISC和“E-Science核心计划”共同资助成立英国数据管理中心 (Digital Curation Centre,DCC),为英国高校的数据管理提供专门知识和建议。
英国对科研项目产出的数据管理已有多年历史,只是数字化科研数据的增长进一步强化了数据管理与长期保存的需求。英国的多个研究理事会都投资建立了特定学科的数据中心,收集和保存资助项目的科研数据,使其能为后续研究所利用。如经济与社会研究理事会 (ESRC)建立了英国数据存档(UKDA)中心,艺术与人文研究理事会(AHRC)建立了虚拟艺术数据服务和历史数据服务中心,自然环境研究理事会(NERC)建立了国家地理科学数据中心、大气数据中心等多个数据中心。
NERC、ESRC和AHRC等设有数据中心的机构早在1996年至2000年间就相继发布数据管理与共享政策。2004年,经济合作与发展组织(OECD)成员国签署《开放获取公共资助科研数据的宣言》,并于2007年发布《开放获取公共资助科研数据的原则和指南》。英国作为成员国之一,为响应OECD的政策,英国主要科研资助机构,包括惠康基金(Wellcome Trust)、研究信息网络(RIN)及英国研究理事会的其他4个专业理事会均发布了数据管理政策。这些政策对其资助项目科研数据的管理、保存和获取做出了明确要求,并将受资助者实际遵守情况作为今后是否给予资助的依据。
E-Science计划的实施、国家数据管理机构的成立及科研资助机构数据管理与共享政策的发布,推动了英国高校科研数据管理实践的迅速发展。英国相关机构基于高校科研数据管理不同层面投资启动了多个项目,很多高校也结合自身特点就科研数据管理的实施进行了积极探索。
JISC作为英国非政府部门公共机构,为英国高等教育领域信息与通信技术的创新应用提供战略指导、咨询建议和资金支持。JISC资助了很多高校科研数据管理的相关项目,本文选择三个有代表性的项目加以介绍。
2.1.1 DISC-UK数据分享项目
DISC-UK数据分享项目 (DISC-UK DataShare project)于2007~2009年获得JISC资助,由JISC投资建立在爱丁堡大学的EDINA国家学术数据中心,爱丁堡大学数据图书馆牵头,与牛津大学和南安培大学共同建设。DISC-UK(Data Information Specialists Committee,英国数据信息专家委员会)是由英国数据馆员和数据管理者所组成的联盟,如英国高校图书馆和院系的数据支持专业人员,该项目是在这些数据专业人员的现有合作基础上建立的。
DISC-UK数据分享项目的总体目标是在EScience技术应用、科研资助机构的政策要求、开放获取运动发展等变化的信息环境下,探索高校科研数据共享的新模式、新流程与新工具。项目旨在通过高校数据支持人员和机构仓储管理者的合作与知识交流,发展英国高校的分布式机构数据仓储模式。三所大学分别基于不同的仓储平台,建立了机构数据仓储及相关服务。其中,爱丁堡大学采取独立的数据仓储系统,并设计与该校的科研出版物仓储实现互操作;而牛津大学和南安培大学则选择与各自的科研出版物仓储同一系统的建设方式。
2.1.2 数据审核框架项目
数据审核框架项目 (Data Audit Framework projects)于2008年获得JISC资助,其目的是为英国高校掌握其拥有的数据及实际管理情况提供必要的审核工具,以推动高校科研数据管理政策与实践的发展。该项目共包括五个子项目,其中一个为总体的框架发展项目,由格拉斯哥大学人文先进技术与信息协会 (Humanities Advanced Technology and Information Institute,HATII)与DCC共同承担,负责创建数据审核框架和在线工具;其余四个是框架实施项目,由爱丁堡大学、伦敦大学学院、帝国学院及皇家学院分别承担,作为具体应用案例,检测数据审核框架的有效性并促进其利用。该项目的主要产出是为高校核实所拥有的数据及评估其管理情况提供了一整套的方法、工具和实施指南,涉及前期规划、数据识别与分类、数据管理评估、调查结果与建议等各个阶段。
2.1.3 管理科研数据计划
管理科研数据计划 (Managing Research Data programme)是JISC资助的大型项目,共分两期,分别包含若干子项目,旨在通过发展和支持科研数据管理来推进英国高校教学与科研。其中,一期项目为2009~2011年,包括科研数据管理基础设施、科研数据管理计划及其支持工具、科研数据引用、链接、整合与出版,以及科研数据管理培训资料等多个项目系列。一期项目产生了很多重要的工具、技术和服务,并且针对若干学科领域发展了相应数据管理培训材料。二期项目为2011~2013年,在一期项目成果基础上,进一步提升英国高校科研数据管理的能力。其核心是17个科研数据管理基础设施项目,帮助高校建立或进一步发展数据管理基础设施及支持服务,涉及发展本校的数据管理政策和实施路线、数据管理指导材料和培训活动、项目进程中动态数据的管理和存储系统、数据仓储平台及数据目录等多个方面。
作为数字保存和数据管理的国家机构,DCC经历了三个发展阶段:一期活动主要是参与公众和商业部门的项目活动,与国际组织、标准组织合作,开发数据管理工具;二期活动则更多地直接参与研究社区的相关活动;从第三期开始,DCC转为针对高等教育机构开展专门服务,加强高等教育系统的数据管理能力和技能建设。
2011年,DCC由英国高等教育拨款委员会(HEFCE)的高校现代化基金(Universities Modernisation Fund,UMF)资助,实施了为期两年的机构参与计划(Institutional Engagement programme)。该计划通过与21所英国高校的密切合作,为其提供量身定制的服务和支持,以提高科研数据管理能力。DCC针对各参与机构的特定需求和重点,协助其开展一系列数据管理活动,从需求评估、制定政策和方案、提供培训到开始实施一系列的数据管理服务。这21所参与机构涵盖了各种高校类型,从而为英国各类高校的数据管理提供了最佳实践案例。
爱丁堡大学科研数据管理的负责部门是其信息服务部。信息服务部包括爱丁堡大学数据图书馆和EDINA国家学术数据中心。爱丁堡大学通过DISCUK数据分享项目和数据审核框架实施项目建立了科研数据仓储,并调查了本校研究人员的数据管理状况和需求。在此基础上,信息服务部于2009年建立数据管理指南网页;数据图书馆尝试为地理科学学院的博士生提供数据管理培训课程,随后又为研究生发展了通用的数据管理培训。2011年制定并发布了英国高校第一科研数据管理政策,确认了研究人员和大学在数据管理中的责任。
为贯彻学校的科研数据管理政策,信息服务部的一个重要举措是制定数据管理实施路线。该路线分为数据管理计划、动态数据管理设施、数据管理工具与服务、数据管理支持4方面。其中,数据管理计划部分是对科研数据收集之前的计划制定提供支持和服务;动态数据管理设施是为科研活动使用中的数据提供存储平台和数据处理工具;数据管理工具与服务是对项目结束后数据产出的描述、存储和提供获取;数据管理支持就整个科研全程提供咨询与支持服务,重点是为研究团体和专业人员提供定制化的培训及尝试深度数据管理咨询服务。该路线对各个阶段数据管理的目标、负责单位和行动措施都予以详细规定,从而确保了该校科研数据管理的有效实现。
牛津大学依托于各类项目,发展了一系列数据管理设施和服务。在DISC-UK数据分享项目中,牛津大学图书馆利用Fedora平台建立了Databank数据仓储。2009年,牛津大学承担了JISC管理科研数据计划一期项目SUDAMIH (Supporting Data Management Infrastructure for the Humanities,支持人文学科数据管理基础设施),发展了协助人文研究人员管理数据的软件工具、培训材料和课程。
为整合已有的数据管理基础设施,牛津大学在2011年实施了Damaro(Data Management Roll-out at Oxford,牛津大学数据管理推出)项目,获得JISC管理科研数据计划二期项目资助。牛津大学实践的重点是发展该校科研数据产出的元数据目录——Datafinder。Datafinder记录牛津大学的所有科研数据,提供其所在位置(本地或大学外的系统)信息,并与该校的研究论文仓储 (Oxford Research Archive,ORA)整合,ORA中的研究论文与Datafinder中对应的科研数据相互提供链接。牛津大学还为研究人员开发了在线科研数据库服务(Online Research Database Service,ORDS)等数据处理和协作工具,研究项目结束或数据出版时,ORDS收集的元数据能自动在Datafinder创建记录,使大学可以跟踪研究人员的数据产出。
2011年,英国工程与物理科学研究理事会(EPSRC)发布了其科研数据政策框架,并对受资助机构提出了涉及数据管理和提供获取的各个方面的9点预期。与之前其他资助机构政策不同,EPSRC将政策遵守的责任主体限定为机构而不只是研究者。EPSRC要求受资助机构制定明确的政策实施路线,2012年5月1日开始执行,2015年5月1日以前应完全符合预期要求,不遵守的机构将不再具备受资助资格。
应用科学和工程研究一直是巴斯大学的重点研究领域,EPSRC是其最主要的资助者。因此,巴斯大学科研数据管理的首要目标是确保满足EPSRC关于科研数据的政策要求。巴斯大学科研数据工作组2011年获得JISC二期管理科研数据计划资助,实施了Research360项目。该项目的中心就是制定一个完全符合EPSRC预期的科研数据管理实施路线,并发展具体运作案例来支持其执行。工作组在调查巴斯大学科研数据现状基础上,对应EPSRC的9点预期,制定了包括22个目标和举措的数据管理实施路线,规定了各目标实施和监督管理的责任单位。为确保这些目标的实现,工作组与查理比格里(Charles Beagrie)公司合作发展实际案例,借鉴其数据管理和数字保存成本/效益分析的丰富经验,探讨通过合理投资实现数据管理的可持续运作。
资助机构政策对英国高校的科研数据管理发挥了重要的驱动作用。英国研究理事会的七个专业理事会均要求在申请资助时要提交数据管理计划,因而英国高校数据管理实践的重点之一,就是根据本校需求发展数据管理计划支持工具和相关指南。由于EPSRC的数据管理政策将政策遵守的责任限定到机构层面,且取得了更好的实施效果,包括巴斯大学在内的多所高校都积极发展数据管理路线和措施以符合EPSRC的要求。而这些政策得以有效贯彻实施,有赖于英国在科研数据管理基础设施和服务上的大量公共投资。除JISC在科研数据管理项目上进行的重大投资外,英国研究理事会也支持将项目基金用于科研数据的管理和共享。
数据管理的最终目标是确保具有长期价值的数据能被获取和重用。从机构层面上看,英国高校通过其科研数据仓储和科研出版物仓储的整合,以及科研数据元数据目录的建设,实现科研数据与对应出版物的链接,促进科研数据的发现和获取。从国家层面上看,英国拥有众多的学科数据中心和不断增长的机构数据仓储,这些数据仓储采用了不同的系统平台和元数据标准,因而需要建立全国性的通用搜索网关,增加科研数据的可见度。为此,DCC在2013至2014年与英国数据存档合作,完成了科研数据注册(Research Data Registry,RDR)实验项目。 RDR建立了英国高校和学科数据中心的科研数据注册模型,并利用该模型测试收获来自英国九个数据中心和九所大学数据仓储的元数据记录,从而提供统一的英国科研数据注册和发现服务。
英国皇家学会在2012年发布的《科学是一个开放性的事业》报告中指出:“转变将数据视为私人领域的研究文化对于实现科研开拓是非常必要的,这种变革需要大学、科研资助者、政府机构及学会等众多利益相关者的参与合作”。英国高校在开展科研数据管理时,不仅实现了图书馆、IT部门、科研管理部门之间的内部合作,还积极与DCC等国家机构合作,尤其是与学科数据中心进行密切合作。例如,英国数据存档作为英国最大的社会科学数据收藏机构,至今已有数十年历史,在数据管理与共享方面积累了丰富经验。英国数据存档利用其专业知识和经验,协助埃塞克斯大学建立数据仓储和相关服务,实现了数据中心和机构数据仓储的知识交流和共同发展。
英国高校在科研数据管理实践中非常注重吸取国际经验。巴斯大学等高校在发展数据管理实施路线时都参照了澳大利亚莫纳什大学制定的科研数据管理战略规划。为促进全球范围的科研数据共享与交流,推动数据驱动的科学创新和发现,欧盟、美国和澳大利亚等国的相关组织在2013年成立了科研数据联盟 (Research Data Alliance,RDA),DCC和英国一些高校也积极参与该联盟的活动。RDA致力于消除国际数据共享的障碍,加强科研数据的标准化。2014年,RDA元数据标准目录工作组着手建立各学科科研数据的元数据标准目录,以促进这些标准的应用,减少标准的重复研制。该项工作以DCC之前建设的学科元数据标准目录为基础,DCC和RDA围绕标准目录建设展开密切合作。
英国高校的科研数据管理,是在资助机构政策和政府项目投资的推动下,由DCC作为指导机构提供业务支持,在制定明确的机构数据管理政策和实施路线基础上,以发展数据仓储、数据管理规划工具、数据管理培训和指南为重点,实现科研数据管理的可持续运作。英国的实践表明,高校要实现完善的科研数据管理,不仅仅依靠高校自身,更需要机构之间乃至国际之间的通力合作。
[1] McKnight S.Envisioning Future Academic Library Services[M].London:Facet Publishing,2010:145-168.
[2] Lord,P.,Macdonald A.E-Science Curation Report-Data Curation for e-Science in the UK:An Audit to Establish Requirements for Future Curation and Provision[R/OL].[2015-02-28].http://www.jisc.ac.uk/publications/reports/2003/escienc efinalreport.aspx.
[3] Ball A.,Ashley K.Show Me The Data:The Pilot UK Research Data Registry [J].International Journal of Digital Curation,2014,9(1):132–141.
[4] Jones S.Developments in research funder data policy[J].International Journal of Digital Curation,2012,7(1):114-125.
[5] DISC-UK DataShare project[EB/OL].[2015-02-28].http://www.disc-uk.org/datashare.html.
[6] Data Audit Framework project background[EB/OL].[2015-02-28].http://www.data-audit.eu/background.html.
[7] Data Audit Framework:Four steps to effective data management[EB/OL].[2015-02-28].http://www.data-audit.eu/methodology.html.
[8] JISCManaging Research Data Programme 2009-2011[EB/OL].[2015-02-28].http://www.jisc.ac.uk/whatwedo/programmes/mrd.aspx.
[9] JISCManaging Research Data Programme 2011-2013[EB/OL].[2015-02-28].http://www.jisc.ac.uk/whatwedo/programmes/di_researchmanagement/managingresearchdata.aspx.
[10] History of the DCC[EB/OL].[2015-02-28].http://www.dcc.ac.uk/about-us/history-dcc/history-dcc.
[11] DCCInstitutional Engagements[EB/OL].[2015-02-28].http://www.dcc.ac.uk/community/institutional-engagements.
[13] Macdonald S.,Martinez-Uribe L.Collaboration to Data Curation:Harnessing Institutional Expertise [J].New Review of Academic Librarianship,2010,16(S1):4-16.
[13] University of Edinburgh.Research Data Management Policy[EB/OL].[2015-02-28].http://www.ed.ac.uk/is/research-data-policy.
[14] University of Edinburgh.Research Data Management Roadmap [EB/OL].[2015-02-28].http://www.ed.ac.uk/schools-departments/information-services/about/strategy-planning/rdm-roadmap.
[15] Wilson J.SUDAMIH final report[R/OL].[2015-02-28].http://sudamih.oucs.ox.ac.uk/docs/Sudamih_FinalReport_v1.0.pdf.
[16] Wilson J.,Jeffreys P.Towards a Unified University Infrastructure:The Data Management Roll-Out at the University of Oxford[J].International Journal of Digital Curation,2013,8(2):235-246.
[17] EPSRCPolicy framework on research data[EB/OL].[2015-02-28].http://www.epsrc.ac.uk/about/standards/researchdata/.
[18] EPSRC’s expectations[EB/OL].[2015-02-28].http://www.epsrc.ac.uk/about/standards/researchdata/expectations/.
[19] Pink C.Meeting the Data Management Compliance Challenge:Funder Expectations&Institutional Reality[J].International Journal of Digital Curation,2013,8(2):157-171.
[20] Royal Society.Science as an open enterprise[R/OL].[2015-02-28].http://royalsociety.org/policy/projects/science-publicenterprise/report/.
[21] Ensom T.Harnessing Data Centre Expertise to Drive Forward Institutional Research Data Management:A Case Study from the University of Essex[EB/OL].[2015-02-28].http://ukdataservice.ac.uk/media/212749/te_rde_iassist2013.pdf.
[22] Research Data Alliance[EB/OL].[2015-02-28].https://rd-alliance.org/about.html.
[23] Ball A.,Chen S.Building a Disciplinary Metadata Standards Directory[J].International Journal of Digital Curation,2014,9(1):142-151.