摘 要 论文选取英国10家具有代表性的图书馆为调查对象,通过网络调研法,在政策性文件、数据管理计划、数据存储与备份、数据共享、数据组织教育培训等方面进行比较分析。我国图书馆界应学习其在科研数据管理方面的做法,明确图书馆及各部门在科研数据管理中的角色和责任,加强相关基础设施建设,推动图书馆和科研机构联合制定科研数据管理共享平台,加强宣传教育推广,使科研数据管理服务在各科研项目中得以普及和实施。
关键词 英国 图书馆 科研数据管理 数据管理计划 数据共享
分类号 G252.7
DOI 10.16810/j.cnki.1672-514X.2020.11.013
Investigation and Analysis of Scientific Research Data Management Services in British Libraries
Wang Youzhuan
Abstract Ten representative libraries in the United Kingdom are selected as the research objects in this paper. Through the network research method, the policy documents, data management plan, data storage and backup, data sharing, data organization, education and training are compared and analyzed. The library field in China should learn from its practice in scientific research data management, clarify the roles and responsibilities of libraries and departments in scientific research data management, strengthen the construction of relevant infrastructure, promote the joint development of scientific research data management and sharing platform between libraries and scientific research institutions, and strengthen publicity, education and promotion, so as to make scientific research data management service in various scientific research projects popularized and implemented.
Keywords The United Kingdom. Library. Research data management. Data management plan. Data sharing.
0 引言
科研数据管理是指机构或组织为了避免数据丢失、验证科研成果、提升科研成果的曝光度和影响力、实现科研数据共享、提高科研效率等目的,对科研数据进行计划、组织、分析、存储、获取、分享、再利用的一系列活动 [1]。英国是科研数据管理的先行者,其政府部门和相关机构对科研数据管理与数据共享非常重视,发布了若干科研数据管理办法及其计划,在科研数据管理和数据共享等服务方面取得了不少实践经验,例如英国研究理事会(RCUK)发布《RCUK数据政策共同原则》,明确规定了数据管理的使用政策,在鼓励科研人员完成科研项目后及时公开科研数据[2]方面促进了高质量研究和创新。英国研究理事会下设的工程和物理科学研究理事会(EPSRC)着重对研究机构提出了数据共享责任,要求它们在全部数据生命周期上至少提供十年的数据管理服务[3]。图书馆作为数据管理服务提供方,具有丰富的文献资源和管理经验,在科研数据管理服务中发挥着重要作用。英国图书馆开展科研数据管理服务的时间较早,服务相对成熟,内容也较丰富。因此,本文选取英国10家具有代表性的图书馆为调查对象,其中9家为研究型大学图书馆,1家为专业图书馆。通过网络调研法,在政策性文件、数据管理计划、数据存储与备份、数据共享、数据组织、数据引用和教育培训等7个方面进行比较分析,梳理英国图书馆在科研数据管理方面的经验,以期为我国图书馆开展科研数据管理服务提供借鉴和启示。
1 英国图书馆科研数据管理政策及其计划
1.1 政策性文件
科研数据管理政策性文件是图书馆开展科研数据管理的基础和保证。英国的科研资助机构大都制定了科研数据管理政策,要求被资助的研究者更好地管理科研数据,从而推动了英国图书馆对科研数据管理政策的制定[4]。
英国图书馆近几年对科研数据管理的重视程度越来越高。10家图书馆中,除大英图书馆参照资助机构的科研数据管理政策,布里斯托大学图书馆和华威大学图书馆未表明外,其余7所高校图书馆均发布了本校科研数据管理政策,见表1。从政策内容来看,除了政策頒布的背景、目的外,都有一项共性内容,就是对各方的职责进行了详细的规定。职责涉及数据收集、数据管理、数据保存、数据保护、信息安全、数据共享等方面。就政策发布时间和版本更新情况来看,除了爱丁堡大学图书馆一直延用2011年发布的政策外,其他6所图书馆均采用了更新版。其中,伦敦大学图书馆和牛津大学图书馆现用版本更新于2018年12月,伦敦帝国理工学院、剑桥大学图书馆、曼彻斯特大学图书馆和伦敦国王学院更新于2019年。
除了科研数据管理政策外,一些图书馆还发布了与科研数据相关配套辅助政策,如牛津大学图书馆将新版科研数据管理政策改名为《数据支持科研成果管理政策》,曼彻斯特大学发布了《曼彻斯特大学档案管理政策》 《曼彻斯特大学数据保护政策》《曼彻斯特大学知识产权政策》等。
1.2 科研数据管理计划
数据管理计划(DMP)概述了研究项目在研究期间和项目完成后将如何管理数据。制定DMP具有以下好处:(1)节省时间和资源;(2)可以更轻松地查找和理解数据;(3)有助于避免或管理风险(例如数据丢失,意外或恶意泄露敏感数据);(4)确定需要提前计划的任务和职责(例如管理道德和法律义务);(5)预先确定进行数据管理活动所需的额外成本和资源。在英国,越来越多的资助机构要求其资助者在投标准备阶段和资金获得后制定和维护DMP,也可称为“数据共享计划”(NIH)或“技术计划”(AHRC)。
调查的10家图书馆均鼓励科研人员在项目开始到项目结束时编写DMP,见表2。其中,伦敦大学图书馆、牛津大学图书馆、曼彻斯特大学图书馆、布里斯托大学图书馆和华威大学图书馆的DMP编写以英国数据监管中心(DCC)创建的免费工具DMP online为主,编写内容在DCC提供的清单中,包括基本信息、数据收集、文档和元数据、道德与法律合规、数据保存与备份、数据选择与保护、数据共享、责任与资源等。大英图书馆根据资助机构提供的模版来编写数据管理计划。伦敦帝国理工学院图书馆依据资助机构的模版,若资助机构未规定,则用图书馆提供的通用模版(通常包含数据类型、数据创建、数据保存、数据共享、数据安全等)。剑桥大学图书馆采用DMP online工具或本图书馆提供的模版。爱丁堡大学图书馆和伦敦国王学院采用DMP online工具或资助机构提供的模板。由于DMP在科研项目的实施过程中非常重要,应根据项目而作出相应调整,因此,一些图书馆还要求定期检查DMP,并根据需要进行修改或更新。
2 英国图书馆数据管理内容及其服务
2.1 数据存储与备份
数据存储与数据备份都是数据保存的方式,数据备份用于应对数据丢失、损坏等问题,而数据存储用于解决数据存放和读取问题。选择存储时,应考虑备份数据的位置、时间和次数,数据安全性和访问控制,还要考虑是否需要在项目结束时存档数据。
10家图书馆中,除了华威大学图书馆未提供数据存储和备份服务外,其他9家图书馆均提供了相关服务,见表3。其中,伦敦大学图书馆、牛津大学图书馆、曼彻斯特大学图书馆、伦敦国王学院图书馆和布里斯托大学图书馆针对不同类型的数据提供了两项以上的数据存储服务。不同项目的科研人员可根据数据本身需求,选择适合的数据存储服务。伦敦大学图书馆、伦敦帝国理工学院、剑桥大学图书馆和布里斯托大学图书馆专门提供长期数据存储服务,存储年限有10年以上和20年以上。不同的存储服务提供的免费数据存储容量不同。如布里斯托大学图书馆提供的科研数据库服务,目前对数据存储容量不设限制;牛津大学图书馆的HFS(分层文件服务器)备份服务可接受最高50TB的容量;伦敦国王学院图书馆的SharePoint Online服务提供25TB的存储容量,但其Personal File服务仅提供2GB的存储容量。
2.2 数据共享
共享数据可以使科研人员不必重新创建和收集相同的数据,就能开辟新的研究和查询渠道。数据共享的好处包括:(1)防止数据重复;(2)减少数据丢失的风险;(3)加强对已发表研究的审查;(4)协作研究和数据重用;(5)提高科研数据和相关出版物的知名度。因此许多主要的研究资助者和学术出版商呼吁共享科研数据,并以“数据访问声明”的形式发布访问信息。例如,由英国研究与创新局(UKRI)资助的科研人员将在“默认情况下”提供科研数据,而英国国家医疗服务体系(NHS)道德审查程序则鼓励科研人员“确定样品或数据是否可用于现有的生物库或数据共享库”。
调查的10家图书馆均表明了数据共享的可能,并对在何时共享、如何共享作了相关说明。凡是建立了存储数据库或是提供存储服务的图书馆,均可通过存储服务提供数据共享服务。如伦敦大学图书馆在项目完成后,要求科研人员根据资助机构的要求确定项目数据的存储位置、开放程度和共享的时间范围。大英图书馆制定了《2015—2018年馆藏元数据战略》,强调通过馆藏元数据的对外开放让馆藏资源与社会信息资源相关联,形成社会广泛认可的二次利用数据[12]。牛津大学图书馆建立了机构知识库ORA-Data,用于数据保存与共享。爱丁堡大学的研究人员可以使用其自建的数据存储库DataShare上传、共享和许可自己的数据资源,以供他人在线查找和重用。伦敦帝国理工学院要求科研人员确保可共享的科研数据在出版后的10年内保持公开。而未提供数据存储服务的华威大学图书馆,也明确表示科研人员需根据资助机构的要求共享科研数据。
2.3 数据组织
数据组织包含对数据文件的构建和相关规则标准的描述,如文件组织规则、文件命名规则、元数据标准、数据格式要求等。在创建、收集和处理数据的时候,如果不能很好地组织数据,则会出现数据混乱、容易丢失等风险。因此,图书馆会要求研究人员在文件/文件夹命名、文件格式以及文档和元数据等方面遵循一定的规则。
调查的10家图书馆中,牛津大学图书馆、剑桥大学图书馆、曼彻斯特大学图书馆、伦敦国王学院图书馆和华威大学图书馆对数据组织提供了相关建议,涉及文件/文件夹命名、文件格式、文件夹结构、文档和元数据、参考文献管理、电子邮件整理、版本控制等内容。
在数据组织的具体建议上,可归纳为:(1)文件/文件夹命名:文件夹命名应简单明了,可在不打开文件的情况下知道文件的内容;项目组成员应该在文件命名上保持一致性,方便文件查找;文件命名时可按日期、作者或者主题等规则进行,方便排序;建立文件访问系统,确保可以备份数据和避免数据重复;将已完成工作的文件夹和正在进行工作的文件夹分开,以免混淆;定期将不再使用的文件移动到其他文件夹或位置;定期或在项目结束时评价文件的重要性,删除不必要的文件等。(2)文件格式:选择适当的文件格式(标准形式、未加密、未压缩、适用于提取和查看的数据、易于使用元数据进行注释的数据等),确保科研数据可用和可访问。(3)文件夹结构:主推使用分层文件夹结构,并在文件的深度和广度之间取得平衡,即不要使文件夹的类别太大,不必单击很多文件夹来查找文件。英国数据服务公司建议将文件夹级别限制为三到四个,并且每个列表中的项目不要超过十个;为每个文件分配一个或多个标签,可更容易区分重叠类别,并可以同时以多种方式对文件进行分类;不定时重新评估文件夹或标签结构,以免文件混乱。(4)文档和元数据:在研究项目开始时记录数据,在项目进行过程中继续添加信息,在DMP中包含文档编制過程;通过嵌入式文档、支持文档等方式将文档添加到数据中;采用开源ISA元数据跟踪工具提供实验元数据的丰富描述,从而使所得数据可发现和重用。(5)参考文献管理:使用参考文献管理软件,在研究中存储使用的所有论文、书籍和其他资源的详细信息,并自动生成书面作品中的引用。(6)电子邮件整理:删除不需要的电子邮件;定期(最好是每天)从收件箱和已发送邮件中删除所有琐碎或过时的邮件;使用文件夹存储邮件;按主题、活动或项目建立结构化的文件目录。(7)版本控制:针对同一文件修改的不同版本,可在文件命名时增加版本号进行区别,如v01、v02等。
4 结语
科技创新越来越依赖于大量、系统、高可信度的科学数据,我国在科学数据开发利用、开放共享和安全保护等方面还有很大改进空间。我们应吸取国外从政府部门到各机构在科研数据管理方面的做法,明确图书馆及各部门在科研数据管理中的角色和责任,加强相关基础设施的建设,推动图书馆和科研机构联合制定科研数据管理共享平台,从各个层面提升科研数据管理意识、加强宣传教育推广,使科研数据管理服务在各科研项目中得以普及和实施。
参考文献:
韩金凤.加拿大高校图书馆科研数据管理服务调研及启示[J].国家图书馆学刊,2017,26(1):38-46.
UK research and innovation. common principles on data policy[EB/OL].(2017-08-10)[2019-10-08]. https://www.ukri.org/funding/information-for-award-holders/data-policy/common-principles-on-data-policy/.
Clarifications of EPSRC expectations on research data management[EB/OL].(2014-10-09)[2019-10-10].https://epsrc.ukri.org/about/standards/researchdata/expectations/.
HIGMAN R, PINFIELD S. Research data management and openness: the role of data sharing in developing institutional policies and practices[J]. Program,2015,49(4):364-381.
UCL research information and IT services group(RIISG)[EB/OL].(2018-12-12)[2019-10-13]. https://www.ucl.ac.uk/isd/sites/isd/files/uclresearchdatapolicy_2018.pdf.
Policy on the management of data supporting research outputs[EB/OL].(2018-12-08)[2019-11-13].http://researchdata.ox.ac.uk/wp-content/uploads/sites/126/2018/12/Policy-on-the-Management-of-Data-Supporting-Research-Outputs.pdf.
Research data management policy[EB/OL].(2019-12-15)[2019-12-17].https://www.imperial.ac.uk/media/imperial-college/research-and-innovation/research-office/public/Imperial-College-RDM-Policy.pdf.
University of cambridge research data management policy framework[EB/OL]. (2019-12-04)[2019-12-18].https://www.data.cam.ac.uk/university-policy.
Research data management policy[EB/OL].(2019-02-01)[2019-12-19]. http://documents.manchester.ac.uk/display.aspx?DocID=33802.
Research data management policy[EB/OL].(2011-05-16)[2019-12-20]. https://www.ed.ac.uk/information-services/about/policies-and-regulations/research-data-policy.
Research data management policy[EB/OL].(2019-05-09)[2019-12-21]. https://www.kcl.ac.uk/governancezone/assets/research/research-data-management-policy.pdf.
侯茹.大英圖书馆馆藏元数据战略报告研究[J].图书馆学研究,2016(5):75-79.
李丹丹,吴振新.研究数据引用研究[J].图书馆杂志,2013,32(5):65-71.
项英,赖剑菲,丁宁.高校图书馆科学数据管理服务实践探索:以武汉大学社会科学数据管理为例[J].情报理论与实践,2013,36(12):89-93.
张计龙,殷沈琴,张用,等.社会科学数据的共享与服务:以复旦大学社会科学数据共享平台为例[J].大学图书馆学报,2015,33(01):74-79.
邢文明. 我国科研数据管理与共享政策保障研究[D].武汉:武汉大学,2014.
王友转 广东省科技图书馆(广东省科技信息与发展战略研究所)馆员。 广东广州,510070。
(收稿日期:2020-04-29 编校:陈安琪,刘 明)
*本文系广东省科学院建设国内一流研究机构行动专项资金项目“图书馆科研数据管理需求与服务模式研究”(项目编号:2019GDASYL-0105080)、广东省省级科技计划项目“粤港澳大湾区城市群创新要素流动、集聚及其配置优化策略研究——基于空间测度、社会网络与政策分析方法”(项目编号:2019A101002039)的研究成果。