李淑婷 张羽
(1. 辽宁大学历史学院,沈阳 110000;2. 辽宁大学图书馆,沈阳 110000)
2007年,计算机图灵奖获得者吉姆·格雷在美国国家研究理事会计算机科学和远程通信委员会的演讲报告中提出现如今科学研究进入“第四范式”,即继经验范式、理论范式、模范范式后出现的数据密集型范式[1]。如何对这一范式下研究中所产生的海量数据进行有效管理、发挥其最大价值日益成为焦点。目前国内外一部分基金组织通过明确要求所资助项目须制定数据管理计划等规定推动科研数据管理(Research Data Management,RDM)的发展。在这些因素影响下,科研人员对数据管理的需求明显提高。为应对这一趋势,国外不少高校开展了科研数据管理服务。新西兰作为较早开展这一服务的国家,有丰富的经验值得我们学习。基于此,本文对新西兰大学RDM情况进行详细分析,以期推动我国RDM发展。
笔者在《中国学术期刊(网络版)》中以“科研数据”或“科研数据管理”为主题词,在“图书情报与数字图书馆”领域进行检索,截至2020年4月7日,共得到900条结果。经分析发现,其中研究国外科研数据管理的论文有105篇,内容主要涉及两个方面。①服务。可分为整体RDM服务和单项服务。在整体服务方面,张莎莎等[2]从从业主体与资质要求、主要用户、主要内容、服务方式对4所美国高校图书馆RDM服务进行了全面分析;杜琪等[3]从科研数据管理计划、收集、组织与分析、保存、发布与共享、访问6项服务流程介绍英国高校图书馆RDM现状,并分析其顺利开展的4项保障措施。在单项服务方面,李艳琴等[4]专门对美国RDM服务中的数据描述服务进行研究,并总结服务内容和服务方式。②政策。发布主体有政府、科研资助机构、科研机构等。陈大庆[5]从发布时间和内容两方面分析了英国科研资助机构的数据管理与共享政策;司莉等[6]选取美国、英国、澳大利亚,分析其科研管理机构、高校和政府制定的RDM相关政策。经过上述分析发现,国内对RDM研究主要集中在英国、美国、加拿大、澳大利亚等国家,但是对于同样在RDM建设方面有着丰富经验的新西兰高校研究甚少,相关论文(共2篇)均没有详细介绍新西兰高校RDM各项服务:一是对新西兰高校RDM整体情况进行介绍,详细展开了数据管理计划、培训等服务,并没有分析数据的存储、引用、安全等服务[7];二是选取梅西大学作为主要研究对象展开研究[8]。因此,笔者选取新西兰8所高校作为研究对象,详细分析其各项服务内容,以期为国内高校开展RDM服务提供有益参考。
针对科研管理服务,韩金凤[9]在研究加拿大RDM时,将其划分为数据管理计划、数据组织、数据备份与存储、数据获取与共享、数据出版、数据引用、培训教育7个方面;刘桂锋等[10]将服务内容分为数据管理计划、数据组织、数据存储共享与出版、数据引用、数据分析、数据再利用;杜琪等[3]将其分为科研数据管理计划、收集、组织与分析、保存、发布与共享、访问。笔者选择英国《泰晤士高等教育》发布的2020版世界大学排名最优的8所新西兰大学为研究对象,分别是奥克兰大学、奥塔哥大学、惠灵顿维多利亚大学、坎特伯雷大学、怀卡托大学、梅西大学、林肯大学和奥克兰理工大学,采用网络调查法,分别进入8所高校官网的RDM服务平台和服务页面,从简介、数据管理计划、数据组织、数据存储与备份、数据共享和培训教育6个方面对其RDM服务展开研究。
据调查,8所新西兰高校全部开展了RDM相关服务,除奥克兰大学是由电子研究中心建设RDM,图书馆只进行相关培训外,其他7所均以图书馆为主体提供服务。官网显示服务名称有“Managing Your Research Data”“Research Data Management”“Research Data”等,根据具体服务内容,笔者从以下6个方面调研(见表1)。
表1 新西兰高校科研数据管理服务开展情况
(1)简介。8所高校全部设置了这一服务,且均放置在首页。简介主要是向用户解释研究数据和RDM的定义及作用,其内容通过自制或引用方式完成。惠灵顿维多利亚大学、怀卡托大学、梅西大学在简介中阐明研究数据的含义及类型。怀卡托大学认为科研数据涵盖广泛的数据类型,包括电子表格、实验室笔记本、音频、视频文件等。梅西大学引用昆士兰科技大学关于研究数据的定义,认为研究数据是以任何格式或介质保存的,原始的或加工过的事实、观察、图像等形式数据,并在此基础上认为有利于理解科研数据的信息也是科研数据的一部分。关于RDM的介绍主要从整个平台的功能出发,说明其对研究人员在科研活动中能起到的作用,包括减少数据丢失、增加研究可见度、满足出版商及自助者关于RDM的要求等。
(2)数据管理计划。数据管理计划(Data Management Plan,DMP)描述研究者如何管理、描述、分析和存储科研数据,以及在项目结束时使用何种机制来共享和保存数据[11],一些国际研究资助机构(如美国国家科学基金会、美国国家卫生研究院等)都要求其资助研究者制定DMP。经调查,除奥克兰大学外其他7所高校均开展了DMP服务,服务内容主要有3个方面。①DMP简介。包括DMP的意义、创建时间、创建前的准备,如知识产权问题、研究资助机构要求、相关道德问题等。②DMP工具。分为自制工具和推荐参照工具。推荐参照工具主要链接了英国、澳大利亚的高校DMP服务,奥塔哥大学、惠灵顿维多利亚大学、梅西大学、林肯大学在引用其他机构DMP的同时自制了本校DMP供研究人员选择。笔者进一步对各校DMP的具体内容进行调查,发现虽然不同研究主题的DMP会有所差异,但各类型DMP都具有一些基本元素,包括项目类型、政策、数据描述、数据管理(权限、安全、保存)、共享、责任、预算[12]。③模板和样本。梅西大学上传了一份含有对DMP各项目的具体操作步骤和回答的文件供研究人员下载和参考。
(3)数据组织。以规范方式组织描述数据有利于研究者本人高效定位数据,同时也有利于其他科研人员发现、理解和利用数据。数据组织包括元数据标准、文件(夹)格式、文件(夹)命名和版本等。共有5所新西兰高校开展该项服务。元数据是伴随科学研究的描述性文档,由一组结构化、标准化的描述性元素组成。元素包括来源、目的、时间、地理位置、创建者、访问条件、使用条款等[13]。不同学科有不同的元数据标准,奥塔哥大学、梅西大学等在各自网页提供了各学科元数据标准的链接供研究人员参考,如果没有合适的元数据标准,可以使用自述文件创建合适的元数据。关于文件(夹)格式,各校推荐使用易于转换、传输、保存的标准文件格式,如奥克兰理工大学推荐使用PDF、ODF而非Word,推荐使用CSV而不是Excel等。还有一些学校对文件夹层级做了规定,如怀卡托大学引用英国数据服务中心的政策,推荐研究者根据数据类型、研究活动分门别类地组织文件,这有助于把文件夹深度控制在3~4层级。关于文件(夹)命名,推荐使用简短而有意义的文件名,以区别文件类型、版本、时间等。如惠灵顿维多利亚大学采用“YYYYMMDD_filename_version number”格式命名。在版本控制上,需制定相应策略管理不同版本和副本。奥克兰理工大学认为,用来分析和处理的数据应保存在单独的文件夹中,原始数据应制作副本。
(4)数据存储与备份。数据存储与备份都是数据保存的方式[9],有效地保证了数据的稳定和持续使用。共有7所大学开展这一服务。数据存储主要涉及存储方式、位置、安全性等问题。对于数据存储的位置与方式,惠灵顿维多利亚大学依据存储的时间向用户推荐了不同的方案,如不建议将研究数据长期存储在笔记本电脑、外部硬盘、CD等个人设备上,并列举了该校推荐的存储系统[14]。关于存储的安全性,大致可分为存储空间的安全性及数据的安全性。存储空间的安全性指虚拟空间和实体空间两个方面,大部分学校对虚拟空间的存储都推荐了安全的存储系统;此外,梅西大学对不适合以数字形式存储的实体类型数据提出建议,帮助研究人员选择实体存储空间。新西兰大学对数据的安全性问题十分重视,涉及机密、敏感等类型数据都有相应服务帮助研究人员对数据进行加密并选择合适的存储服务。关于数据备份,梅西大学提出3条黄金法则:定期备份,一个工作副本两个备份副本,在两个位置分别备份[15]。备份不仅有助于在灾害情况发生时恢复数据,也有利于及时更新过时载体,保证数据可读。
(5)数据共享。数据共享包括数据出版、传输和引用。据调查,目前8所新西兰高校RDM平台上均有相应服务。数据出版是指在互联网上公开数据并支持其他研究人员使用[16],出版模式有机构知识库、数据存储库、数据期刊等。奥塔哥大学为满足用户多样化的需求,既提供像Dryad这样高质量但须付费的数据发布平台,也提供Figshare等无须投入成本的平台。惠灵顿维多利亚大学认为数据期刊也是共享数据的一种渠道。此外,考虑到部分数据的机密性和敏感性,奥克兰大学对这一类数据提供仅使用元数据、私人链接或保留DOI服务。对于其他类数据,奥塔哥大学规定二级用户必须在获得许可的情况下才能使用数据[17],以此来保护研究人员的知识产权。不论是保存还是发布数据,都会涉及数据传输,所以奥塔哥大学根据研究人员对数据大小、传输速度、安全性的不同要求提供3个平台以供数据传输。在数据引用上,一些学校会在研究人员上传数据后为其分配DOI,使得数据有持久、可引用的链接。关于引用的格式,各校之间略有差异。奥克兰理工大学列举出引用时须具备的关键元素,如作者、题名、版本等,并推荐使用APA第六版的引用格式。林肯大学在Data@Lincoln上生成多种类型的引用格式供选。
(6)培训教育。据调查,为支持研究人员进行RDM,共有6所新西兰高校开展培训教育。培训模式主要分为两种。①自制。由图书馆牵头,部分学校还与相关学习服务机构合作自制培训课程,采用定期举办和申请举办两种方式对符合培训资格的人员开展培训教育。奥克兰大学由eResearch中心与图书馆、学习服务机构定期为博士生、导师等研究人员举办研讨会,内容有数据管理概念、最佳实践、服务、工具等[18],同时也可向其提出申请,专门为研究小组、部门培训。②引用。通过网页链接其他机构的RDM课程资源。奥塔哥大学为不同身份的用户推荐了不同类型的课程。如为信息专业人员推荐RDMRose课程,为学生、研究人员推荐MANTRA免费在线课程。此外,为了更加及时、准确地帮助研究人员管理科研数据,梅西大学、林肯大学还配备了学科馆员、记录和研究数据分析员,为RDM提供智力支持[19]。
调查的8所新西兰高校全部开展RDM服务,大致按照科研生命周期设计的同时又兼具各校特色。因此,新西兰高校在此方面的经验值得我们借鉴学习,从而推动RDM在国内的发展。
从宏观层面,新西兰政府发布《新西兰数据和信息管理原则》《新西兰政府开放获取和许可框架》等,并将相关政策集中在data.govt.nz网站,到微观层面各高校采用自建和引用的方式制定政策,可以看出新西兰十分重视政策和法律法规的建设,并逐步打造了一套围绕RDM各项服务的、较为全面的政策体系。在我国,2018年3月,国务院办公厅正式印发《科学数据管理办法》[20],2019年2月11日中国科学院正式发布《中国科学院科学数据管理与开放共享办法(试行)》[21],体现出国内也在积极制定各层面相关政策法规,但是在高校中尚未有成熟的科研数据管理政策,可见国内目前还没有搭建起系统完整的RDM政策环境。一方面可以借鉴新西兰大学的做法,引用符合实际情况的政策或是引用与自建结合来构建完整的政策体系。奥克兰理工大学引用美国、英国、澳大利亚的RDM政策并自制本校政策一起保障RDM服务。另一方面需要细化政策,满足不同领域的需求。不同领域的研究会产生不同的科研数据和管理需求,需要不同的政策支持。如惠灵顿维多利亚大学针对本校的人类研究(研究涉及人类及其相关数据等)制定了人类伦理道德政策和准则,并规定此类数据必须安全存储,对其中敏感数据进行加密等,这一政策帮助从事相关研究的人员安全处理此类数据。奥克兰理工大学援引了国际医学期刊编辑委员会规定的临床试验出版物必须包括数据共享声明的内容,一方面可以指导医学领域科研人员按照国际权威认可做法开展研究;另一方面也有利于发表研究成果,切实满足了用户需求。
调查发现,除惠灵顿维多利亚大学、奥塔哥大学、怀卡托大学外,其他5所高校在RDM服务页面均显示各校RDM服务团队或工作人员的联系方式,可以认为这5所学校设置了RDM专业岗位或配备了工作人员。设置方式有专职和兼职两种。林肯大学设立记录和研究数据分析员一职帮助工作人员、博士后候选人、研究生进行RDM工作。梅西大学由3个团队采用兼职和专职方式开展服务,一是学科馆员可通过邮件、电话等形式兼职提供个人研究帮助,二是研究发展团队为研究人员提供研究项目的数据管理建议,三是信息科技服务团队可提供关于存储、备份、安全性、元数据识别等服务建议。目前我国较少高校设置RDM岗位或成立专业团队,这也限制了我国RDM的发展水平。所以,我国高校可借鉴新西兰高校的经验,设立专业岗位,成立RDM团队提供服务,同时采用兼职方式,由学科馆员、技术人员等多种类型人才协作开展更具针对性的个性化服务。
RDM服务并没有统一的标准和模式,除数据存储、管理等围绕数据生命周期展开的基本服务外,完全可依据各机构研究重点、科研数据特点、服务对象开展特色服务。新西兰是一个民族构成复杂的多元化国家,人口主要由六大族裔143个小族群构成,其中毛利人约15%,是不少学者的研究重点[22]。惠灵顿维多利亚大学是开展毛利人研究的重点院校,因毛利文化有其特殊之处,所以在RDM服务平台上特别为科研人员提供了关于毛利人研究的政策指南,并且提到研究人员可与副校长(毛利人)办公室联系进一步讨论研究方式、政策等,帮助这一领域研究人员管理数据。奥克兰大学在科研活动中产生大量仪器数据,所以在RDM平台专门设“仪器数据”这一项目,由研究中心与多部门合作,提供面对面咨询,帮助科研人员设计存储、共享和传输数据的解决方案。我国同新西兰一样是一个多元化的国家,各机构均有不同的研究特点,不同类型的数据,可借鉴其做法,设计出具有各校特色的RDM服务,切实满足科研人员需求。
RDM教育培训不仅指开展各种培训课程和讲座,网页上的文本内容、咨询服务等都是其不同的表现形式。目前我国鲜少开展线上线下RDM培训,武汉大学、北京大学、复旦大学和中国科学技术大学所建RDM平台以数据库形式体现,主要用于存储和使用数据,对数据管理计划、数据引用等方面没有如新西兰一般有详细的说明。因此,为提高RDM培训水平和质量,高校应多样化培训方式,一是线上可针对不同群体、不同专业自制或引用相关视频和文本,视频内容可以卡通或真人等多种方式表现,平台相关文本内容可借鉴新西兰做法,放置数据管理计划、引用方式的样例、实施步骤等。二是线下的讲座、研讨会开设时间周期化,内容定制化。把握合适周期,定期开设讲座普及RDM,同时为及时满足个性化需求,可如奥克兰大学一般采用申请制,接受申请为特定群体开展专项服务。三是咨询即时化。林肯大学在RDM平台提供“Ask Live”服务,可在线实时解答相关问题,优化用户的服务体验。
综上,新西兰大学在借鉴他国经验的同时探索出了一种属于本国RDM发展的模式,以图书馆为主体多方合作搭建平台并开展服务,通过自建和引用方式建立并完善政策体系为RDM保驾护航。尽管目前各校的服务水平参差不齐,但也确实为科研人员提供帮助,产生积极影响,这也有利于提高图书馆在高校中的地位。随着《科学数据管理办法》的出台,我国高校迎来了RDM建设的良好时机,应积极借鉴国内外相关成果,探索出属于自己的发展道路。