澳大利亚高校图书馆在数据管理与开放获取服务中的作用研究

2021-06-18 05:53冯林林
兰台世界 2021年6期
关键词:数据管理澳大利亚政策

冯林林

一、研究背景

2017年,在英国国立及大学图书馆常设会议(SCONUL)关于图书馆未来的报告中讲到,大学图书馆正在将其战略重点从馆藏转向服务,以“支持不断变化的研究和教学实践”[1]。而数据服务就是其中重要的部分。近年来,全球都在致力于如何让研究人员更容易获取研究数据,包括研究成果和基础研究数据。2004年1月,经济合作与发展组织(OECD)通过了《利用公共资金获取研究数据宣言》,作为成员国之一的澳大利亚同意“努力建立公共资金数字研究数据的获取制度”。2007年,经合组织发布了《利用公共资金获取研究数据的原则和指南》[2]。最初,其重点是开放获取出版物,这样以便使研究型出版物能够摆脱商业期刊出版商施加的版权限制。这一重点倾向,使不需要订阅、从开放获取存储库或档案馆所获取到的研究型出版物的访问量和获取量大幅度增加。而如今开放存取的重点已转移到研究数据上,许多开放数据存储库也旨在提供用于此类研究的原始数据的存取[3]。然而,与英国和欧洲其他国家的发展相比,开放获取研究数据在澳大利亚发展相对缓慢。

在过去的几年里,澳大利亚高校为了更好地开展研究数据的管理出台了一系列管理政策及管理程序,一方面是响应政府及资助机构的要求,另一方面也是研究数据管理自身的需求。而这些政策和程序是如何执行的,由哪一所高校来执行却不是很明确,特别是高校内有许多团组和机构都参与其中,如电子研究组、信息支持服务部门、大学图书馆以及研究人员所在的学院等。因此,本文旨在了解澳大利亚高校是如何管理和辅助学校教职工来进行其研究数据的管理活动的,以及哪些高校和高校中的哪些机构或团组参与了研究数据服务,而高校的图书馆又在其中起到了什么作用。

二、相关概念界定

1.研究数据开放获取。欧盟委员会将数据的“开放获取”定义为“向最终用户免费提供可重复使用的在线科学信息的做法,其中包括研究数据(数据基础出版物、整理数据或原始数据)”[4]。开放获取最初是指获取已发表的研究成果,现在也将访问研究数据包括在内。支持对研究数据的开放获取有几点重要意义:第一,它可以保留重要的数据库,否则随着研究人员退休或死亡,这些数据库可能会丢失;第二,它可以更好地对研究结果进行外部验证,可以探索最初研究人员未预见的主题;第三,可以从多个数据源创造新的数据集,也可以通过政府研究资金惠及更广泛的研究群体,从而增加公共研究资金的回报。研究数据共享的定量研究相对简单,但是在研究数据共享的定性研究方面存在一些问题,主要与定性研究中收集个人数据引起的隐私及保密问题有关。匿名化和去标识数据被视为解决这些问题的最佳方案,但这些实践反过来又会引出有关结果数据的可用性和可靠性的问题[5]。

2.研究数据管理。研究数据管理(RDM)被定义为“数据的组织,即从数据进入研究周期开始到有价值的研究结果的传播及归档的整个过程。其目的是确保结果验证的可靠性,并允许基于现有信息进行新的创新[6]。它包括了数据的收集、管理、使用、分享、传播及再利用等。它要求研究人员在进行研究时要考虑到数据管理的所有阶段,也体现了对于研究数据开放获取的需求。

三、研究方法

为了了解澳大利亚高校如何进行研究数据的管理、高校内部有哪些机构或部门在负责管理以及是否鼓励支持研究数据的开放获取等问题,本文分别从澳大利亚几大联盟高校中选取了13所具有代表性的高校,对其学校网站进行了调研。其中包括高校主页及大学图书馆主页等,把关键词设定为“research”“research data”“open access”以及“research data management”进行检索,以获取与研究、研究数据管理及开放获取(包括数据存储)等相关的公开信息和相关的大学政策。

表1 调研高校汇总

使用内容分析法,对可公开访问到的相关大学政策及网页进行调研,以确定大学是否有与研究数据管理或开放获取相关的政策,以及大学中哪个团组或部门向研究者提供了研究数据管理指南、资源和培训、研究数据存储选择和研究成果(包括数据和出版物)开放获取等相关领域的帮助。

四、研究结果

目前,几乎澳大利亚所有的高校都已经积极地参与并支持其教职工进行研究数据的管理。高校内部开展或辅助教职工进行数据管理的团组和部门很多,如图书馆、信息支持服务部门、研究人员所在的研究组、学院等。从2012到2014年间的许多研究发现,澳大利亚、加拿大、英国、美国的大部分高校图书馆在开展研究数据管理时所提供的都是信息或咨询服务,而不是技术型支持。比如加拿大和美国221所大学图书馆提供的最常见的数据管理服务类型是与查找及引用研究数据和数据集相关的参考支持服务,其中44%提供此服务,只有14.5%提供与访问存储库相关的数据管理技术支持服务[7]。同样的,另外一项对澳大利亚、爱尔兰、英国以及新西兰的88所高校图书馆进行的调研发现,82所图书馆中只有8所以电子馆藏(比如保存和归档研究数据)的形式提供技术型研究数据管理服务,但有40%的图书馆计划未来会提供类似的技术型支持服务[8]。然而随着研究数据管理服务需求的增长,也由于研究人员在此领域受到时间及培训的限制,高校图书馆在研究数据管理活动中将发挥独一无二的作用。

1.澳大利亚国家政策支持。为引导和支持研究数据的管理,澳大利亚颁布了一系列政策和管理程序。例如于2007年发布并于2015年更新的《The National Statement on Ethical Conduct in Human Research》,适用于进行研究的所有研究人员,它提供了一些指导,说明如果研究人员决定将研究数据用于数据库(如存储库)中进行二次分析时应如何处理开放存取的问题。于2018年1月更新的澳大利亚健康医学委员会开放存取政策虽然不强制开放获取研究数据,但它“强烈鼓励研究人员采取合理步骤共享研究数据和相关元数据”[9]。澳大利亚国家健康与医学研究理事会(NHMRC)、澳大利亚研究理事会(ARC)和澳洲大学联盟于2018年6月发布了《A new Australian Code for the Responsible Conduct of Research》,受此影响的高校需要在2019年7月1日前达到该准则的要求。其中特别规定了“除非在道德、隐私或保密情况的阻止下研究数据应该提供给其他研究人员使用”[10]。澳大利亚研究理事会“强烈鼓励将项目产生的数据存放在适当的可公开获取的主题或机构存储库中”。该理事会有一个“开放存取政策”,但只是针对研究成果如文章、报告及相关的元数据[11]。澳大利亚研究理事会的要求旨在鼓励研究人员去思考如何才能最好地管理、存储、传播和再利用数据。

2.高校数据管理及开放获取政策。表2列出了13所高校开展数据管理活动的调研结果。在过去几年里,澳大利亚的高校已经开始根据相关政策和程序来解决研究数据管理问题。尽管一些高校,如澳大利亚国立大学、昆士兰理工大学,从2008年起就有了数据管理政策,但仅有一小部分高校有关于研究数据开放获取的政策。所有被调研的大学均有某种形式的科研政策。例如格里菲斯大学、斯文伯恩大学、昆士兰理工大学和莫纳什大学已经采用或改编了2007年版的研究实践守则作为其学校自己的研究实践守则,而其余几所大学也已经起草了自己的科研政策。11所大学引入了特定的研究数据管理政策,其中格里菲斯大学将研究数据管理政策纳入到他们的研究守则中。斯文伯恩大学在其数据管理网页上声明它有一个研究数据管理政策,但是提供的网址链接没有找到该界面。

表2 澳大利亚高校开展数据管理服务项目汇总

调研中,有3所大学推出了独立的开放获取政策。新南威尔士大学的开放存取政策,与ARC开放存取政策类似,集中于研究成果,如出版物,同时鼓励研究人员通过新南威尔士大学的机构知识库完成其研究成果包括研究数据的描述。新英格兰大学的数据开放获取政策仅涉及出版物等研究成果,其中也包含了一些元数据。与新南威尔士大学类似,开放获取研究成果的途径是通过大学的研究资源库e-publication@UNE。西悉尼大学的政策包括研究出版物和研究数据。其他高校里,数据的开放存取是以其他方式处理的。例如,斯文伯恩大学通过一个研究数据共享网页提供信息。同时,它还提供了另一个网页,鼓励研究人员通过大学的开放存取知识库Swinburne research bank提供他们的研究出版物。弗林德斯大学有一项研究数据和主要材料管理政策,该政策规定“研究数据通常应在开放获取许可下提供,如知识共享许可证或受控访问……”[12]。类似的,墨尔本理工大学的研究数据管理政策规定研究人员应该“向其他研究人员提供研究数据,并在可能的情况下支持研究数据的再利用”[13]。墨尔本理工大学的研究数据管理政策也是将研究人员引向图书馆,以帮助其发现研究数据。它的IT小组负责一个关于数据共享和协作的网页,该网页的内容重点是项目期间的数据处理。这个网页同时也提供了一个大学图书馆研究数据管理指南页面的链接,指南中包含了有关数据共享和存储以及数据发布的简要介绍。

3.数据存储。如表2所示,关于研究数据的存储,除了弗林德斯和格里菲斯两所大学外,其余大学都为研究者提供了在校内存储数据的方式。另外一些大学还提供一些外部存储的选择,如Figshare和Cloudstor。截至目前,有10所大学代表其研究人员托管研究数据。6所大学的研究存储库中包含了研究数据记录。与研究成果记录类似,在抽样大学的研究储存库中保存的研究数据记录一般不提供对研究数据的访问,但提供数据描述,在某些情况下还提供数据记录的外部存储链接。4所大学将其研究数据与研究资源库分开存放。例如莫纳什大学利用Monash.figshare、昆士兰理工大学利用Research Data Finder来管理、存储、共享和发布其研究数据。同样的,墨尔本理工大学和西悉尼大学利用Research Data Catalogue来存储和共享及再利用研究数据。在数据存储的支持服务方面,南昆士兰大学的研究者自己负责保存和存储项目所需而收集的研究数据,但可以通过研究小组得到有关数据存储的建议,也可以从学校图书馆来寻求帮助[14]。同样的,墨尔本理工大学和塔斯马尼亚大学的研究者也可以通过他们的图书馆来寻求关于上传他们的研究数据与其他研究者共享或再利用方面的帮助。相比之下,澳大利亚天主教大学图书馆为研究人员提供了一个研究数据管理工具包,并且只帮助他们将记录上传到大学研究存储库中。总的来说,缺乏研究人员使用数据存储方面的技术支持。

4.数据开放获取与共享。管理和共享研究数据可以加快科学进程,允许对科研成果的可靠性进行证实,促进建立在现有信息基础上的创新性研究,对于实现公共投资的全部价值至关重要[15]。为了促使研究者分享和再利用研究数据,样本中的9所大学推荐了外部数据存储选项,例如澳大利亚研究数据网(Research Data Australia)。其中3所大学,在研究者将其研究数据上传到学校内部资源存储库时,研究数据就会自动同步上传到澳大利亚研究数据网。例如,迪肯大学有一个管理数据的网页,包含了数据管理计划在内的一系列主题。其中一个非常有用的板块是可以通过Deakin Research Online(DRO)和澳大利亚研究数据网来分享数据。然而,不是所有存储在外部存储数据库的数据记录都能提供数据的获取渠道。例如,截至2020年5月,墨尔本理工大学在澳大利亚研究数据网提供了540条记录,但是当在澳大利亚研究数据网检索可以开放存取的研究数据时显示其只提供了1条记录。目前,塔斯马尼亚大学和西悉尼大学在澳大利亚研究数据网提供了最多的开放获取研究数据记录,分别为339条和131条记录。

Nuijten等人于2017年的一项研究也揭示了大多数开放数据无法获取利用的情况。该研究发现474篇发表在声称所有研究数据都是开放的两本心理学杂志的文章,事实上只有137篇(接近29%)可以获取到研究数据,另外在研究中的一家期刊引入数据共享政策后,提供对研究数据开放访问的文章比例大约从5%增加到56%[16]。Kidwell等人的研究也展示了承诺开放数据在期刊上的文章,只有40.5%是有可用数据的[17]。研究数据无法做到完全开放获取和共享的原因有几点:第一,数据所有者对数据的描述不够充分;第二,有部分需要保护和匿名的隐私数据;第三,有限的在线数据存储选择;最后,研究人员自身对于研究成果和研究数据的共享意愿。

5.研究数据管理培训。在此次调研的大学中,研究数据管理培训主要是由图书馆承担,另外研究组及电子研究小组也会有所分担。然而,除图书馆外,其他小组所提供的培训课程或课程信息并不容易获取,调研中发现这些信息在可公开访问的校园网站上是不可用的。而有些培训信息只有特定大学的研究人员才能在内部网页上查阅。调研的高校中,许多研究数据管理网页都提供了其他网页的链接,但很难确定负责该培训信息的网页由高校内的哪个部门负责。澳大利亚天主教大学研究数据管理政策明确规定,大学图书馆员负责制定和宣传数据管理培训信息,并为参与研究数据管理的大学研究部门和行政单位提供培训和支持[18]。迪肯大学的相关培训信息由Deakin e-research提供,还提供关于研究数据管理技术的培训。西悉尼大学也同样是通过电子研究组来为研究人员提供关于研究数据管理方面的帮助。位于弗林德斯大学图书馆的电子研究组负责数据分享支持,并于2017年与澳大利亚国家统计局(ANDS)主办了社会科学支持数据研讨会。格里菲斯大学的图书馆是提供RDM培训的部门。莫纳什大学图书馆及昆士兰理工大学图书馆也是如此。塔斯马尼亚大学与澳大利亚国家统计局共同举办了数据管理联合研讨会,并通过图书馆主页发布消息。在研究数据管理培训方面,3所大学提供了Edinburgh’s MANTRA tool的链接,此链接可以被进行研究工作的学生、学者及信息管理专业人士使用。新英格兰大学图书馆提供了一个学校的数据管理在线课程链接。

6.高校内各团组作用分析。表3总结了13所高校内部各部门和团组在研究数据管理活动中主要承担的作用。从图中可以看到,高校的规模越大,其内部参与研究数据管理的团组越多。而澳大利亚高校内的科研组、电子研究组、图书馆和信息技术服务组并没有统一的方法进行研究数据管理,每个高校内的团组在研究数据管理过程中所承担的作用也有所不同。

表3 澳大利亚高校各部门承担的数据管理活动项目汇总

13所高校的研究数据管理指南几乎都是由图书馆进行发布、解释和管理,只有格里菲斯大学除外。数据存储方面,5所大学中是由两个小组来共同负责,其中包括图书馆,而昆士兰理工大学则是完全由图书馆负责,另有6所大学的数据存储由其他部门辅助完成,例如格里菲斯大学的电子研究组、墨尔本理工大学的信息服务部等。在研究数据的开放获取方面,图书馆也承担了主要作用。经调研发现,7所高校的开放获取支持服务是由图书馆单独承担,格里菲斯大学及莫纳什大学则是由电子研究组单独承担。研究数据管理培训方面,调研的高校中主要是由图书馆承担,另外研究组及电子研究组也会有所分担,但其培训信息及培训课程并不明确,或不可获取。

虽然澳大利亚每个高校内的团组在研究数据管理过程中所承担的作用有所不同,但总体上大学图书馆发挥了主要的作用,几乎活跃于研究数据管理的每项服务中,尤其是在中小型的高校中。调研中还发现,高校图书馆在为研究人员提供研究数据管理方面的建议表现非常活跃,尤其是在辅助研究人员创建元数据及上传数据到存储库方面。另外,高校图书馆在提供指南、网页和研究数据管理资源的相关链接方面也发挥着关键作用。

随着高校科研水平的不断提升,所产生的研究数据也在不断增加。研究数据的有效管理对高校科研活动、高校的科研工作者乃至一个国家的科研活动都至关重要。因此,研究数据管理已然成为所有高校工作的重中之重。从调研结果可以看到,澳大利亚国家层面的数据管理政策非常完善,它既对高校开展研究数据管理提出了要求,也为其提供了依据和支持。所有调研的高校都根据国家相关政策制定了学校的研究数据管理政策,但只有3所大学制定了特定的开放存取数据政策。大部分高校都可以提供数据存储服务或推荐外部数据存储选项,但对于研究数据开放获取和共享方面,仍有更大的开拓空间。通过调查发现,虽然大部分高校都鼓励和支持研究者将研究数据上传共享,但由于各种因素的影响,能够完全开放获取到的完整数据仅占很小一部分。

整体来看,在调研的13所高校中,对于研究数据管理服务并没有统一的方式,并且一所高校内通常会有几个机构或小组来支持研究数据的管理服务。通过梳理高校中各个小组所负责的数据管理服务活动,我们发现,高校图书馆的参与度越来越大,并且在其中发挥了重要的作用。这一点,澳大利亚国家数据服务局也曾表示图书馆员有丰富的经验和技能可以带到研究数据管理服务中来[19]。尽管如此,高校图书馆在实践时仍无法充分参与到研究活动中,其中一个原因是目前高校图书馆所提供的研究数据管理服务,大学内的其他小组或部门也能够提供。因此,未来高校图书馆能否使其馆员拥有足够的经验、培训和专业技能来突破研究活动参与的局限性,从而使高校图书馆扩大其在研究数据管理活动中的作用也值得我们进一步去研究。

猜你喜欢
数据管理澳大利亚政策
政策
澳大利亚学校的“失败课”
政策
企业级BOM数据管理概要
定制化汽车制造的数据管理分析
航发叶片工艺文件数据管理技术研究
澳大利亚RaeRae五口之家
助企政策
政策
数据挖掘在学生成绩数据管理中的应用研究