加拿大阿尔伯塔大学图书馆数字学术研究及其启示

2018-06-06 00:54:56
中华医学图书情报杂志 2018年12期
关键词:阿尔伯学术大学

数字学术最早起源于英国,泛指科研工作者应用新技术、数据分析工具进行学术研究,不同行业、不同研究者对其界定略有差异[1]。随着科学技术的发展,各国政府和研究者逐渐意识到数字学术的价值及重要性。数字学术是学术图书馆发展的新引擎,推动了图书馆转型及变革。阿尔伯塔大学图书馆是加拿大开展数字学术的高校图书馆之一。本文通过分析阿尔伯塔大学图书馆数字学术研究,可以为我国高校图书馆建设提供经验,推动我国高校图书馆转型和发展。

1 阿尔伯塔大学图书馆数字学术概况

阿尔伯塔大学于1908年成立,是加拿大著名的科学研究型大学,是世界100强大学之一,也是加拿大排名前5的大学之一。阿尔伯塔大学有5个校区,400个研究实验室,开设专业近400门。

阿尔伯塔大学图书馆致力于资源数字化,通过数字存储库为科学研究和知识存储提供更多支撑和保障。阿尔伯塔大学数字资源通过扫描形式进行数字化存储,特色资源是印刷品、缩微胶片,大部分扫描工作都由外部供应商完成并以 TIFF文件进行保存。数字化项目由定制的Apache Cocoon应用程序主控,可以利用Apache Solr进行全文索引。

阿尔伯塔大学图书馆数字学术研究使用的元数据遵循的标准是元数据对象描述模型(Metadata and Object Description Schema,MODS)、都柏林核心元素集,其中MODS是用XML定义的元数据对象,用来提取MARC记录中的部分内容。都柏林核心元素集包括15个“核心元素”,用于描述数字对象、馆藏管理和元数据交换。原始数据通过Hydra系统转换为RDF,再结合DCMI元数据术语等常见词汇加工为具有兼容性的元数据。对元数据质量要求高时,需要使用规范的主题词表。常用的主题词表有Library of Congress Authorities,Library of Congress Thesaurus for Graphic Materials,Canadiana Authorities,Canadian Subject Headings,Répertoire de vedettes-matière,Geographical Names of Canada,Getty Thesaurus of Geographic Names。用来创建和编辑元数据的开源工具包括Open Refine(清理数据)、AtoM(开源档案描述和访问应用程序)、Marc Edit(开源MARC编辑实用程序)、通用元数据对照表。借助现有的MARC记录、电子表格中的注释对新产生的元数据进行加工,保证数据的兼容与统一[2]。

2 阿尔伯塔大学图书馆的数字学术支持

2.1 数字集合内容

阿尔伯塔大学图书馆数字内容丰富,包含教育与研究档案(Education & Research Archive,ERA)、多媒体存储库资源、20世纪初摄影集、加拿大西部历史和草原的文化相关的数字书籍与报纸及图像、阿尔伯塔大学丰富的数字化历史资料集以及非盈利互联网档案馆开放获取资料库[3]等类别资源(表1)。

表1 阿尔伯塔大学图书馆部分数字集合内容

2.2 部门设置和服务内容

阿尔伯塔大学图书馆设立了数字计划服务部门,提供的服务内容包括ERA库服务、开放获取、研究数据管理、图书馆出版等(图1),目的是以数字技术和图情专业知识为支撑,通过开展丰富的学术活动促进图书情报学科的发展[4]。

图1 阿尔伯塔大学图书馆数字学术服务内容

2.3 数字学术支持团队

阿尔伯塔大学在数字计划方面有一支23人的专职研究团队,其构成见图2。团队成员包括领导、员工和实习者。团队负责人为该馆的副馆长,其他22人中包括图书出版类1人(为图书出版和数字制作服务主管)、数字学术类10人(主要为数字创新技术馆员、数字内容专家、数字计划项目管理员、数字化图书馆员、数字档案管理员、数字保护官、数字计划应用图书管理员、数字存储库服务协调员、数字奖学金服务主管)、元数据类4人(主要为元数据协调员、元数据管理员、元数据助手)、程序技术类6人(主要为程序员分析师和程序分析员、系统集成分析师、记录和信息分析员、GIS馆员、书目编制和内容协调员、研究数据管理服务协调员)、其他1人(实习生)。由副馆长亲自领导体现了该馆对图情专业知识的重视与支持,同时副馆长丰富的专业知识也有利于项目推进[5]。该团队的组建说明阿尔伯塔大学数字学术方面的研究已成为该馆研究的重要组成部分之一,更好地支持校园文化建设。

图2 阿尔伯塔大学图书馆数字技术团队的构成

3 阿尔伯塔大学图书馆的数字学术服务

阿尔伯塔大学图书馆在数字学术服务方面有许多可借鉴之处,如拥有专门的资源储存库ERA,实施开放获取政策、允许研究者免费获取期刊文献,研究数据管理拥有成熟的标准和政策,注重对特色资源的保护与利用、建立特色馆藏库,提供图书馆出版服务、有效保证文献的共建共享。同时在数据保密方面制定了严格标准,防止数据的丢失及版权受到损害,从技术层面出台了电子信息安全政策,保护存储数据的安全、完整[6],为数字学术服务开展奠定坚实的基层。

3.1 ERA

ERA是阿尔伯塔大学一个可以开放访问的教育和研究档案资源库,负责保存与阿尔伯塔大学教学、科研、智力生产相关项目的资源。其中收录有阿尔伯塔大学的本科生和硕士生学位论文,农业、食品、营养科学专业期刊,油砂研究和信息网络资源,图像研究竞争方面的资源。ERA容纳内容丰富的开放获取资源,确保研究者共享科研成果。ERA资源包括图书、研讨会、期刊文章等,类型是数据文件、代码或其他形式的数据。会议记录或普通信件等行政性质的材料,存放在阿尔伯塔大学档案馆。

除了单独任命数字存储库服务协调员外,负责ERA资源存储工作的员工必须来自阿尔伯塔大学。存储在ERA中的数据除非涉及非法活动的内容,或被用户用来进行网络犯罪活动的资源(如向他人发送垃圾邮件)外,不允许移出。此外,有3种方法可以查询期刊文章是否允许在ERA中存放以及以何种形式存储[7]:一是通过专门介绍开放获取期刊相关规定的网站SHERPA/RoMEO查询,二是通过专业期刊网站查询,三是通过期刊编辑发送电子邮件咨询是否能被机构存储库收录。

3.2 开放获取

开放获取是对在线出版物和研究数据免费、自由、无限制的访问。阿尔伯塔大学数字学术服务提供的OA出版物类型包括html格式的期刊文章,电子预印本文献库(如康奈尔大学主管的arXiv.org,存储有物理、数学、计算机科学、定量生物学、定量金融、统计、电子工程和系统科学和经济学等学科知识[8]),存储机构知识库(如ERA)中的论文。

2015年5月1日后,同行评议的期刊由加拿大自然科学和工程研究理事会(Natural Sciences and Engineering Research Council of Canada,NSERC)、加拿大社会科学和人文科学研究委员会(Social Sciences and Humanities Research Council of Canada,SSHRC)和加拿大卫生研究院的研究(Canada Institute of Health Research,CIHR)3家资助机构授权,同时还规定在出版的12个月内必须向公众免费开放。对于国际研究资助者,美国国家卫生研究院(National Institutes of Health,NIH)要求其资助人员的论文在公共医学中心的在线数字档案出版12个月内允许公众免费访问,并且有专项资金用于报销研究人员论文的版面费。威康信托基金会是英国最大的私人生物医学研究资助者,它要求受让人提交的电子版本保存在研究论文公共医学中心,同时也为开放获取的期刊提供额外的资金支付出版费用。愿意公开论文的研究者或作者需与美国化学学会(American Chemical Society,ACS)、NRC研究出版社(National Research Council's Research Press)、SAGE出版商(SAGE Publications)签订许可协议,上传论文电子版[9]。

3.3 研究数据管理

研究数据管理主要包括对数据的组织、分享、访问和存档,是图书馆未来发展趋势之一。Tri-Agency数据管理原则指出,数据管理贯穿于研究项目生命周期的所有阶段,从项目开始到项目终止[10]。联机计算机图书馆中心(Online Computer Library Center,Inc.,OCLC)发布的《纵观研究数据服务》中提到目前图书馆开展教育、专业、监护服务等3类研究数据管理服务。阿尔伯塔大学图书馆在研究数据管理方面偏重监护服务,主要通过技术设施支撑研究数据管理的整个生命周期[1]。

研究数据组织环节要制定数据管理计划(Data Management Plan,DMP),其流程为对管理数据进行定义、加强研究数据应用、确保遵循资助者和期刊的要求、阐述数据内容、延长数据使用周期及加强过程管理。在DMP阶段要特别注重对数据的保护,防止数据泄露。通过建立符合数据保护要求的机制,对数据进行加密处理,防止被技术黑客袭击[11]。

阿尔伯塔大学图书馆主要收集来自社会、人文、健康和物理学科的定量研究数据(包括微观类、汇总类、时间序列类、文本类、空间类数据),可以通过页面的链接直接访问,也可以请求图书馆员帮助检索(检索、访问、利用需要付费)。阿尔伯塔大学图书馆设有加拿大统计研究数据中心(Research Data Centre,RDC),对某些特定保密数据需借助安全数据工具进行管理,研究人员可以通过访问加拿大统计局(Data Liberation Initiative,DLI)获得公共使用微观数据无法获得的详细数据[12]。

如今,越来越多的出版商要求作者公开其所发表论文中涉及的数据,科学研究者也呼吁将研究领域数据共享给其他科研人员,以推动科研的发展与进步。研究数据分享要注重4点:一要注重对机密数据的保护,研究中的机密数据不能公开;二要确保有安全的数据环境,保证数据开放获取过程没有丢失或损坏;三要在共享过程中遵循数据的格式、标准等;四要规范对数据的引用,严格按照著录标准进行引用[13]。

提供对研究数据的长期访问需要研究人员和机构之间共同协作。与备份文件不同,研究数据的长期保存涉及一些特定的程序,如维护和存储。阿尔伯塔大学图书馆科研数据按照收费标准的不同提供青铜、白银和黄金3种级别存储服务,每个级别根据评估标准、数据的使用周期和保存可行性进行分配。青铜级的科研数据采用比特级保护;白银级的科研数据提供中长期访问,但会存储在别处或使用较低级别的保存策略;黄金级的科研数据提供长期访问[14]。数据存储需要注意以下事项:一是存储格式一般为.csv或.txt,二是研究项目期间的备份文件按照距离项目时间由长及短存储,三是需要预先测试备份文件的恢复能力,四是提供工作流程文档,五是创建记录研究数据的元数据,六是根据描述主题领域及存储库之间的优缺点、规定标准和认证机构的评估选择合适的数据存储库[15]。

3.4 图书馆出版

图书馆出版是图书馆依托机构知识库对自身馆藏的学术出版作品进行开放获取、数字出版的活动。阿尔伯塔大学图书馆利用开放期刊系统(Open Journal Systems,OJS)对加拿大开放获取的50多种期刊提供重要支持,并提供多种增值服务,包括OJS软件托管、更新和维护,LOCKSS(Lots of Copies Keep Stuff Safe)档案保存,NEOS(Networking Edmonton's On-line Services)图书馆系统以及EBSCO(Elton B.Stephens.Company)机构知识库、协助期刊编辑管理服务等。

阿尔伯塔大学图书馆出版包含开放期刊杂志和开放教育资源(Open Educational Resources,OER)的出版。阿尔伯塔大学图书馆为教职员工提供开放教科书和其他开放教育资源的免费出版服务。该服务可用于创建或改编内容以及在课程中使用公开许可的学习材料。利用Pressbooks和Omeka进行托管、更新和维护,通过CrossRef创建和注册DOI,并对出版服务内容相关的技术、元数据或版权进行推荐和协助[16]。

4 阿尔伯塔大学图书馆数字学术对我国高校图书馆的启示

做好数字学术服务工作才能更好地推动图书馆的发展。我们应借鉴加拿大阿尔伯塔大学图书馆在数字学术方面的丰富经验,从开放共享科研数据资源、开拓图书馆出版服务、推进元数据资源建设、注重数字资源的长期保存等方面提供针对性的服务。

4.1 开放共享科研数据

越来越多的国家正以立法的形式对研究成果的公开作出规定。

首先,免费公开国家资金援助所取得的科学成果。国内高校图书馆应加快建立机构知识库的步伐,强制要求公开国家资金援助的科研成果。在保留作者版权前提下,将高校教师发表的研究论文实行开放获取,激励其他院校制订和实施开放获取政策,吸引更多机构关注和参与开放获取。

其次,扩大OA科研数据资源建设范围,从传统的学术论文扩大到各种科研数据。开放获取科研数据资源可采取PDF格式供用户下载阅读,印本服务主要有以下几种服务模式:免费下载PDF版,印本收费;在线提供网页版,印本收费;在一定范围内电子版免费;免费提供电子版,不提供印本。

第三,建立全国统一的OA科研数据资源收集与服务平台,采取政府主导、统一收集、服务的模式,有利于更好地为研究者提供服务,确保科研数据的长期保存与安全。

最后,制订立法层面的科研数据开放获取规定,不仅有利于增加本国的OA科研数据资源,而且可以打击大型出版集团对学术科研资源的垄断。

4.2 开拓图书馆的出版服务

图书馆在文献集成组织与服务、知识产权、长期保存和归档方面有坚实的根基,在学术出版方面累积了一定的经验。数字化出版成为新型出版方式,可以拓展出版物载体,满足更多用户的需求,更具多元性和开放性。

随着数字技术和网络技术的发展,图书馆可以与出版机构合作开拓出版服务,加强对数据质量的管理、合作共享和版权维护。一是可以利用本校图书馆的机构知识库开展出版服务,开发适合本校的“独立数据出版”模式和“以论文辅助资料的数据出版”模式[17],将数据存储到机构知识库,实现数据间关联,助推知识加工及文献归档。二是斩断出版机构的独断局面,从来源获取文献资源的版权,推动资源的开放共享。三是打造本校特色的出版平台,形成特色文献资源的加工机制,重塑特色文献资源出版、利用、保存等格局,更加合理合法地通过数字平台传播共享本校学术研究成果。四是制定学术成果质量评定标准,规范科研行为,对科研人员在研究过程中的数据和研究成果的版权及学术成果价值进行保护[18]。

4.3 推进元数据资源建设

数字资源的发展导致图书馆印本资源锐减,图书馆占有的元数据资源日益减少。合理利用现有数字资源,实现图书馆特色的馆藏元数据系统,是图书馆亟需重视的一大问题。图书馆要实施新型资源建设模式,将元数据纳入图书馆馆藏系统,丰富图书馆资源,为日后工作的开展提供坚实的数据支持[19]。为实现图书馆元数据战略,需要加强对元数据的管理。一是要恰当区分元数据类别及形态,对业务元数据、技术元数据、描述元数据、语义元数据等进行合理归类,从识别、描述、定位扩大到关联、挖掘数据资源方面了解元数据功能。二是要建立统一的元数据体系,构建XML元数据格式,增强元数据之间关联;设置元数据管理标准(如CASRAI、DDI、NAP、EML等),方便各种数据资源类元数据的采集、著录等。三是要加强与出版社、数据库商之间的合作,改革元数据编目及著录方式,构建多渠道元数据管理仓库,方便用户获取及使用[20]。

4.4 注重数字资源的长期保存

在数字资源长期保存方面不仅要加强印本文献的数字采集收藏及长期保存,而且要联合争取外文数字资源订购中的本地长期保存权力。合理利用数字图书馆现有的基础设施存储数字资源,通过高校图书馆之间的合作,引领和参与数字资源保存联盟的各项活动,开发数字图书馆基础设施,应对最新科研学术的发展需求。

按照科研人员的需求、图书馆馆藏的传统优势和持续进行数字化等要素改善馆藏策略,同时开发将研究者信息融入图书馆馆藏的方式丰富图书馆资源,并且根据科研工作者、出版商的实时动向和图书馆的长期规划优化投入产出。制定灵活统一的资源收集和整理方案,确保资源内容符合收藏策略的要求。将数字资源和物力资源的收集、存储、保存等方面的成本状况进行比较,形成规范的文档。

5 结语

大数据时代高校图书馆做好数字学术服务要在方式和内容上创新。首先,图书馆员应主动与学术人员沟通交流,深入了解他们在科学研究中对数字学术的需求,参与其项目研究过程,定期推送服务并提供数据技术指导,支撑其学术研究,提升研究人员数据素养。其次,抽调技术与专业过硬的馆员成立数字学术部门,聘任专业技术人员,定期指定目标任务,开展学术服务活动,实现数字学术工作的专业提升[21]。第三,加强兄弟院校间沟通与协作,学习数字学术方面的成功经验,引进先进的技术与设备,加快数字学术的发展步伐。最后,开展丰富多彩的数字学术活动,吸引读者的参与和互动,更好地传播数字学术服务理念。

做好以上工作需要学校和领导的大力支持,加强数字学术技术和团队的配置,发挥自身在数字和网络环境下知识加值服务的能力,在技术革新与职业追求同步发展中,进一步提升图书馆服务用户、服务社会的水平,为我国高校图书馆开展数字学术研究提供契机。

猜你喜欢
阿尔伯学术大学
“留白”是个大学问
《大学》
大学(2021年2期)2021-06-11 01:13:12
48岁的她,跨越千里再读大学
海峡姐妹(2020年12期)2021-01-18 05:53:08
大学求学的遗憾
如何理解“Curator”:一个由翻译引发的学术思考
中国博物馆(2019年2期)2019-12-07 05:40:44
对学术造假重拳出击
商周刊(2019年2期)2019-02-20 01:14:22
良心
蒲公英种子的大梦想
良 心
中外文摘(2015年22期)2015-11-22 23:08:52
学术