高校图书馆科学数据馆藏发展研究
——以弗吉尼亚大学和普渡大学为例

2023-02-20 18:38:32
新世纪图书馆 2023年11期
关键词:普渡大学弗吉尼亚馆藏

姜 萃 刘 华 介 凤

随着大数据时代的到来和科学研究向数据密集型研究范式的转变,科学数据不仅成为一种重要的学术资源,更成为国家间经济和科技竞争的重要战略资源,引起各国政府的高度重视。具有再利用价值的科学数据如果不能得以保存并充分加以利用,必然是一种浪费,成为人们的普遍共识。高校作为科学创新的重要阵地,科学数据是一切科学研究的基础产物和必备资源,而高校图书馆作为信息资源的保障机构,科学数据作为馆藏资源的一部分在馆藏发展中也应成为高校图书馆关注的内容。由此,本文基于詹姆斯·鲍曼(James C. Baughman)馆藏发展三要素,围绕规划(Planing)、实施(Implementation)和评价(Evaluation)三个方面对弗吉尼亚大学图书馆和普渡大学图书馆的科学数据馆藏发展现状和策略进行分析研究,以期为高校图书馆科学数据馆藏发展提供参考。

1 科学数据馆藏发展概述

科学数据馆藏发展是将“馆藏发展”的概念范畴和应用领域聚焦于科学研究领域。“馆藏发展”起源于20 世纪50 年代美国,代替原来使用的book selection、collection building,即有系统、有计划地建立、发展、规划和组织馆藏体系的全过程,包括馆藏政策、用户需求、馆藏评估、资源选择、维护和剔除等多方面[1-2]。而“科学数据”是人类在认识世界、改造世界的各类科技活动中产生的原始数字化数据,以及按照不同需求进行系统加工或重组的数据产品和相关信息,对研究结果具有重要价值和决定性意义,包括实验数值以及图像等[3-4]。从这一意义出发,将“科学数据”纳入“馆藏发展”的内涵中即可将“科学数据馆藏发展”理解成“图书馆制定相应的规则与政策,收集和维护科学数据,并进行评估与分析,以满足科研人员或科研团队需求,以反映科学数据馆藏系统化发展的过程”。由此可看出图书馆的科学数据馆藏发展不仅包含购买、搜集和整理方式获得的科学数据,还有科研人员在科研活动中产生的科学数据[5]。

科学数据馆藏发展有诸多密切相关的概念,如数字馆藏发展(Digital Collection Development)、科学数据管理(Research Data Management)、科学数据监管(Data Curation)等,梳理清楚相关概念侧重点是理解科学数据馆藏发展的前提。数字馆藏发展亦属于馆藏发展的范畴,针对纸质型馆藏发展而提出的,而科学数据馆藏发展是将数字资源更明确地界定为科学数据,所以科学数据馆藏是数字馆藏发展的特定模式[6]。科学数据馆藏发展、科学数据管理和数据监管都是围绕科学数据,均涉及科学数据的组织、保存等多个方面,但科学数据管理目的是提高科学数据的使用效率和成本效益[7],数据监管注重科学数据所产生附加价值和知识[8],可以说科学数据管理和科学数据监管是科学数据馆藏发展的有机组成部分。

目前,关于科学数据馆藏发展的相关理论和实践成果丰富,涉及科学数据馆藏发展各阶段,如科学数据用户需求、科学数据馆藏发展政策、科学数据元描述与组织、科学数据评价、科学数据共享。科学数据馆藏发展的落实工作离不开平台的支撑,这主要涉及机构知识库、科学数据平台。高校图书馆也积极开展科学数据馆藏发展,如上海大学和普渡大学等高校图书馆对科研人员的科学数据需求展开了调查[9],弗吉尼亚大学制定了科学数据馆藏发展政策,哈佛大学制定了地理信息馆藏发展政策,北京大学和弗吉尼亚理工大学等高校图书馆将科学数据存储在机构存储库中,实现了科学人员对于科学数据的长期保存和复用的需求,康奈尔大学图书馆将科学数据纳入到馆藏评估的指标中。虽然研究硕果丰硕,但学界普遍重视科学数据管理高于科学数据馆藏发展,且缺乏对科学数据馆藏发展的独立且整体性的研究。

2 弗吉尼亚大学和普渡大学图书馆的科学数据馆藏及其发展规划

弗吉尼亚大学和普渡大学在科学数据馆藏发展中有着卓越的成绩,弗吉尼亚大学图书馆馆员赢得了数字保存联盟奖,在数字保存级别修订项目获得认可[10];普渡大学图书馆因为在科学数据馆藏发展与管理等方面的创新举措,被美国大学与研究图书馆协会(ACRL)和美国图书馆协会(ALA)在2015 年授予卓越图书馆奖[11]。

2.1 科学数据馆藏及其特色

两所高校图书馆在科学数据馆藏方面各具特色,但最终以服务于科学研究者为导向。弗吉尼亚大学图书馆将国内外具有权威性机构组织的人文社会科学数据整合到图书馆网站中,重点建设人文社会科学数据资源,凸显馆藏权威性和丰富性的特色。而普渡大学图书馆基于科学数据平台PURR,实现对本校科研人员及其合作者的科学数据的保存,彰显馆藏地域特色。此外,两所高校图书馆的科学数据类型和格式都非常全面,对于弗吉尼亚大学图书馆来说,科学数据类型和格式是对数据资源进行详细介绍的方式,实现用户对资源进行全面的利用;但普渡大学图书馆注重每个类型所对应的格式的保存级别,实现对科学数据的长期保存。

弗吉尼亚大学科学数据馆藏[12]构成可以从以下三个方面进行归类:(1)从科学数据主题来看,包括艺术文化与宗教、商业与消费者和人口普查等11 个主题,基本上涵盖了人文社会科学数据主题范畴;(2)从科学数据文件类型来看,主要包括统计数据集、音频文件、图像和文本文件等,但调查数据和统计数据占绝大多数;(3)从科学数据的时间跨度和地域分布来看,时间分为历史统计和未来预测两方面,如判例法访问项目(Caselaw Access Project)时间跨度最久远可以追溯到1658 年,地域绝大多数为美国,其中还有弗吉尼亚当地数据。

普渡大学图书馆科学数据馆藏[13]以本校科研人员及其合作者的科研成果为主。在科学数据数量方面,PURR 平台目前共开放1296 个数据集和380 个研究项目,且科学数据资源仍在持续增长;在科学数据主题方面,农业、林业、土木工程、计算机科学和数学等科学数据集较多;在科学数据格式方面,PURR 科学数据格式类型非常丰富,提供文字处理、纯文本、电子表格、数据库、音频、视频、图片和结构标记八个文件类型,共涉及30 多种数据格式,且每个类型所对应的格式都注明了可持续保存级别。

2.2 科学数据馆藏发展规划

在科学数据馆藏发展方面,两所高校的科学数据馆藏发展规划各有侧重。弗吉尼亚大学图书馆重视用户,以提供更专业的服务为目的,同时也将科学数据纳入馆藏体系,更加考虑馆藏发展的整体性与系统性。而普渡大学图书馆偏向科学数据的建设,以提高科研水平为目标;无论是战略规划,还是具体措施,更加考虑馆藏发展的长期性与规划性。

弗吉尼亚大学图书馆针对馆藏发展制定了《馆藏发展与管理政策》《数字馆藏策略》和《数据馆藏发展政策》等系列馆藏发展政策,其中在数据馆藏发展政策上注重经费分配、效益最大化和以用户为中心的理念[14],因此在所制定的政策内容上包括科学数据选择、资金分配原则和科学数据采购决策权。值得一提的是,北得克萨斯大学和詹姆斯麦迪逊大学等在制定数据馆藏发展政策都借鉴了该政策框架和内容。为了使数字馆藏得到应用和挖掘,了解除用户需求,弗吉尼亚大学图书馆加强了与用户的及时沟通和有效沟通,建立了用户、数据馆员和学科联络员三级联系网络。

普渡大学图书馆致力于建设一所国内和国际典型性的学术图书馆[15],因此连续在2011—2016 年、2016—2019 年、2019—2024 年的图书馆使命、愿景和战略目标中着重并反复提及“学术”和“科研”,其中在2011—2016 年战略目标中强调了对学生群体数据素养的提升,希望通过数字人文和科学数据推进学术发展模式,持续建设对普渡大学具有独特意义的馆藏。2011 年普渡大学图书馆联合信息技术部、研究副校长办公室合作建设普渡大学研究仓储,标志着普渡大学图书馆的科学数据馆藏发展进入新篇章。普渡大学图书馆科学数据馆藏发展政策高度重视用户使用行为规范和科学数据保存,尤其针对普渡大学研究仓储,制定了《普渡大学研究仓储(PURR)条款》(Purdue University Research Repository (PUR) Terms of Use),内容涉及数据创建、数据保存、数据访问、数据共享、数据处理、数据迁移和数据安全等,尤其在科学数据保存部分详细概述了保存目的、任务、范围、挑战、激励措施、原则、标准和保存策略[16]。在用户需求和行为规范上,普渡大学图书馆则与伊利诺伊大学厄巴纳-香槟分校图书情报学院合作开发数据监护配置文件工具包(data curation profiles toolkit)[17],以便更广泛地了解研究人员的需求和态度。

3 弗吉尼亚大学和普渡大学图书馆的科学数据馆藏发展实施策略

弗吉尼亚大学和普渡大学两所高校图书馆为了保证科学数据馆藏科学合理发展,对于科学数据组建了相应的团队,其人员构成具有多元化、专业化特点。弗吉尼亚大学图书馆科学数据团队注重与校外专家和校内学生的交流,以聆听到更多的意见和声音,体现了“以人为本”的理念。在团队成员中包括了学科专家、数据馆员和学生助理,呈现三级结构,三者相辅相成。其中,数据馆员精细化负责不同的学院和学科主题。弗吉尼亚大学图书馆对科学数据馆藏发展所作出的贡献,体现了弗吉尼亚大学的人文情怀。普渡大学图书馆科学数据馆藏发展由领导者进行统筹协同,成立了PURR 执行委员会和指导委员会,负责科学数据馆藏发展的规划和实施,确保科学数据馆藏顺利实施和长期发展。普渡大学图书馆PURR 执行委员会由3 人组成,分别是图书馆馆长Beth McNei、研究与合作部执行副主席Theresa Mayer和信息技术部副主席Karl Browning;PURR 指导委员会囊括了普渡大学图书馆、工程学院、文理学院、林业学院和信息技术部等组织的人才。在创建团队的基础上,对于科学数据馆藏发展还注重以下几个方面的实施策略。

3.1 科学数据选择

弗吉尼亚大学图书馆强调科学数据的科学性和适用性[14],认为科学数据馆藏发展应尽力做到以下几个方面:第一,科学数据是最新的且不需要昂贵的更新升级,而要满足对前沿热点的了解和成本控制。第二,科学数据本身要具有可靠性,同时科学数据发布机构也具有可靠性,从而保障教学需求和学术研究。第三,科学数据对课程和研究具有广泛的影响,从而要最大程度发挥科学数据的作用。第四,要使科学数据访问方式多样性,支持科研人员无限制访问。普渡大学图书馆以保存本机构科学数据为目标,所以选择范围是本校科研人员及其合作者。但为帮助科学人员理解“科学数据选择”,即理解科学数据潜在价值,普渡大学图书馆开展科学数据管理计划时 ,针对相关科学数据的原因和意义、术语概念、自我评估问卷、工具和相关案例都进行了概述。

3.2 科学数据组织

对于每一个科学数据知识库,弗吉尼亚大学图书馆从主题内容、时间跨度、地理位置、地理单位和观察单位等进行描述与组织,以便研究人员可以快速找到所需内容。普渡大学图书馆将DC 元数据、PREMIS、METS、MODS 等元数据标准进行选择整合,用以解决一个元数据标准局限性问题,最终形成一整套PURR 的元数据解决方案。

3.3 科学数据保存与维护

弗吉尼亚大学科学数据保存[18]遵循以下几个方面原则:第一,科学数据要具有稳定性和可访问性;第二,科学数据与教学研究内容要保持相关性;第三,对科学数据的次要特征(部分与整体的关系、出处、完整性等)审查;第四,科学数据在保存、重新格式化和传播方面要具有适用性。普渡大学图书馆由于PURR 获得国际标准化组织(ISO)16363 审核认证,在科学数据保存具有一定的影响力,因此针对科学数据保存的目标、文件格式推荐规范和保存政策,制定了详细的保护策略和保存措施,包括保存级别、安全存储和备份、数据迁移等[19]。

3.4 科学数据共享

弗吉尼亚大学与利益相关机构合作共享科学数据。普渡大学图书馆致力于提供一个可供最广泛的受众访问的网站,提供新的科学数据共享模式——科学数据出版。首先,普渡大学为科学人员提供了发布数据的分步指南,使科学数据开放访问,并可在PURR 的网站上下载。其次,在PURR 中保存或发布后可获得数字对象标识(Digital Object Identifier, DOI)。

3.5 科学数据馆藏发展评估

弗吉尼亚大学图书馆评估具有全面性和系统性,从时间的角度来说兼顾长期与短期,且从馆藏和用户两方面进行了评估,而普渡大学图书馆评估更注重长期性。

弗吉尼亚大学图书馆会发布年度报告,比较分析不同类型数字馆藏的网站浏览、数据下载等。图书馆年度报告显示,科学数据馆藏及相关服务受到用户的欢迎,各项指标数据排名中位列前三;弗吉尼亚大学图书馆对教师、研究生、本科生进行科学数据需求与满意度调查,弗吉尼亚大学图书馆创建了新的数字解决方案“数据实时监测板”,监测板使用数据、用户参与和空间数据三个模块,实时监测数据,做到随时改进。

普渡大学图书馆重视科学数据资源的使用情况,PURR 的数据集下载量逐年攀高,尤其2019—2020 年度下载量已经超过了10 万次[20]。截止到调查时间,PURR 平台注册研究人员达4730 人,被重复使用次数最多的数据集已被引用99 次。

4 启示与建议

由上述的比较分析可以看到,两所高校的科学数据馆藏发展具有典型性,且各具特色,存在科学数据资源丰富、政策体系完善、科学数据团队成熟等优势,对我国科学数据馆藏发展具有启示意义。

4.1 制定完善政策

科学数据馆藏发展是一个长期性、系统性的过程,这就要求各高校图书馆要制定具有指导作用的纲领性文件。弗吉尼亚大学和普渡大学图书馆都制定了科学数据馆藏发展政策,从而形成了制度方面的保障和优势。我国高校图书馆应积极主动出台科学数据馆藏发展政策,政策内容要考虑国家战略发展的整体性和体现各个图书馆的差异和重点。科学数据馆藏发展政策不是孤立存在,应该纳入到馆藏发展政策体系中,为“双一流”建设多元化馆藏资源体系提供保障,并坚持将规章政策发布到图书馆网站上,增强和提高政策的透明度,将政策贯彻到实践。

4.2 加强战略意识

战略规划是高校图书馆可持续发展的基石,战略意识体现了高校图书馆对战略规划的制定,使命、愿景、价值观、目标和策略可以展现高校图书馆的发展方向。但我国高校图书馆缺乏连续、规范的中长期战略规划[21],导致高校图书馆无法对于局势和环境的变化做出迅速反应和正确的定位。高校图书馆战略规划不能脱离学校的使命、国家双一流建设战略部署。同时,我们也要认识到科学数据是高校科研创新的基础性战略资源,在战略规划中注重科学数据馆藏发展。

4.3 建立用户思维

科学数据馆藏发展要以用户为导向,而不是以科学数据为导向。在政策文件或战略规划文本中,科学数据馆藏发展应把满足高校师生的课程和研究需求放在首位。在科学数据选择,注重科学数据的广泛适用性,保障高校师生使用科学数据的权力。针对科学数据保存,要提供固定的基础保存时间。为使科学数据实现最大化利用,要注重科学数据评估,收集用户使用数据和主观选择。除此,科学数据馆员也要开展个性化或精细化咨询服务。

4.4 成立专门团队

我国高校图书馆应参考弗吉尼亚大学和普渡大学图书馆,成立专门负责科学数据相关工作的团队。科学数据馆藏发展不能只依靠图书馆自身的力量,需要跨部门、多组织的大力支持,团队成员除图书馆领导、图书馆馆员,还应该广纳学校部门领导、教师与学生、校内外专家学者等,引入跨学科、跨领域的优质人才,建设高素质的图书馆科学数据馆藏发展团队。

4.5 建设科学数据资源

在建设模式上,我国高校图书馆建设科学数据资源时要借鉴和学习先进的馆藏模式。基于平台自建,高校图书馆可以重点放在院校的学科重点和特色,筑起科学数据资源“护城墙”。虽然高校图书馆面临资金匮乏和商业数据库涨价的问题,但是也要有相对应的采购模式,以使科学数据资源更加全面。同时,我国高校图书馆要加强外链型科学数据资源建设,在资源的覆盖范围上,不断形成学科范围广泛化、丰富化数据载体、多样化数据格式的布局。

4.6 健全评估机制

科学数据馆藏发展评估要多种方式相结合、多方人员参与。科学数据馆藏发展评估方式要主观与客观相结合,可以通过调查问卷、访谈与数据监测对科学数据进行评价。科学数据馆藏发展评估应广泛收集和接受来自校内师生、校内外专家学者以及专业组织机构等的看法和建议。科学数据馆藏发展评估活动可以贯穿整个科学数据馆藏发展过程,形成每一个环节的闭环,确保科学数据馆藏发展的合理性与操作性。

5 结语

馆藏发展是图书馆长期以来关注的课题,是助力高校建成一流大学和一流学科的资源基础,将科学数据纳入馆藏发展范畴,不仅可以充分满足师生的科研需求,更能不断提升高校教学质量和科研水平。由此,我国高校图书馆应借鉴国外的可行性实践经验,完善科学数据馆藏发展规划,提升科学数据在馆藏发展中的质量,采取机构知识库、科学数据平台等多种方式加大推广应用,才能使科学数据馆藏得到很好的发展,贯穿到高校的诸多科学研究过程中去。

猜你喜欢
普渡大学弗吉尼亚馆藏
馆藏
现代装饰(2022年6期)2022-12-17 01:07:32
论弗吉尼亚·伍尔夫《伦敦风景》中的情景交融
美国“弗吉尼亚”级攻击核潜艇
博物馆的生存之道:馆藏能否变卖?
艺术品鉴(2019年11期)2019-12-27 09:06:18
知还印馆藏印选——古印篇
英美高校图书馆数据素养教育研究
图书与情报(2016年1期)2016-03-29 07:22:46
高等工程教育与高等技术教育课程设置的比较与分析
美国普渡大学研发出一种新型锂离子电池负极
电源技术(2015年2期)2015-08-22 11:27:42
美国普渡大学学科交叉研究生培养模式及其特征
介绍两件馆藏青铜器
文物春秋(2014年2期)2014-12-24 21:23:05