严 珊
(中南财经政法大学图书馆,湖北武汉 430073)
随着大数据的到来,以及E-science概念的提出和发展,科研工作者面临着数据方面的诸多问题,如数据管理计划制定、数据搜集与辨别、数据处理与分析、数据存储与销毁、数据引用与出版、数据使用伦理等,数据素养已成为科学研究人员进行学术研究与探讨必不可少的技能之一。在瑞典举行的第76届IFLA大会上,科学数据素养成为会议主题[1]。美国博物馆与图书馆服务协会于2012年赞助了“数据信息素养项目”,用来研究和培养下一代科学家在搜索、组织、使用与共享数据的能力[2]。由此可见,图书馆界对科学数据素养产生了浓厚的兴趣和关注。高校图书馆作为信息资源中心,不仅承担着数据收集、处理的职责,也担负着科学数据素养教育的使命。故了解数据素养的内涵、特性,并及时总结国外高校图书馆关于科学数据素养教育的实践经验,具有重要的理论意义和实践参考价值。
在数据密集型第四科研范式下,科研工作者搜集、存储、利用和共享数据的能力对推动科学进步、提高经济生产力和生活质量具有关键作用[3]。这种在不同需求中获取、操作和总结数据的能力被M.Schield称为数据素养[4];QinJ和D’Ignazio认为数据素养不仅仅是在科研过程中搜集、操作和总结数据,也包括评估和利用数据的能力[5];CalzadaPrado和Marzal则认为数据素养应是批判性地评估和管理数据,并在使用数据的过程中遵守道德规范[6];ChantelRidsdale、JamesRothwell等进一步改进数据素养概念,认为应是在科研过程中以规范形式收集、管理、评估和利用数据的能力[7]。综上可得出,数据素养应定义为正确发现和搜集数据,批判性地选择与评估数据,以标准化方式来管理和处理数据以及合理使用和共享数据的能力。即“科学数据素养”包括三层含义:一是“数据”意识——意识到数据是一种资源;二是数据知识——掌握数据生命周期与科学研究生命周期,并具有发现、获取、处理、使用与共享数据的能力,熟悉相关数据管理的政策与法规、数据道德伦理等知识;三是数据技能,即在大数据时代背景下,能够对数据进行挖掘,进而发现、分析和解决问题。
在E-Science科研背景下,对于科研人员来说,面对海量数据,如何科学高效的收集和管理数据对研究进展提出了极大挑战。数据获取与收集、数据处理与存储、数据分析与利用、数据引用与出版、数据交流与共享等问题贯穿整个研究过程,故急需提高科研工作者的科学数据素养能力[8]。国外图书馆业界积极探索与研究科学数据素养教育,并通过长期的理论研究与实践经验,形成了较为成熟的数据素养教育体系,在数据素养教育模式、教学内容和数据素养教育参与主体方面积累了丰厚的经验。
数据素养教育包括两个方面:一是专业能力的培训,二是思维模式的向导[9]。基于已有的研究和对国外图书馆网页的调研可知,目前国外图书馆针对科研人员的科学数据素养教育模式主要包括三种:(1)利用Libguides平台,在图书馆网页建立科学数据资源导航,提供科研数据资源分布和数据管理服务,包括数据管理计划、数据政策法规、数据共享、数据伦理等。如加州大学洛杉矶分校图书馆的自然科学数据管理,华盛顿大学图书馆的数据管理指南,南安普顿大学图书馆的研究数据管理,罗格斯大学图书馆的数据服务等;(2)科学数据素养通识教育,即面向科学研究人员展开的概览性数据管理的基本知识。如哈佛大学图书馆哈佛Dataverse小组的“数据管理”讲座,爱丁堡大学数据图书馆“数据管理培训MANTRA”在线课程,昆士兰大学图书馆“管理你的研究数据”[10]讲座等;(3)科学数据素养教育专题培训,即根据不同学科的不同需要设置不同的数据素养教育体系。如哈佛大学图书馆哈佛Dataverse小组针对社会科学、天体物理学学科开展如何使用Dataverse平台和具体操作方法[11];剑桥大学图书馆针对考古学、社会人类学并开展由JISC助的Datatrain项目下的培训课程[12]。
国外高校图书馆业界对科学数据素养教育高度重视,针对不同的教学对象设置了不同的教学内容与教学形式。教学主要内容涉及整个数据生命周期和科学研究周期。例如哈佛大学图书馆、昆士兰大学图书馆通过讲座的形式,向科研人员讲授科学数据管理方法与工具的使用、数据分析技能等。爱丁堡大学图书馆以在线课程的形式系统讲授科研数据素养的基本概念、数据获取与转换、数据保护与共享以及相关数据分析软件的使用方法。俄勒冈大学图书馆以课堂学习,为特定研究项目提供数据服务,包括制定数据管理计划,即项目涉及到的知识产权、元数据、数字获取与存储等[13]。麻省理工学院图书馆通过研讨小组,为科研工作者系统介绍数据管理中常见的基本问题与实践应对策略[14]。综上可知,国外高校图书馆在数据素养教育不管是内容还是形式上都已经构成完整的体系。
数据素养教育参与主体可从以下三个方面来探讨。(1)政府和基金组织的引导和资助。如英国经济与社会科学研究理事会(ESRC)、美国国家自然科学基金(NSF)在数据管理政策和《资助与管理指南》中提出项目申请者在项目书中必须含有数据管理计划,说明对项目数据如何进行质量控制、存储与共享等要求[15][16];欧盟以FAIR原则为指引,制定了《2020计划框架下的FAIR数据管理指南》[17]与《2020计划框架下的科学出版物与科研数据开放获取管理指南》[18]等规范,对欧盟科研数据管理及开放获取勾勒出了框架与详细的指导意见。(2)学校领导层面的组织与拓展。现阶段高校对科学研究工作者的科学数据素养教育从三个方面展开:数据意识培养、构建课程体系和创造数据素养实践环境。如哈佛大学于2012年创建的科研数据合作项目(RDC)[19]以及构建Dataverse网络信息平台[20],意在通过制定专业的数据培训体系,从数据管理计划、数据存储与利用,数据安全与共享,数据获取与评估等方面为科研人员提供系统的数据素养教育。(3)图书馆的保障与实践。大部分高校图书馆已经把科研数据管理作为图书馆的一项业务,大量培训与招聘数据馆员对科研工作者提供服务,包括数据素养教育与数据服务。如IASSIST网站,有大量与科研数据馆员相关的招聘信息,如数据馆员、数据专家、数据分析师、数据管理协调员、数据服务馆员等的招聘。对岗位职责的要求则是:支持研究人员管理、分析、共享和交流数据;与教师和研究部门合作,提供嵌入式学科服务,以科研数据为基础进行数据挖掘和研究热点预测等。美国博物馆与图书馆服务协会(IMLS)于2012年进行“数据素养项目”的研究[21];哈佛大学与普渡大学图书馆就“将图书馆服务嵌入到科学研究生命周期中”为主题展开合作,并举行数据管理研讨会[22]等。英国利兹大学(The University of Leeds)的科研数据管理政策强调:科研数据按标准管理,资助项目需有数据管理计划,学校相关部门需提供科研数据管理的培训等,公开发表的论文都需有数据访问声明等[23]。爱丁堡大学的数据管理政策要求:按最高标准进行科研数据管理;创建数据管理计划来尽可能的确保数据的公开性;保护敏感数据和数据的合法权益[24]。数据服务是适应大数据发展而产生的一项科研服务,数据馆员的需求也日益增加。数据素养教育作为提高数据素养的重要途径在学术界引起了高度关注,而图书馆作为资源聚集、整合的场所,在数据素养教育方面能提供全方位的培训与服务。
我国高校数据素养教育也有一定的发展,如武汉大学针对不同的学科利用高校科研数据共享平台对科研人员开展数据存储、导览、检索等服务,并提供在线分析工具;北京大学以讲座的形式针对不同学科开展IBMSPASStatistic20、网络版的培训、Dataverse使用基本培训等;复旦大学基于社会科学数据平台开展数据空间、数据集、文件、Dataverse使用培训等。国内图书馆基于数据素养教育而展开的一系列培训尚且处于起步阶段,与国外相比,还是有许多可借鉴学习的地方。在数据素养教育概念、教育内容和模式上没有引起足够的重视,缺乏系统性的研究和理解。国外高校图书馆在数据管理政策与实践、数据素养教育内容及模式上都有比较成熟的经验,值得我们借鉴学习。
3.1.1 科学数据馆员岗位
数据馆员岗位职责包括:数据查找、数据获取、数据脱敏、数据质量管理、数据交换、数字共享、数据伦理、数据安全、数据销毁等,嵌入式教学与科研以及成为科研人员的合作伙伴等。针对数据馆员的职责要求,图书馆可增设数据管理专家及数据馆员岗位,成立科学数据服务小组,明确任职要求与工作职责。通过数据馆员的岗位设置来推动科学数据管理的高效运作。
3.1.2 科学数据馆员培训
培训形式包括入职馆员培训、数据馆员研讨班、学术会议、线上课程、专业课等。并理论联系实际,鼓励数据馆员积极参与到科研项目中,将所掌握的数据管理的理念、方法和技能运用在嵌入式科研工作支持中。塑造全方位的数据馆员,为科研人员提供数据服务。
3.2.1 以需求为导向,注重教育内容的层次递进性
国外高校图书馆开展科学数据素养教育之前都非常重视用户需求,会进行相关的调研。在调研结果的基础之上,根据不同学科,以及科研生命周期所处阶段的不同,而设计不同的数据素养教育课程体系。教育课程体系应从浅入深,从数据管理的资源导航、数据素养通识教育逐渐递进到针对不同学科的数据素养专业教育。
3.2.2 开展多样化的科学数据管理培训
现阶段国外高校图书馆科学数据素养教育体系已成熟,其教育模式也逐渐丰富。主要包括现场课程、在线课堂(Mooc公开课)、讲座、专题研讨会、实践活动、夏令营以及利用科学数据管理平台来开展数据素养教育。国内高校图书馆的信息素养教育有待进一步加强,借鉴国外经验,国内高校图书馆可根据自身设施条件和馆藏资源,开展信息素养知识单元化的线上教育和知识场景化教育,信息素养教师团队包干制指导教育,学生社团驱动式的信息素养教育,融合新媒体开展信息素养教育宣传等[25]。提供多种教学模式,满足不同的需求,提高教育培训的效益。
3.2.3 教学内容理论联系实际,遵循科学生命周期的规律性
数据馆员可依据不同的对象和所处的生命周期不同阶段,提供不同的教育课程体系。目前国内高校的数据素养教育多是短期课程的通识课教育,且是选修课。未能给在校师生提供完整的、系统的数据素养教育。故国内高校图书馆应利用自身优秀的数据馆员和丰富的馆藏资源开展不同的教育课程,不仅包括选修课,也应该包括系统的专业性较强的必修课;不仅包括短期课程,也应有贯穿整个科研生命周期的数据素养专业课。并构建面向大数据管理与应用专业的数据素养能力评价指标体系[26]。
3.2.4 依托数据管理平台,推进科学数据素养教育
高校图书馆科学数据素养教育离不开先进的数据管理工具,图书馆拥有海量的数据资源,并且在资源的收集、处理和共享上具有天然的优势。充分发挥图书馆的作用,合理利用数据管理工具,如DMP-Tool,DR-NTU(Data),Dataverse等,推动高校科学数据素养教育的发展,更好地服务于教学与科研。
我国在宏观层面已对科学数据管理制定了相关的政策,但仍不健全。目前虽然已有《科学数据管理办法》《科学数据共享条例》《国家科技项目科学数据汇交暂行办法(草案)》等。但《公共图书馆法》、地方性图书馆法规、基金组织和科研机构缺失科学数据管理与服务的政策与内容。故应站在国家战略的高度,进一步完善科学数据管理与服务的相关法规和政策体系,形成法律与政策两者之间的最优配制,支持和引导科学数据管理与服务。如欧盟2018年正式实施的《通用数据保护条例》,通过统一规范协调整个欧洲的资料保护和数据隐私法律,成为“史上最严隐私法案”[27]。基金组织,如国家自然科学基金、国家社会科学基金、教育部项目等均需要制定相关科学数据使用管理政策,对项目申报者提出数据规范合法使用的要求。科研机构如研究所和高校层面,也应制定科学数据管理政策,如数据的标准化与规范化、数据保护、数据伦理等。国家从宏观层面进行法规政策引导,基金组织、科研机构等制定政策建议,学校发展规划部、科研部、图书馆等制定科学数据管理政策细则与实施方案[28]。
随着时代进步和社会发展,图书馆也在不断发展与变革中,科学数据素养教育已成为高校图书馆服务创新发展的必由之路。高校图书馆应设置相应的数据馆员岗位,遵循数据生命周期并依托数据管理平台来设置不同的科学数据素养教育课程,以此来提升图书馆的管理与服务功能,推动图书馆事业得发展,实现图书馆转型。