高校图书馆科学数据素养教育体系模型构建研究

2016-04-11 08:05张群刘玉敏
大学图书馆学报 2016年1期
关键词:数据管理科学图书馆

张群 刘玉敏

摘要 E-Science环境下,科学数据素养作为数据管理的一个关键概念,已成为科研人员学术研究与交流的必备能力之一。在总结国內外高校图书馆科研数据素养教育研究与实践的基础上,以系统论、协同论为理论基础,构建了高校图书馆科学数据素养教育体系“5W”立体模型。对国內高校图书馆科学数据素养教育实施提出了建议,指出未来的高校图书馆将实现从信息中心到科学数据中心的转型。

关键词 “5W”模型 素养教育 科学数据 高校图书馆

分类号 G252

DOI 10.16603/j.issn1002—1027.2016.01.012

E-Science环境下,密集型数据环境的形成使高校产生的科学数据在“数量”、“种类”和“速度”三方面得以海量增长,科研人员面临数据管理问题的严峻考验。科学数据素养作为数据管理的一个关键概念,已成为科研人员学术研究与交流的必备能力之一。对高校图书馆来说,培养师生的科学数据素养,是一项紧迫而重要的任务,同时也是全新的机遇与挑战。

卡尔森(Carlson)认为数据素养的核心能力包括:了解数据库和数据的格式、发现和收集数据、管理与组织数据、数据转换和互操作、数据质量筛选、元数据、数据综合处理和再利用、数据实践规范、数据保存、数据分析、数据可视化、数据伦理等。普拉多(Prado)将数据素养定义为信息素养的组成部分,使个体能够获取、解释、评价、管理及伦理上使用数据。张艳梅认为数据素养就是在数据行为主体符合社会伦理和道德伦理的基础上,能对所面对的数据进行辩证,科学、正确的认识,操作和管理。国内外学者对科学数据素养的内涵认识虽然不一致,但都强调对数据的管理与应用。简言之,科学数据素养是指科研人员在科学数据的生产、管理和利用过程中的能力及应遵守的道德与规范。

1中外高校图书馆科学数据素养教育研究及实践

随着E-Science的发展,科学数据管理兴起,科学数据素养问题逐渐受到了图书馆的关注。2010年,社会科学数据素养成为第76届IFLA大会会议主题之一。2012年,美国博物馆与图书馆服务协会(Institute of Museum and Library Services.IMLS)开展“数据信息素养项目”,旨在培养科学家查找、利用与共享数据的能力。从文献研究来看,国外图书馆界集中研究了图书馆科学数据素养培养的作用及方式,如,科尔泰(Koltay)强调数据素养在实现高校图书馆使命中的重要性,指出数据素养应该有统一的术语;弗兰克(Frank)等以气象学科为例,介绍了高校图书馆的数据信息素养教育;狄龙(Dillo)关注了档案馆和图书馆的联合数据管理培训活动,建立了FrontOffice-BackOffice模型;梅比(May-bee)等采用扎根理论方法审查了普渡大学的营养科学和政治科学科的教学大纲,分析了学生的信息素养及数据信息素养需求。国外多数研究型图书馆已经开展了相应的科学数据素养教育活动,并且教学形式多样化,包括开设选修课程、专题讨论、在线课程等,如哈佛大学、耶鲁大学、弗吉尼亚大学等。弗吉尼亚大学图书馆的数据素养教育课程体系设置比较完备,按照数据生命周期纵向设计,在不同的学科领域横向展开,为特定学科的研究人员提供专业的培训等。

国内高校图书馆已经意识到科学数据管理的重要性,在机构知识库建设中已开始了数据管理方面的探索,如北京大学、清华大学、厦门大学、西安交通大学、武汉大学等。2014年由复旦大学牵头,国内9家高校图书馆共同发起成立“中国高校图书馆研究数据管理推进工作组”。同年12月,复旦大学社会科学数据平台正式上线,为高校、研究机构和政府部门提供科研数据的存储、发布、交换、共享与在线分析等功能。我国一些高校图书馆尝试开展科学数据素养教育实践,主要体现在对数据统计数据库、分析软件的培训等。如,北京大学图书馆以讲座形式对数据素养与统计数据资源进行了系统介绍,并提供统计数据分析服务及SPSS网络版升级;武汉大学图书馆2014年下半年举办的90分钟专题讲座就包括科研活动中数据的存储与共享、教你玩转统计数据库、利用EXCEL进行数据分析和图表展示等;上海交通大学2015年的讲座与培训中介绍了统计分析软件SPSS应用方法、Matlab使用技巧与提高。目前,国内相关的文献主要集中在对国外研究及教育模式的介绍上,为我国高校图书馆科学数据素养教育提供借鉴和启示。如孟祥保、李爱国将国外高校图书馆数据素养教育实践归纳为利用Libguides建立科学数据管理资源导航、数据素养通识教育、学科数据素养教育三种模式。朱玉奴调查分析了国外数据素质教育的典型案例以及教育课程的特点,指出图书馆已经承担起数据素质教育的重要角色。郝媛玲结合哈佛大学案例和对我国图书情报人员的访谈分析,提出我国高校开展数据素养教育实践的思路。

综合国内外研究和实践现状可知,科学数据素养教育兴起于国外研究机构,国内研究起步较晚,目前仍处于引进、吸收、消化阶段。相比国外,我国高校图书馆科学数据素质教育主要存在以下不足:(一)图书馆科学数据素养概念的理论层面尚处于萌芽阶段,尚未形成专门的理论架构,缺乏具体路径的设计;(二)对科学数据素养教育的重要性认识不充分,缺乏顶层设计和政策支持;(三)部分图书馆开展了科学数据教育实践,但是缺乏对用户的实际需求的广泛调研,缺乏“跨机构”协同发展的管理机制的研究,也缺乏专门的组织机构和专业的人员队伍;(四)图书馆界缺乏对科学数据管理、科学数据素养教育等的规范共识与协同管理,业界没有统一的标准与相应规则,各个图书馆往往自定规则、自成体系,难以进行深度有效的对外合作与交流。针对国内高校图书馆科学数据素养教育实践存在的问题,文章对高校图书馆科学数据素养教育体系模型构建进行了研究,提出了实施建议,尝试为图书馆开展科学数据服务提供理论与实践指导。

2高校图书馆科学数据素养教育体系“5W”模型设计

综合借鉴国内外高校图书馆科学数据素养教育研究及实践成果,以系统论、协同论为理论基础,以图书馆现有的信息服务和知识服务为实践基础,以培养师生的科学数据素养为着眼点,依据科学性、通用性、系统性、可行性原则,提出了高校图书馆科学数据素养教育体系“5W”模型(图1)。“5W”即“Who+When+Why+What+How”,其中:Who指科学数据素养教育的参与主体,When指图书馆科学数据素养教育介入阶段,Why指图书馆数据素养教育的驱动因素,What指图书馆数据素养教育内容,How指图书馆数据素养教育的实施方式。“5W”即在E-Science科研驱动下,全面考虑图书馆服务诸因素及关联因素,以图书馆为主导,协同相关部门及群体,考虑学科差异,基于科学数据生命周期全方位开展科学数据素养教育。下面对“5W”分别进行阐述。

2.1参与主体:纵向贯通,强调差异

Who指科学数据素养教育的参与主体,包括图书馆在内的相关部门及群体组成的一个自上而下组织的广泛参与的“纵向贯通”的团队。科学数据素养教育的参与主体可以分为上、中、下三个层次。上层,包括发展规划部、科研院等高校行政管理部门及教务处、研究生院等教学管理部门,要为高校科学数据素养教育体系进行整体规划设计、制定数据管理战略、确定素养教育政策和计划。中层,包括图书馆、信息化建设中心及其他支持部门(如档案馆)。图书馆作为中间层次,是科学数据素养教育的主要承担者,是“纵向贯通”设计架构中的关键点,起着上通下达的枢纽作用,要从高校内部教学和科研的工作流出发,引导并承担全方位科学数据素养教育任务;信息化建设中心则为图书馆提供网络基础设施及技术支持。下层,指科研人员,不同学科的科研人员对科学数据素养能力的要求具有差异性和专指性,如工程学科强调实验获得的一手数据,可专门开设《实验数据分析》介绍实验和测量数据分析中涉及的概率和数理统计及相关的数学知识;人文社科数据主要指调查数据、网络公开数据、政府统计数据和指标等,据调查,67%的社会学论文和73%的经济学论文都使用了基于数据的实证研究方法,可以重点开展数据的收集和统计分析能力的教育。不同的学科在模型中用一个单独的层来表示,强调了在科学数据素养教育中的学科差异性。图书馆应对不同学科的用户进行广泛调研,根据用户需求有针对性地开展科学数据素养教育,以取得事半功倍的效果。

2.2介入阶段:因人而异,因势利导

When指图书馆科学数据素养教育介入阶段,是根据科学数据生命周期来划分的。科学数据生命周期源于科学研究的生命周期,可大致分为数据采集、数据生产、数据存储和管理、数据保存和共享、数据引用和出版这5个阶段。“数据采集阶段”是科研工作的起点阶段,该阶段主要是进行数据资源的培训和讲座,这是高校图书馆的强项,基本上所有高校图书馆都能介入。“数据生产阶段”是科研人员根据开展科学试验和研究,从而产生原创研究数据的阶段,高校图书馆往往需要通过嵌入式服务的方式,融合到科研团队中方能较好的开展,这对馆员的学科背景、科研能力有较高的要求,只有研究型图书馆才能介入。“数据存储和管理”阶段需要高校图书馆进行大量的投入来获得足够的软硬件支持,包括技术保障、硬件设备、人才力量等,与信息化建设中心相比,图书馆在这一阶段的功能往往处于劣势,这是图书馆的薄弱环节,目前只有少数综合实力强的研究型图书馆才能介入。“数据保存和共享”阶段是对生产的科学数据进行充分的保护和利用,高校图书馆在这方面具有得天独厚的优势,理应承担起自身的职责。“数据引用和出版阶段”是科学数据生命周期的最终阶段,该阶段高校图书馆主要开展数据引用学术规范的教育,能够增加数据重用性和共享能力,提高数据生产者的认可度,也有利于科学研究过程的验证,这是高校图书馆的应有之义,但数据引用标准的缺失、数据集粒度选取和数据的动态性问题等使得数据引用实践仍处于起步阶段。图书馆科学数据素养教育是贯穿全过程,或是在某个具体阶段介入,必须根据自身的实际水平和能力以及服务对象的需求状况来决定,并没有统一的标准,只能是因人而异,因势利导,“摸着石头过河”。

2.3驱动因素:外因内因,共同作用

Why指图书馆数据素养教育的驱动因素,包括外因和内因,两者相互作用的复杂过程促使图书馆开展数据素养教育。外因是密集型数据环境要求科研人员具备一定的科学数据素养。主要包括数据的存储、安全、保存、合规、质量、共享。数据的存储是首要因素,海量的数据需要海量的储存设施,以保障数据的重复利用。安全:对于机密或敏感数据,应进行安全相关的认证和授权。保存:对于中长期保存归档的数据需要根据相关协议进行保护。国际图联(International Federation of Library Associationsand Institutions,IFLA)与国际出版商协会(In-ternational Pubilshers Association,IPA)2002年联合发表的声明中明确规定:“出版者应该担负短期保存的责任,长期保存的责任应由图书馆承担”。科学数据作为数字化信息的组成部分,应被纳入图书馆的长期保存范围。合规:使科学数据符合相关的标准和规范,以解决数据共享的法律问题、数据滥用、数据类型不兼容等问题。质量:必须保持和提高科学数据的质量,使研究结果具有鲁棒性?和重现性。质量是一个“多维”概念,“适用”是最基本的要求,可以从技术和管理两个角度进行数据质量的控制和评估。数据共享是图书馆参与的主要推动力。图书馆应以公益为目标,致力于促进科学数据的开放共享,以使其研究价值和社会效益最大化。服务创新是高校图书馆开展数据素养教育的内在因素,主要包括创新愿望、创新能力和决策机制等。创新是发展的灵魂,随着时代的发展和用户需求的变化,高校图书馆创新愿望愈加强烈,在实践中不断创新服务手段和方法,通过开展读者信息素质教育,提供参考咨询服务、空间服务、学科服务等,提高自身的创新能力。在E-Science环境下,高校图书馆已意识到参与科学数据服务的重要性和必要性,并在新环境下,主动承担起科学数据素养教育之责任,探索并寻找新的发展空间。由于服务创新具有创造性、系统性和风险性的特性,建立科学的决策机制尤为重要。内因与外因共同作用,缺一不可。

2.4内容:理论先行,实践依托

What指图书馆数据素养教育内容,应该理论、实践两手抓。包括以下4部分内容:(1)科学数据意识教育。尽管科学数据管理正被越来越多的研究者所熟悉和了解,但数据管理在很多情况下是在制度层面上运作的,而不是学术共同体的用户需求,除了数据存储,对用户服务需求的响应实际上是有限或缺少的。因此,对于研究者来说,数据素养教育首先应该是意识教育,即让研究者了解数据的基本术语、关键概念、政策、作用、个人角色和责任等等,培育用户需求。(2)科学数据素养技能教育。针对不同的学科领域讲授数据资源、数据分析软件,围绕科研项目生命周期提供数据管理指导,使科研人员熟悉数据生命周期,在学科领域内具有查找、分析、管理、利用与共享数据的知识与技能。(3)科学数据素养应用教育。着重培养科研人员数据挖掘、数据发现的能力,即能够利用数据资源发现问题、分析问题与解决问题,甚至能够为特定研究项目创建数据管理计划,这着重于技能实践训练。(4)科学数据伦理教育。培养科研人员科学规范地使用数据的能力,包括数据引用、知识产权和版权、隐私和安全问题等。在当前学术功利主义泛滥、学术诚信缺失时有发生的情况下,培养高尚的数据道德尤为重要。

2.5实施方式:横向协同、内外联合

How指图书馆数据素养教育的实施方式,主要解决如何开展科学数据素养教育的问题。这里着重体现“横向协同”、“内外联合”的特点。“横向协同”即图书馆内部构建组织管理协同、教育模式协同和教育资源协同(机构知识库、数据仓储、科学数据档案等)的横向协同模型。“内外联合”:指图书馆发挥主导作用,积极联合校内外、馆内外相关部门及群体,多方合作,共建共享,最终建立内外联合、“跨机构”协同发展的管理机制。

组织管理协同要有健全的组织管理机制来保障科学数据素养教育的实施。高校图书馆设立专门“数据素养教育机构”,或在原信息素养教育机构配备专职数据素养教育人员,尽量使组织结构“扁平化”以增强灵活性,并制定行之有效的管理制度,这在下文将具体论述,在此不赘述。

教育模式协同即以图书馆现有的服务模式(如信息素质教育、学科服务、参考咨询服务、科研诚信教育等)为载体,嵌入科学数据教育,协同作用,构建全方位嵌合式科学数据教育模式,服务于高校科学研究、学科发展和学术交流。根据不同用户的不同需求提供相应的科学数据素养教育,主要包括:(1)面向大多数用户的科学数据通识教育模式。针对本科生进行的信息素质教育课是科学数据通识教育的主要阵地,主要介绍科学数据的基本理论与方法,使学习者了解科学数据,逐步培养数据意识。(2)面向高层次用户(教师、博士、硕士生等)的学科数据素养教育模式。主要针对特定学科提供专指性的讲座与培训,可以大力依靠学科馆员,借助于学科服务和学科平台。海量增长和亟待开发的科学数据也为学科服务增添了新的内容,二者相得益彰。如武汉大学图书馆在学科服务平台嵌入了科研数据管理模块,为全国高校图书馆起到了示范作用。(3)面向特定用户的个性化科学数据教育模式。大数据的发展使得科学数据教育可以真正实现个性化,图书馆可以构建基于自适应学习技术的在线科学数据素养教育平台,实现用户自组织学习、自我调节学习,并能根据用户特征适应性推送学习资源,并及时跟进,自动调整。参考咨询服务也是实现个性化科学数据教育的重要手段。(4)面向科研人员的科学数据诚信教育模式。在科研诚信教育中嵌合科学数据素养教育,针对科研人员重点介绍科学数据对于科学研究的重要性,避免因数据作假而造成的学术不端,增强科研成果的可靠性,开辟学术规范的新领域,完善科研诚信体系建设。由此可见,图书馆的科学数据素养教育不是孤立的,而是嵌合式的,与图书馆的其它服务工作协同发展。

教育资源协同即机构知识库、数据仓储、科学数据档案等的协同。机构库可以成为容纳数据的仓储,成为整个数据监护战略的一个重要组成部分。我国高校图书馆已普遍认识到机构知识库的重要性,开始加速建设这种基于全球开放理念的新型知识组织与传播的门户。机构知识库虽然在数量上增长迅速,但在机构知识库建设的完善程度及使用效果层面却仅仅处于初级阶段。乔杜里(Choudhury)倡议机构库要推出能切入到科研起点,进而惠及整个科研流程的新服务。这应该成为我国高校图书馆机构知识库建设的最终目标。开放科学数据仓储(如SRDA、eCrystals、Dryad等)不仅能为科研人员提供数据基础,而且对所拥有的数据集进行了一定的描述,便于挖掘与利用。科学数据档案也是科学数据素养教育的重要资源。它为科研人员提供科研过程中产生的论文、技术报告、数据、图片和其它类型文档的永久、安全网络保存,并在世界范围内共享交流。如华盛顿大学图书馆提供研究工作档案服务(ResearchWorks Archive Serv-ice),着重收集研究工作中的灰色文献,如技术报告、工作底稿、未发表的手稿、期刊论文预印本(如果出版商允许)等。

3对国内高校图书馆科学数据素养教育实施的建议

针对国内高校图书馆科学数据素养教育实践存在的问题,依据上述高校图书馆科学数据素养教育体系“5W”模型,笔者认为,就目前而言,高校图书馆科学数据素养教育亟需开展且能够开展以下3方面的工作:

3.1广泛调研,基于用户需求设计科学数据素养教育课程

调研分两部分,一是通过对国内外高校图书馆科学数据素养教育的理论、实践现状进行文献调研,总结经验,分析问题,探讨我国高校图书馆开展科学数据素养教育的可行性以及介入方式;二是通过设计调查问卷,或者半结构式地?访谈了解用户的实际需求。前者国内图书馆界已有一定的研究,但却欠缺对于国内用户需求的实际调研。只有在充分调查研究的基础上,研究高校图书馆科学数据素养教育的基本理论,才能够科学合理地设计出符合用户需求的高校图书馆科学数据素养教育课程,进而通过满足用户需求的服务来实现用户观念的转换。

3.2多方合作,构建“跨机构”协同发展管理机制

高校的科学数据素养教育应从高校内部教学、科研工作流出发,以图书馆为主导,采取多方合作、“跨机构”协同发展的管理机制。这方面,国外图书馆提供了很多成功的经验和有益参考。如康奈尔大学的研究数据管理团体(RDMSG)由全校多方协作组建而成,协助创建和实现数据管理计划,应用最佳实践来管理数据,并能在研究过程的任一阶段提供数据管理服务。牛津大学嵌入式机构数据监管服务(EIDCSR)由牛津大学校内的几家科研机构包括大学计算中心(项目主持、调研和顾问)、研究服务办公室(政策研究)、波德林图书馆(元数据管理)和科研项目团队(参与调研)共同合作完成。因此,在进行科学数据素养教育平台建设时,图书馆应协同学校信息建设中心,并积极联合科研院、研究生院、教务处、档案馆等,完善平台的功能模块内容,尽量达到便捷、交互;在设计数据素养教学方案时,图书馆可与专业教师全程合作,把数据素养教育内容嵌入专业课程设计与教学实践,分担教学任务,开展学科嵌入式科学数据教育。

3.3明确职责,建设专门的组织机构和专业人员队伍

人员队伍和组织机构建设是图书馆开展科学数据素养教育的前提条件。国外不少大学图书馆成立了专门的数据管理机构,并根据其职责和服务侧重点的不同设置了相关岗位:纽约大学图书馆成立了数据服务工作室,设置了5个岗位:数据服务协调员、数据服务与公共政策馆员、数据服务助理馆员、数据服务高级专员、数据服务馆员;约翰.霍普金斯大学的Sheridan图书馆的数字研究和监管中心设有7个岗位,包括:高级数据教育专家、学术沟通专家等。我国高校图书馆当务之急应该加强科学数据教育的人员队伍和组织机构建设,一方面应在现有学科馆员、咨询馆员的基础上加强数据服务馆员的培养和再教育,形成一支强大的专业化数据教育馆员队伍;另一方面要加强图书馆专业数据服务组织机构的建设,统一协调图书馆的数据服务工作,在协同发展的管理机制指导和引领下,汇聚各方力量,拓展图书馆数据管理与服务工作。

4结语

高校图书馆科学数据素养教育体系“5W”模型的构建,是在总结国内外高校图书馆科研数据素养教育研究与实践的基础上,探索数据素养教育内容及实施框架,通用性强且易于应用。但该模型是以图书馆为中心来考虑的,而科学数据素养教育体系构建是一个系统工程,不是图书馆能独立完成的,它依赖于顶层设计,需要国家的战略规划和大力推动。并且,随着美国大学与研究图书馆协会(Associationof College & Research Libraries,ACRL)《高等教育信息素养框架》(第三版)的发布,数据素养教育如何与信息素养教育相互衔接与协同,如何在新媒体(MOOC、微课等)环境下开展数据素养教育,这些都是需要我们思考的问题。

猜你喜欢
数据管理科学图书馆
企业级BOM数据管理概要
定制化汽车制造的数据管理分析
海洋环境数据管理优化与实践
CTCS-2级报文数据管理需求分析和实现
点击科学
科学大爆炸
图书馆
科学拔牙
去图书馆
衰落的科学