王焱 袁先文 林晨晨 程结晶
(扬州大学社会发展学院,扬州 225009)
素养是人们为适应生活所习得的知识与能力[1],素养能力应该随着社会生存环境的变化而不断发展。20世纪80年代图书馆用户教育,在计算机兴起后演变成今天的信息素养教育,就是为迎合时代变迁对于素养能力提出的新要求。如今,第四科研范式的常态化、科研知识的数据化、数据管理需求的多样化、科学数据的复杂化,使得数据素养的独特价值也逐步显现。E-Science环境蓬勃发展的同时,对于科研人员、高校师生乃至社会大众的素养能力再次提出更加深入的要求,素养教育的用户需求也随之发生变化,以数据为核心的数据素养能力越来越受到关注和渴求。新型的时代背景、社会需求、教育经济、知识结构和科研方式对于原本的素养教育产生深刻影响。
高校图书馆具备丰富的数据资源,拥有雄厚的素养教育经验和人才基础,是实施数据素养教育的理想之地。目前,国内外众多高校图书馆已对数据素养教育进行了不同程度的探索。然而,这些探索是否能够真正满足人们对于素养能力的需求?相比世界处于该领域顶尖水平的高校图书馆,我国的相关教育是否存在差距?数据素养教育的未来之路又该如何发展?要探究这些问题,就要首先认清数据素养教育的真正内涵,将之与如今高校图书馆数据素养教育的内容和效果加以对比分析。而要真正认清一件事物,最好的切入点莫过于追本溯源。
大数据环境下的现代人生活已经截然不同,生活、工作、学习的每一个瞬间都有可能接收或产生数据。互联网技术的发展以及移动终端设备的普及,让我们获取数据的途径复杂多变,每时每刻都被浩如烟海的数据所包围。如何处理庞大的数据量,如何辨别数据的真伪、价值,如何分析数据、表达数据,如何应对该过程中的伦理问题,如何防止自身的信息行为带来安全隐患,这随着大数据时代而来的一系列难以解决的问题,暴露出人们在面对海量数据时个体素养的严重不足。时代的变化向个体素养提出越来越高的要求,数据素养教育作为大数据时代信息素养教育的传承与适应性发展[2],关注的重点逐渐从信息的查找与利用向数据的保存与管理方面转变。人们需要通过有效的途径培养相应的数据素养。
在互联网时代,有人说“知道知识在哪,比知道知识是什么更重要”。这一说法虽然过于绝对,但也侧面折射出在新时代中知识教育的意识变化。在今天,网络、移动终端触手可及。科学知识的结构也日益呈现出数据化趋势[3],“搜索即学习”的思想逐步深入人心。因此,在知识教育中,培养学生利用数据掌握新知识的能力也愈发重要。此外,传统的面对面知识传授方式也逐渐被形式多样的网络课程所改变。当代学生面临着大量数据信息,数据素养的缺失使他们缺乏以有效方式获取知识、辨别知识价值等能力。高校图书馆素养教育在此情况之下应顺应知识教育改革的趋势,向提高师生数据素养的方向发展。
科学研究范式随着科技和社会的发展不断变化,以适应新的环境和问题。21世纪以前,科学研究范式经历了3次演化:从描述自然现象的经验科学,到使用模型或归纳法的理论科学,再到模拟复杂现象的计算科学。大数据时代的到来,促使科研范式发生第4次变革,诞生数据密集型的第四范式。该范式之下,科研方式也随之发生变革。传统的假设—验证型科研方式被大量的科学数据研究所逐步替代,研究方式逐渐变为对收集的各种数据深入挖掘,以得出相应的结论。在第四科研范式中,数据成为科学研究的主要对象。用以研究的数据,其全面性和准确性都被加以极为严苛的要求,这对科研人员的数据收集和筛选能力提出新的挑战。而在整个研究过程中,数据的获取、保存、利用等通常都牵涉到伦理问题,一旦处理不当,将危及整个科学研究项目。在最终的成果转化过程中,科研人员也需要具备极高的数据表达能力。大数据时代科研方式的转型,对科研人员的数据素养提出严格的要求。高校图书馆开展相应的数据素养教育,能够在很大程度上满足他们日益增长的数据素养需求,进而推动科学研究的整体进步。
数据素养教育因何出现,是我们正确认识它的基础。这些原由,决定它的根本目的,从而衍生出其基本内容。而实施数据素养教育的前提在于搞清楚数据素养的内容究竟是什么,也就是针对什么样的目的进行施教。顺应数据环境、教育环境、科研环境的诉求而诞生的数据素养,其内容理应与这3个方面息息相关。虽然学界对于其概念定义尚未有统一认识,但研究者对于数据素养内容的诠释,无不脱胎于这3个方面。
黄如花等[4]认为,“数据素养包括3个方面:数据意识;数据能力(即贯穿于数据生命全周期的数据采集、表示、描述、发现与检索、选择与评价、分析、利用、引用、整合、复用、保存、管理等一系列活动所需的技能);数据伦理”。孟祥保等[5]指出,“科学数据素养包括3个层次:具有数据意识,能够认识到数据是一种资源;具备数据基本知识与技能,熟悉数据生命周期与科学研究生命周期,在特定专业领域内具有查找、管理、利用与共享数据的能力,了解相关数据管理政策法规、数据伦理等知识;在大数据时代,能够利用数据资源发现问题、分析问题与解决问题”。吴建中等[6]提到,“数据素养应该至少包含数据意识、数据技能和数据伦理3个方面。所谓数据意识,就是对大数据的敏感力、观察力、分析判断能力和创新能力;所谓数据技能,就是分析、处理数据的技巧和方法;数据伦理,就是使用数据要注意数据的隐私及使用范围和边界”。
虽然具体内容界定有所不同,但公认的数据素养应当贯穿数据生命周期的始终,内容大致包括数据意识、数据能力、数据伦理。具体的数据素养教育模式应该对应这些内容加以制定。而随着学界对于数据素养这一概念越发深入的探究,其教育目的、教育内容也越发清晰,数据素养教育的完整理论体系逐渐成型。
那么,对比数据素养的概念、内容、目标等,高校图书馆数据素养教育的现状与其是否存在差距呢?本文通过对国内外部分高校图书馆数据素养教育的调查分析进行深入探究。
针对高校图书馆数据素养教育的理论与实践,本文运用文献分析、网络调查、比较分析等研究方法,从教育对象、内容、形式3个方面详细分析国内外部分高校图书馆数据素养教育开展的特点与差异,了解数据素养教育的发展历程、基本内涵、教育模式等,进行比对分析与研究高校图书馆数据素养教育的现状。
为保证其数据信息的代表性、对比有效性等,本文综合考虑高校的综合排名、数据素养教育开展的状况以及资料的完整性,最终选取国内外10家水平较高、各有所长的高校图书馆作为调研对象。国外高校图书馆为麻省理工学院图书馆(Massachusetts Institute of Technology Library)、哈佛大学图书馆(Harvard Library)、伊利诺伊大学香槟分校图书馆(University of Illinois at Urbana-Champaign Library)、剑桥大学图书馆(Cambridge University Library)、爱丁堡大学图书馆(Edinburgh University Library)、维多利亚大学图书馆(University of Victoria Library)、多伦多大学图书馆(University of Toronto Library)。国内高校图书馆为北京大学图书馆、复旦大学图书馆、浙江大学图书馆。同时归纳总结收集的数据信息,结合文献印证、补充,在此基础上进行数据素养教育体系要素分析,对我国高校图书馆数据素养教育的发展提出建议,以推进我国数据素养教育进程。
相较于传统的素养教育,数据素养教育的对象更加广泛,包括学生、教师和科研人员、各类从业者以及社会大众。大数据环境影响着不同年龄阶段的民众,从小培养数据素养是时代的必然要求。教师群体除自身需求以外,其数据素养直接影响学生的数据素养能力塑造,而在高校中,一部分教师更是承担科学研究的工作,因此也是数据素养教育的重要对象。在新型科研范式下,培养研究人员的数据素养能力,能够帮助其大幅度提升科研水平。各类从业者中,不仅是专业的图书馆馆员,各行各业的职业人员都需更高的数据素养来提高自身的职业水平。网络技术的发展,使高校图书馆将社会大众纳入教育范围成为可能,这也是高校图书馆发展社会化服务的道路之一,是其职能转变的重要举措。
在实际数据素养教育实施中,即便是在数据素养教育比较发达的国家,教育对象主要还是本校师生及科研人员。加拿大高校图书馆数据素养教育对象主要是本科生、研究生和科研人员[7],如多伦多大学图书馆教育对象为本科生和研究生、维多利亚大学图书馆则为研究人员;英美高校图书馆数据素养教育对象主要是研究生和科研人员[8],如麻省理工学院图书馆、剑桥大学图书馆教育对象为研究人员,哈佛大学图书馆、伊利诺伊大学香槟分校图书馆、爱丁堡大学图书馆为不同学科领域的用户。国内高校图书馆虽然将不同学科领域的用户都纳入教育对象之列,但向校外开放的只是极小部分教育内容,如北京大学图书馆的部分公开课、慕课对所有社会人士开放,讲座的课件可以由外部用户在图书馆网站上免费获取;浙江大学云中课堂的微视频对所有用户开放;复旦大学图书馆的部分培训课件可免费获取,另外还有为复旦大学的师生以及全国CASHL馆员提供的专题培训。
数据素养教育内容的制定是由数据素养的内容而来的。胡卉等[8]提到,“2013年ARLC发布的《信息素养白皮书》指出图书馆开展数据素养教育应包含以下内容:数据发现与评估;数据内容理解和数据使用;数据归属权和数据责任问题;数据引用;数据购买中的伦理问题”。黄如花等[4]认为“数据素养教育应与数据素养定义相对,包含培养数据意识、培育数据能力、树立数据伦理。其中数据意识包含数据价值意识与数据安全意识;数据能力涉及数据管理的生命全周期所需要的能力;数据伦理包括数据隐私、数据的合理与合法利用、数据交流的规则等”。张新红[9]根据教育对象的不同,提出“本科生阶段的教育内容主要是熟悉与了解科学数据基本知识;研究生则培养科学数据管理技能;研究人员是从事科研实践的工作人员,需要掌握科学数据分析、处理、存储、组织、共享、政策、规范、伦理等复杂的数据管理”。
国内外高校图书馆在教育内容的设置上,大致还是围绕数据意识、数据能力和数据伦理三方面展开的。目前,国外的数据素养教育主要针对数据生命周期制定其内容[8],而国内的相关研究和实践起步较晚,内容层次浅、较为零散,主要以基础理论、技能和软件操作培训为主[9],“围绕数据的发现与获取、数据库和数据格式、数据处理和分析、数据伦理与归因等几项内容展开”[10]。北京大学图书馆的“一小时讲座”包含图书馆服务介绍、检索技巧、数据库的介绍与使用、统计数据和科研开放数据的查询获取、大数据下的论文写作指导、数字人文与大数据、Excel与SPSS数据处理软件的运用等内容。浙江大学图书馆系列讲座“求真一小时”分为面向研究人员、毕业生和师生日常技巧需求设置,其中也设有Excel、SPSS等软件的培训课程,还设有教授专利基础知识和检索利用的专利课堂和讲座,以及“云中课堂”致力于解答师生在数据库利用方面的问题。复旦大学图书馆开始注重与具体专业相结合的数据素养教育,因此除基础性的数据挖掘、数据可视化等课程之外,还开设《大数据商务分析与应用》《大数据在健康产业中的应用》这一类专业相关度较大的数据素养课程。具体如表1所示。
表1 国内外部分高校图书馆数据素养教育内容比较
高校图书馆数据素养教育的形式在科技的带动下日益多样。另外,国内外高校在持续创新探索中也逐渐发展出各种别开生面的新鲜形式。传统的数据素养教育主要有专题研讨会、讲座、培训班、科学数据管理导航、学分课程、在线课程等。同时,也有部分高校图书馆尝试开展嵌入式服务、暑期学校、交流空间等全新的教育形式。其中,较为常见的形式当属专题研讨会、讲座和短期培训班,这类教育活动可操作性大、周期短、针对性强,是效果比较明显的教学形式。另外,在线课程打破时间、空间的限制,有权限的用户可以随时随地接受教育,大大提升数据素养教育的覆盖范围。科学数据管理导航为用户提供所需数据,并能够引导用户在使用过程中潜移默化地提高数据分析、处理、使用等能力。至于学分课程,虽然时间较固定,耗时也相对长,但是教育效果比其他形式更加系统,也是有效实施形式之一[11]。
目前,我国少部分高校图书馆已经展开初步尝试,主要涉足科学数据管理导航、学分课程、讲座、培训和慕课等方面,但多数与信息素养教育融合开展[9-10]。北京大学图书馆主要由LibGuides科学数据管理导航、学分课程、讲座、短期培训等方式开展数据素养教育。浙江大学图书馆的主要教学形式有学分课程、讲座、培训等。复旦大学图书馆的主要教学形式有学分课程、慕课、讲座、培训等。而国外高校图书馆除上述几种较为传统的教育形式以外,还以研讨会、实践项目等形式开展数据素养教育。如麻省理工学院图书馆开展科学数据管理资源导航;哈佛大学图书馆、爱丁堡大学图书馆、维多利亚大学图书馆均开设相关讲座;哈佛大学图书馆、伊利诺伊大学香槟分校图书馆、剑桥大学图书馆、维多利亚大学图书馆设有培训;除麻省理工学院图书馆、哈佛大学图书馆外,被调查的其他国外高校图书馆均开设相关课程;开展研讨会的则有麻省理工学院图书馆、伊利诺伊大学香槟分校图书馆、爱丁堡大学图书馆、多伦多大学图书馆。
综合国内外高校图书馆数据素养教育实践和研究现状可知,国内研究起步较晚,大多依附于信息素养教育之下,有些虽已属于数据素养教育的内容,却没有明确标明,亦没能将相关模块整合。与国外处于领先地位的高校图书馆相比仍存在不足之处。在教育对象方面,国内外部分高校图书馆虽然已经将目光投向全民教育,但教育对象重点主要为本校师生、图书馆馆员以及科研人员等。在教育内容方面,国外数据素养教育领先的国家注重行业专业人才的培养,国内的数据素养教育层次较浅,整体上欠缺系统性、逻辑性,同时普遍缺乏与专业能力、实际应用相结合的培养内容。在教学形式方面,国内以传统的课程、讲座、培训为主,不能依据教育对象的特质以及数据素养水平进行分类教学,同时缺乏实践,亦没有统一的评价体系以供参考。此外,国内尚未形成总体的数据素养教育环境,目前真正有计划开展相关教育的高校图书馆数量并不多,缺乏整个教育界的联合、图书情报业内的合作以及行业之间的协作。因此,目前高校图书馆的数据素养教育尚未形成独立的体系,也没有形成完善的数据素养教育模式,很难进行深度有效的培育。基于此,笔者从教育对象、教育内容、教育形式的维度出发,分析高校图书馆数据素养教育体系要素,为数据素养教育发展提供理论与实践指导。
根据上述分析,本文针对当前我国高校图书馆数据素养教育存在的问题,借鉴联合国GMR2005教育模型[12]投入-产出的教学设计思路,结合国内外数据素养教育研究成果,尝试对我国高校图书馆数据素养教育体系进行要素分析(见图1)。一方面,帮助厘清该教育体系各组成部分的内涵与意义、梳理各部分间的逻辑关系,以推进理论认识;另一方面,对照各要素分析结果和其逻辑顺序,一一比对相关教育现状的缺失和差距,以便修正及改进教育实践工作。但需要指出的是,当前研究成果和实践的路径不可避免地具有时代性和地域差异等局限。因此,在分析数据素养教育体系的要素时,有必要将社会、经济、政治、教育、文化、科技背景环境的影响及其变化一并纳入考虑。鉴于此,该教育模型以学习者为中心,全面考虑受教育群体的差异、相关背景影响,采用不同的教育形式,以高校图书馆为主导,联合高校相关部门及行业相关机构,最终保障用户所需数据素养能力的培养。
图1 数据素养教育体系构建的要素分析
综上所述,本文将组成高校图书馆数据素养教育体系的要素分为5部分具体论述,包括教育对象及其特质、教育模式、参与主体、数据素养能力、相关背景。各要素之间并非相互孤立。教育对象及其特质是整个数据素养教育体系的起点和中心,以此为基础来进行教育的实施。教育对象的需求、特征决定特定的教育模式,而不同的模式则需要具体教育主体配合实施,以培养教育对象贯穿数据生命周期的数据素养能力。同时,在此过程中,相关背景的影响伴随始终。
大数据环境下,数据素养能力已经成为整体社会需求,这就意味着教育的受众不再如以往素养教育那样只针对高校师生和研究人员,即精英层面,因而数据素养教育也应向社会大众教育发展。其教育对象不仅要贯穿整个大学教育,亦需针对各阶段的学习和科研需求实施教育。除此之外,社会各职业从业人员、网络用户也都应该纳入教育体系之中。而扩大化的教育对象群体,自然拥有比以往更加复杂多样的特质。还有,以往以高校师生和研究人员为主体的受众,大体上素质整齐划一,学科分类明确,不论在时间和空间上都易于统筹控制。但如果将社会大众一并纳入施教范畴,就要充分考虑到不同知识储备、不同学习能力的群体,甚至是弱势群体的接受范围。同时,针对不同学科的数据素养教育在方法和最终目标上也通常有所不同。高校中受众的学科需求一般较为明确,但对于社会大众,尤其是不同网络用户而言,需要施教者刻意进行区别。此外,由于缺乏各方面约束,社会化教育对象的学习态度也各自不同,有些求知欲旺盛、目标明确,有些倾向于被动接受,有些则只是抱着可有可无的态度。并且高校内教育设施齐全,可以面对面教授为主,但高校以外的群体则大不相同。普及化教育不得不考虑部分群体远程学习上的障碍。这些不同教育对象的不同特质,左右了最终数据素养能力的培养效果,这就需要有针对性的教学模式来保证最佳教育效果的实现。
特质各异的教育对象,要求素养教育不能大而化之,需要精心区别,设计各具针对性的教育模式。教学时间方面,利用碎片化时间,除系统性的课程,也应设置时长较短的学习视频,如十几分钟甚至几分钟,只包含一个知识点的微视频。但需要注意的是,即便是碎片化的知识点,也需要在整体上构成完整的知识体系。教育形式方面除了传统的形式外,也要拓展线上教育,可以尝试与各大网络教育平台合作以解决技术、经验等问题。教育评价方面,社会化的教育面对诸多迥然不同的群体,很难满足所有人的需求,因此评价反馈机制变得越发重要,也因为教育形式的变化,重新建立教育评价体制十分必要。
在社会普及教育的模式下,高校图书馆在教育对象的范围、社会服务经验及精力上都有其局限性,所以要满足整个社会的需求,需要开展整个高校、行业,乃至整个社会的协同合作。数据素养教育的参与主体可以分为三个层次。最上层是高校各级行政管理部门,负责统筹全局,从宏观上制定战略规划。中层属于教育实施层,由高校图书馆主导,信息中心提供技术支持,各院系合作开展嵌入学科教育,公共馆、专业馆整合资源和经验,辅助社会化教育。下层指实践层,数据素养能力的培养需要大量的实践。国外的相关教育大多建基于具体项目的实施。社会其他图书情报机构,如专业的信息情报公司,既可以与高校合作项目开发,亦可以为教育对象提供实践基地。
数据素养教育的教育结果,即数据素养能力,应当与数据生命周期各个环节一一匹配。具备制定数据管理计划、完整收集需要数据的能力是数据创建阶段的要求;将收集的数据进行恰当组织、整理的能力是数据处理阶段的要求;合理地统计、解读、评估数据的能力是数据分析阶段的要求;数据著录、数据保护和数据备份的能力是数据保存阶段的要求;数据共享能力和遵循数据伦理是提供数据入口阶段的要求;数据跟踪和再利用是数据重用阶段的要求[13]。但需要施教者注意的是,不同群体对数据素养能力的要求不同。如数据分析能力,科研人员和普通网络用户对其的需求层次明显不一,很难制定统一的标准,需要将标准分类细化。
相关背景中影响因素可能涉及社会、经济、政治等多个方面,它与上述4个部分相互影响,教育基础设施、资源、理念,第四范式的兴起,市场竞争要求以及国家政策法规都会对每个环节产生影响。如鼓励信息机构参与素养教育的政策法规,就可以促进图书情报机构的参与热情。反之,数据素养教育作用于社会每位大众时,相应地也会对社会、经济、政治产生作用。因而,在制定和实施数据素养教育的过程中,要将这些因素纳入考虑。
对比上述教育体系构建的要素分析可知,高校图书馆数据素养教育仍存在不足。如未能充分考虑不同教育对象的用户需求,参与教育的主体、教育形式传统而单一,最终能力的培养难以覆盖数据生命周期的每个环节,同时通常会忽视社会背景、环境的变化及影响。在具体实施中,笔者认为还应注意以下4个方面。
教育的模式应根据用户的需求构建。不同的用户群有着不同的需求,同时也有着不同的数据素养基础水平。根据上文数据素养教育现状的分析,可以看出教师和研究人员对于数据素养的水平要求较高。而社会大众的需求一般只处于基础能力层次,为这一群体提供教育时要重点关注的是教学形式,这类群体地理上分散,时间上难以集中,因而应该充分发挥线上课程的作用,利用碎片化时间,依托移动网络,推进数据素养教育的社会普及。
国内开展数据素养教育的高校图书馆绝大多数秉承的是以能力导向为原则的施行理念,也就是致力于系统化地培养贯穿整个数据生命周期的素养,这种方式不受具体学科和对象的限制,可以统一实施教育。但是这同时忽略了不同背景、需求的群体对素养能力的个性化要求。如高校研究人员对于科研过程中的数据表达、数据伦理等方面能力要求较高。这就要求施教者兼顾目标导向的思想,对于有专门化需要的群体,侧重培养其某一方面的数据素养能力。
不仅是高校内部,图书情报界之间、行业内外都需要联合起来,建立一个多方合作的数据素养教育体系。第一,图书馆内部不能再各自为政,应展开跨部门合作。第二,图书情报界之间也需要加强合作。目前国内的数据素养教育大多是由单个图书馆主持。但是,如果想营造全社会层面的教育环境,图书馆联盟需要发挥行业领军作用,同时充分利用公共图书馆在教育大众方面的优势。第三,高校图书馆也应注重与学校相关部门、外部专业机构的联合,全面配合,整合各类资源,开展深度合作。
一方面,开展数据素养教育的主体本身需要掌握多学科知识和技能,而这些知识技能绝不是简单地叠加,应融会贯通;另一方面,在设置数据素养教育内容的同时,应注意各相关学科的融合,如结合基础学科、计算机科学、信息科学、数据科学、计量学、统计学、大数据技术等具体专业的交叉和融合。此外,从多学科交互融合的角度而言,数据素养教育的普及也在很大程度上促进其进程。如数字人文作为计算机科学与人文社科碰撞而诞生的产物,可将以往难以接触或处理的传统文化资源和前人研究资料,转化为可借助机器加工、获取、处理的知识关联与推送的数据资源。数据素养教育的成果有助于推进数字人文进展,对传承传统文化、推进人文社科研究都具有重大意义。而数字人文通常以项目的形式开展研究。数据素养教育与其具有相通之处,因此亦可依托数字人文项目作为教育平台。