(广西民族大学管理学院,广西 南宁 530006)
大数据及数据密集型科学的兴起,使得数据素养成为大数据背景下的研究热点。但学界对数据素养的定义仍未有统一表述,有学者将其与信息素养的定义联系起来[1],认为数据素养是信息素养在大数据时代的拓展和延伸。虽然两者在能力表述上具有相似性,但数据素养更强调数据的生产、保存与管理等方面。基于已有研究[2-4],本文认为数据素养是具备数据意识,掌握数据基本知识和技能,拥有有效获取、处理、分析和使用数据的能力,能够遵守数据法律法规和道德准则。其内涵包括数据意识、数据知识、数据能力、数据伦理4个方面。
目前,数据素养的相关研究大多围绕着国外数据素养教育经验介绍[5-6]、图书馆开展数据素养教育实践[7-8]等主题,针对图书情报学数据素养教育的研究较少,而面对大数据及数据密集型科学的兴起,图书情报学专业开展数据素养教育刻不容缓。因此,本文在分析图书情报学开展数据素养教育必要性的基础上,从数据素养教育内容、教育框架两方面构建图书情报学数据素养教育体系,以期为图书情报学数据素养教育实践提供借鉴参考。
关注并解决“信息爆炸”的现象和问题,是图书情报学科产生的初衷之一[9]。信息技术的发展,使图书情报学的研究内容不断调整和扩展,从学科诞生之初的文献资料加工,到20世纪60年代后期开始关注信息的处理利用[10],再到20世纪90年代开始全面关注网络信息的处理分析。在大数据时代,为了应对数据爆发式增长的挑战,图书情报学科的研究重心由信息转向为数据。相比于信息,数据的外延更加广泛,因此图书情报学的研究对象和内容也变得更加广泛,这种变化可以从两方面来理解,虽然数据一直是图书情报学的研究对象之一,如图书馆元数据研究、信息计量学中的文献数据、社会网络分析的数据等,但与大数据相比,这些数据的规模极小,并且数据范围局限于文献领域。而大数据使得图书情报学由小数据研究转变为全源粗糙海量的大数据研究[11]8,并且数据范围也突破了学科的界限,不再局限于文献领域。在这样的背景下,图书情报学研究者必须具备一定的数据素养,深刻认识和理解数据的内涵以及大数据带来的影响和变化,其次需要掌握基本数据知识以及学科交叉融合的知识,实现跨领域、跨学科研究。
大数据及数据密集型科学的兴起,不仅拓展了图书情报学的研究对象和内容,同时也为图书情报学研究方法提供了借鉴和参考。数据密集型科学带来的科学研究第四范式是一种新兴的方法论,其本质是以数据为驱动探索数据密集型科学中有价值的数据[12],而图书情报学是一门关于信息的科学,信息与数据的密切关系,使得图书情报学与科学研究第四范式有着与生俱来的本质联系。在大数据及数据密集型科学背景下,数据涵盖了文献、信息和知识,使得图书情报学研究方法由原有的信息驱动转变为数据驱动。一方面,数据挖掘、大数据分析、机器学习等技术方法给图书情报学带来了研究方法上的借鉴,丰富和拓展了图书情报学研究方法体系;另一方面,大数据思维也给传统图书情报学带来了新的启示,图书情报学的研究思维由因果推导转变为关联分析[11]9。因此,图书情报学研究者不仅需要掌握图书情报学研究方法,还需要了解大数据挖掘分析、机器学习等大数据技术方法。同时要转变研究思维,培养数据意识和思维,积极适应科学研究第四范式带来的变化。
在大数据时代,图书情报服务实践也围绕着“数据”而开展。2013年11月,德国数字图书馆(Deutsche Digital Bibliothek)就正式利用应用程序接口(API),向公众提供开放数据服务[13]。美国高校图书馆的科学数据服务囊括了科学数据管理的各方面内容,涉及科研工作的全部流程[14]。从实践形式看,图书馆科学数据服务分为咨询类和技术类两类服务,咨询类服务如数据服务培训、数据管理计划、数据查找与引用等;技术类服务包括提供数据标识、数据更新、技术支持等。但由于技术服务涉及数据的内容、形式、创建与修改等方面,对馆员的数据素养提出了更高的要求[15]。与此类似,面对海量数据的供应,用户迫切需要从海量数据中挖掘情报,对情报机构的情报服务也提出了更高的要求,并催生出精准情报服务[16]。而服务的过程中,要求情报机构必须将支撑情报服务的数据和信息进行整合[17],这必然对情报服务人员的数据素养提出了要求。“打铁还需自身硬”,图书情报机构在提供服务的过程中,必须提高机构人员的数据素养,才能更好地适应时代的发展,实现优质的图书情报数据服务。
无论从图书情报学研究内容、研究方法还是服务实践看,大数据及数据密集型科学带来的影响都不可忽视。图书情报学专业学生作为未来的从业人员必须具备数据素养,才能适应大数据时代图书情报理论研究和服务实践的发展。因此,数据素养教育就成了大数据时代图书情报学教育中不可回避的问题。
数据素养教育,顾名思义就是为提高数据素养而开展的一系列教育活动。国内外学者定义数据素养教育的主要有三种类型:一是通过列举数据素养的课程来进行阐述,Milo Schield认为数据素养的要求相比于计算机科学的技术含量低,主要要求学生掌握各种工具来获取、转换和操作数据,包括结构化语言SQL、关系数据库如MS Access、数据处理技术、统计软件(SPSS、STATA、Minitab和Excel等)和数据演示软件PowerPoint等[18];二是基于数据生命周期视角进行阐述,Carlson等认为数据素养教育的基本内容包括数据库及数据格式介绍、数据发展与获取、数据管理与组织、数据转换与互操作、数据质量保证、元数据、数据管理与再利用、数据保存、数据分析、数据可视化和数据伦理等[19];张静波则将数据素养教育的主要内容归纳为:数据的收集技能、数据组织与管理的规则和技术、数据分析的工具和技能、数据保存与安全问题、数据共享规则、数据管理和应用中的法规和伦理道德等部分[20];三是将数据素养教育划分为若干模块,黄如花指出数据素养教育是信息素养教育在大数据时代的拓展,并将数据素养教育划分为三个模块:培养数据意识、培育数据能力、树立数据伦理[21]。
本文认为数据素养教育包括树立数据意识、掌握数据知识、培育数据能力、培养数据伦理4个方面的内容。树立数据意识是先导、掌握数据知识是基础、培育数据能力是核心、培养数据伦理是必备素质,这4部分内容相辅相成,构成一个不可分割的整体。
基于数据素养教育的内容,本文将图书情报学数据素养教育划分为数据意识教育、数据知识教育、数据能力教育、数据伦理教育4个模块,在具体课程内容设计方面应考虑到图书情报学专业特点,并结合数据生命周期理论。
表1 数据素养教育内容及模块
续表
教育模块教学单元内容设计数据能力数据分析与利用单元介绍若干数据统计、数据挖掘工具和软件,并对数据分析利用工具在图书情报学领域的应用进行重点讲授,同时结合图书情报学进行专题实际操作。并要求熟练掌握1至2种数据挖掘分析工具的使用数据展示交流单元介绍数据可视化工具和软件,讲授对可视化图表进行解读过程,以及利用数据可视化工具进行科学研究的过程,并结合图书情报学进行专题实践操作。并要求熟练掌握1至2种数据可视化工具的使用数据伦理数据法律单元介绍数据采集、使用、分享中所涉及的数据信息法律问题,重点讲解图书情报学领域内的数据利用所涉及的知识产权及隐私权问题数据道德单元介绍数据采集、使用、分享中所涉及的道德和伦理问题,以及数据利用过程中需要遵守的学术道德和学术规范。重点讲解图书情报学领域内的科研数据开放共享的规范与原则
如表1所示,本文参考已有研究[22-23]将图书情报学数据素养教育模块进一步细化为9个单元:数据意识及思维单元、数据基础知识单元、数据应用知识单元、数据获取与评估单元、数据组织与管理单元、数据分析与利用单元、数据展示交流单元、数据法律单元、数据道德单元。
2.2.1 数据意识教育模块
数据意识教育模块包含数据意识及思维教学单元,从数据意识内涵而言,数据意识是数据素养的先决条件,涵盖整个数据生命周期,涉及数据获取、数据评价、数据分析、数据交流等环节,因此数据意识教育模块不可能独立开展,应结合数据知识和数据伦理的理论知识学习,以及数据能力的实践锻炼,将理论学习和实践结合起来,真正树立数据意识、强化数据需求、提高数据价值观念[24]。从教育内容而言,应紧密围绕数据对于图书情报学专业的理论研究和实践应用的价值,重点培养学生利用数据解决图书情报学专业问题的意识。
2.2.2 数据知识教育模块
数据知识教育模块包含数据基础知识和数据应用知识教学单元,该模块为理论知识的学习,主要介绍数据素养的基本知识以及数据挖掘、数据组织、数据分析等数据应用的技术知识,并在教学实践中将数据知识与图书情报学专业知识进行对比教学,为后续的数据能力教育打下知识基础。教学内容侧重于大数据及数据科学对图书情报学带来的影响,以及图书情报学数据利用方面的知识,让学生掌握和了解图书情报学在利用大数据方面的优势。
2.2.3 数据能力教育模块
数据能力教育模块结合数据生命周期理论,共划分为数据获取与评估、数据组织与管理、数据分析与利用、数据展示交流4个教学单元。该模块每一单元的教学内容都与图书情报学专业内容结合起来,实现数据素养与专业素养的融合,具体而言应在教学过程中将数据获取评估、组织管理、分析利用、展示交流与信息获取评估、组织管理、分析利用、展示交流进行对比教学,同时配有专题实践教学,开设相关实验课程,给学生提供实践操作的机会,如开设数据挖掘实验课程、数据分析实验课程等,通过理论学习结合实践操作达到学以致用的目的。
2.2.4 数据伦理教育模块
数据伦理教育模块包含数据法律和数据道德两个教学单元,该模块主要是理论知识的学习。主要介绍数据生命周期中从数据采集到数据利用整个过程涉及的法律和规范,在教学内容设计中,可以通过相关案例分析,向图书情报学专业学生介绍图书情报学领域涉及的法律法规与学术规范,如结合图书情报学专业组织学生学习我国的《科学数据管理办法》,让学生了解图书情报学领域涉及的数据法律和学术规范等。
图书情报学数据素养教育结构包括教育对象、培养目标、培养模式、教育主体、培养形式5大部分,其中教育对象与培养目标密切相关。
3.1.1 图书情报学数据素养教育对象及培养目标
我国图书情报学分为图书馆学和情报学两个专业,其中情报学专业仅存在于研究生教育中,此外在研究生教育中还有图书情报专业硕士研究生(以下简称“图情专硕”)。因此,图书情报学数据素养教育对象包括图书馆学本科生和研究生,情报学研究生以及图书情报专业硕士研究生4个部分。从图书情报学教育对象面对的工作领域看,图书情报学数据素养教育的目的包括两方面:一是数据研究型人才,让学生成为具备数据素养的科研工作者;二是数据应用型人才,培养在图书情报服务实践领域的数据管理人才。
从教育层次看,图书馆学本科教育为基础性教育,其主要培养目标为图书馆专业人员[25],但图书馆学本科生可以选择更高的教育层次,因此图书馆学本科生数据素养培养目标应该包括两方面:一是培养具备数据素养的图书馆专业人员,该目标偏向实践应用领域;二是为有志读研的本科生培养一定的数据素养和科研素养。从我国研究生教育现状看,学硕及博士生培养一般面向学术科研领域,专硕培养一般面向实践应用领域。因此,图书馆学、情报学研究生的培养目标应定位为培养具备数据素养能够从事科研工作的研究人员,而图情专硕则应定位为培养具备数据管理能力能够从事图情服务实践的应用型人才。
3.1.2 图书情报学数据素养教育主体
图1 图书情报学数据素养教育主体结构图
数据素养是一个全方位、综合性素质能力,这决定了数据素养教育必须走合作化培养路径[26]。有研究认为数据素养教育主体包括图书馆、院系专业教师和科研人员等[27],从图书情报学数据素养教育培养目标来看,并非所有图书情报学生都会从事科研工作,因此有必要在教育主体中增加具有实践性和应用性的教育主体,以培养图书情报学学生的实践应用能力。如图1所示,图书情报学数据素养教育主体包括图书情报学院系、图书馆、数学统计院系、图书情报服务机构、导师以及网络MOOC。其中图书情报学院系为主导主体,负责制订学生的培养方案,明确学生的培养目标,设置教学课程以及开展多方位的实践锻炼。图书馆、数学统计院系、导师以及网络MOOC则是支持主体,围绕着图书情报学院系制订的培养方案,对学生各方面的数据素养能力进行培养和教育。
3.1.3 图书情报学数据素养教育模式
传统图书情报学教育模式是老师讲授、学生选修的单一模式,而图书情报学本科生文理兼收,而研究生的本科专业更是差异悬殊。因此,图书情报学数据素养教育应考虑到学生的专业功底、学科背景差异以及兴趣爱好[28],综合各种教育模式优势,形成互补教育体系。根据不同的教育主体类型,可以将图书情报学数据素养教育模式划分为4个部分:通识教育、专业教育、嵌入教育和网络教育[29-30]。其中:通识教育是基础,专业教育是核心,嵌入教育是通过实践锻炼和培养数据能力和数据意识,网络教育是对上述教育的补充。通过通识教育培养学生的基本数据素养,专业教育则是结合图书情报学专业特征及需求而开展,将数据素养教育融入图书情报学教育之中。在此基础上,根据学生群体的不同,通过不同目标的嵌入式教育,培养学生的科学研究素养和实践应用能力。此外,还应鼓励学生进行网络学习,以满足不同层次学生的数据素养学习需求。
3.1.4 图书情报学数据素养教育培养形式
由图书馆和数学统计院系承担通识教育课程,通过开设培训讲座、公共基础课等,培养形式为课程讲授。由图书情报学院系承担专业教育课程,开设专业必修课和专业选修课,采取课堂讲授与课下实践操作相结合的方式进行培养。由学生导师或图书情报服务机构承担嵌入教育,通过制订学习目标、培养计划和考核方案,在课题研究、专业实践实习过程中,不断强化和锻炼数据能力的培养,树立学生的数据意识。网络教育则由学生根据个人兴趣爱好及知识体系欠缺部分,自主进行互联网在线课程选修和学习,并且各图书情报学院系应承认其MOOC学习考核通过获得的学分,以此鼓励学生通过多元化途径自主学习。
通过对图书情报学数据素养教育结构的分析,本文构建出图书情报学数据素养教育框架体系(如图2所示)。框架体系包括教育主体、培养模式、培养形式、教学内容4个部分,通过教育主体之间的相互协调配合、培养模式之间的互补,突出培养形式的多元化特征、教学内容的层次性特征,并且将数据素养教育内容分配到各个教育主体,形成合作化教学和培养。
图2 图书情报学数据素养教育框架体系
不同教育对象在通识教育、专业教育的基础上,可以通过不同嵌入式教育模式,实现多层次的培养目标。如针对图书馆学本科生和图情专硕,应加强图书情报服务机构的实践实习的作用,在实践锻炼中强化图书馆学本科生的数据能力和数据意识,以此锻炼其成为图书馆专业人员。针对图书馆学、情报学研究生,则应加强导师课题项目研究的作用,通过实际科研工作锻炼、深化其数据能力和数据意识,使其具备开展科研工作的数据素养。除此之外,针对有志读研的本科生,他们还可以通过MOOC学习的方式,深入学习数据知识,掌握数据能力,为后续研究生学习阶段打下良好的基础。
图书情报学数据素养教育培养路径应从教育主体、教育模式、教育对象等多方面进行分析。
3.3.1 编写数据素养课程教材,制定数据素养教学大纲
目前,我国尚无具体的数据素养课程教材,已有的数据素养教育都是通过诸如数据挖掘、数据分析等课程教学来实现的。随着大数据持续深入的影响,有必要编写特色鲜明、有针对性的数据素养教材。因此,各大图书情报学院系应联合起来,通过研讨、协调、调研等方式,借鉴国外相关经验,合作编写数据素养课程教材,并且根据院系特色和实际教学方向制定数据素养教学大纲,完善数据素养课程和教学体系,以此满足图书情报学专业学生日益增长的数据素养需求。
3.3.2 加强多元教育主体合作,提升数据素养教育能力
仅仅依靠图书情报学院系来培养学生的数据素养肯定是不现实的,各教育主体之间应加强合作,形成优势互补,提升教育主体的数据素养教育能力。如北京大学信息管理系与北京大学图书馆、南海大数据应用研究院合作举办了首届全国高校数据驱动创新研究大赛[31],不仅加强了各主体之间的交流合作,也为图书情报学学生提供了实践和交流的机会。图书情报学院系作为教育主体中的主导力量,应积极开展与其他主体间的合作交流,大力推动各主体间的合作教学,并且将学生的学习状态和数据素养水平反馈给其他教育主体,这不仅会提高教育教学的针对性,也能使教育主体了解到自身的教育问题,从而达到教学相长的目的。
3.3.3 明确学生的兴趣及需求,开展多元化数据素养教育
不同学生有不同的学科背景、兴趣爱好、数据素养需求,这一点在情报学研究生群体中尤为突出。国外教育机构在开展数据素养教育前,十分重视用户需求的调查,通过调查了解教育对象对数据的基本态度和观点,从而掌握其获取和利用数据的基本情况[32]。因此,图书情报学数据素养教育应在兼顾普遍性的同时突出差异性,调查和了解学生的学科背景、兴趣爱好、数据素养需求,制订个性化、多层次的数据素养教育方案,利用嵌入式教育和网络教育模式,满足不同层次学生的数据素养需求。同时在课程设置方面应结合专业方向以及培养目标,灵活设置数据素养相关课程,以此保证图书情报学专业学生掌握相应的基础知识和能力,又保证相关专业方向及培养目标的学生在知识和能力获得长足发展和提高。
数据素养是信息素养在大数据时代的拓展和延伸,图书情报学数据素养教育更是图书情报学专业素养的拓展和提升。本文在分析图书情报学开展数据素养教育的必要性和图书情报学数据素养教育结构的基础上,从教育内容、教育框架两方面构建了图书情报学数据素养教育体系,并针对当前的现状提出了培养途径建议,以期为图书情报学数据素养教育提供借鉴和参考。