卢祖丹 余达淮
(河海大学图书馆,南京 210098)
随着大数据时代全面来临和数据密集型第四科研范式迅速兴起,科学数据成为国家科技创新和经济社会发展的重要基础性战略资源[1],而对数据的获取、分析和利用等能力已成为人们在这个时代的必备素养。数据素养教育是在当前大数据时代对信息素养教育的传承与适应性发展,而高校担负着将学生培养为数字公民的责任[2],其图书馆作为高校数据资源的枢纽与信息素养教育的传统阵地,理应识别用户的数据需求并在其后的数据获取及学习过程中提供支持[3],成为高校数据素养教育的主阵地。目前数据素养教育正在高校图书馆如火如荼地开展,本文拟对我国高校图书馆的数据素养教育内容展开实证分析,总结理论经验并发现实践不足,以期为今后有效开展相关工作与提高教育成效提供参考。
随着大数据环境的全面形成,数据已经成为获取信息、开展科学研究的重要基础资源,并将在人们的工作和生活中扮演越来越重要的角色。与之相适应,数据素养与数据素养教育受到了国内外学者广泛关注,对数据素养和数据素养教育的内涵展开具体而深刻的剖析,其中也蕴含了对数据素养教育内容的探索。
国外学者较早开始了对数据素养及数据素养教育内涵与内容的探讨。如美国图书馆联合会(American Library Association)认为信息数据素养应包括识别信息和数据的必要性,以及能够有效获取、评估与使用信息和数据的能力,“信息数据素养高的人群是那些学会如何学习的群体”[4]。Hegarty等[5]认为数据素养是信息素养的子集,是一种“能以有效的方式使用、管理、创造、引用和分享数据信息”的能力。Mandinach等[6]认为数据素养不仅是个体的数据管理利用能力,也是其思维方式的引导与转变,是个体数据获取、利用、操作、批判及数据伦理方面能力的综合体现。Khatun等[7]将数据素养定义为“数据识别、查找、获取、评估合适来源以满足数据需要,以及符合伦理且有效地利用数据资源”的一种能力。Carlson等[8]明确指出数据素养教育的基本内容包括数据库及数据格式介绍、数据发现与获取、数据管理与组织、数据转换与操作、数据质量评价、数据保存及再利用、数据分析、数据可视化及数据伦理等。Calzada等[9]指出科学数据素养教育需培养的核心能力包括理解数据、解读与评价数据、管理数据与利用数据。
我国学者也对数据素养及数据素养教育的内涵与内容进行了多方面的解析。如张静波[10]从科研生命周期角度阐述数据素养概念,指出数据素养是科研人员需要具备的数据获取、组织、处理、分析与共享等能力,以及应遵守的规范道德。孟祥保等[11]认为科学数据素养应包括“具有数据意识,即形成数据的资源性认识;具备数据的基本知识与技能,能在特定专业领域内查找、管理、利用与共享数据的能力;了解相关数据管理政策法规、数据伦理等知识”,并且认为适时开展数据素养教育能够在一定程度上满足科研人员的数据管理需要,同时也是高校图书馆积极融入学术交流与大数据环境的战略选择。沈婷婷[12]从科学数据管理视角认为数据素养是对数据的理解、获取和运用能力,以及具备的批判性思维。陈明星[13]指出国内外数据素养教育应围绕数据意识、数据管理技能以及数据管理知识展开,并构建了基于数据意识、数据评价、数据分析等模块的KMDC数据素养教育内容框架。宋甲丽等[14]认为高校图书馆开展数据素养教育的内容主要为五方面:一是数据素养相关知识;二是数据库的使用;三是数据相关处理,包括对数据获取、整理以及综合管理等;四是数据分析工具应用及技巧;五是数据的交流与应用培训。张长亮等[15]认为高校数据素养教学内容应在学科领域或专业课题项目的基础上注重数据理论知识和实践能力的培养,主要包括数据采集与获取、数据分析与处理、数据安全与分享、数据开发与利用等方面。
虽然学界目前尚未对数据素养形成统一定义,但从上述分析中可得出一定的规律性认识,即数据素养主要包括:①数据意识,即对数据的必要性和资源性的一种敏感性认识;②数据技能,包括对数据的查找获取、处理与分析、共享与交流展示等能力;③数据评价,即对数据的批判性思维,这既是一种能力,更是一种意识;④数据伦理,即在数据援引、利用与共享等过程中应遵守的伦理道德规范。数据素养教育应围绕数据素养的内涵展开,其中数据技能部分因其内容丰富及操作性强等特点通常成为教育的重点。依据国内外研究成果,并结合图书馆实践,可将数据素养教育内容分为四方面,即旨在提高数据意识、伦理与评价能力的教育,提高数据获取能力的教育,提高数据处理能力的教育,以及提高数据交流能力的教育。
高校图书馆是数据素养教育的先锋阵地,一流院校图书馆的教育水平代表着我国数据素养教育的先进水平,故选取我国在数据素养教育方面有较好作为的42所“世界一流大学”建设高校的图书馆作为调查对象。
本文采用网络调研法,于2020年3月通过登录42所“世界一流大学”建设高校图书馆网页,浏览其主页面、服务/培训讲座、教学与培训、新闻动态、通知公告等栏目,以调查2019年各高校图书馆数据素养教育的开展情况。但4所高校(大连理工大学、厦门大学、湖南大学与云南大学)存在外部无法访问或相关信息无处查找等问题,最终获得38所高校的相关数据,占42所“世界一流大学”建设高校的90.5%,具有较好的代表性。
调查内容主要涉及3个方面。
(1)数据素养教育概况。具体内容包括:①相关专题讲座开展的总场次及场次梯度,反映各高校举办数据素养讲座的总体规模;②讲座师资的内外源调查,反映数据素养教育队伍的建设情况;③讲座有无详细介绍、是否指明对象、是否提供讲座课件或视频下载,反映讲座内容和对象的明确程度;④是否形成数据素养教育专题讲座、是否对此类讲座进行内容细分,反映图书馆数据素养教育服务的常态化程度;⑤讲座信息是否多途径揭示、讲座的平均预告天数是多少,反映专题讲座开展的计划性状况;⑥是否面向全校提供可定制的数据素养讲座,反映服务院系的功能性状况;⑦是否提供数据素养教育的微视频/微课堂、学分课程、嵌入式课堂、数据商在线教育等,反映其他数据素养教育方式的开展情况。
(2)数据素养教育内容。依据前文归纳的数据素养教育内容体系,将我国高校图书馆数据素养专题讲座内容分为4类:①数据意识、伦理与评价;②数据获取;③数据处理;④数据交流。统计总场次及占比,并对开展高校进行统计。此外,清华大学、北京大学作为我国“世界一流大学”建设高校中最核心的两所高校,其对数据素养教育内容的分类也较具借鉴意义。故而,综合两校的分类方法,将数据素养教育内容分为四大模块,即新手指南、资源推介、科研助力、软件工具。然后据此分类法统计讲座场次和高校情况,以作为第一种分类的对照。
(3)数据素养教育的一流学科契合度。由于研究对象为我国“世界一流大学”建设高校,其数据素养教育应当支持学校的一流学科建设。因此,还调查了图书馆数据素养教育与该校一流学科的契合度,以了解数据素养教育工作有否体现该校学科建设重点,考察各高校图书馆相关工作对“双一流”建设的保障支持力度。
在38所“世界一流大学”建设高校中,其图书馆2019年开展数据素养教育活动的情况概括如表1所示。
表1 数据素养教育概况
(1)2019年数据素养教育专题讲座共开展1 450场次,校均38场次。其中场次较少(<20场)的高校15所,场次基本满足需求(20~39场,即教学周每周或隔周有讲座)和场次满足需求(40~59场,即教学周每周平均有1~1.5次讲座)的高校各8所,而讲座安排较为充足(≥60场,即教学周每周讲座平均1.5次以上)的高校有7所。总的来说,在样本高校中数据素养讲座的供给呈正偏态分布,偏度系数为1.619,即供给场次偏少的高校占大多数,这表明“世界一流大学”建设高校的数据素养专题讲座的供给工作仍有待加强。
(2)专题讲座师源分为两类,一类为馆内或校内提供(内源师资),另一类为数据商培训师及其他(外源师资)。调查发现,2019年样本高校图书馆开展的数据素养专题讲座中内源师资讲座为1 170场(占比80.69%),而讲座师资以馆内或校内为主(内源讲座超过半数)的高校有27所(占比71.05%),这表明“世界一流大学”建设高校图书馆数据素养教育队伍正成长壮大,逐渐掌握了数据素养讲座活动安排的主导权。
(3)大多数高校图书馆(31所,占比81.58%)在讲座开始前都会作内容预告,以便于听众事前了解与选择;但只有少数图书馆(11所,占比28.95%)会指明听众对象;另外有略超半数的高校图书馆(21所,占比55.26%)提供讲座的课件或视频下载,这反映出“世界一流大学”建设高校图书馆数据素养教育的内容明确度较高,但对象明确度不足,且讲座形式的数字化、网络化程度有限。
(4)有近半数的图书馆(18所,占比47.37%)形成了数据素养教育系列讲座专题,但只有9所高校图书馆对数据素养教育的内容进行细分,这反映出“世界一流大学”建设高校图书馆数据素养教育服务的常态化仍有待加强。
(5)超过半数的高校图书馆(21所,占比55.26%)对讲座信息进行多途径揭示,平均预告天数为26天,表明这些高校图书馆数据素养教育服务的计划性较好。
(6)24所高校图书馆(占比63.16%)面向全校各院系提供定制数据素养讲座,表明这些图书馆在服务院系方面的功能性较强,但仍有超过36%的高校未提供该项服务。
(7)图书馆提供数据素养教育微视频/微课堂的高校有12所(占比31.58%),开设数据素养方面学分课程的有25所(占比65.79),有7所高校图书馆提供数据素养嵌入式课堂服务(占比18.42%),有26所高校图书馆提供数据商在线教育服务(占比68.42%),这表明“世界一流大学”建设高校图书馆开展数据素养教育的方式多样化,不仅讲座培训、学分课程、数据商在线教育等传统方式方兴未艾,微课堂、嵌入式课堂等新兴方式也在各高校陆续发展起来。
为明晰“世界一流大学”建设高校图书馆数据素养教育的具体内容及特征,选取讲座培训进行内容调查,而学分课程及其他教育方式因主题较为笼统且开展范围不够广泛而未作为分析对象。分别采用前文提到的两种数据素养教育内容分类体系进行分析,结果见表2。
表2 数据素养教育内容
(1)从分类体系一(经典定义分类)框架下数据素养培训讲座的分布来说。①数据获取能力是现阶段高校图书馆数据素养教育强调的重中之重,38所高校图书馆所举办的数据素养讲座中有超过半数皆为数据库资源检索与推介类讲座(共818场),如“标准、专利、政府数据的获取”“外文电子期刊数据库检索利用”“数据素养与统计数据的获取”“Lexis Advance法律数据库介绍及使用培训”等,而且37所样本高校都开展了此类培训讲座。②数据处理与数据交流是高校图书馆数据素养教育的次重点,两项内容占全部场次的比例为41.59%,如“利用Gale数据库发现学习和研究中的各种可能性”“如何利用Web of Science核心数据库进行学术热点追踪分析”“Python软件助力数据分析”“详解excel常用函数”等讲座旨在提升数据分析与处理能力,“巧用SCI和Scopus数据库,助力论文写作”“ASCE数据库的期刊选择、投稿与使用技巧”“Springer Nature助力科研成果发表”等讲座则试图培养数据交流能力。样本中举办这两类讲座的高校分别占比89.47%和76.31%,说明这两种能力也为多数高校图书馆数据素养教育所强调。③数据意识、伦理与评价是当前数据素养教育的薄弱之处,仅有2.00%讲座是针对数据意识、伦理与评价的培养,如“如何发现与挖掘专利价值”“学术道德与学术规范”“关于科学伦理的潘多拉宝盒”“专利侵权的判定与分析”等,而样本中也仅有14所高校开展了此类讲座培训(占比
36.84%)。
(2)从分类体系二(清华北大分类)框架下数据素养培训讲座的分布来说。①资源推介模块是高校图书馆数据素养教育的重点,有50.07%的讲座都是针对图书馆资源的检索、查阅与获取的(共726场),37所高校皆举办了资源推介类的培训讲座。②软件工具与科研助力是数据素养教育的次重点模块(两项占比43.80%)。软件工具培训既有针对数据管理与分析的,如Endnote、Incites、NoteFirst、Citespace、思维导图、印象笔记、Origin、Excel、Python等;也有强调数据展示、表达与交流的,如Visio、Latex、Premiere、3D打印、PPT、Photoshop等。科研助力既包括针对专业领域热点进行追踪分析的讲座,也包括指导学术论文写作、投稿等的讲座。开展两类讲座的高校分别占比89.47%与84.21%,说明图书馆也倾向于开展这两类讲座。③仅有6.14%的讲座与新生入馆教育有关,仅有11所高校开展了分院系的新生入馆讲座,在调查中发现许多高校图书馆新生教育方式已由讲座培训转为在线教育,形式有微视频/微课堂、在线答题、入馆原创手游等。
因研究对象为“世界一流大学”建设高校,这里尝试分析图书馆数据素养教育与各高校一流学科的契合度,以考察该工作能否对一流学科的建设起辅助支撑作用。仍以数据素养讲座培训为分析对象,并定义数据素养教育的一流学科契合度为讲座培训涉及的一流学科个数与高校一流学科个数的比。由分析结果可知(见表3),38所高校中,应建设的一流学科均值为8个,而其图书馆开展讲座涉及的学科均值仅为2个,这其中具体涉及的一流学科则更少,一流学科的契合度均值仅为0.235。由此可知,高校图书馆的数据素养教育一般较为笼统,涉及具体学科的数据素养教育较少,且与一流学科的契合度极低,这说明图书馆数据素养教育对高校“世界一流大学”建设的保障支持作用尚未显现。
表3 样本高校数据素养教育的一流学科契合度
(1)内容系统性不强,重技能而轻意识。各高校图书馆的数据素养教育内容存在普遍性倾斜,系统性不强,对收集获取、分析利用及展示交流等数据技能的培养非常重视,而对于数据意识、数据伦理、数据评价等意识方面的培养则较为薄弱,仅有少数高校开展了有限场次的相关教育。然而,数据意识决定了数据使用者从事数据挖掘、处理、利用及传播的效率,直接影响科学数据管理的过程与效果[16];数据伦理体现了数据的安全意识和产权意识,规范了数据资源使用行为,是高校师生培养科学诚信、完善学术人格的重要基础;数据评价决定了使用者能否有效甄别数据及判断数据价值,是提高数据利用效率、从事科研交流、实现工作创新与科研积累的根本保障,任何高校图书馆都应重视这些方面的教育。
(2)与一流学科建设不契合,对学校“双一流”建设的辅助支撑作用尚未彰显。“双一流”建设是我国高等教育发展的重大历史机遇,是“世界一流大学”建设高校集聚资源和力量的工作焦点,也是图书馆开展各项服务的重心。但从数据素养教育角度来说,目前图书馆开展此类活动中“一流学科”的特色并不明显,尚未形成围绕“一流学科”开展数据素养教育的意识观念,故而数据素养教育活动仍然孤立于学校发展的大局,对一流学科建设的保障服务作用较为有限。
(3)教育内容的信息化水平不高,严重限制了数据素养知识的扩散。数据素养教育讲座培训、学分课程、在线教育等注重现场教学,有场地人数和讲授时间的限制,所能提供的学习机会较为有限,而后期其教育内容的课件、视频等又较少出现在图书馆网页上以供下载,不能满足未到现场师生的自主学习要求,不利于数据素养知识的传播与扩散。
本文以38所“世界一流大学”建设高校的图书馆为研究对象,对其数据素养教育的内容展开实证分析。研究发现,样本高校图书馆中各种形式的数据素养教育正如火如荼地开展,教育工作的主导性、计划性较好,但不同高校间供给差距较大,且教育常态化、对象明确性、服务功能性仍待加强。就数据素养教育内容而言,现阶段高校图书馆侧重于数据获取、分析与交流能力的培养,以及资源推介、科研助力与软件工具等模块的教育,目前尚存在重技能而轻意识、未与一流学科建设相契合及教育内容信息化水平不高等问题。
针对以上问题,现提出如下对策建议,以期改进今后的数据素养教育工作。
(1)重视数据意识、伦理与评价教育,提高数据素养教育的系统性。数据意识、伦理与评价是师生数据素养教育的基础性因素,是创新型人才形成敏锐严谨的数据态度、坚守学术规范的基本保证,是数据素养教育系统中不可或缺的重要内容。因此,各图书馆不仅应利用现有的知识产权讲座、学术规范及科研诚信等讲座来加强数据意识、学术规范与严谨性的教育,也可制作相关的宣传手册、视频、书籍等通过剖析案例加深师生认识,还可利用图书馆新媒体手段将数据意识伦理教育渗透数据素养教育日常。
(2)抓住一流学科建设契机,开发数据素养教育深层次服务。“双一流”建设是现阶段我国高等教育的重要主题,高校应抓住该发展契机实现内涵式发展,图书馆各项工作也应服务于一流学科建设。对于数据素养教育服务工作,不仅应充分开展线上线下调查,为高校重点学科的数据库、文献资源和特色馆藏建设提供咨询建议,而且应完善馆院协作机制,针对优势学科定制数据素养教育专场,也可将数据素养教育内容能动地嵌入重点学科的专业教学中,还可针对学科制定数据管理计划,响应学科教研人员需求提供数据管理服务,以期从各方面助推重点学科发展。
(3)提高教育内容的信息化水平,发挥数据素养教育的正外部性。高校图书馆应在征得教育者同意的基础上,对数据素养课件和视频进行整合处理并公布在图书馆相关专题网页上,提高数据素养教育的信息化水平,使有需求的师生可不受时空限制并有针对性地进行甄选学习,充分发挥教育活动的正外部性。
(4)科学制定数据素养教育实施方案,提高受众学习效率效果。首先,积极建立一支以内源师资为主的数据素养教育队伍,掌握数据素养教育活动安排的主导权;其次,科学安排教学内容,明确教育对象,提高数据素养教育的常态化、例行性水平,制定周期性的教育活动计划,使广大师生可根据需要从容选择;最后,定期开展数据素养教育实施效果的反馈,评估教育活动绩效,及时针对不足进行调整改进。