郑新 吴荣霞
【摘要】本文研究了数据密集型科研范式下高校图书馆的数据素养教育,阐述了数据素养的概念,数据素养教育的内容和模式,以期为我国高校图书馆数据素养教育提供借鉴。
【关键词】大数据;数据素养;数据素养教育
在E-Science环境下,科学研究范式向数据密集型转变,数据驱动科研发展进程成为这一科研模式的主要特征。数据作为一种重要的学术信息资源,真实记录了科学研究的全过程,对科学研究成果具有直接的支撑和佐证作用。在此背景下,科研人员面临着数据管理与利用能力的严峻挑战,而数据素养作为数据管理范畴的主要概念,日益受到重视。高校图书馆作为数据素养教育的重要阵地,理应发挥资源优势,履行自身职能,加强数据素养教育,提高科研人员的数据管理能力。
一、数据素养的概念
近年来,数据素养成为大数据领域的研究热点,用于表述数据素养的术语很多,包括数据信息素养、科学数据素养等。Canada Prado和Marzal认为,数据素养是使个人能够访问、解释、批判性评估、管理、处理并合乎道德地使用数据的能力。Mandinach和Gummer将数据素养定义为理解并有效地使用数据来为决策提供信息的能力,这是一种具体的技能,使我们能够将数据转换为信息和最终成为可操作的知识。归纳关于数据素养定义的各种描述,笔者认为,科学数据素养是在科学研究中收集、处理、管理、评价和使用数据的知识和能力。
二、数据素养教育内容
(一)数据意识教育
数据意识是数据素养的先导,主要是指科研人员能够意识到数据在科研实践中的重大作用和所蕴含的重要价值,具备敏锐的数据感知能力,对高价值数据进行甄别。当前,数据管理在许多情况下是在机构层面运行,对学术界用户服务的需求响应有所缺失。因此,对于研究人员来说,数据素养教育首先应该是意识形态教育,即让研究人员了解数据的基本术语、关键概念、政策、个人角色和责任,并培养用户需求。
(二)数据技能教育
数据技能是指用户所具备的与数据相关的基本技能,具体指数据获取、存储、处理的能力。主要包括教授不同学科领域的数据资源类型格式和数据分析软件,围绕科研项目的生命周期提供数据管理指导,使研究人员熟悉科研生命周期和数据生命周期,并具备查找、分析、管理、利用和分享不同主题领域的知识和数据的技能。
(三)数据应用教育
数据应用指培养学生利用数据解决问题,或通过对数据的分析、处理、运算得出科学结论的能力,它是数据素养教育的最终目的。强调研究人员进行数据挖掘、数据发现,能够利用数据资源发现问题、分析问题和解决问题,甚至为特定研究项目创建数据管理计划的能力。重点是技能和实践培训,将数据素养真正嵌入用户的需求环境中,为用户的最终数据应用提供决策参考和运用指导。
三、数据素养教育模式
(一)嵌入式数据素养教百
嵌入式数据素养教育模式将科学数据素养教育的内容嵌入专业课程教学中,将图书馆科学数据素养教育作为各学科课程目标的组成部分。它不仅完成了专业教学,还要求学生掌握科学数据管理的知识和技能,并使用科学数据来解决专业问题。嵌入式教育渠道多种多样,可以嵌入专业课程、科研项目、图书馆服务、网络教学平台等。不同的学科主题领域,对数据素养的要求不同。例如,社会学强调数据收集和统计分析的能力;经济学强调数据分析和建模能力;生物信息学强调使用计算机作为存储,检索和分析生物信息的工具的能力。因此,嵌入式数据素养教育对数据图书馆员的专业性提出了很高的要求,需要与专业教师合作,共同开展课程设计,并承担科学数据素养教育模块教学。
(二)基于科学数据生命周期的全程教育
科研项目生命周期与科学数据生命周期是相互关联、相辅相成的关系,科研项目的推进过程中产生了大量数据,科研数据工作的递进又佐证了科研项目的完成。科学数据生命周期可大致分为五个阶段:数据采集、数据生成、数据存储和管理、数据保存和共享、数据引用和发布,图书馆可以根据科学数据的生命周期开发一个全过程数据素养教育模型。“数据收集阶段”是科研项目的启动阶段,在此阶段,图书馆可以介绍数据管理的基础知识并协助制定数据管理计划;“数据生产”和“数据存储与管理”贯穿于科研项目的整个研究阶段,课程侧重于教授如何使用分析软件进行数据分析并使用元数据来描述数据集。“数据保存和共享”阶段教授如何充分保护和利用所产生的科学数据。“数据参考和出版阶段”是科學数据生命周期的最后阶段。在这个阶段,大学图书馆主要开展数据参考学术规范教育,教授数据伦理和引用规范知识,以促进数据合理合法的利用。
(三)MOOC数据素养课程
在高等教育界备受关注的MOOC平台,是对传统教学课堂教学模式的重大变革。其利用互联网技术和移动通信技术,为用户提供了不受时间和空间限制的自主学习模式,是开展数据素养教育的良好方式。MOOC以学习者为中心,为学习者提供个性化的教育服务。充分激发学习者主观能动性和提高学习效率。许多欧美高校主流的MOOC平台都被纳入了数据素养类课程,开设了数据管理与可视化、数据分析工具、数据科学、机器学习等课程,充分关注学生对数据管理知识、能力和技能的需求和愿望。我们应有效利用MOOC平台,实现专业教学和科学数据素养的相互渗透和提高。