美国数据素养课题剖析与启示*

2019-01-18 01:45孟祥保符玉霜
图书与情报 2018年5期
关键词:数据管理课题素养

孟祥保 符玉霜

(1.东南大学图书馆 江苏南京 211189)

(2.深圳图书馆 广东深圳 518036)

1 引言

数据素养是科研人员、图书馆馆员的核心素养之一,是大数据时代信息素养的拓展与深化。数据素养一般包括三个层次:一是具有数据意识,将数据作为一种重要资源;二是具有数据相关的基本知识与能力;三是能够以批判方式运用数据资源发现问题、分析问题与解决问题。数据素养研究目前多集中在数据素养概念,数 据素养教育课程设置调查、不同群体的数据素养能力评价、各国高校开展数据素养教育实践经验总结、数据素养教育模型、数据素养教育策略等方面,关于数据素养课题梳理方面的文献研究尚不多见。事实上,欧美等国家早已开展了大量数据素养课题研究,如英国联合信息系统委员会(Joint Information Systems Committee,JISC)资助的RDMRose项目,美国数据素养课题的研究数量更多。

本文以数据素养课题为切入点,主要基于三方面原因:(1)科研课题尤其是国家级课题能够集中体现数据素养研究领域当前重点问题,是透视学科热点与发展动态的一面镜子;(2)数据素养教育实践的深入发展需要理论支撑,数据素养课题研究为实践发展提供理论源泉与实践素材,及时了解理论研究成果能够更好更快地将理论成果转化到教育实践活动之中;(3)数据素养研究具有学科交叉性,了解其他学科领域的数据素养研究有助于增进数据素养认识,深化数据素养研究,促进数据素养教育发展。本文通过调研美国数据素养课题概况及其典型案例,从课题基本内容与成果价值两个角度深入剖析,进而为我国数据素养研究与教育实践提供参考。

本文的主要研究方法是:(1)网络调查方法,检索美国国家科学基金会 (National Science Foundation, NSF)、美国国家人文基金(National Endowment for the Humanities,NEH)、美国博物馆与图书馆服务协会(Institute of Museum and Library Services,IMLS)等基金网站,收集数据素养课题相关资料;(2)个案研究方法,研究数据素养课题典型案例,通过网络调查、期刊论文、引文追溯等多途径收集资料,类型包括课题网站、课题公开出版的期刊论文、会议论文、学术专著、会议报告等成果。

2 美国数据素养课题的特征与价值

2.1 总体特征

美国数据素养课题无论是在数量方面,还是在研究深度与广度上,抑或是成果影响力方面,都具有可借鉴性。从具有代表性的美国数据素养课题(见表1)。可以看出,美国数据素养研究课题具有如下特征:

(1)资助级别高、力度大。美国自2002年已经开展数据素养探索研究,一直延续至今。NSF、NEH、IMLS等多种高级别基金相继资助了数据素养课题,推动了该领域的发展。在资助力度上,少则数十万美元,多则百万美元,如课题1资助经费为1,717,708美元。这从侧面也反映了美国对数据素养研究的高度重视。

(2)具有跨学科性,涉及图书情报学、计算机科学、教育学、考古学、语言学等学科。跨学科也意味着数据素养研究具有复杂性和基础性。申报单位也较为多样,包括专业学院、图书馆、档案馆、天文台、科学馆等,这些机构通过课题研究或教育实践,在促进数据素养、缩小数据鸿沟方面发挥了积极作用。

(3)研究问题更为具体与细致,具有较强的问题导向性。各个课题对批判性数据思维能力训练、数据素养教育课程开发、数据可视化技术应用等问题的研究各有侧重,如课题10“开发和研究一种新技术平台xMacroscope,作为一种学习工具,允许明尼苏达州科学博物馆和科学与工业中心的参观者创建、查看、理解和交互不同的数据集”,通过可视化技术促进公众数据素养提升。具体到学科领域,有专门针对考古学、语言学、教育学、天文学等学科领域的数据素养课题。

(4)广阔的应用性。数据素养教育对象覆盖了本科生、研究生、教师、馆员、科学家、普通公众等,各个课题重点解决特定群体的数据素养教育问题,如课题4旨在提高理工科本科生的科学数据素养能力,故而没有将教育对象无限制扩大。

表1 美国代表性数据素养课题

2.2 课题价值

(1)推动了数据素养研究领域的深入发展。毋庸置疑,上述课题对数据素养的核心术语、研究方法、影响因素、课程建设、工具包开发、教育机制等方面的探索研究,促进了数据素养知识体系的不断深入发展与完善。如课题2专门研究数据素养工具包Tabletop 2,整合了数据素养资源,使学生和教师能够跨主题跨年级有意义地使用数据。课题11的研究则应用了循证研究方法。

(2)促进学科发展与人才培养。数据素养的宗旨是提升研究者的数据管理能力,通过数据素养课程建设与开展,使研究者迈入数据密集型科研范式,促进包括人文社会科学在内的学科建设的科学化与规范化进程。如课题9旨在使语言学成为一门数据驱动的社会科学,提高语言学家的数据管理知识水平,实现科研的可重复性。在课程建设方面,开发面向语言学本科生的MOOC课程、面向研究生的研讨会,并开放提供培训资料。此外,学科领域的科研数据有效管理也是促进学科发展的重要基础资源,如课题7关于考古数据的管理、数据出版服务与在线数据素养教育。

(3)社会公共服务价值。图书馆、天文台、科学馆等公共服务机构,通过数据素养课程建设、教育与服务平台开发等,为特定用户提供数据服务、促进公众的数据素养。如课题11建立了通用在线数据分析平台(Common Online Data Analysis Platform,CODAP),帮助高中生直观地探索与分析数据,辅助高级数学与统计课程学习。课题6培养高中生物理方面的数据素养与科学素养。课题5则是大学图书馆为所在机构师生开展的数据素养教育服务。

3 美国数据素养课题个案剖析

在美国代表性的数据素养课题中,“为将成为下一代科学家的研究生开展教育的数据信息素养项目”(Data Information Literacy,DIL)课题无论是在资助力度、合作范围,还是成果类型与应用价值,均具有较大影响力,同时又是由大学图书馆所主持。因此,本文以DIL为研究对象,拟对其课题背景及成效、发展历程和特征进行系统分析,归纳其经验以供国内数据素养研究与教育实践借鉴与参考。

3.1 课题概况

(1)背景。2007年,NSF发布了一份关于技术驱动(又称“e-Science”)的报告,提出建立公共数字数据集的要求。2011年,NSF要求课题申请书应附有数据管理计划。数据管理科学性与规范性的不断提升,随之对研究者数据素养的要求也越来越高。2011年,普渡大学图书馆联合明尼苏达大学图书馆、俄勒冈大学图书馆、康奈尔大学图书馆向美国IMLS申请并获批数据信息素养课题,资助经费为249,391美元。DIL课题的三个核心目标是:在图书馆领域内建设数据信息素养教学基础与能力;确定适合各个学科背景的数据信息素养技能;为馆员开发一个数据信息素养模型,促使他们在研究社区中宣传与推进数据信息素养课程。课题研究对象包括教师、研究生、本科生,涉及工程学、计算机科学、生态学、农学等多个学科领域。

(2)实施过程。DIL课题由5个小组组成,其中2个在普渡大学,另外3个在其他三所大学。每个小组由数据馆员、学科馆员和至少1名学科专业教师或者研究人员组成。与一线学科专业人员直接合作的目的是确保研究成果与教师学生需求直接相关。课题实施步骤是:①文献调查与环境扫描阶段,了解该学科文献是如何解决数据管理问题,如数据管理概念、数据管理相关问题、专业术语、数据管理最佳实践与标准、数据管理教育路径方法等;②访谈阶段,利用普渡大学开发的数据管理工具包(Data Curation Profiles Toolkit)来发现用户数据管理教育需求。每个学科团队都进行访谈,访谈对象包括教师、研究生、博士后、研究助理等。访谈过程中还观察科研人员的具体数据处理与管理活动,获取第一手资料;③课程设计与教学开展阶段,每个研究小组根据特定学科的具体需求设计相应的课程,并开展各种形式的教学;④教育干预与评估阶段,在实验室或课题内进行干预,通过评估学生成绩以及学生、教师的态度来确定教学的相关性和有效性。然后,研究小组对干预措施进行汇总分析,总结各自数据信息素养教育的模式并解释差异性;(5)建立数据信息素养模型,为后续相关研究提供一个可参考的程序与方法。

(3)课题成果。DIL课题成果丰富、类型多样,既有学术专著、期刊论文、会议论文等学术成果,又有教学案例、访谈工具、课程材料等实践成果,理论研究与实践应用并重。理论成果方面,2015年,普渡大学出版社出版了课题学术专著 《数据信息素养:馆员、数据与新一代研究人员的教育》(Data Information Literacy:Librarians,Data,and the Education of a New Generation of Researchers),在《门户:图书馆与学术》(portal:Libraries and the Academy)、《数字管理国际杂志》(International Journal of Digital Curation)、《大学图书馆学报》(Journal of Academic Librarianship)等学术期刊发表多篇学术论文,在数字图书馆联盟(Digital Library Federation)论坛、科研数据研讨会、科研数据与获取保存峰会(Research Data and Access and Preservation Summit)、第八届国际数字管理会议(8th International Digital Curation Conference)等学术会议上宣读课题成果或展示海报。2013年9月,普渡大学还主办了数据信息素养学术研讨会。实践成果方面,课题开发了工程学、电子与计算机工程、工业与生物工程、自然资源、土木工程、生态学、农学领域的数据信息素养案例,每个案例包括案例内容描述与补充材料,为其他机构开展数据信息素养教育提供了示范与参考。此外还开发了数据素养访谈工具表。明尼苏达大学图书馆还设立了一门结构与土木工程研究生的数据管理在线课程,内容包括数据管理概述、数据需要被管理、数据组织与数据文档、数据获取与所有权、数据共享与再利用、长期保存技术、完成个人数据管理计划7个模块。

3.2 成果价值

(1)在理论上,界定了DIL概念内涵及维度。数据信息素养是数据素养、统计素养、信息素养和科学数据素养的组合或整合。通过系列访谈,DIL 课题确立了数据信息素养的12项核心能力:数据库与数据格式简介、数据发现与获取、数据管理与组织、数据转换与互操作、质量保证、元数据、数据监管(Data Curation)与再利用、实践文化、数据长期保存、数据分析、数据可视化、数据伦理(如数据引用)。该定义的特点在于:将研究人员视为数据产品的生产者和消费者,数据创建过程也是数据消费的过程,体现了图书馆“以用户为中心”的理念;数据信息素养能力是基于数据管理生命周期的视角,体现出数据信息素养能力的独特与价值。

(2)在工具上,开发了DIL教育测量工具。DIL课题分别开发了面向教师、研究生的数据信息素养访谈工具包。面向教师的访谈表模块包括数据集、数据集的生命周期、认识数据、获取外部数据、格式、工具、数据组织与描述、文化实践与伦理行为。面向研究生的访谈表模板包括:数据集、数据集的生命周期、数据管理、数据记录与描述,获取与利用外部数据、数据共享、知识产权与伦理、数据长期保存、教育需求。访谈工具包包括访谈表和访谈手册,访谈表由教师或研究生填写,当问完一个问题时,访谈工作人员会询问访谈手册中的后续问题。正是通过科学规范的访谈,才能获得第一手资料,从而能够较为准确识别师生数据信息素养需求并做出合理排序。课程在教学案例开发及相关研究中均使用了此工具包。为其他高校、学科的数据素养需求调查提供了可借鉴的工具,同时也为数据素养评价提供了思路。

(3)在方法上,构建了DIL课程案例开发模型。DIL课题提出了一个完整的数据信息素养课程案例开发过程模型,该模型包括规划、开发、实施与评价四个阶段(见图1):

图1 数据信息素养课程案例开发四阶段模型

各阶段的主要任务是:①规划:主要任务是识别合作者、建立推广策略、收集学科信息和机构信息。与馆员合作开发教育案例是最为可靠的策略之一,成功的关键因素之一是了解各个学科领域内数据管理规范并尽可能纳入数据信息素养教育之中;②课程开发:主要任务是资源配置、课程开发、教学内容建设。资源配置需要考虑的问题是时间、经费与专业技术成本,项目与机构资源的匹配度、项目成员等;课程开发主要是需求评估、预期成果、评估方法等;教学内容建设主要是教学素材采集与组织;③课程实施:包括教学方法的选择、提供指导;④教学评价:包括建设性地使用计划评估,规划可持续性以及分享成功的建议,以便继续发展相关案例或者开展定期服务,如康奈尔大学的评估结果表明,学生在上课前后数据素养存在显著差异,几乎都表示会把课程推荐给其他学生,该评估结果使得该课程成为图书馆定期服务。

(4)在实践上,提供了DIL教育案例素材。DIL课题在研究期间,前后开发了5个学科领域的数据信息素养教育案例,这些案例是数据信息素养教育模型建立的实践基础,也是数据信息素养教育实践范例(见表 2)。

从案例中可以发现:①教学案例的开发围绕上述四阶段模型展开,其中核心环节是明确具体需求、选择合适教学方式确定预期成效;②数据信息素养教育具有学科性,不同学科领域的数据信息素养教育需求具有差异性,在数据管理生命周期各环节、核心能力教育侧重点有所不同,如案例2侧重数据共享与元数据;③教学方式各有优缺点,主要取决于具体学科和教学对象的特点。如案例1的嵌入式图书馆服务方式,优点是教学材料能够紧密针对本科生的特定需求,能够提高学生对数据管理工具、资源与最佳实践的认识,也便于评估教学成效,缺点是需要投入大量时间。而案例4的在线课程方式,优点是课程扩展性强、教学模块可重复使用或重新组合,在线方式也有利于学生实践,但前期投入较高、需要具有较为丰富的教学设计经验和熟练的教育技术。

4 对我国数据素养研究与实践的启示

近年来,数据素养研究引起国内学界高度重视,一批数据素养方面的课题相继立项,如“数据素养对科学数据管理的影响及对策研究”“认知视角下用户科学数据素养偏差及其干预策略研究”“移动网络视域下的数据素养教育创新实践研究”“基于大数据时代用户的信息行为特征的图书馆数据素养教育研究”“大数据时代教师数据素养能力构成和发展研究”等,这些课题无疑促进了数据素养的发展,但是也存在概念模糊、本土案例缺乏、实践发展缓慢等不足。美国数据素养课题无论是理论成果,或是实践案例,抑或是研究思路与方法,对我国数据素养研究与教育实践都具有积极的借鉴意义。

4.1 界定研究边界,细化研究主题

核心概念上,数据素养、信息素养、数据信息素养、科学数据素养、统计数据、媒介素养和元素养等概念不断涌现,国内学界一般将“数据素养”等同于“数据信息素养”,因此首要问题是准确厘清这些概念之间的区别与联系。研究宗旨上,以“人”的发展作为最终归宿,以提高公众的数据意识和能力为根本目的,把数据创建过程和数据消费过程统一起来。研究对象上,学术图书馆应以包括教师、研究生、本科生为对象,具体研究中应注重学科的差异性、群体的差异性。公共图书馆应以公众为对象。价值取向上,应强调数据素养对于图书情报学、教育学、新闻学、生物学等专业研究与学科发展的贡献,证明数据素养对于公众生活的价值。研究选题方面,国内目前研究问题较为泛化,今后应细化研究主题,选择社会现实与学科发展需求的重点问题,具有较强理论性与实践性的热点问题,而美国数据素养课题的发展历程正符合这一发展趋势。

表2 数据信息素养教育案例

4.2 开展数据素养跨学科研究与对话

如前所述,数据素养课题具有较强的跨学科性。数据素养的基础性和复杂性决定了研究问题的综合性,需要跨学科研究。“从知识发展的逻辑上来看,‘混沌—分化—整合’式螺旋上升的路线是科学知识发展的一般路线”,数据素养作为新兴研究领域,诸多问题还存在争议、研究议题也较为宽泛、研究方法较为单一等问题。因此,在研究视野上,应以开放与广阔的视野加强跨学科研究与对话,积极吸收国外数据素养研究成果、加强本土研究,为我国数据素养教育提供理论支撑与教学资源。在研究方法上,在注重文献研究、问卷调查、深度访谈等传统研究方法基础上,还应积极吸收与应用自我民族志、学习分析技术、眼动追踪研究等新方法与新技术应用,加强实证研究,深化研究深度。在学术交流上,通过笔谈、学术论坛、专稿等形式,促进不同学科之间的对话,激发数据素养研究活力。

4.3 分层次实施数据素养教育活动

数据素养在实施上,需要社会各方力量的参与,构建数据素养培养机制,分层、有序、联动推进数据素养发展。(1)宏观上,不断完善国家层面的数据管理政策,大力发展数据素养教育,提升全民数据素养。2015年,国务院印发了《促进大数据发展行动纲要》,提出要加强数据专业人才培养,“依托社会化教育资源,开展大数据知识普及和教育培训,提高社会整体认知和应用水平”。《关于高等学校加快“双一流”建设的指导意见》指出:“推进信息化实践教学,充分利用现代信息技术实现优质教学资源开放共享,全面提升师生信息素养”,数据素养是其中不可或缺的部分;(2)中观上,在教育目标、教育主体、教育资源建设、教学方式等方面有规划有步骤开展。开发适用于不同教育对象的数据素养课程,开展数据创新应用大赛等活动。大力发展形式多样、灵活的数据素养教育方式,尤其是要建立数据素养MOOC课程,如香港地区大学的《开发与实施共享多媒体课件,提高香港高校信息素养》项目,是香港8所大学通过合作方式,建立高校信息素养教育共享MOOC课程。合作、共享、在线课程有利于节约资源、发挥合作伙伴的群体智慧与力量。同时,从上述分析来看,高校图书馆是数据素养教育的重要主体,在数据素养教育发展中应积极行动起来;(3)微观上,发挥信息技术的作用,实施启发式、嵌入式教学,利用微博、微信等新媒体,促进教与学的交互、协作与交流。

4.4 注重教学方式的整合性

在教学内容建设上,根据数据素养课程性质与教学对象,确定课程内容范围与主题。数据素养通识课程应选择数据管理核心概念、工具、方法与案例方面的教学素材,并按照数据管理生命周期进行组织,从而体现数据素养课程理论性与实用性、数据管理知识体系的完整性和关联性。如爱丁堡大学数据图书馆与北卡罗来纳大学教堂山分校联合建设的《数据管理与共享》MOOC课程,包括科研数据基本概念、数据管理计划、数据处理、数据共享与数据存储,内容覆盖了数据管理生命周期各个阶段。专题性、学科性数据素养课程应注重数据分析与创新应用,选择符合学科领域的数据分析方法与工具,提高学生批判性的数据思维能力。此外,还应注重多模态教学资源建设,如数据创新应用案例、专题数据资源、数据分析工具、研究报告等。在教学组织方式上,按照不同用户群体的学习目的与特长兴趣,整合多种教学方式。面向本科生的数据素养通识教育,以讲授式为主,尽可能建立在线共享课程,如普渡大学通过灵活的在线课堂方式,提高学生数据意识。面向研究生的数据素养通识教育或学科数据素养教育,可以通过专题研讨、嵌入式教学等方式,提高研究生运用数据解决问题能力、数据创新应用能力。面向教师的数据素养教育,以嵌入式服务为主,提供专业咨询与工具,能够解决研究人员在科研过程中的具体问题。

4.5 开发本土情境下的测量工具

目前国内主要是从传统信息素养评价思路出发,缺乏数据素养教育需求、教育成效等测评工具。数据素养的深入发展需要开发出信度效度合理、适应符合数据素养特征的一整套测量工具。信息素养测量工具很难适应数据素养测量要求,需要在理论、方法与技术方面探索与创新。(1)在理论层面,以持续改进数据素养教育成效、以促进“人”的发展为理念。构建坚实的数据素养概念模型,为本土数据素养测量设计与开发提供理论支持。数据素养测量工具要能够覆盖数据管理生命周期各个环节,能够识别数据素养教育需求识别,监测与评价课程规划、设计与实施,评估教育成效;(2)在技术方法方面,充分利用学习分析、数据挖掘、可视化等技术与方法,根据具体教学情境采集多源异构数据,提高测评的信效度。同时应注重问卷调查、深度访谈、实地观察等传统测评方法的融合应用。

5 结语

宏观上,本文较为系统地阐述了美国数据素养课题基本特征及其价值,微观上,较为深入地分析了数据素养典型课题,对我国数据素养课题资助方向、研究重点、研究路径、教育实践等具有积极的借鉴意义,尤其是对我国大学图书馆数据素养教育具有实践参考价值,但也存在研究视角较为单一、缺乏案例比较研究等不足。在今后的研究中,可在数据素养课题研究成果量化研究、数据素养课题与图书情报学学科建设的关系、数据素养课题与图书馆服务的互动关系等方面进行更为深入地研究,同时,也应及时掌握其他国家的数据素养课题进展情况。

猜你喜欢
数据管理课题素养
企业级BOM数据管理概要
定制化汽车制造的数据管理分析
抓住本质重理解基于素养活应用
多思少箅彰显素养
一节践行核心素养的数学拓展课
数据挖掘在学生成绩数据管理中的应用研究
数据挖掘在学生成绩数据管理中的应用研究
追本溯源提升素养
第十单元 课题1常见的酸和碱(第二课时)
竹溪县实施“五个一”工程开展草根课题研究