国内外数据素养教育研究现状及启示*

2020-03-03 05:02张群印熙媛
数字图书馆论坛 2020年12期
关键词:素养课程研究

张群 印熙媛

(1. 江南大学“互联网+教育”研究基地,无锡 214122;2. 江南大学图书馆,无锡 214122)

数据密集型科研范式作为推动数据素养研究兴起的主要力量,掀起了以数据为基础的科学研究浪潮。面对数据浪潮,能否最大化挖掘数据资产的潜能、释放其蕴含的科学力量至关重要。数据素养将成为科研人员在科学研究中的必备能力与科技创新的核心竞争力[1]。2012年初,“大数据研究与发展项目”(Big Data Research and Development Initiative)启动[2],而后,数据素养逐渐成为国内外学者的研究热点。越来越多的学者从不同方面对数据素养展开了积极探索,形成了丰富的理论与实践成果。本文从数据素养教育的角度对数据素养领域的相关研究成果进行系统梳理,对理论与实践成果进一步总结、归纳与分析,以期为数据素养教育的未来研究提供参考与启发。

1 数据素养内涵

数据素养自出现以来并未形成一个普遍公认的标准性定义。关于数据素养的概念及内涵表达众多,但多数对数据能力的界定贯穿了数据生命周期所包含的各个过程。笔者梳理、归纳、对比分析目前形成共识的(文献引用率高)较有代表性的定义,可以发现大多数研究者倾向于从数据的应用能力这一角度对数据素养进行描述。国外研究者从整体性强调对数据收集、组织、分析、处理、评估等方面的能力[3]。国内研究者则倾向于对数据素养进行分层次描述[4],其中数据意识、数据能力、数据伦理是被提及的3个重要维度。除了上述整体性、分层次对数据素养应用能力进行阐述外,有学者侧重从综合能力这一角度对数据素养进行表述,表述更具概括性与抽象性[5]。还有部分学者从科学数据利用过程出发,更加具体且有针对性地解释数据素养的内涵[6]。总体来看,国内学者对数据素养的界定更偏重于个体对数据的具体实操能力,而国外学者则在数据基础操作上更加强调能够基于数据分析作出决策的更高层次能力。

随着数据素养及相关研究的发展,在数据素养这一概念的基础上,逐渐衍生出众多相关概念,如数据管理素养(Data Management Literacy)、科学数据素养(Science Data Literacy)、数据信息素养(Data Information Literacy)等,以上概念本质上与“数据素养”大同小异,但侧重于不同方面,使得数据素养这一概念拥有了被赋予更多内涵的可能性,也更加丰富了当前已有研究。

2 数据素养教育的起源

国外关于数据素养教育研究最早可以追溯到2004年,Love[5]较早论述了数据素养教育的相关研究,较详细地介绍了由国家科学基金会(National Sanitation Foundation,NSF)资助的“使用数据项目”(the Using Data Project),帮助数学和科学教育工作者发展数据素养,通过让教师参与严格的数据分析与反思对话,改进数学和科学的教与学,最终缩小成绩差距。国内有关数据素养教育的研究起步较晚。2011年,项华[7]在《论物理教育中数据素养的培养》一文中,首次将物理学科与数据素养相结合,以期通过提升学生的数据素养水平,促进信息技术与物理教学深层次整合。

数据密集型科研范式的兴起、用户的需求以及图书馆界的积极实践推动了数据素养的兴起,也由此促进了数据素养教育的不断发展与变革。美国早在2012年就推出了以科学数据素养教育为核心的系列创新项目和计划,这对数据素养教育的产生与发展起到了重要的推作用[8]。数据素养根植于信息素养[4],又不等同于信息素养,在日常生活与学习中发挥着重要作用。数据素养的培养问题不仅关系到社会整体发展水平的提升,也关乎民众日常生活质量的改善,数据素养逐渐发展成为各类主体、各层次人群所必须具备的能力。正是由于数据素养研究具有学科领域丰富性、教育形式多样性、参与主体多元化等特点,其逐渐形成的各类教育研究成果也必将持续推动学术界、教育界乃至图书馆界的不断发展。

3 国内外数据素养教育研究现状

近年来,国内外纷纷开展了数据素养教育研究,形成了丰硕的教育研究成果,国外相关理论研究与实践研究二者相辅相成、共同发展。但区别于国外,国内数据素养研究更多集中于理论探讨,实践研究更多处于探索阶段,成果数量较少,存在更大上升空间;国外数据素养教育理论及实践研究发展相对成熟。通过对国内外数据素养教育研究成果进行归纳总结,可以更加清晰地分析国内研究现状,从而更有针对性地提升我国数据素养教育研究水平。

3.1 国外数据素养教育研究现状

国外十分重视数据素养教育及数据人才的培养,较早地展开了数据素养教育理论与实践研究。以Mandinach团队为首的众多学者面向教师这一群体展开系统研究,也由此形成了丰富的理论性研究成果,包括多样的数据素养教育培养模型、数据素养教育评价工具的开发等。除此之外,也不乏学者依据数据素养教育相关理论框架,面向不同群体开展形式多样的数据素养教育实证研究,探析教育干预对数据素养水平的影响。

3.1.1 数据素养教育理论性研究

国外已有一些机构或组织围绕如何培训教师使用数据驱动教学开展了研究,并在此过程中,针对教师的数据素养能力培养设计了较为系统的能力培养体系,并形成了相应的培养模型。其中,发展较为成熟且得到普遍应用的培养模型包括哈佛大学提出的数据智慧改进过程(Data Wise Improvement Process,DWIP)模型[9],其将教师数据素养培养过程分为3个阶段、8个不同的活动。马萨诸塞州的技术教育研究中心(Technical Education Research Center)在“使用数据”(Using Data)项目中提出将培训过程分为创建使用数据基础环境、确定以学习者为中心的教学问题、运用教学数据发现问题的根源、生成解决方案及实施、监控和实现结果五阶段,从而提出了数据使用五阶段过程模型[10]。Marsh等[11]对前人提出的数据驱动决策模型加以改进,构建了数据驱动决策(data-driven decision making,DDDM)模型,包含能力建设指导、数据驱动决策过程和环境3个方面内容,用于帮助培训者理解如何建立教师使用数据的能力,见图1。以上模型均对教师在数据驱动教学培训所需技能作出明确规定,对国内外开展教师数据素养教育有重要的参考和借鉴意义。

还有部分学者致力于数据素养测评工具的开发,以实现数据素养教育结果的量化与可视化;以教师数据素养测评工具为例,可以将其归纳为问卷调查、知识测试和情境访谈3种类型[12]。Wayman等[13]开发并发表了教师数据使用量表,可从美国区域教育实验室(Regional Educational Laboratory,REL)网站免费获取该问卷及其使用手册,调查问卷共包括5份子量表,并设计了面向教师、管理者、教辅人员等多个角色的不同版本。除了收集教师的感知或态度数据外,为了提高调查结果的可靠性,荷兰学者Ebbeler等[14]开发了知识测试,且被广泛地应用在教师数据素养研究中。测试形式为包含12道开放题在内的纸笔测试,作答时间为30分钟。除问卷调查及知识测试外,Means等[15]在2009年开发了情境访谈工具,并应用于教师数据素养测量。访谈工具共包括7种情境,每种情境访谈包括模拟情境、一套数据文件和一组问题。相对于前两种测试方式,情境访谈工具操作较为烦琐,表现出了一定的主观性,且推广范围有限。

图1 数据驱动决策模型

3.1.2 数据素养教育实证研究

除了对数据素养基础理论进行研究外,许多研究者从不同的角度围绕数据素养教育这一主题开展了多种多样的实证研究,Gummer等[16]基于实证分析,提出了一个新的知识和技能概念框架——数据素养教学框架,并指出可以将其作为今后开发数据素养测量工具的基础框架。Porat等[17]以280名初中生为被试,测量了学生数据素养的自我认知与实际水平,研究结果表明学生大大高估了自身的数据素养水平,其实际能力往往相对较低,强调了培养学生数据素养的重要性。Van Geel等[18]对上千名教育者开展了基于数据决策(data-based decision making,DBDM)的干预实验,并计划进一步调查在DBDM干预过程中教育者数据素养与提高学生成绩之间的关系。

3.2 国内数据素养教育研究现状

国内数据素养教育相关研究起步较晚,集中于高校图书馆界,并覆盖中小学、高校各学段,随着相关研究的不断发展,目前已经形成包括对比国内外研究、结合具体学科以及课程等角度探析数据素养教育的策略性研究、数据素养教育模式体系研究、数据素养教育评价研究等在内的多样化研究。

3.2.1 数据素养教育策略研究

国内许多学者对数据素养教育现状与存在问题进行探讨,并从不同角度出发为开展数据素养教育提供策略指导与建议。以欧美为主的发达国家对数据素养教育的研究较早,积极开展数据素养教育相关实践,涌现了大量数据素养教育实践案例,研究者对其进行了系统梳理与对比分析,并以此作为探索我国数据素养教育的参考与借鉴。除此之外,也不乏研究者试图从更微观的角度结合具体学科领域或课程探析如何更好地推动数据素养教育,充分体现出数据素养教育跨学科的典型特征。

宋甲丽等[19]对我国42所“双一流”高校图书馆科学数据素养教育情况进行了网络调研;隆茜[20]调研了高校教师、博士生、硕士生、本科生的数据素养能力现状;余维杰等[21]基于双生命周期理论视角,调查我国研究生的数据素养现状;张璇等[22]通过网络调研,基于数据素养能力层次与教育活动过程二维框架分析了国内外6所高校面向数字人文的数据素养教育实践活动;张新红[23]从教育对象与目标、教学课程、方式与内容等方面对国内外14所高校图书馆科学数据素养教育现状进行对比分析。上述学者均针对国内教育的问题与不足提出发展策略和建议。

聂云霞等[24]基于对数字人文视域下档案学学生数据素养培育目标的分析与总结,从教育核心、模式、手段和导向4个层面,探索数据素养培育策略。周林兴等[25]选择开设国内图书情报与档案管理学的10所“双一流”高校为调研样本,分析研究生数据素养课程设置与内容,并从需求驱动、主体构建以及资源赋能三方面对数据素养教育提出相应建议。司莉等[26]调查了38所iSchool院校、138个图书情报专业研究生项目及其所开设的4 017门课程,多维度分析了数据素养课程的设置情况和特征。沈玖玖等[27]以信息管理专业信息素养课程为基础,通过相关性分析,提炼出数据素养相关课程,通过聚类分析对课程进行模块化划分,构建了数据素养课程群。2020年9月,杨现民教授团队研制的全国首个教师数据素养课程标准《徐州市中小学教师数据素养培训课程标准》已由徐州市教育局正式发文[28]。

3.2.2 数据素养教育模式体系研究

张群等[29]综合借鉴国内外高校图书馆科学数据素养教育研究及实践成果,提出了高校图书馆科学数据素养教育体系5W模型。张群等[1]还面向研究生这一主体,提出实施有差异的分类分层的数据素养教学,并提出了嵌入式教育模式、全过程教育模式、在线课程教育模式以及全方位渗透式教育模式。蔡洪齐[30]基于对英美开展数据素养教育典型实践的分析,提出3种面向学科的高校图书馆数据素养教育模式,并提倡3种模式的交叉和综合应用。胡卉[31]基于中国科学院研究生数据素养现状与需求分析,构建了数据素养教育体系与服务模式。

3.2.3 数据素养教育评价研究

隆茜[20]以高校师生为研究对象,从数据意识、数据获取、数据处理与分析等6个维度构建了高校师生数据素养能力评价指标体系。王维佳等[32]面向科研人员,选取科研兴趣群体进行问卷调查,对18个观测变量进行因子分析,归纳得到科研人员数据素养能力的主要构成以及数据素养能力综合评价函数。秦小燕等[33]分析与归纳国外科学数据素养能力构成要素,并基于我国科研人员数据管理与利用行为的本土化研究,构建了我国科学数据素养能力评价体系。

3.3 数据素养教育实践推进路径分析

国内外数据素养教育的实践推进从3个层次展开,即制度层面推进、项目资金扶持、多元主体实施。其中,制度层面推进是上层引领,项目资金扶持是基本保障,多元主体实施是积极践履。

3.3.1 制度层面推进

美国除了在国家层面推出数据相关项目和计划外,美国教育部门还开放与基础数据统计和专业训练所需的相关知识与资源[3]。2015年9月,我国国务院颁发《促进大数据发展行动纲要》[34],在肯定数据重要作用的同时,鼓励高校大力培养大数据专业人才。2018年4月教育部发布《教育信息化2.0行动计划》[35],也大力鼓励使用大数据等新技术提高教育管理信息化水平,从而优化教育治理能力。同月,国务院办公厅印发《科学数据管理办法》[36],强调把确保数据安全放在首要位置,对如何把握好科学数据开放与保密的关系,作了原则性、政策性的规定。《中共中央国务院关于构建更加完善的要素市场化配置体制机制的意见》将大数据列为社会生产新要素,充分证明大数据是推动经济高质量发展中不可或缺的重要组成部分[37]。

3.3.2 项目资金扶持

2007年,NSF资助“科学数据管理”课程,以培养未来的科学工作者,使他们具有扎实的有关数据管理与使用的知识与技能[6]。2011年,美国博物馆与图书馆服务协会(Institute of Museum and Library Services)资助了“数据信息素养培训项目”(Data Information Literacy Projects),项目最终的目标是形成数据素养教育最佳实践,为实施DL课程建立可行的模型和标准流程[38]。目前,我国已启动2014年度教育部人文社会科学研究项目“数据素养对科学数据管理的影响及对策研究”、2017年度国家社科基金项目“大数据时代图书馆数据素养教育理论建构与实践创新研究”、2017年度教育部人文社会科学研究项目“认知视角下用户科学数据素养偏差及其干预策略研究”等。上海图书馆数字人文项目的开放数据平台陆续以关联数据的方式在互联网公开发布其数字人文项目所用的基础知识库、文献知识库、本体词表、数字人文项目建设过程中所用到的各种数据清洗和转换工具,并以REST API、Sparql Endpoint、Content Negotiation等方式提供各种数据消费接口供开发人员调用,以促进数据的开发获取、共享和重用[39]。《图书馆杂志》于2016年启动了数据管理平台研究项目,2018年正式发出关于论文上传数据的启事,要求作者在上传稿件的同时,将与论文相关的原始或一手科研数据(如通过调查法、实验法等方法获取的数据)一并上传至数据管理平台[40]。

3.3.3 多元主体实施

国外高校图书馆界十分重视数据素养的培养,在国家政策的指导及基金组织的资助下纷纷开展了形式多样的数据素养教育项目,并形成了丰富的教学模式。普渡大学图书馆创建名为“数据服务信息”的数据管理资源导航为用户提供数据文献与管理的相关资源[41]。爱丁堡大学图书馆为研究生以及信息工作人员提供MANTRA数据管理在线课程,内容涵盖基本术语、关键概念、数据管理最佳实践以及R软件、质性分析软件等多个软件的操作练习。通过以上方式最终帮助学习者整体把握数据管理的基本知识[42]。除此之外,2010年马萨诸塞大学阿默斯特分校图书馆成立数据工作小组(Data Working Group,DWG),为教师与研究生提供数据管理服务与资源,DWG还为研究生举办“数据管理基础”讲习班,培养学生有关数据管理的核心技能[43]。

我国图情界也尝试开展了数据素养教育培训及服务实践,如国家科技图书文献中心提供元数据标准服务,其元数据登记系统对元数据规范、元素集、元素及属性进行发布、登记、管理和检索,支持开放环境中元数据规范的发现、识别、调用,以及在此基础上的元数据映射、挖掘和复用[44]。中国科学院文献情报中心为研究生开设面向地理与生命科学领域的数据管理课程、面向图书馆馆员举办短期培训班等[45]。2014年包括复旦大学、北京大学、清华大学等在内的9所高校图书馆共同发起成立“中国高校研究数据管理推进工作组”,为高校开展数据素养教育提供基础保障。北京大学图书馆在《2018年行动计划》中,明确提出拓展素质教育范畴,提高全校师生的数据素养,且提出将数据素养纳入信息素养体系[46]。许多诸如中国大学MOOC、爱课程等MOOC平台也免费提供数据素养课程,成为专业数据素养教育体系的有益补充。如中国大学MOOC平台开设了《中小学教师数据素养》课程,旨在有效提升学习者的数据素养,以适应新时代教育发展的现实需求。此外,我国积极推进人工智能、大数据、云计算等行业人才的培养工作,众多高校通过教育部审批,增设大数据相关专业。2017年获批“数据科学与大数据技术”专业的高校就达到了32所,目前,开设此专业的高校已高达上百所。

4 我国数据素养教育存在问题分析

基于以上对国内外数据素养教育研究的梳理,可以看出国内外均搭乘了数据素养教育研究的列车,但是由于社会文化差异、政府、高校等主体参与度的不同,形成数量、深度、种类形式不尽相同的数据素养教育研究成果。通过对比国内外相关研究,可以发现目前国内数据素养教育研究存在的问题。

4.1 缺乏以数据素养教育为主体的实践性研究

我国在制度制定、项目资金、基层落地3个层面上推进了数据素养的教育实践,但同时存在缺乏主体针对性的问题,从制度制定与资金扶持两个层面看,国家更多投入在“数据”这一主体上,“数据素养”主体研究较少,更缺乏针对“数据素养教育”这一主体的实践性研究。从基层落地这一层面来看,数据素养教育工作主要由高校承担并且更多依附于信息素养教育实践,由此在一定程度上也受限于信息素养教育的发展。从3个实践推进层面来看,数据素养教育还存在更大独立发展空间。

4.2 亟需较完整的数据素养教育模式体系

国内外的研究范式有所区别,国外学者更偏重于实证研究,而国内学者则更将重点偏向于理论探讨。国外数据素养教育在政策引导、资金扶持下,在高校这一层面积极投入实践研究,以欧美为代表的多个国家均形成了横跨多个学科、数据素养主体与受众多元、教学体系丰富、形式多样的数据素养教育服务体系。但是国内数据素养教育缺乏顶层设计与总体架构,并未形成本土化的、较为完整且系统的模式体系,相关理论研究与实践探索均有较大的上升空间。纵观国内数据素养教育形式,更多以讲座为主,由此出现了数据素养教育“灌溉”面积有限,且“渗透”力度不足的局面,因此可以借鉴国外采用学分课程等多种形式相互补充的方法,推进数据素养教育持续且全面地发展。

4.3 缺乏面向具体对象的创新性研究

分析发现,国内数据素养研究更多集中在数据素养内涵、现状、典型案例的比较与分析等策略性研究上,但是从微观角度进行数据素养课程设置,结合具体对象构建数据素养教育模式等的“创新性研究”相对来说较为缺乏。笔者认为,数据素养内涵及构成要素等的相关理论性研究是全面开展数据素养教育的基础,但是数据素养教育研究也更应该逐渐从大范围、偏概括的理论性研究向面向具体学科类别、某一特定专业开展范围更为具体、针对性较强的实践研究过渡,使得数据素养教育覆盖更多学科、调动更多主体参与教育实践。

4.4 数据素养教育评价体系尚未形成共识

目前,国外已经形成包括问卷调查、知识测试和情境访谈等在内的较为成熟的数据素养教育测评工具,虽然国内有学者面向不同群体开发了数据素养评价指标体系,但更多研究者倾向于根据自身研究需要开发与编写数据素养测评量表,因此,国内并未形成较成熟的数据素养教育评价体系。笔者认为,一方面,这与数据素养教育的多主体、跨学科特性密切相关;另一方面,国内数据素养教育相关研究起步较晚,也是实践研究并未成熟的体现。数据素养教育评价指标体系的研究对于数据素养教育模式的选取、数据素养课程的设置、教育的提升与改进等发挥重要导向作用,应当受到更多相关主体的关注。

5 数据素养教育研究启示

基于对国内外数据素养教育已有成果的分析,笔者认为数据素养教育的研究启示主要有以下3点。

5.1 设计面向不同教育主体的数据素养教育模式

5W立体模型为面向不同教育主体的数据素养教育模式研究提供了良好的理论框架,目前已有面向研究生群体的数据素养教育模式研究。开放教育同样为教师提供了平等的学习机会,教师也可以通过提高自身的数据素养从而提升教学水平。中小学时期作为发展学生数据素养的基础时期,可以影响学生的未来学习与生活[4],除此之外,生活在大数据时代的每一个公民,都应该或多或少具备一些数据素养所要求的基本技能。正是由于数据素养教育具有主体多样性的特点,设计面向不同教育主体的数据素养教育模式显得越发重要,基于需求调研,涵盖教育实施主体、教育对象、教育内容、教育方式、教育评价等要素的教育模式作为数据素养实施的框架与指导,可以持续推动面向不同教育主体的按需开展个性化数据素养教育的有序开展。

5.2 构建面向不同层次主体的教育评价体系

相比较国外,国内数据素养评价指标处于摸索阶段,欠缺权威、全面的数据素养教学评价体系。这就导致各高校在进行数据素养教学评价时,常常根据自身需要与课程开展具体情况制定不同的指标,未能形成统一标准。除此之外,笔者认为,数据素养教育本身就具有主体多样性,不同群体(如高年级与低年级学习者、专门面向数据管理与数据分析的专业人才等)对数据素养的需求与所须掌握的数据素养能力是不尽相同的,因此,面向不同主体数据素养教育评价指标也不应使用完全统一的标准。但是,数据素养能力中的许多基本维度是各层次教育主体都应该具备的,因此,可以在此基础上,秉承“大同小异”的理念,构建面向不同层次主体的既统一又有所差异的数据素养教育评价体系,并在教育实践中不断完善评价指标体系。

5.3 依托现代信息技术开发数据素养课程

数据素养教育与信息素养教育有着密不可分的联系,数据素养的独特性就在于处理数据比处理其他任何一种类型的数据更具复杂性。而日新月异、飞速发展的社会也要求我们在拥有简单的获取、利用信息能力外,更要具备从复杂数据中挖掘与提取有用信息的能力。国内信息素养教育的发展较为完善且成熟,是数据素养教育发展的参照对象与合作伙伴,在国内仍未形成系统化、常态化的数据素养课程的形势下,借助信息素养教育开展数据素养教育成为重要的教育手段。传统信息素养类课程为大数据环境下数据素养课程的建设提供了良好的教学基础和借鉴经验,但仅仅依靠传统信息素养课程的数据素养教育已无法完全满足大数据时代的人才需求[25]。笔者认为,应依托现代信息技术,在深入挖掘教学资源的基础上,开发较为完备的数据素养课程。数据素养课程的开发,能够有效地推动数据素养教育向纵深发展,并可促进信息技术教育与数据素养教育的融合以及多元教育实施主体之间的合作。

《2017新媒体联盟中国高等教育技术展望:地平线项目区域报告》将提升师生的数据素养视为可应对的挑战,学会在特定情境中挖掘与发挥数据价值从而支持决策并解决问题的能力愈发关键,数据素养的重要性也就不言而喻。国内的数据素养教育正处于起步与发展的阶段,还存在许多值得深入探讨的问题,相信在理论研究与实践探索的共同努力下,我国会形成具有本土化特色的数据素养教育生态系统。

猜你喜欢
素养课程研究
FMS与YBT相关性的实证研究
辽代千人邑研究述论
数字图像处理课程混合式教学改革与探索
必修上素养测评 第四测
必修上素养测评 第三测
软件设计与开发实践课程探索与实践
必修上素养测评 第八测
必修上素养测评 第七测
视错觉在平面设计中的应用与研究
为什么要学习HAA课程?