付 超
(贵州广播电视大学 贵阳 550004)
长时期以来,数据素养被认为是科研人员、图书馆馆员、学生、教师等特定人群的核心素养之一,是大数据时代信息素养的拓展与深化。以“数据素养”为检索关键词,国内目前共有242篇相关研究文献,导出文献之前进行数据清洗:删除通知、简讯、报道、重复和无关键词字段等不符合要求的文献,最终得到与数据素养相关文献237 篇。
数据素养已有的研究主要围绕教师、学生、医生、图书馆员、记者、编辑等群体展开,以教师、学校管理人员等教育工作者为研究主体的文献有41篇,以学生(研究生、本科生)为研究主体的文献有25篇,以图书馆馆员为主体的研究文献有18篇,以编辑、记者等科研人员为研究主体的文献有9篇,以医生等医务工作者为研究主体的文献有4篇。然而,仅有2篇文献以公民为研究主体,如《大数据时代:如何提升公民的数据素养能力》(任以姝,2016)和《大数据背景下公民数据素养提升策略探析》(付超,2018),阐述了大数据背景下对全体公民(而不是特定人群)进行数据素养培育的重要性[1]。以上数据表明,在已有的研究文献中,数据素养被认为是特定人群应当掌握的“技能”或是“从业准则”,是少部分人的事情。
数据素养的定义在国内尚没有统一的界定,国内具有代表性的数据素养定义研究主要基于数据管理视角、数据利用视角及起源视角进行的。数据管理视角的代表观点有科学数据素养是指科学研究中收集、加工、管理、评价和利用数据的知识与能力,这种能力并非基于文献价值,而是强调在科研过程中对数据产生、操作和使用数据集的能力(秦建,2015);黄如花等认为数据素养是信息素养的扩展,是人们亟待通过教育提高的一项技能(黄如花,李白杨,2016)。数据利用视角的主要观点有孟祥保的具备数据意识,具备数据基本知识与技能,能够利用数据资源发现问题、分析问题与解决问题(孟祥保,2014);沈婷婷认为数据素养就是对数据的‘听、说、读、写’等能力,也是对数据的理解、交流、获取、运用能力,同时还要具备批判性的思维(沈婷婷,2015);李青等认为数据素养是大数据时代信息素养的内容[2],通过分析研究国外教师数据素养教育现状指出当前我国教师数据素养提升的重要性(李青,任一姝,2016)。起源视角认为数据素养源于信息素养、量化素养、统计素养、科学素养(黄如花,2015)。总之,不同的学者基于不同的学科背景、工作领域、研究对象等因素,对数据素养研究的内容各有侧重。数据素养概念的认识和界定决定了数据素养需求调查内容、评价指标、评价主体、评价客体、素养模型、教育模式等的不同。
从已有的文献研究来看, 数据素养的研究范围主要集中在各级各类学校(含关键词“教育”),如高校(顾瑞,卢加元,2018;赵立平等,2018)、中小学(赵虹元,2017)等,图书馆(魏来,王思明,2018),医院(伍娟,2018),新闻媒体(许向东,2017;金兼斌,2016)。研究领域主要有,人文社会科学领域如图书情报学(王显,2014)、新闻传播学领域(金兼斌,2013);自然科学领域如数学(陈娜萍,2013)、物理学(项华,2011)等。这表明,目前的数据素养研究具有从 “小处”出发的特点,通过对特定范围内人群数据素养的研究,有助于提升数据素养研究的针对性。但是,也可以这样理解,大多数研究者认为,数据素养仅仅是特定范围的人群才有必要具备的素质。
任何研究都是有其目标定位的,也就是研究的目的标准。就数据素养研究现状来看,有规范科研人员科研行为的,如《期刊编辑数据素养研究——以B学报今年来载文情况为例》(李世红,2018)、《编辑的大数据素养与实现路径》(禹卫华,2017)》;有提升教师教学能力的,如《教师数据素养评价指标体系研究》(李青,2018)、《小学教师大数据素养培养的理据和要求》(曾碧锋,2018);有帮助学生提高研究能力的,如《基于胜任特征的研究生数据素养能力测评量表研究》(张晓阳,李楣,2017)、《教育技术学本科本科生数据素养模型及提升策略研究》(尹爱青,2017)、《基于大数据的师范生数据素养培养策略研究》(张斌等,2017);有规范医生医疗及服务行为的,如《医生大数据素养问题研究》(伍娟,2018)》;也有助力科学教育或是具体某一课程的,如《数据素养与数学概念相融合的课改研究——以概率论与数理统计为例》(葛明星、苏永刚,2018)、《大数据时代大学生数据素养的培养:内容与策略——以<消费者行为学>课程教学为例》(张秋红,2018);还有针对图书馆馆员的,如《由信息素养馆员向数据素养馆员转型:动因、模式与路径》( 焦海霞,2018)。
检索到与数据素养相关的237篇文献中,有163篇发表在图书情报类期刊上,如《图书馆理论与实践》《 图书馆学研究》《 情报资料工作》等;102篇发表在教育类期刊上,如《 中国成人教育》、《 电化教育研究》、《 中国远程教育》等;31篇发表在出版、新闻与传媒类期刊上;11篇发表在经济与管理类期刊上;8篇发表在医药卫生科技类期刊上。①以数据素养为篇名的研究文献主要发表于图书情报类期刊,占比高达67%。一方面是期刊定位的原因,另一方面也是最重要的原因,据笔者分析,在多数人看来,数据素养是特定人群特别是图书馆馆员才应该具备的素质。
发表的刊物层次主要反映两个问题,一是文章的质量和影响力;二是“数据素养”主题文章在学科发展中的受重视程度。在检索到与数据素养相关的237篇文献中,有90篇发表在中文核心期刊上,99篇发表在CSSCI来源期刊上,这两者加起来是189篇,却没有文献发表在CSCD、EI、SCI来源期刊上。考虑到部分期刊既是中文核心期刊,同时又是CSSCI来源期刊,因此,发表在这两种期刊上的实际文献数量是低于189篇的,这表明,当前“数据素养”研究质量有待提升。随着大数据的深入发展,有关数据素养的研究文献会更多,质量也亟待提升。
中国知网收录以“数据素养”为篇名的文献最早是从2011年开始的,2011年收录了2篇,2012年收录了1篇,2013年收录了6篇,2014年收录了9篇,2015年收录了22篇,2016年收录了62篇,2017年收录了70篇,2018年收录了70篇。由此看出,一方面,国内对数据素养的研究起步比较晚,而西方发达国家早在20世纪90年代就开始了数据素养方面的研究;另一方面,国内数据素养研究文献的数量在近几年呈现出较为快速的上升趋势。尽管国内数据素养研究文献的数量在总体上呈现出逐年增加(除2012年减少之外)的趋势,但仍然有极大的提升空间,因为只有基于一定数量的研究基础才能有质的提升。
我国虽然从2011年就开始了数据素养的研究,但研究内容主要集中在数据素养的含义界定、基础理论、国外典型案例、先进经验的介绍、适用于小范围的评价体系研究、针对特定领域和特定人才的数据素养教育研究等方面,无论是从研究的深度还是从广度而言都有极大的提升空间。随着我国大数据的不断发展,数据素养研究不应该囿于部分人群和领域。目前,面向公民的数据素养教育、评价指标体系以及分类研究匮乏,大部分还停留在基础理论研究阶段,甚至没有形成学界公认的、统一的数据素养定义。
任何学术研究的成功,都离不开量大、质优的研究成果,当然也离不开相当数量且基于不同学科、不同背景、不同视角的科研工作者。从国内研究现状来看,目前虽有大量的科研工作者对数据素养进行了一定程度的探讨和研究,但尚未形成在全国甚至是国际上有影响力的研究者或研究团队,也缺乏相应的持续性的跟踪研究和实践,难以形成“百家争鸣、百花齐放”的学术氛围,这将影响科研工作者对数据素养发展动态和前沿研究的把握,一定程度上阻碍了数据素养的深入研究与应用。
已有的数据素养研究文献在研究方法上呈现出多元化的特点,主要研究方法有文献研究法、问卷调查法、访谈法(包括个人访谈和群体访谈)及案例分析法。通过多元化的研究方法,国内数据素养研究虽然取得了值得肯定的成绩,但是与美国、欧盟等国家数据素养研究取得的成就相比,还是存在明显差距。特别是国内数据素养研究重实用轻理论倾向明显,数据素养的丰富实践没有得到理论升华,更别说理论对实践的有效引导。数据素养的含义在国内至今都没有得到被大多数研究者认可的统一界定,能够经得起实践检验的新理论、新思想、新方法与新观点难得一见,也缺乏微观尺度的个案深入刻画和宏观层面的社会文化解读。
已有研究认为数据素养是特定人群或是特定领域的人才应具备的基本素质,这种普遍观点显然不符合国家大数据发展趋势的要求。本文认为,数据素养绝不仅是少数人的事情,对数据素养的研究也不应该限定在特定范围或领域。在大数据时代,大到国家、小到公民,以及各种社会组织如政府机构、非政府组织、企业等同样需要过硬的数据素养,数据素养是制约一个国家和地区大数据向纵深方向发展的关键因素。
趋势一,注重公民数据素养意识的养成。公民数据素养意识的养成是一个循序渐进的过程,需要全社会的积极参与。我国大数据发展突飞猛进,数据产业和数据经济得到了前所未有的重视与开发,但相应的公民数据素养并未同步跟上。本文认为,数据素养是制约大数据向纵深方向发展的“软件”因素,而这种“软件”因素在大数据发展的初期并未凸显其制约功能,所以我国不少地区依然只重视大数据产业、大数据经济、大数据硬件设施的发展,却鲜有提升公民数据素养的意识和决心。可是,随着大数据的深入发展,数据素养的“软件”制约功能会越来越明显。因此,数据素养的提升和建设需要由政府主导,各级教育行政主管部门、图书馆、各级各类学校、公司企业,特别是广大公民积极参与。加强对公民数据素养意识的培养研究,是今后数据素养发展的重要趋势。
趋势二,研究符合我国国情的公民数据素养评价指标体系。当前,国内尚未建立一套得到大家公认的数据素养评价指标体系,已有的评价指标体系主要从数据收集、数据管理、数据评估、数据应用等知识阈,或是从数据意识、数据能力、数据道德等能力维度进行评价。与数据素养研究较发达的英国、美国相比,我国现有的数据素养评价指标体系无论是从覆盖面还是从深度、系统性、科学性、可行性等方面来看,都还有极大的研究空间。因此,形成一套科学合理的数据素养评价指标体系是今后我国数据素养研究的重要努力方向。我国可以在信息素养评价指标的基础上,合理借鉴欧盟数字素养、美国21世纪核心素养等成功经验,结合实际,建立一套维度明确、层次分明、相互连接的科学评价体系,加强对不同情境下用户数据素养特征的挖掘,并在价值取向上体现用户导向、嵌入流程、数据驱动等精神,最终建立一套能够形成共识的数据素养标准指南。
趋势三,注重数据素养研究对象的全覆盖。本文认为,数据素养绝不仅是少数人的事情,对数据素养的研究也不应该限定在特定范围或领域,大到国家、小到公民,以及各种社会组织如政府机构、非政府组织、企业等同样需要过硬的数据素养。在大数据时代,每一个公民都是集数据的生产者、使用者、受益者等多种角色于一身。提升公民数据素养,既是大数据时代背景下公民的社会责任,也是公民个人追求美好生活和自由的保障。为避免公民在大数据使用过程中陷入“既受益又损益”的尴尬局面,数据素养研究对象必须实现全覆盖。因此,如何最大限度的维护公民数据权益,减少数据损益,将成为今后面向公民的数据素养研究的重要内容。
趋势四,注重数据素养的分类研究。在大数据环境下,公民集数据使用者、传播者、受益者、损益者等多重角色于一身,但由于专业、职业、个人发展以及个人偏好的影响,个体对数据素养的要求各有侧重。因此,未来数据素养的分类研究会在细化和针对性上下工夫,加强对“用户需求”的研究和探索,兼顾用户的显性与隐性数据素养需求。已有的数据素养需求研究基于某一专业或某一职业用户数据素养需求的规律,比较了不同专业、不同职业用户的数据素养需求特点。未来的数据素养需求研究基于已有研究,可从用户专业或职业的角度出发,既探讨用户的专业需求,也要揭示用户的一般性需求。在此,我们将数据素养需求分为三类:第一类是面向所有公民和组织的数据素养需求,即基础性数据素养;第二类是以专业或职业为标准划分的针对特定人群如教师、学生、图书馆员等的数据素养需求,即专业性数据素养;第三类是针对特定的数据人才如数据算法师、数据分析师的数据素养需求,即创新性数据素养。
趋势五,更加注重数据素养教育研究。数据素养教育研究应在公民数据素养教育的针对性和实效性上狠下功夫,分门别类地开展基础性数据素养、专业性数据素养和创新性数据素养教育,同时注重数据素养教育与实践的有机结合。第一,应明确数据素养教育对象,提高数据素养教育的针对性。第二,必须明确数据素养教育理念、手段及要达到的目标。第三,开展“以学习者为中心”的数据素养教育需求调查研究,为他们提供切实需要的数据素养教育,摈弃传统的“以教师为中心”的教育理念,以用户需求为导向提升数据素养教育中“学习者”的积极性和主动性。第四,形成多元化的教育模式和手段,充分采用“MOOC”“翻转课堂”等教育模式,运用案例学习法、项目教学法、PBL教学法等信息素养教育方法,形成多元化的教育模式和手段,达到全面提升公民数据素养的目标。
注释
①部分期刊属于综合性期刊,具有交叉性、综合性的特点,典型的有《浙江传媒学院学报》《比较教育研究》等刊物,其定位多元化。故此部分出现子数据相加后超过实际总数据的现象。