刘爱琴,刘蕾蕾,尚 珊(.山西大学经济与管理学院;.中国科学院文献情报中心)
大数据时代的到来把数据的价值推向了新的高度,数据资源的作用和影响力逐渐深入,并对个人进行有效数据分析处理及决策能力提出了更高的要求。大学生作为未来研究人员的潜在力量以及大数据时代社会工作的主要创新力量,提高大学生的数据素养能力是当务之急。目前,国内外对数据素养能力的研究主要是基于研究生和科研人员的视角,从群体角度出发,分析适用于大众的数据素养能力构成要素,并没有考虑个人因素对其数据素养能力的影响;针对特殊的学科领域开展了相应的数据素养教育,但对教学成果的评估只是定性的反馈,并未形成定量的评估模型。曲德强对当代大学生数据素养现状的研究显示,硕士研究生在数据意识和数据技能两方面均强于本科生。[1]随着MOOC类教育平台的开放,传统的教育模式和学习方式在不断被更新。MOOC类教育平台与一般环境相比,其最主要的特征在于聚集、重组和个性化,因此极大地丰富了数据素养教育的课程体系,学习者可根据自己的兴趣、专业和能力持久而稳定的学习。尽管大学生接受数据素养教育的方式更自由,内容更丰富,但学习能力和效果却无法考量。因此,一套标准规范的数据素养能力评价机制亟待建立。本研究以高校大学生为研究对象,借鉴国内外数据素养教育理念、能力框架及评价标准设计数据素养要素指标,同时,考虑个人因素对MOOC平台学习效果的影响,将学生的个人因子纳入其中,构建了数据素养能力评价指标体系。并采用因子分析法实现了数据素养能力量化评定,达到了精确评价数据素养能力的目的,实现了MOOC环境下数据素养教育类课程效果的有效评估。学生可以随时对其接受的数据素养课程进行效果评估,并据此来调整自己的学习目标,在MOOC平台选择与自己目标与学科相关的课程,最终实现数据素养能力的全面提高。
从目前有关数据素养的研究来看,不同学者对于数据素养定义的关注点有所差别。如,Hogenboom认为数据素养是通过对收集数据读取、理解和转换后,将结果数据作为验证材料的能力;[2]Mandinach等提出数据素养包含了数据的解读和运用技巧,能够有效地利用信息指导决策制定;[3]张静波主张数据素养是信息素养内容的丰富,其更强调数据的解读、产生和使用技巧。[4]数据素养指在具备数据意识的条件下,在道德伦理范围内收集、检测、分析、处理、解读和应用数据信息。而一个完整的数据素养教育则应针对数据素养包含的具体内容,从通识教育层面开始,提高个体的数据主体、获取、安全等意识及数据道德观念,同时,利用数学及计算机科学知识开办数据分析及处理软件工具教学提高其数据处理技能。
目前,国内外都在开展各种模式的数据素养教育。国外许多高校图书馆针对不同学科和教学对象及目标,采用了多种形式的数据素养教育。如,哥伦比亚大学针对其新闻专业硕士生开展了有关“数据新闻”的数据素养教育;约翰·霍普金斯大学开办了数据科学系列课程,主要内容涉及数据获取、清理及分析等;普渡大学针对理工本科生开展了有关评估数据对象及网络数据库的数据素养教育来提高学生的数据来源和质量意识,同时,还面向图书馆在农业与生物工程学科领域进行了数据素养教育,但教育对象却主要选择了博士和研究生。同样,剑桥大学也创建了以考古学专业和社会人类学专业的研究生为教学对象的数据素养教育模型——DataTrain。此外,英美其他高校图书馆开展数据素养教育也主要针对研究生和科研人员。[5]
国内只有极少图书馆实施数据素养教育。中科院文献情报中心选择地球科学专业的研究生作为主要的教育对象,通过设计“地学科学数据管理”课程以提高其研究生的数据素养能力。我国高校图书馆开展数据素养教育课程的主题大多是利用数学和计算机相关知识分析处理数据,比较片面和单一,如,南京大学开展了“用Python玩转数据”的有关数据统计和可视化的数据素养教育;哈尔滨工业大学开办了“大数据算法”课程,山东大学图书馆开展了“Origin软件的使用方法”等系列讲座,只有极少图书馆开展了涉及数据素养内涵的相关讲座。
国内外数据素养教育现状表明,研究生和科研人员是数据素养教育的主要对象且本科生接受的线下数据素养教育课程数量少,项目单一。吴晶娥对美国开展课堂数据素养教育经验的研究显示,应从中小学时期开展数据素养教育,大学时期是基础数据素养的重要发展阶段,必须加强高校大学生数据素养教育,为研究生数据素养教育课程培养高层次人才和下一代的数据科学家和工程师奠定基础。[6]受场地和时间等因素的限制,高校图书馆不可能对全校学生普及教学知识,各个学科有涉及特定的数据素养教育课程,但对全面提高学生数据素养来说仍是微不足道的。同时,受个人因素的影响,学生的接受能力也有所不同,MOOC类线上教育平台作为个人学习平台,学生可根据自身情况选择或者重复利用课程。因此,MOOC平台的开放,在全面、自由的丰富学生课程体系的同时,也为大学生接受数据素养教育提供了很好的路径。
在开展数据素养教育前,必须明确其实施的必要性和目标。数据素养教育实施后,需要对数据素养教育进行教学评估,以确定数据素养教育对象能力的提高。国外关于学生数据素养学习成果评价大多采用定性分析,如,康奈尔大学和伦敦大学图书馆通过考试、提交学习报告等途径考核学生是否达到了预期的效果。普渡大学图书馆会在课程结束后举办小型讨论会议,通过会议反馈得知学生课程的接受程度,并根据接受程度和预期目标调整课程内容和进度;在期末课程结束时给学生发放问卷,了解其对所学知识的掌握情况并要求学生为后期的教学提出建议;在课程结束六个月后会针对教学对象开展讨论会议,以评价数据素养教学的长期影响力。
国内关于数据素养能力评价的研究较少。隆茜根据数据素养不同定义中包含的数据素养能力因素建立了详细的评价体系,在此基础上,通过对不同群体发放问卷,调研各目标群体的数据素养能力水平,提出了根据不同群体在数据素养能力上的差异性来开展差异化的数据素养教育。[7]王维佳等人围绕数据生命周期的各个环节归纳设计了数据素养能力评价指标,采用LIKET五分法得到了科研人员数据素养综合评分函数。[8]
国内外的数据能力评价研究角度大多为定性分析,很少有学者对数据素养能力做量化研究,而量化分析是每个数据素养教育对象最直接的成果评价。尤其是学生在MOOC平台接受素养教育时,受平台条件和机制的限制,大多数课程只是在课程中或者课程后穿插部分习题检测学生对所学知识是否掌握,学生无法得知自己的数据素养能力是否有所提高。因此,建立数据素养能力量化评价模型,能够促使学生在实时检测学习成果的同时评估数据素养能力等级,及时调整学习方案,提升自身能力。
此外,我国学者对数据素养教育及评价的研究主要从群体的角度出发,如,曲德强等对上海某理工大学学生数据素养的研究,主要以研究生与本科生、男生和女生为分类标准,调查结果显示硕士研究生的数据意识比本科生强,女生通过数据来挖掘信息的能力及数据储存意识比男生强;[1]吴晶娥对数据素养的研究主要以大学生整体为研究对象,提出高校图书馆针对大学生实施数据素养教育的对策;[6]喻婷对数据素养的研究是以全体图书馆员为研究对象,提出面向图书馆员的数据素养培育路径;[9]隆茜对数据素养评价的研究,以大学教师、博士生、研究生及本科生整体为调查对象,分析各群体的各项数据技能分值。[7]并没有学者从个体出发研究其数据素养能力,或者在研究数据素养能力构成时融入个人因素,仅仅是分析广泛且通用的数据素养能力的构成要素。MOOC教育平台是针对个人的自由学习平台,个人可通过该平台为自己个性化定制课程,但由于个人基本因素的不同,学生通过该平台接受数据素养教育时,其学习效果必然受到影响,因此在对MOOC平台学习成果进行评价时必须考虑其个人因素的影响。本文在之前对数据素养能力要素研究的基础上,加入学生个人因素,以期能对学生的数据素养能力作出更全面,准确的评价。
对于不同的数据素养内涵,其中包含的数据素养要素也不尽相同。在考虑大学生的数据素养能力时,个人因子对其数据素养能力的影响也是一个重要层面。一套综合性的数据素养能力评价指标系统应包含数据素养要素和学生个人因素两个方面。综合来看,该体系共包含了数据素养能力和个人因子两个模块和26个具体指标,它们之间是相互独立,并行不悖,协同促进的关系。
不同的数据素养能力框架包含了不同的能力维度和能力指标。上海大学的郝媛玲和沈婷婷[10]以及华东师范大学的隆茜[7]建立了10种数据素养能力框架,本文借鉴国内外数据素养教育理念、能力框架及评价标准,提取了21种数据素养能力要素及指标含义(见表 1)。
表1数据素养能力评价体系——能力要素
不同学生因教育背景不同直接影响学生的数据素养能力高低不同,本文把学生的个人因素,如,学校、城市、专业等融入设计度量(见表2)。
表2数据素养能力评价体系——学生个人因素
数据素养能力评价系统的要素组成采用LIKET五分法对在校学生的数据素养评价指标进行评分,学生的个人因子指标按照评价尺度表打分(见表3)。
表3 学生个人因素评价尺度表
问卷调查采用线上和线下相结合的方式,调查对象为全国各高校的大学生,问卷内容分为两个部分,第一部分,为学生的个人因子评分;第二部分,为学生的数据素养要素评分,问卷调查历时60天,共收回有效问卷2,280份。调查问卷的信度分析结果显示,Cronbach’s Alpha 值为 0.808,标准化项 Cronbach’s Alpha值为0.91,26个项目内部具有很好的一致性。数据素养能力评价指标的KMO测度和Bartlett球体检验结果显示KMO值为0.787,相关矩阵中均存在大量显著相关关系(a=.000),保证了问卷结构的有效性。
样本符合因子分析的条件,本文在主成分分析的基础上,提取数据素养能力的主要评价维度。采用最大方差法旋转因子,得到各公共因子在各指标上的载荷值,并将其作为各指标的权重系数。通过矩阵旋转,因子载荷值截取点为0.8,特征值大于1,分析得到5个公因子,累计方差贡献率为90.287%。
因子得分系数矩阵显示,F1在 X5、X6、X7、X8、X9、X10、X11、X12、X13上的载荷值大于 0.8,包含了收集、检测、整理、分析、解读等数据技能认知;F2在X14、X15、X16、X17、X18、X19上的载荷值很高,代表数据伦理认知;F3在X1、X2、X3和X4上的载荷值很高,体现了数据意识认知;F4在X22、X23、X24、X25和 X26上的载荷值很高,体现了学生个人因子的影响。F5在X20和X21的载荷值较大,体现了数据管理认知。
为了更好地体现数据素养各能力要素认知及其指标和个人认知之间的反馈关系,依据系统动力学设计了能力评价关系图(见下图)。数据素养能力系统分为数据意识认知、技能认知、管理认知、伦理认知和个人因素5个子系统。学生个人因素在很大程度上反馈了技能、意识等其他数据认知。而数据技能、管理、意识、伦理认知子系统间则是相互独立,并行不悖,协同作用的。
依据确定的公共因子个数和不同指标在公共因子上的载荷来计算其绝对权重。
图 数据素养能力评价系统因果关系图
按照公式(1)计算得到各个指标的绝对权重Aj(j=1,…,26)。
其中,aij=(i=1,…5,j=1,…,26) 表示第 j个指标在第i个公共因子上的因子载荷,表示第i个公共因子对第j个指标的权重系数。Fi=(i=1,…5)表示公共因子的贡献率。
确定了26个指标的绝对权重,利用公式(2)作归一化处理,即可获得数据素养能力评价指标体系中各指标的标准权重Wj=(j=1,…,26)(见表4)。
为了更准确地测定每个学生的数据素养能力,必须由学生个体来评价。在表4确定的数据素养能力评价指标相应权重的基础上,依据表3确定的学生个人评价标度,以及表1的数据素养能力要素指标进行LIKET五分法打分,即可得到数据素养能力评价指标体系下不同指标上的得分Sj(j=1,……,26)。依据公式(3)就可以确定学生具体的数据素养能力值。根据打分标准可知,数据素养能力数值T的取值区间为[1,5],数值越大,学生的数据素养能力水平越高。
根据数据素养能力评价指标体系以及学生个人数据素养能力数值确定方法,本文选取问卷中某学生的数据结果如表5所示。
表5 某同学数据素养能力评价指标得分
将Sj与其在评价指标体系中对应的权重Wj(j=1,……,26)相乘,并将乘积相加,即可得到该学生的数据素养能力数值T=2.496,得分显示该学生数据素养能力水平较低。根据该得分,对比数据素养能力评价指标权重,该学生应主动学习的模块是数据技能。可通过MOOC平台学习常用的期刊论文数据库CNKI、SSCI、Elsevier、SDOL和World Cat等,加强数据收集能力,学习InspierData,加强数据分析能力。其次,由于数据伦理认知在学生的数据素养技能中也占了较大比重,该学生可通过学习知识产权与数据共享加强数据伦理认知。学生个人因子作为主要的影响因子之一,其中包含了许多不可控因素如学校、城市等,但学生可通过参与科研项目来提高自身的数据素养技能。
数据素养动力学能力评价系统动力学关系图很好地表征了数据素养能力因子子系统间的反馈关系,利用Spss,定量确定数据素养评价标度,构建了完整的数据素养指标体系。基于该体系可以实现:① 数据素养能力影响因素的比较和分析,确定了它们的先后顺序;② 明确不同指标之间的密切联系;③ 明确数据意识认知、技能认知、管理及伦理认知对能力权重的影响;④ 对学生的数据素养能力进行了量化。
通过量化数据素养能力,学生在了解自己的能力水平的基础上可根据自己的评分偏向,在MOOC平台选择加强课程。如,得分在4-5之间,显示该学生的数据素养能力已经很高,得分在2-4之间,显示该学生的数据素养能力较低,得分在0-2之间,显示该学生的数据素养能力差。对于数据素养能力弱的学生,应结合自己的各项得分来有针对的选择适合自己的数据素养课程。如,数据意识各指标的得分较低,其可以在MOOC网站选择《数据管理概念介绍》等课程;数据管理各指标较低,其可以选择《数据管理培训》等课程,通过学习DataCitec工具、EZID元数据创建工具和DMPTOOLS等数据管理计划制定工具,提高数据管理技能;[11]数据技能各指标得分较低,其可以在MOOC平台选择计算机和数学等相关课程及软件来提高其数据分析处理技能。MOOC教育的细分模式能够帮助学生精准、快速、反复地进行素养提高。
大数据时代,高校大学生提高数据素养能力不仅仅是为了培养未来研究人员具备的品质,更是为了适应时代的发展,学生应结合个人教育背景,合理利用MOOC平台和数据素养评价标度,学习必须的数据素养技能,以此在大数据的浪潮中站稳脚步。
[参考文献]
[1]曲德强,李陈财.当代大学生数据素养的现状分析及培养方法研究[J].思想政治教育研究,2015(4):97-101.
[2] Hogeoom K,etal.Showme thedata!Partneringwith instructorstoteachdataliteracy[EB/OL].[2016-05-07].http://www.ala.org/acrl/sites/ala.org.Acrl/files/con tent/conferences/11/papers/showme thedata.pdf.
[3] Mandinach E B,Gummer E S.A systematic view of implementing data literacy in educator preparation [J].EducationalResearcher,2013,42 (1):30-37.
[4]张静波.大数据时代的数据素养教育[J].科学,2013,65(4):29-32.
[5]胡卉,等.英美高校图书馆数据素养教育研究[J].图书与情报,2016(1):62-69.
[6]吴晶娥.高校图书馆大学生数据素养教育探析[J].图书馆理论与实践,2014(12):73-78.
[7]隆茜.数据素养能力指标体系构建及高校师生数据素养能力现状调查与分析[J].图书馆,2015(12):51-56.
[8]王维佳,等.数据素养能力评价与大学图书馆数据素养教育的思考[J].图书馆杂志,2016(8):96-102.
[9]喻婷.大数据时代图书馆员的数据素养研究[J].图书馆界,2016(3):1-4.
[10]胡卉,吴鸣.嵌入科研工作流与数据生命周期的数据素养能力研究[J].图书与情报,2016(4):125-137.
[11]黄如花,林焱.大数据背景下数据素养教育研究[J].数字图书馆论坛,2016(5):19-26.