黄丽霞 韩晓雨 刘琤斐
(1.黑龙江大学信息资源管理研究中心 黑龙江哈尔滨 150080)
(2.黑龙江大学信息管理学院 黑龙江哈尔滨 150080)
(3.黑龙江省生态地质调查研究院 黑龙江哈尔滨 150080)
随着科学技术的不断发展,新媒体时代已经到来,海量的信息资源不但促进了社会信息环境的演进与成熟,而且也使人们更加注重对自身数据素养的提升。尤其自疫情爆发以来,以疫情分布图、人口流动图、病源排查、疫情管理等为代表的大数据项目各显神通,数据信息充分发挥了重要作用,因此数据素养能力的高低对于疫情防控工作而言显得格外重要。大学生作为社会未来发展的重要群体,更应当具备良好的数据素养,以提高自身的多方面能力,来顺应时代的变化。
数据素养不等同于信息素养,而是对信息素养和媒介素养概念的扩展和延伸,也就是说,数据素养的内涵来源于信息素养,但却具有一定的独立性。数据素养强调对数据的敏感性、数据的分析和处理能力、对数据的批判性思维、数据的收集能力以及决策能力等方面。近年来,虽然与数据素养有关的研究和实践成果数量呈现逐渐上升的趋势,但由于发展时间较短,因此数据素养的具体含义尚无定论。
目前,数据素养逐渐成为科学研究的热点,国内外很多学者对数据素养的核心内容与评价体系进行了不同程度的研究与探讨。A.Grillenberger和ROMEIKE以计算机科学专业为主题,运用理论知识推导出了数据素养的核心内容和应用领域,并且构建了由4个数据主题及相应的数据处理模块构成的数据素养能力模型[1];Databilities研究组织将15项数据素养能力划分为6个等级,并从数据获取、操作过程与应用交流3个方面构建出了数据素养能力框架[2];周兵以高校教师为研究主体,运用模糊综合评价法设计了数据素养评价指标集合和数学模型,并给出了具体应用案例[3];潘雪等人利用层次分析法从教育主体、教育对象、教育形式、教育内容和教育效果5个角度构建了高校数据素养教育评价指标体系[4]。综上,关于数据素养的研究目前多注重数据素养教育,以数据素养能力现状和提升策略作为研究的重点,而有关大学生数据素养能力评价指标的实证性研究比较少。为此,本文基于现有研究成果并结合美国大学与研究图书馆协会(Association of College and Research Libraries,ACRL)标准,探讨基于新媒体时代大学生数据素养的新要求,构建具有专指性的大学生数据素养评价指标体系,从定性和定量两个方面对指标进行实证评价。
互联网的发展加速拓宽了人们利用网络进行数据转化的可操作时间与空间。传统的网络环境要求使用者要具备一定的计算机操作能力,而如今的大数据环境降低了人们上网的准入门槛。对于大学生群体来讲,他们能够通过手机、电脑等移动终端随时随地地通过网络获取所需要的信息,将以往的单向获取数据转变为双向共享数据。智能终端的利用极大地方便了大学生的日常学习和生活。
在新媒体时代下,大学生的数据素养呈现进步性和适应性。第一,在复杂的网络信息环境中,大学生在数据演化的过程中呈现出协调性、复杂性的特征,个体在进行数据交换和使用行为的同时,能够根据自身的需求来调节数据应用方式[5],如越来越多的大学生能够利用手机和平板电脑等移动终端进行在线购物、网络社交等行为,不再利用传统的PC端访问。第二,大学生能够利用更多样的渠道来获取数据,除了常用的网站、微信、微博等新媒体渠道,大学生还能通过抖音、快手、花椒等视频和直播平台来获取有效的数据。第三,大学生的数据辨别能力有着显著的提高。如今,大学生数据搜寻呈现出碎片化的趋势,海量的信息不断地向大学生输出,使得大学生的甄别和处理数据能力稳步提高。
在总结大学生数据素养能力的特点和调研相关文献的基础上,以新媒体环境下社会和国家发展战略的核心目标为依托,并结合现有的理论研究成果和数据素养的内涵,笔者构建了大学生数据素养评价指标体系。该体系包含数据意识、数据获取、数据利用、数据分析、数据评价、数据管理、数据知识、数据创新、数据伦理、数据安全在内的10个一级指标,及对应的21个二级指标,具体如表1所示。
表1 新媒体时代大学生数据素养评价指标体系
数据意识是数据素养能力的基本组成部分,它主要强调主体对数据及相关信息的感受程度,常常表现为在复杂的网络环境下激发的探索需求,对数据搜寻、处理、辨别等过程中的敏感性和多领域的数据拓展意识。
作为数据素养评价体系中重要的一环,数据获取表现为对于所需要的数据的多方面功效进行考量,通过适当的方法和手段进行有策略的、精确的搜寻工作。
数据利用的过程能够反映出数据的真实价值,数据在应用、表达与交流、共享等资源整合和展现时,才能充分完成其效能的价值转化。
数据分析是指用适当的分析统计方法对收集到的数据进行分析,提取有用的信息和形成的结论并对数据进行详细研究和总结概括的过程。数据分析往往与数据判断并存,分析即存在判断的过程。
数据评价是指对数据质量进行评估,是从数据综合运用的视角考虑,对信息和数据的收集、储存和应用进行全方面的考察和评估,进而提高数据的有效度和可信度。
数据管理是对数据进行分类组织、存储管理的过程,通过对收集到的数据信息进行正确处理,能够实现数据应用和共享的真实价值。
数据知识是数据素养能力的基础,包括数据的基本概念、类型、特点等基础知识和数据的交流方法、转换方式等应用知识。
数据创新可以是在本学科领域内对基础数据的聚集、优化、再造,也可以是跨学科的对数据进行融合,构建出新的数据,进而实现数据的共享和交流。
数据伦理是从数据视角对人的信息行为进行的伦理关注,是指在数据获取、加工、利用、创新等数据活动过程中与数据相关的所有道德规范问题。
数据安全是图书情报等相关学科的重要研究领域之一,它的核心内容是隐私。安全思维和安全技能是数据安全的基础。数据安全不仅关系到个人隐私、企业隐私,甚至能够直接影响国家安全。
根据构建的新媒体时代大学生数据素养评价指标体系开展问卷调查,调查问卷主要分为两个部分:第一部分为调查者的基本信息,包括性别、年龄、年级、所属学院和专业;第二部分是根据10个一级指标、21个二级指标设计的问题,运用李克特五级量表的形式,设置了“完全不同意”“比较不同意”“基本同意”“比较同意”“完全同意”五个选项,分别按照1—5分进行赋值。
问卷调查利用“问卷星”平台,并通过社交软件在线上完成,选择的调查对象为黑龙江大学在校本科生,本次调研的时间为2021年7月13日至2021年7月18日,共发放问卷1 703份,经过筛选和整理得到有效问卷1 592份,有效问卷回收率为93.5%。本次调查兼顾了不同学科专业的差异性,因此调查样本来自理工类、经管类、文史类等多种类别。回收到的数据中,男生669人,约占总人数的42.02%;女生923人,约占总人数的57.98%。
利用SPSS软件对收集到的数据进行描述性分析,统计数据素养评价指标体系10个一级维度和总量的平均值、标准偏差、方差、Cronbach’s α系数,具体计算结果如表2所示。
表2 量表各维度平均值、标准偏差以及信度
标准偏差能够评估数据之间的离散性,标准偏差越小,表明选择的样本数据与平均值的偏差越小。从表2能够看出,10个维度的数据标准偏差均在0.88—0.96之间,这说明题项的离散性不大,调研结果比较稳定。信度能够反映调查数据的可靠性。本文在进行信度分析时,选用Cronbach’s α系数进行信度检验。一般认为当α系数大于0.7时,调查问卷的信度比较好。通过SPSS软件的信度分析,能够得到10个维度的α系数均大于0.7,并且除数据意识之外,其他9个维度的α系数都大于0.8,问卷的整体信度为0.981,这能够表明此问卷的可靠性和稳定性都比较好。
利用SPSS软件进行相关性分析,得到的具体结果如表3所示。从表3可以看出,10个一级指标之间的相关性在0.333—0.691之间,而除了数据意识与总量表的相关性为1.000外,其余一级指标与总量表的相关性均在0.333—0.515之间,这说明每个一级指标都具有一定的独立性,而且只有数据意识与其他一级指标以及整个评价指标体系存在很大的关联性,其余一级指标与整个评价指标体系关联性不大,这说明数据意识从某种程度上来说决定了数据素养能力。
表3 量表相关性分析
在结构有效性方面,利用SPSS软件对问卷进行KMO和巴特利球形检验,结果如表4所示。
表4 KMO和巴特利特球形检验
从表4能够发现,KMO的值为0.975,大于0.9,并且显著性值P=0.000<0.05,说明这些数据有共同因素存在,非常适合进行主成分分析。
在因子分析中,以特征值大于1为原则提取主成分,运用最大方差法对原始载荷进行旋转,得到的结果如表5所示,旋转后的主成分矩阵如表6。
从表5能够看出,共有2个成分特征值大于1,因此该数据能够提取2个主成分。这2个主成分方差的累积贡献率为65.194%(一般认为累积贡献率达到55%就可以接受),这表明提取主成分后数据的损失率比较小,主成分分析效果比较好。运用综合得分来评价大学生数据素养能力现状,可以按各主成分对应的方差贡献率的比例为权重来计算综合得分,第一主成分的权重43.163%/65.194%=0.662,第二个主成分的权重为22.032%/65.194%=0.338,因此,数据素养综合评价得分为:Factor=0.662Factor1+0.338Factor2。
表5 总方差解释
从表6可以看出,第一个因子包含X1、X2、X3、X4、X5、X6、X7、X8、X9、X10、X11、X12、X14、X15、X16、X17,第二个因子包含X13、X18、X19、X20、X21。那么,第一个因子可以概括为数据的获取与应用,第二个因子可以概括为数据存储与安全。
表6 旋转后的成分矩阵
3.4.1 基于性别分组比较分析
为了了解性别对于数据素养能力的影响,运用SPSS软件对不同性别的样本进行比较分析,计算结果如表7和表8所示。
对于方差齐性进行检验,从表7中能够看出F=12.940,P=0.000<0.05,因此两个样本方差有差异,即方差不齐性,方差不齐性看第二行,t=3.735,P=0.000<0.05,因此认为不同性别的大学生数据素养能力存在显著差异。从表8能够看出,男生的个人平均分略大于女生,分数越高,数据素养能力也越好,这说明男生整体的数据素养能力要高于女生的数据素养能力。
表7 独立样本T检验
表8 不同性别统计分析
3.4.2 基于专业分组比较分析
运用SPSS软件对不同专业的大学生样本数据进行比较分析,把数据中的专业分成三个大类,即理工类、文史类、经管类,得到的计算结果如表9、表10、表11和表12所示。
从表9能够看出,P=0.000<0.05,因此可认为样本来自的总体不满足方差齐性的假设。从表10能够发现,P=0.003<0.05,表明达到显著水平,即不同专业类别的大学生的数据素养存在显著差异。由于不满足方差齐性,因此利用塔姆黑尼方法对数据进行多重比较。两两比较时,P<0.05,说明两类数据存在显著差异;P>0.05,说明两类数据不存在显著差异。通过表11能够看出,理工类和文史类、理工类和经管类的学生数据素养存在显著差异,而文史类和经管类的学生数据素养没有显著差异。从表12能够看出,经管类和文史类的样本数据平均值非常接近,而理工类高于经管类和文史类的平均值,这说明从宏观来看,理工类的学生数据素养能力要高于文史类和经管类的学生数据素养能力,文史类和经管类的学生数据素养能力相差不大。
表9 方差齐性检验
表10 方差分析
表11 基于不同专业的多重比较
表12 不同专业分析描述
3.4.3 基于年级分组比较分析
运用同样的方法对不同年级的学生数据素养进行比较分析,计算结果如表13、表14、表15所示。从表13能够看出,P值均大于0.05,因此可认为样本满足方差齐性的假设。从表14能够发现,P=0.249>0.05,表明没有达到显著水平,即不同年级大学生的数据素养能力相差不大。从表15能够看出,四个年级的样本平均值相近,这也充分证明了大学生的数据素养能力与年级无关。
表13 方差齐性检验
表14 方差分析
表15 不同年级分析描述
在对当前高校大学生数据素养能力的特点总结和上述实证分析的基础上,面对现实社会复杂多样的环境变化,以新时代新媒体背景为前提,探讨大学生数据素养能力提升的合理化建议。
数据的生命周期一般可以分为认知阶段、能力阶段和应用阶段三个阶段。新媒体时代的大学生数据素养教育体系应以素质教育为依托,以数据的生命周期为基础,着眼于生命周期的各个阶段,通过个人、家庭、学校、社会组织等力量,从根本上逐步提升大学生的数据素养能力[6]。
在数据认知阶段,重点培养大学生的数据意识和共享意识,并在原有的数据安全意识的基础上,拓展与数据相关的法律法规知识,逐渐提升其数据伦理和数据道德意识,为后面两个阶段数据素养能力的提高奠定认知基础。在数据能力阶段,帮助大学生寻找更多的数据收集与评估途径,提升他们数据获取和分析的能力,使其掌握数据管理和存储的多种方法和技巧,培训使用数据分析软件,灌输与数据有关的基础知识,从而更好地为数据应用铺垫。获取和管理数据都是为了更好地应用和表达。在数据应用阶段,应该重点培养大学生的数据利用与交流共享的能力,为他们制造更多交流和创造的机会,拓展数据创新能力。
对于大学生而言,高校是他们学习和生活的主要场所之一,高校不仅承担着传授科学文化知识的职能,而且还担负着提升学生多方面素养和能力的使命。
从上述的实证分析可知,数据意识对于大学生数据素养能力起着至关重要的决定作用,它是数据素养能力的基石,是数据素养长久发展的基础,因此高校可以针对不同专业的需求,联系专业理论性知识,开设数据通识教育类的课程,构建数据结构体系,建立高校智慧培养机制,注重培养大学生的数据意识,增强他们对数据的敏感度和重视度,从而使学生逐渐形成数据分析思维意识,从根本上提升个人的数据素养。
在培养数据意识的基础上,高校可开设数据分析与应用等相关课程,教师要利用理论与实践相结合的方式来提升大学生的数据处理能力。同时,授课项目可以是丰富多样的,例如:跨校交流、网上直播、新媒体课件等。这些多样化的数据分析应用课程体系为学生搭建了新媒体资源平台,提供了新型的数据技术和产品,在学习与交流时,自然而然地组建了数据素养小组和团队,营造了和谐、共享的交流气氛,从而能够满足因个体差异而对数据产生的不同需求[7]。
高校只是社会环境体系中的一个组成部分,因此,想要提升大学生的数据素养能力,需要以社会环境为依托。云环境要为大学生用户群体树立正确的数据意识导向,通过多样化的数据应用与交流方式,构建良好、健康的网络共享环境,完善数据管理云环境,将数据知识与技能、数据应用与管理等多重能力融入互联网数据文化的建设中,打造具有专业学科知识特点的特色数据库,充分利用大数据、云计算等先进技术和网络平台,挖掘并开发将数据获取与利用、数据分析与评价、数据管理与创新等多功能集于一体的云服务体系,从而全面促进大学生数据素养能力的提升[8]。
除此以外,国家应构建新媒体时代云服务的管理标准与规范,优化数据素养培养体系的评价指标,制定相关法律制度体系,从根本上保障大学生数据素养能力的全面提升。
新媒体时代的来临,使数据的价值达到了一个新的高度,这对大学生的数据素养能力提出了更大的挑战。本研究基于现有的理论成果,结合新媒体时代大学生数据素养能力的新特点,构建了具有针对性的数据素养评价指标体系,形成了10个一级指标和21个二级指标,并对体系进行了描述性分析、信度分析、主成分分析等一系列实证评价,以完善大学生的数据素养综合测评,并在实证分析的基础上,构建起在协同与重构下的数据素养能力提升策略,以满足学生个体成长要求和实现社会对复合型人才培养模式的创新,从而最终更好地服务于社会和国家。