王 旭,赵 娅,朱晓敬
(东北石油大学计算机与信息技术学院,黑龙 江大庆 163000)
在“万物皆可数据化”的时代,如何高效地获取数据,分辨数据的质量,是每个人在大数据时代发展中都要面临和解决的问题,这就需要具备一定的“数据素养”来适应时代发展的需求[1]。目前,我国现有的提升学习者的数据素养培养模式主要有课程教育、专题讲座等,虽然不同形式侧重内容不同,但都是以培养学习者的数据素养为最终目的[2]。由于疫情影响,传统的教学无法开展,以至于现有的数据素养培养模式不能完全满足学习者的需要[3]。随着网课的兴起,线上教育已成为后疫情时代的常态化学习方式[4]。在此背景下,只有实现数据素养教育途径线上化,才能更好地满足学习者的学习需求[5]。目前,国内现有的数据素养平台一类是面向高校的图书馆数据素养服务平台[6]。但是,开展实用化数据素养教育的高校图书馆较少,缺少对资源的有效整合,很难建立起具有影响力的数据素养教育服务体系。另一类是开放的数据素养学习平台,但学习模式比较单一,通常以网络视频教学,内容只限于理论层面,不利于学习者的数据操作能力培养[7]。针对以上现象,研究设计了一款基于数据素养的学习平台。依据数据素养培养目标,平台设置多个模块,可以满足学习者从数据获取到利用等各个阶段学习需求。平台以数据素养的多个层面设计服务模式和学习内容,提供全方位的一站式学习服务,学习者仅需通过该平台就可以实现基本的数据素养学习。
数据素养作为一种新的素养,近些年得到了各行各业研究人员的广泛关注。通过查阅国内外相关文献发现,数据素养最早起源于国外,它并不是一个全新的事物,其由来主要与统计素养和信息素养有关,是在统计素养和信息素养的基础上,通过对统计素养外延的扩大、信息素养内涵的扩展而形成的一种新的概念[8]。关于数据素养,各国的研究人员给出的定义或概念并不相同,目前尚未有统一的定义或概念。数据素养内容上大致可以分为三个层面:意识层面的数据素养、知识层面的数据素养、能力层面的数据素养[9]。具体指科学的数据获取、数据组织和管理、数据处理、数据分析、数据创新利用等方面的能力,以及在数据的获取和发布过程中的数据伦理道德与行为规范[10]。根据《世界经济论坛最新发布的未来工作报告》显示:由于全球范围内的疫情扩散加快了信息技术相关工作迭代更新,新技术的应用速度在一些领域进一步加快。但是,大数据等技术依然是重点发展方向[11]。领英公司最近几年公布的一份职业报告表明,在位居前十的热门职业种类中,如数据分析师、软件工程师、投资分析师、平面设计员等职业,都要求从业人员具有深厚的数据素养[11]。由此可见,在新技术革命背景下,国民数据素养的提升已经成为各国增强国家竞争力,提升经济水平的一个主要趋势。
数据素养是一种由多层次的数据能力构成的核心能力,形成良好的数据素养并非一朝一夕的事情,而是一个长期学习发展的过程。线下的数据素养培养需要学习者在特定的时间和地点学习固定的知识,并且随着课程的完成,数据素养的培养也随之结束,后续的学习完全需要学习者自行摸索,这样的数据素养培养模式在一定程度上造成了学习者的不便,更不利于学习者的数据素养形成。而利用线上学习平台提升学习者的数据素养,学习者可以自主安排学习时间、地点、学习内容等,可以满足学习者在课余时间的数据素养学习需要,让学习的方式更加人性化。平台功能模块设计的灵活性更加适合不同的数据能力培养,通过有针对性地对功能模块设计可以满足学习者对数据素养学习的不同需求。同时,平台还可以追踪学习者的学习情况,依据学习者在平台上的行为数据,在后台及时调整平台的学习内容,保证提供的学习内容更具有针对性。因此,以学习平台的形式培养学习者数据素养不仅可以提高学习效果,而且能满足学习者长期学习的需要,符合数据素养形成的标准。数据素养与学习平台的有效结合,将是培养学习者数据素养的一个重要途径。
构建基于数据素养的学习平台,目的在于整合数据素养相关知识,帮助学习者通过线上学习的形式学习到数据素养的知识,了解相关热点信息、形成数据意识、掌握数据分析方法、学会利用数据,提升数据素养的各方面能力。以线上学习的形式打破传统的面对面数据素养学习的局面,满足学习者在课余时间进行数据素养的学习需要。学习者在完成线下的数据素养学习外,可以通过平台进行练习,达到巩固学习效果。同时,平台也可以满足教师对学习者的数据素养提升情况进行跟踪的需要等。通过构建数据素养的学习平台,为学习者提供更加便捷的数据素养学习服务。
基于数据素养的学习平台,包括动态信息、精品课程、资源平台、学习检验、互动论坛、站外链接六大功能模块,如图1 所示。
图1 平台主要功能模块
1)动态信息模块。该模块包括发布站内公告、数据素养相关热点、领域前沿等。在该模块下,学习者可以了解数据素养的最新动态信息,通过对数据素养动态信息阅读学习,有利于转化学习思维,培养数据意识的形成。
2)精品课程模块。该模块包括数据素养公开课、数据素养讲座等,在课程中包含了数据素养不同层面的知识,如数据分析方法、数据处理、数据利用等。该模块下可以满足零基础的学习者的学习需要,同时可以帮助已有经验的学习者完善知识体系。
3)资源平台模块。该模块包括学习工具、数据包两部分。学习工具主要为数据分析处理软件、在线处理数据平台等,如Python、R 语言、在线数据可视化分析BDP 等。在该模块下学习者可以下载软件安装包或者通过跳转至在线处理平台等形式使用数据分析工具。数据包的设置主要为学习者提供大量且多样的数据信息,便于学习者利用多样的数据信息进行分析处理,掌握多种数据处理方法。
4)学习检验模块。该模块主要包括在线测试、在线练习两部分。测试和练习的内容为数据素养的基础知识,包括数据意识、数据获取、数据分析、数据伦理道德等。实际操作的检验上,学习者利用给出的数据完成情景模拟试题,在这部分学习者可以将处理好的数据结果进行上传,对比系统给出的数据结果,以检验完成情况。在该模块下学习者通过测试和练习,可以了解自身的数据素养情况。
5)互动论坛模块。该模块包括在线问答、投稿交流等,在该模块下学习者间可以对数据素养相关信息进行沟通交流,发表观点和意见,对不明确的知识进行提问或投稿等。通过该模块有助于学习者解决在数据素养学习过程中遇到的问题,同时有利于学习者数据素养的提升。
6)站外链接模块。该模块包括公开的数据统计网站、优质数据素养学习网站等。在该模块下学习者可以跳转至公开的数据统计网站进行数据获取,或者可以按照链接主题的形式自行搜索,通过站外链接可以满足学习者对真实数据获取的需要。
在平台设计中,数据库是必不可少的一环,特别是在后台和前端都要求实时交互的情况下,数据库的设计将会影响到整个平台的性能[12]。通过对不同数据库的比较,数据素养的学习平台选择了MySQL数据库。MySQL 作为一个开放的数据库不仅有速度快、易操作等特点,而且可移植性好、稳定性高,是一种支持多线程的关系型数据库,可以为多种编程语言提供接口[13]。该研究根据数据库的设计要求,从数据分析开始,逐步展开细化,运用面向数据的数据库设计,兼顾了数据库间的关系和数据库的结构,同时考虑到用户对平台的使用情况,从而提升数据库的使用效率[14]。根据平台需要,数据库设计如下,E-R如图2 所示。
图2 平台E-R图
1)用户表。主要用于存储注册该平台的用户信息,包括了id、账号、密码、姓名、性别、邮件、照片等。
2)管理员表。主要用于管理用户和平台权限,包括用户的id、账号、密码,权限表包括权限编号、权限名称以及权限描述。
3)留言板表。主要用于存储用户在平台中的互动交流信息,包括留言编号、留言内容、发布时间等。
4)课程表。主要用于存储数据素养相关的视频数据信息,包括课程编号、课程名称、课程描述以及发布时间等。
5)资源表。主要用于存储学习工具和数据包信息,包括资源编号、资源描述和资源地址等。
6)文章表。主要用于存储在动态信息模块下发布的数据素养的热点和前沿等,包括作者、文章标题、文章编号和文章内容等。
7)公告表。主要用于存储在动态信息模块下发布站内公告,包括公告编号、公告标题、公告内容和发布时间等。
8)题库表。主要用于存储数据素养的习题信息,包括了的题项编号、类型、题目、选项和答案等。
基于数据素养的学习平台采用B/S 架构模式,使用解释型语言PHP 作为后台开发语言,前台网页使用结构化语言HTML5 进行编写,在页面样式上使用CSS 进行渲染,页面使用Javascrip 添加交互行为,采用速度快、性能稳定的Apache 作为WEB 服务器,实现效果如图3、图4 所示。
图4 学习检验模块展示
在平台的导航栏分别设置首页、动态信息、精品课程、资源平台、学习检验、互动论坛、站外链接等,便于学习者能够快速找到目标栏目。主界面设置五个功能模块,第一个为精品课程,在该模块下直接展示了最新的课程资源,学习者直接点击便可观看视频。第二个为动态信息、第三个为公告,这两个功能模块上发布的信息都具有较强的时效性,所以主界面设置这两个模块的目的在于方便学习者登入平台后,可以第一时间掌握最新的数据素养动态信息和站内公告。第四个为学习工具、第五个为站外链接,这两个功能模块是学习者较为常用的功能,同时模块上的内容比较固定,所以将这两个功能模块设置在主界面,便于学习者可以快速跳转至相应的页面。
在学习检验模块的基础上,设计了一系列的实践活动,旨在提高学习者对数据的实际操作能力,使学生者能够把所学的理论知识融入到实践中,并转化为自己的实际操作技能。学习者在该模块下可以针对给出的实际问题,在模块内下载需要分析的数据,通过分析后上传答案。用这样的方法来提升数据素养,既可以提高学习者在实际数据中的解决问题能力,又可以检验学习者数据素养的掌握情况。
平台构建完成后需要进行测试,平台测试在计算机硬件环境下,用户端选用Windows 7 以上操作系统。采用黑白盒测试方法,测试各模块的运行状态及平台的性能指标,保证平台的可用性、容错性以及运行的稳定性[15]。平台中各模块功能测试选用可以在任何平台都能运行的QTP 测试工具,测试模块选取动态信息、精品课程、资源平台、学习检验、互动论坛、站外链接六个模块,通过测试各功能模块可以正常运行,能达到预期结果。在平台性能测试方面,平台在长时间运行下,各模块运行状态正常,可以独立运行,无异常情况。平台操作上流畅连贯,无卡顿现象。综合上述测试,平台在可持续性和稳定性等方面较好,较好地达到了设计要求,实现了预定的平台功能。
为了检验平台的实际使用效果,选取了东北石油大学教育技术学、电子信息等专业58 名学生作为平台使用的实验对象,实验为期一个月。首先,为了确保实验结果的可靠性,在实验开始前,将设计好的数据素养调查问卷通过问卷星平台发放给实验对象,来检验实验对象数据素养的起始状态。问卷内容是以数据意识、数据获取、数据分析、数据处理、数据利用、数据伦理道德六个维度进行设计。将回收的问卷作为实验前测,然后展开实验,实验结束后再次发放数据素养问卷,将回收的问卷作为实验后测。最后将实验前测与后测的数据导入到SPSS 中,采用配对样本检验方法,从数据素养的不同维度进行分析[16]。分析结果如表1 所示,结果表明实验对象数据素养各维度的平均值均有提高且提高明显,显著性Sig.值均为0,小于0.01,说明实验对象的数据素养提升非常显著。
表1 配对样本检验结果
关于测试结果展现出的该平台在提升数据素养方面的优势,给出以下简要分析。在动态信息模块上汇集了数据素养领域最新热点,让学习者了解了数据素养的重要性,丰富了学习者对数据的认识。在课程模块设置了从易到难的数据素养各类视频,满足了学习者对数据素养从初识到掌握的各个阶段学习。在学习检验方面,设置了从简单到困难不同程度的基础知识练习和实践操作练习,学习者在练习中逐步提高难度,并将资源平台中各种分析工具、数据包以及站外链接中的公开数据相结合展开分析,让学习者的数据获取、分析和利用等能力均得到了训练。学习者通过在平台上的学习,发挥了数据真正的价值,发掘了其以数据为导向解决问题的能力,提升了数据素养水平。
除问卷调查法外,还结合了访谈法对实验对象进行平台的使用体验调查,综合分析后得到以下结论,使用者反馈页面清晰、操作简单,能够在导航栏的引导下准确找到相应模块,各个功能模块整体使用效果较好。该平台能够较好地满足学习者数据素养的学习需要,可以投入使用。
数据素养是当今社会发展的核心能力,在大数据时代,以数据驱动问题、发现问题、解决问题,是培养高素质人才的必然选择。该研究从线上学习的视角设计了基于数据素养的学习平台,弥补了后疫情时代数据素养线下教育中存在的不足。该平台针对数据素养中各项能力进行了相应的模块设计,通过测试结果表明,该平台能够满足学习者据素养学习的基本需求,为提高学习者的数据素养提供了一种有效的途径,并为今后的数据素养教育的发展奠定了基础,是一种有较大潜力值得推荐的一种数据素养提升方法。