卢文青 秦志永
摘 要 目前在教育大数据应用过程中仍存在数据共享障碍、数据体系混杂、数据挖掘难度大、数据安全与隐私缺乏监管以及数据结论存在缺陷等问题,针对问题进行深入分析,并在数据共享、数据挖掘、数据标准体系构建、数据服务、数据管理等方面提出对策建议。
关键词 教育大数据;教育信息化;数据挖掘;数据管理
中图分类号:G630 文献标识码:B
文章编号:1671-489X(2017)17-0078-03
1 前言
教育大数据是整个教育活动过程中所产生的以及根据教育需要采集到的一切用于教育发展并可创造巨大潜在价值的数据集合[1]。借助于教育大数据分析,可有效促进教育教学发展,在个性化教学环境定制、提升教学水平、优化教学质量等方面具有积极意义。但亦应指出的是,大数据虽然带来思维方式的巨大变革,但是也可能成为一种过度膨胀的力量,使教育管理者寄希望于大数据能够解决教育领域的诸多问题。教育是培养人的过程,具有复杂性、公益性的特征。这一方面要求大数据的质量不断提高,另一方面在认识上应明确大数据不能代替丰富、动态、变化的教育教学实践活动,它仅是一种实践的指导,使实践更具理性化的特征。因此,如何基于实践的观点认识大数据,如何正确认识大数据,提升数据质量,如何利用教育大数据更好地服务于教育,是摆在教育工作者面前亟待解决的问题。
2 教育大数据应用过程中面临的主要问题及原因
数据共享存在障碍 大数据相信全量数据,通过分析几乎全样本的数据来思考和分析问题。从抽样中得到的结论总是有水分的,而全部样本中得到的结论水分就很少,数据量越大,真实性也就越大。然而各地学校之间教育信息化基础设施环境的建设往往各具特色,互不兼容,限制了数据的共享,使得“数据孤岛”成为制约教育大数据发展的瓶颈。
数据体系混杂 出于计量的需要,总是习惯于把教育分解,然而分解后的数据指标体系所描述的属性特征并不保证是教育的真实再现。由于缺乏标准的数据体系,各学校对数据指标的性质差异以及数值差异所表示的实际意义存在认识上的分歧,各学校都倾向于强化本校数值较高的指标在综合分析中的作用,相对削弱数值水平较低的指标的作用,导致在数据收集和分析时存在指标各异、标准不同、口径不一的情况。
教育大数据既包括常规的结构化数据(如成绩、学籍、就业率、出勤记录等),也包括海量难以分析的非结构化数据(如图片、视频、教学软件、学习游戏等)。不仅结构复杂,而且在收集数据的过程中因为操作系统以及版本的不同,数据收集的结果可能会存在多份的情况,造成不必要的数据冗余。另外,由于数据的真实性无法全部保证,数据中还可能存在许多的“伪数据”。
由此可知,数据体系的混杂不仅增加了数据收集的难度,而且削弱了数据整合的价值。
数据挖掘难度大 教育大数据的价值就在于数据挖掘,没经过挖掘的大数据只是没有开采出来的原油,不具有实用价值,而数据挖掘就是通过算法模型搜索隐藏于其中的信息的过程。教育大数据中的非结构化数据将越来越占据主导地位,但是要把视频和图片等转换成有用的数据信息,则必须首先定义视频或图片等的价值。大数据时代信息分析的难点就在于对海量的非结构化数据的分析,而在此领域的研究尚不成熟。
在海量、复杂、多维的数据中去挖掘数据之间的相关性,使用的数据越多,分析的难度越大,则讨论、分析、争议的时间、人力、财力等成本也会相应提高。而采用的数据过少,则又不能充分认识教育过程的本质。因此,数据挖掘的算法模型很重要,但是创建模型的人经常不清楚建模依据的历史数据在未来是否稳定,而使用模型的人也不知道整个数据模型的加工过程;创建模型的人可能不知道此种模型效果好不好,而使用模型的人也不知道该怎么去反馈使用的结果[2]。这样一来,信息不对称现象严重,影响了算法模型的质量优化。
数据挖掘的本质就是还原。虽然好的数据模型是一种有益的提炼,但有时候也会因为缺少场景数据的支持,在某种程度上造成信息的歪曲。事实表明,一些不易收集的量更直接影响人的行为,如健康、情绪、性格、兴趣、习惯等。缺少了这些背景数据的支持,数据分析的结果可能会失真,甚至与事实大相径庭。
数据安全与隐私亟待有效监管 教育大数据收集了各种来源、各种类型的数据,其中也包含很多和用户隐私相关的信息。由于国家在教育大数据方面并没有出台相应的法律法规,保护不当可能会带来严重的安全风险。在大数据时代,个体面临的威胁并不仅限于个人的隐私泄露,还在于基于大数据对人们状态和行为的预测,而这种隐性的数据暴露往往是个人无法预知和控制的。如通过分析学生关于阅读的历史纪录,得到学生的爱好、兴趣倾向等信息。
教育是塑造人的过程,而这种重塑是建立在社会的遗忘机制之上的。因为有了随时间模糊的遗忘机制,个体才能够不停地在记忆中构建和重构自己的过去,进而接受不断发展的自我与别人,才有能力从过去的经历中吸取教训,并调整自身的行为以融入未来的社会[3]。由于数字化记忆缺少人类记忆中自主遗忘的功能,因此,完善的数字化记忆带来的寒蝉效应(指用户害怕自己的言行遭到指责或者惩罚,不敢发表言论,如同蝉在寒冷天气中噤声一般)可能会改变或约束学生的行为,进而影响学生的健康成长。
数据结论存在缺陷 虽然在教育实践中运用数据指标来评价教育并不一定是最好的方式,但也是必然要选择的方式,因为无计量则无管理。由于教育中人的性格、美感、道德、价值观等方面难以量化的现实,造成对教育指标体系的“简单化”处理。换言之,在实践中利用某些数据(如成绩)指标,并不是因为最有价值,而是最易计量。
数据分析的结论具有导向作用,由于数据体系的不完整以及算法模型的不完美,管理者的決策空间就会相应地受到挤压。虽然数据结论有一定的片面性,但是数据结论赋予管理策略合理性,加剧了学校对成绩的关注而忽略了人文精神的培养。简单的教育培养了简单的学生:专制、占有欲强、缺乏审美情趣和道德感、自制力缺乏、攀比心太强……凡此种种,都是“简单人格”的写照,而在教育的轮回中,又在不断复制并加剧这种“简单化”。由此可见,数据结论的缺陷不仅反映了计量的必要性与科学性之间产生了矛盾,也体现了教育目标的长远性与计量的短视性之间的矛盾。endprint
在数据结论的表达方面,许多的数据结论虽然是正确的,但相对于非统计专业的学校管理者来讲,要么晦涩难懂,要么枯燥乏味,缺乏高效的数据表达方式,降低了信息传递和沟通的质量。
3 教育大数据应用过程中的对策
针对教育大数据应用过程中存在的问题,提出以下对策。
互联互通是基础 统筹建设信息化基础设施和应用环境,达到高速可用、安全可靠、可信共享、泛在开放的水平,推动各级各类学校逐步优化教育信息化基础应用环境,完善信息化设施配备,提升网络保障能力。以可持续发展的教育信息化应用环境为基础,构建省市级教育大数据平台,促进各级各类学校数据共享,实现数据的统一开放、实时分析,破除“数据孤岛”,推动教育大数据建设。
标准的数据指标体系是根本 国家正在推行学生的“终身一人一号”统一学籍信息管理制度,各项数据都有了身份标签,为持续性记录每个学生的学业表现与全面发展情况提供制度保障。在数据指标体系方面,需要加强基础设计,制定与国家教育信息化标准相衔接的统一的标准与规范,涉及数据的收集、分析与管理等方面,涵盖基础标准、数据处理标准、数据安全标准、数据质量标准、数据服务标准等。只有确保标准的一致性和权威性,才能在统一的大数据平台内统筹梳理数据来源和流向,集中管理各类基礎数据,确保数据完整、可用、可整合,实现教育大数据的快速抽取、统一共享、及时挖掘。
人才与技术是关键 大数据时代课堂变得无处不在,如翻转课堂的引入、数字校园的流行、云课堂的设想……课堂将不再是单一和被动的模式化、固态化的传统课堂。课堂既可以是校内的,也可以是校外的;既可以是现场的,也可以是网络的,课堂空间被无限拓宽,课堂形式变得自由多元[4]。在动态变换的场景下面向多版本、多操作系统收集教育数据,定义非结构化数据的价值,研究新的算法模型以探寻教育因素之间的相关性等方面,都迫切需要人才与技术的支持。
新形势下的教育不仅关注知识与技能的学习,更加注重人文精神的培养。利用大数据挖掘兴趣、性格等心理特征在教学与个人成长中的价值,更是需要多学科人才的合作。因此,需要组织教育学、数学、计算机科学、统计学等多学科的人员成立专门的教育大数据挖掘中心,打破信息不对称,集聚各方智慧,引入多角度的评价方式,建立多样化的指标体系,通过技术攻关破解数据挖掘中的难题,并探究出美学形式与现实功能兼顾的数据可视化手段,实现数据结论的有效传达与沟通。
数据服务与教学的深度融合是核心 教育大数据既服务于教育教学,又来源于教育教学,因此有必要通过优质数字化教育资源的建设与共享,深化信息技术与课堂教学的融合,拓展数据收集的类型与规模,提升教育大数据的服务空间。
由于技术水平的限制,不可能把千变万化的教育行为提炼归纳进一套或几套模型里。数据模型的局限性决定了在教育实践中需要对模型进行检验,并通过技术改进实现模型的迭代优化,形成持续反馈的机制,进而不断提升数据分析的价值和有效性。由此可见,深化数据服务与教育教学的融合,不仅是促进教学改革、提升教育质量、实现教育均衡的重要手段,更是实现教育大数据驱动教育发展的必然选择,无融合则无数据,无数据则无服务,无服务则无反馈,无反馈则无优化。
数据管理是保障 注重数据的隐私保护与安全管理,出台相关的管理办法。按照分级管理、逐级负责的原则,健全网络与信息安全管理责任体系,完善网络与信息安全管理制度。明确数据管理各部门、人员的安全管理职责,建立数据资源的保密等级,设计高性能、高可信度的教育大数据存储系统,建立数据安全应急保障机制,为大数据平台提供充分的安全保障。
学生的成长是一个过程,这一过程可能是缓慢而复杂的。针对教育大数据建立生命周期管理制度非常必要,对数据只进行一定的控制,允许数据被模糊、被遗忘。给学生留一些自身需要的空间来定义自己,尊重学生重新塑造自己身份的自由,促使其在成长的道路上甩掉过去的包袱,调整自身的行为并融入未来,帮助其健康成长。
4 结语
教育发展必将迎来大数据驱动的新时代,大数据将帮助教育工作者找到更加合适的方法,提供更加广阔的思路来为教育教学的决策提供数据支撑。立足于大数据发展的理论前沿和教育实践的需要,才能强化数据对教育教学的服务与支撑,逐步完善对教育的认识,回归教育复杂性的本质。
参考文献
[1]杨现民,王榴卉,唐斯斯.教育大数据的应用模式与政策建议[J].电化教育研究,2015(9):54-61.
[2]车品觉.决战大数据[M].杭州:浙江人民出版社,2014.
[3]舍恩伯格.删除:大数据取舍之道[M].袁杰,译.杭州:浙江人民出版社,2013.
[4]吴地花.大数据时代的教育创新研究[J].教育探索,
2016(4):120-123.endprint