涂涛 胡柯铭
摘要:大数据赋能教育变革,在促进学情诊断、学习分析、教学评价反馈以及教育智能决策等技术实践运用的同时,也触发了教育数据挖掘和学习分析等教育技术研究热点。如何深度分析、挖掘、利用教育大数据,从而有效发掘教育规律、提升教学绩效、促进学习者个性发展,厘清教育数据本质内涵、建构客观教育数据观是关键。针对目前教育研究数据观存在的维度偏向:重视量化的收集而忽略质性的分析、侧重将非结构化数据转变为结构化、强调相关关系而忽略因果关系,该文引入厚数据概念,分析了厚数据强调定性分析、善于揭示数据背景、侧重发现事物因果关系的特征,阐明教育研究中大数据与厚数据一极两仪、缺一不可的融合互补关系,进而强调理应回归大数据和厚数据原本一体、不可分割的“全数据认知观”,深入情景,挖掘厚数据的潜在价值,将大数据和厚数据结合运用在教育技术研究领域中。
关键词:教育大数据;厚数据;学习分析;智慧教育
中图分类号:G434 文献标识码:A
“智慧教育创新发展行动”是《教育信息化2.0行动计划》提出的“八大行动”之一,智慧教育作为新一代信息技术与教育创新融合的新形态,充分体现了万物互聯时代云计算、大数据、人工智能等新技术赋能教育创新发展的作用。我国学者黄荣怀认为建立智慧学习环境需要新技术、新手段,而不同的学生在新型教学模式中都需要不同的与其相适配的学习内容,这些技术的基础都是数据。智慧教育、智慧环境(核心是智慧计算)和智慧教学(包括Smart Teaching和Smart Learning)互相关联而成。完成智慧教育“大厦”的构建,大数据是关键技术。因此,实现智慧教育的前提是教育大数据的完善,经过数据挖掘和学习分析(Learning Analytics)技术处理后的教育大数据为新型教学提供无限可能。教育领域的大数据与教育创新发展随之紧密相伴而行,如何有效发挥教育大数据效能成为关键。
(一)教育大数据的界定
我国学界认为:大数据是指无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合。而教育大数据是大数据的一个子集,特指教育领域的大数据,是整个教育活动过程中所产生的以及根据教育需要采集到的,一切用于教育发展并可创造巨大潜在价值的数据集合。教育大数据并非仅仅强调数据的数量“大”,更重要的是强调数据带来的作用的大,通过对大量的教育数据进行分析,得出教育数据之间存在的关联、分析产生数据的原因并且帮助预测教育发展趋势。
(二)教育大数据的研究热点
自从2010年大数据一词进入我国视野以来,如今我国对教育大数据的研究已经进入稳定发展阶段。《中国基础教育大数据发展蓝皮书(2016-2017)》提出了教学范式3.0,研究集中在利用数据驱动教学范式,即人工智能各技术帮助分析教学过程中教师的教学数据和学生的学习数据,以期帮助教学者、学习者和教学管理者全面了解教学各个环节的数据,以促进教学的整体优化与变革。杨现民、田雪松等详细解释了应用大数据技术构建高效互动课堂的实施策略。方海光提出了整合现有的及未来的业务应用系统的数据,将数据存储在“云”中,最终实现教育资源的信息化共建共享。武法提对于基于教育大数据的学习习惯动力、未来课堂、学习分析工具的功能都具有一定的研究。余鹏、李艳在教育大数据为背景的基础上提出了生态体系模型,该模型能够实现对数据的精准管理。孙志伟等人从教育大数据视角构建了锥体网络状结构模型,从层次性的视角来梳理教育大数据中不同元素之间的关系。此外,国内对于基于大数据的学习分析、机器学习、数据挖掘、深度学习和教学模式、教学管理、教学资源方面也有相关研究。
国外对于教育大数据的研究重点聚焦于三个方向:教育大数据的基础理论、大数据支持下的学习方式探索、教育大数据处理技术的应用与实践。
大数据在推动教育深度改革的过程中发挥着很多重要的优势。在重塑教学模式、重构评价体系、转型研究范式、创新教育决策、变革教育管理等方面的技术赋能意义重大。我国现阶段教育大数据在改善学习方面主要体现为三点:反馈、个性化和概率预测。而教育工作者和研究者在分析教育数据之间的关系,为教育主管部门提供决策支持、提升线上教学的智能性、技术支持学习者的个性化学习、校园安全的舆论监督、对未来发展提供数据支持等方面已有不少研究。
(三)教育大数据研究的偏向
大数据在教育领域的研究逐渐增多已经显示了大数据对教育领域的影响。但由于教育领域的特殊性,对学习者、教学者、教学过程的记录不能仅仅简单的用“0”和“1”来表示,因为教育领域更多面对的不是行为而是思维。较多研究分析了受教育者的行为以及行为之间的关联,但是大多忽略了行为和行为关联背后不可量化、个体化的思维和情绪要素。基于此,在涉及到教育的研究中(环境、过程、对象、行为、效果),不可量化的非结构化数据将大量呈现,并对研究结果产生显著性影响。
现有的数据认识观更多的偏向于大数据的研究方法,在这个视域的研究中,祝智庭等提出了需要从方法论上探索,将大数据与教学实践和教学管理结合,并且提出了教育大数据文化的教育策略。刘清堂等提出了在大数据视角下在线学习过程性评价系统的设计,而在系统的设计中提到,数据采集是很重要的一个环节。但是大多在大数据视域的研究,对人类活动数字化记录的非结构化数据研究略显不足,造成了在整体教育数据研究上的数据认识观偏向:
1.重视量化的收集而忽略质性的分析
教育大数据是通过对学习者、教学者、教育管理者的活动和行为进行追踪而获得的,包含了教育过程中所有的数据,虽然呈现为0和1数字的量化数据很重要,但通过这些海量数据并不能获得对学习者完整的理解,只能得到浅层次的、对学习者简化的解释。例如,随着大数据、人工智能、可穿戴技术和情感计算的在教育领域的发展,教育领域的研究者将学习者的心理行为、体态行为、情感表现等数据整合之后建立了学习者的肖像特征,但是在建立的过程中忽略了产生这样肖像特征的原因和过程却强调了产生的结果。教育大数据通过对全体数据进行量化分析,得到学习者的行为和活动,却忽略了形成这些行为和活动的原因。这也正显示了教育大数据忽略了质性的研究却偏重于量化的结果这一现象。
教育大数据和厚数据构成了教育数据的整体,呈现为一极两仪的有机关系,通过对教育大数据和厚数据的分析能够帮助我们更好地把握教育数据隐含的潜在意义。对于教育数据来说,大数据和厚数据缺一不可,相互依存,大数据研究事物产生结果和过程,厚数据研究事物产生原因;大数据研究范围广,厚数据研究程度深;大数据研究是什么、怎么做,厚数据研究为什么;大数据研究所有数据之间的联系,厚数据研究数据背景。教育大数据与厚数据之间存在着互不可缺的关系。
(一)教育大数据与厚数据的不可替代性
教育大数据包含学习者在学习过程中产生的所有行为表现、档案数据、学习者情感态度等数据,厚数据能够通过分析,得到学习者学习行为的形成原因或者分析对学习者个性化学习产生影响的因素,厚数据得到数据产生“原因”,大数据得到数据生产“结果”,因此教育大数据与厚数据是不能互相替代的。教育数据包括结构化和非结构化数据,因此在处理教育数据过程中需要厚数据作为指导,判断各变量的逻辑关系,为得出更好的分析结果,需要运用厚数据中的一系列的研究方法,为数据的处理提供依据。
(二)教育大数据与厚数据的互补性
教育大数据与厚数据之间具有互补性,即利用厚数据技术分析小样本找出特定人群(教学管理者、教师、学习者)的需要,然后利用大数据技术充分收集足够的量,最终得到我们需要的教育数据集合以供参考,得出特定人群需要的数据,只有通过对大数据和厚数据的综合考量,才能得出具有说服力的数据。通过大数据和厚数据的互补,能够帮助我们在研究过程中避免走进误区。
(三)教育大数据与厚数据的验证性
教育大数据与厚数据具有验证性。在分析过程中,判断不同变量之间的因果关系是为了得出“灵感”,更好地提供决策依据,在一定程度上也能起到预测未来的作用,分析教育数据的过程中还要不断将厚数据中定性的分析和大数据中定量的分析相结合。通过厚数据的分析,得出数据产生的原因,能够帮助验证大数据的可靠性;而大数据的“大”,能够帮助验证厚数据的有效性。
教育大數据与厚数据一极两仪,缺一不可,大数据和厚数据构成了全数据。因此,要实现智慧教育,除了大数据,厚数据也很重要。教育者在利用数据时需要从全数据思维将大数据和厚数据两部分相结合,帮助学习者提升对自身的认知,帮助教育管理者和教学者进行教育决策,促进教育的进化和数据认知观的培养。
在教育领域中,大数据的发展对促进我国教育公平、改革教育制度、创新教育理论提供了有利的依据,若只单纯地从学习者学习过程产生的大数据发现和判断,过度信任教育数据分析呈现的结果,将很有可能造成偏误。因此,在对教育数据的理论研究和应用实践中,理应回归大数据和厚数据原本统一的全数据思维,建构新的数据认识观,挖掘厚数据存在的潜在价值,在教育领域的研究过程中,将大数据和厚数据相互结合运用,辩证、客观对待大数据和厚数据,将大数据和厚数据看成是教育数据的整体,一脉相承,缺一不可。未来的大趋势应该是,不仅需警醒单纯从现有的教育大数据发现和判断,避免过度信任数字呈现结果可能造成的误判;更是要主动透过深入使用情境,探知源于学习者真实个性需求影响而成的智慧教育发展趋势,方能发掘厚数据在教育信息化征程中的重要价值。