基于大数据的知识发现新途径 视频课例中数据分析与挖掘的 三种应用模式

2021-12-24 04:31王陆
江苏科技报·E教中国 2021年21期
关键词:样貌课例实践性

随着人们对知识的需求不断增加且变得越发迫切,知识发现研究日益受到关注,而基于大数据的知识发现有助于挖掘课堂教学行为和教师实践性知识的数据样貌,为理解教育教学现象及其本质提供深刻的洞见。首都师范大学教授王陆结合团队22年来扎根中小学课堂的实践,深入浅出地介绍了基于大数据的知识发现视频课例中数据分析与挖掘的三种促进教师专业发展的应用模式。

作者简介

王陆 首都师范大学教育技术研究所所长

首都师范大学现代教育技术重点实验室主任

北京市基础教育信息化实验教学示范中心主任

引言

大数据即巨量的资料,指的是专业领域中所创造的大量非结构化和半结构化数据。什么是非结构化和半结构化数据?就视频课例这一特定的研究情境来说,典型的非结构化数据就是我们在课堂中所录下来的课堂录像;半结构化数据就是包含图形、符号、数据等形式的文档,如教师课前撰写的教学设计方案文本以及课后撰写的反思文本。

在视频课例研究中,我所在团队开发的靠谱COP项目研究成果包含了两大类型数据——非结构化型数据和半结构化型数据,分别对应了课堂教学行为大数据和实践性知识大数据。在搞清楚什么是大数据、课堂教学行为大数据、实践性知识大数据后,我将从四个方面对视频课例进行分析和探究。

洞见大数据知识发现

的新见解

知识发现是指从数据集中提取有效的、新颖的、潜在有用的、可理解的模式的非平凡过程。同时,随着计算与网络通信技术、观测与传感仪器以及数字存储的发展,教育学科同很多学科一样,正在从数据贫乏转变为数据富集的研究领域,一种新的透镜——大数据正在影响着研究者看待和认识教育教学问题的方式,也逐渐形成了从数据中提取新知识的有效途径。“让数据说话”开始成為教育学研究领域的一种理论主张,基于大数据的知识发现为教育学的研究找到了新起点,也将获得更深刻的洞见。

数据是知识发现的基础与前提,数据处理的理论、方法与技术势必影响知识发现的过程与结果。大数据的知识发现主要取决于两个关键部分:一是数据获取能力,即对数据获得、共享、整合、分析以及构建预测模型的能力,要获取足够多、足够复杂、足够蕴含复杂关系的数据;二是数据分析能力,即将精细的概率模型、统计推理、数据挖掘与机器学习相结合。

当然,知识发现不可能无中生有地创造知识,数据、信息、实物、现象之间普遍存在的各种关系是进行知识发现的基本依据,尽管在现实世界中有些关系是显性的、直接的、较为容易发现的,甚至可以观测到的,但是绝大部分关系还是隐性的,隐藏在我们数据信息事物和现象中,不容易被发现。其基本关系可以分为五种:因果关系,因时间而形成,是归纳、演绎等知识发现方法的基础;相似关系,因特征相似而形成,是类比、想象、联想等知识发现方法的基础;结构关系,因空间而形成,是系统、综合等知识发现方法的基础;逻辑关系,因逻辑而形成,是分类、比较等知识发现方法的基础;数量关系,因数据而形成,是统计学、数学等知识发现方法的基础。

大数据时代知识发现的思维模式超越了传统数据分析和数据演绎的思维局限性,特别强调三个特点。1.整体兼顾部分:从方法论上看,“全数据模式”注重运用整体方法把握事物,但要克服其局限性,兼顾部分,深化认识,重视还原事物的层次性。2.量化整合质化:从内容上看,质化研究与量化研究应该是统一的、相互补充的——质化研究为量化研究奠定基础,是量化研究的依据;而量化研究是质化研究的具体化,使质化研究更为科学、准确。3.因果强调相关:因果关系是客观存在的,是我们认识世界本质的逻辑前提;即便大数据更侧重强调相关关系,也始终离不开对因果关系的追求,这是由思维的本性所决定的,侧重相关分析并没有否定因果分析。

目前,我们正生活在数据的海洋中。然而,数据不等同于信息,信息也不等同于知识,知识更不等同于智慧。如果我们不能将数据转化成信息,再转化为知识,再涌现出智慧的方法与技术,那么我们就会身处数据的海洋,却忍受着知识的饥渴。此时,基于大数据的知识发现服务应运而生。我所在团队开发的靠谱COP项目就是一种知识发现服务,着眼于课堂教学行为大数据和实践性知识大数据,两组数据相互影响,实践性知识决定了教师课堂教学行为,而教师课堂教学行为的改进,可以反作用于实践性知识,强化甚至重构实践性知识。两组大数据的常模数据库集群为深度的视频课例研究奠定了坚实的基础。

破解基于视频课例的知识发现方法

视频课例一般具有四个工具属性:一是可以跨越时空限制被反复观看。视频课例分析能够提供研究者一种来自研究场域的、永久的且可以支持研究者重复观察的研究资料,从而使得研究者可以发现传统观察方式无法获得的、但也许很重要的线索与知识。二是能够忠实地记录复杂课堂教学的细节以及口语数据以外(动作、表情等)的事件信息。三是视频课例记录可避免教师自陈资料中发生的社会期望偏差。二、三两个工具属性可有效降低因研究者自身的经验和自信而造成的个人主观意见所形成的确认偏差,从而提高研究的可靠性。四是允许跨领域分析并可用于不同分析方法。视频课例分析并不限定于特定的研究方法,可用于民族志、言语分析、互动分析、会话分析等研究中,也可以经过适当编码、计数等转换程序后,同时使用量化与质性等方法。因此,视频课例为教育教学研究开辟了新的空间和新的领域。

基于大数据的视频课例知识发现方法包括资料收集、资料管理和资料分析三个阶段,包括“现象—表征—样貌—知识”循环往复的知识发现路径。

一、现象

教学现象是理解与研究课堂教学活动规律与本质的重要切入点。然而,无论是进入课堂的研究者,还是身处课堂的广大中小学教师,即使有了研究的意识,面对复杂多变的教学现象,也不知如何研究,从而导致了当前的教学规律更多的是研究者通过主观臆想或演绎推论得出的,较少是从复杂、多变的教学现象的观察研究中得出的。

那么,教学现象是如何形成的呢?教学现象是由教学行为导致的,教学现象因课堂教学行为的差异性而具有丰富性和多样性;大数据自身蕴含的模式与关系就可以对复杂的现象产生知识洞见。

在日常的课堂观察中,我们往往会有这样的评价:优秀教师的课堂教学很深入、很有效;低水平教师的课堂教学很浅显,有效性很差。但评价从何得出呢?我们往往无法详细列举。但有了大数据的辅助——教学行为转换序列网络关系图,我们就可以很容易地对其进行描述。教学行为转换序列网络关系图分为六个层次,从低到高依次为记忆、理解、运用、分析、评价、创造,通过研究发现,优秀教师的课堂教学不仅在低级阶层有很多的认知活动(记忆、理解、运用),同时在高级阶层仍然有很多认知活动(分析、评价、创造),而且低级阶层和高级阶层之间有很多的互动;但低水平教师的课堂教学大部分停留在记忆和理解阶层。由此我们便可以对之前的评价进行详细的描述。

二、表征

表征是数据信息的呈现方式,特指当事物从“感性存在”转变为“数字存在”时数据所构成的事物表象。大数据是对真实世界的表征与映射,由于任何形式的表征都会带来信息的丢失,所以一般主张应该直接对视频课例进行编码而略过表征的环节。本文对此不作赘述。

三、样貌

样貌指意义上的表象,意为真实世界中的知识可计算与可视化地赋予数据的外貌。编码体系和记号体系两大类方法可以有效赋予课堂教学行为以数据的样貌。编码体系方法要求确定要观察的具体项目,然后对准备观察的具体项目进行编码。编码体系通常采用时间取样法,观察在特定的时间内发生的特定行为,并以行为编码表示。記号体系也叫项目清单,是指预先列出一些需要观察并且有可能发生的行为,观察者在每一种要观察的事件或行为发生时做个记号。

除此之外,人工智能机器学习等算法可以有效赋予实践性知识以数据的样貌。例如我所在团队从六个维度(教育信念、自我知识、人际知识、策略知识、情境知识、反思知识)对实践性知识数据进行了分析,结果显示,新手教师和成熟教师的人际知识增长最快,而胜任教师策略知识增长最快。

四、知识

知识是人类在改造世界和社会实践中获得的认识与经验的综合,传统的知识生产方式主要是理论驱动式的生产模式,这是一种精英化的知识生产方式。随着大数据智能时代的到来,已经形成了从人类获取与产生的各种数据中提取知识的新途径,数据驱动的知识已经成为认识人和社会的全新的知识来源。大数据为什么可以产生数据驱动的知识呢?这是因为大数据具有三大特性:精准数据追溯能力、协同数据驱动能力、可视化数据决策能力。大数据解释了一种新的知识发现路径,从海量的数据中挖掘出其背后具有规律性的“小模式”。例如,我所在团队针对福建省厦门市思明区教师三年的成长路径数据挖掘出十条有效的发展路径(见下表),这就是大数据背后发现的“小模式”,也是数据的一种高级表达形式。

从“现象—表征—样貌—知识”的知识发现路径,我们经历了经验科学、理论科学、计算(实证)科学、数据驱动型(大数据)科研四代范式。当前我们正经历着第四代范式,与第三代研究范式相比较,其分析思路从“假设—验证”变为了“发现—总结”,分析过程从“定性—定量—再定性”变为了“定量—定性”,逻辑关系从“分布理论—概率保证—总体推断”变为了“实际分布—总体特征—概率判断”。可以说,随着研究水平的提高以及数据可得性、易得性的提升,我们的知识研究已经发生了根本性的转变。

猜你喜欢
样貌课例实践性
基于语篇分析的课例研究
高中物理教材实践性栏目育人价值及其实现策略
实践性是劳动教育课程的第一性
40岁后的样貌靠自己
学天鹅的鸭
时髦美术馆
课例
实践性教学应着力解决的几个问题
课例:双曲线的简单几何性质
课例.篮球体前变向换手运球