李丹丹+杨絮+张海+罗立成
● 探索式学习环境的现状、问题与发展趋势
探索式学习环境提供了以学生为主导的非结构化的主动学习环境。它的优点在于支持学生的主动学习,而不是教师控制型教学,缺点是如果不能识别学生的行为和需求,探索式学习环境往往会失去对学生的有效指导。因而,如何通过数据挖掘,构建学习者模型,已经成为今天教育数据挖掘中的主要研究课题。
来自微软研究院的两名科学家Saleema Amershi和Cristina Conati探索了一种新的方法,克服了此前研究思路的不足,这种新方法利用数据挖掘手段,自动识别通用的交互行为,并通过这些行为来训练用户模型。该模型与传统的基于知识的模型或通过手动标记数据监督模型的差别在于,使用模型后,不必在观察个体学习者的行为模式后再建模,只要将数据输入到受监督的分类器,程序就能够自动呈现学习者通用学习行为模式的可视化分析图片,并能通过这张图片分析其学习效果。这就大大节省了专家的工作量。尽管这些模型不够精细,但仍足以提供探索式学习环境所需要的交互变量。
● 探索式学习环境案例:AIrspace CSP Applet
本文介紹的探索式学习环境名称为人工智能空间约束满足问题小程序(AIspace Constraint Satisfaction Problem (CSP)Applet,以下简称为CSP Applet)。这是一个交互式工具集合,能用算法可视化系统来帮助学生探索常见人工智能算法。
图1显示了一个CSP Applet中以图形方式表示的约束满足问题(AC-3算法)示例。最初,网络中的所有弧都是蓝色,表示需要对其进行一致性测试。当AC-3算法运行时,图中的状态变化通过使用颜色和突出显示来表示。CSP Applet为AC-3算法的交互执行提供了几种机制,并可以通过图1顶部所示的按钮工具进行访问,也可以直接操纵图中元素。
● 建模的第一个阶段:离线聚类
Saleema Amershi和Cristina Conati所提出的学习者建模方法,其建模过程可分为两个主要阶段,首先是离线阶段。
1.数据收集和预处理
24名本科生参与了实验。首先,学生有一个小时的时间来阅读关于CSP问题的课本章节。接下来,他们对材料进行20分钟的预测试,在测试之后学生们使用CSP Applet学习示例问题,最后给出了与预测几乎相同的答案。当前的实验中,研究人员使用与CSP Applet的用户交互记录的时间戳工具来记录相关数据以及前后测试的结果。
离线阶段的第二步是通过收集的数据计算低级特征来生成特征向量。从记录的用户研究数据中计算得出了与24名研究参与者相对应的24个特征向量。特征向量具有21个维度,并总结出每个动作的三个特征:①动作频率;②动作之后的平均等待时间;③行动延迟后的标准偏差。
2.无监督聚类
在形成数据的特征向量后,离线阶段的下一步是对特征向量执行聚类,用来发现学生在交互行为中的模式。该研究执行了20个试验(随机选择的初始聚类中心),并使用最高质量的聚类作为最终聚类集。将K均值聚类应用于研究数据,其中将k设置为2和3。
3.聚类分析
在这个阶段首先分析集群,以确定学生的交互行为是否有效。根据应用程序使用的结果确定哪些学生群体是成功的学习者,哪些不是。
聚类分析的第二步是通过评估每个特征维度上的群集相似性和不相似性来明确地表征不同群集中的相互作用行为。该研究使用正式的统计测试来比较学习和特征相似性的集群。
(1)CSP小程序的集群分析(k=2)
将k-means群集之间的平均学习成绩与k为2的群集比较,发现该群组比其他集群的学习成绩高。此后分别将这些集群称为“HL”(高学习)集群和“LL”(低学习)集群。
为了表征HL和LL集群在区分学生互动行为方面的情况,研究人员对21个维度中每个集群之间的差异进行成对分析。结果显示,LL集群中的学生使用CSP小程序比HL集群中的学生更频繁。此外,精英阶段的延迟平均值和标准偏差在LL集群中的学生中都有所缩短,表明他们的精细步调频繁且始终如一。这些结果表明,LL集群中的学生可能会机械地使用这个功能,而不需要暂停来考虑每个步骤的影响,这有助于这些学生获得收益。
复习后,HL集群中的学生比LL集群中的学生停留时间更长,更有选择性。事后看来,这些学生是成功的学习者,这个行为表明他们能够反思问题。
(2)CSP小程序的群集分析(k=3)
k为2的群集的学习结果与k为3的群集有显著差异。成对分析显示,与其他两个群体相比,该群体学生的学习成绩有明显提高,两个LL集群之间没有显著的学习差异,我们将其标注为LL1和LL2。
研究人员发现两个LL集群中的学生和HL集群中的学生间的行为区别有以下几点:首先,LL1和LL2学生的精练步调频率高于HL学生,呈现出非常显著的趋势。HL集群中的学生的延迟时间的平均值和标准偏差均显著高于LL1和LL2集群中的学生,这表明LL集群中的学生在精细步骤之后始终比HL集群中的学生更少停留,这减少了学生的注意力,可能会对他们的学习产生负面影响。复习后,HL集群中的学生比LL1和LL2集群中的学生停留时间更长,更有选择性,这表明HL学生可能会更多地思考问题。
k-3聚类也揭示了在HL和LL集群之间和在两个LL集群之间的几个附加模式都表明k=3能更好地区分相关的学生行为。k-3聚类揭示了更复杂的模式,总结如下:①LL1集群中的学生使用域名拆分功能远远超过HL集群中的学生。②HL和LL2集群中的学生频繁使用域拆分功能。③HL和LL1集群中的学生在域名拆分后的休息时间相似,暂停时间比LL2学生长得多。④LL1集群中的学生比HL和LL2集群中的学生更有选择地停留。 ⑤LL1回溯后的停顿时间比HL和LL2集群都多。
● 建模的第二个阶段:在线识别
建模方法的第二阶段是在线识别,将新用户的在线分類纳入“成功/不成功”的学习者组。这个阶段设计了一个在线k-means分类器,伴随着学生与目标探索式学习环境进行交互,逐步更新分类。发生动作时,学生行为的特征矢量暂时停止,以反映观察结果。
为了评估模型,研究人员进行了24倍的一次交叉验证(LOOCV)。在每个折叠中,从N个可用特征向量的集合中删除一个学生数据,并且使用k-means来重新聚集缩小的特征向量集。接下来,将删除的学生数据输入到分类器用户模型中,并对如上所述的传入动作在线预测。
图2显示了两类k均值分类器在与CSP小程序交互时预测24名学生(使用LOOCV策略)的正确分类的平均精度。该图还显示了将HL集群中的学生分为HL集群和LL集群中的学生进入LL簇的模型性能。图2的趋势显示,随着越来越多的证据积累,该分类器的整体准确性得到提高。虽然分类器在检测HL学生中的表现优于基线,但仍然可能导致基于此模型的系统干扰HL集群中的学生的自然学习行为,这是探索式学习环境的关键之一。分类LL和HL集群中的学生的准确性之间的不平衡可能是由于样本数据的分布,因为HL集群的数据点少于LL集群。这是分类器学习中的常见现象,如果收集更多的培训数据来纠正这种不平衡,可能有助于提高分类器用户模型对HL集群中的学生的准确性。
图3显示了作为该分类器用户模型(实线)观察到的学生动作次数的函数的总体预测精度。为了比较,该图还显示了最可能的基线用户模型(虚线)的性能,由图3可知分类器的准确性随着更多的观察而提高。
图4显示了各个群集的预测精度趋势。对于HL集群,分类准确性(虚线)开始非常低,但在发生约40%的动作后达到75%,发生所有动作后达到100%。分类LL1集群中的学生(虚线)的模型的准确性开始也低,而在发生约60%的动作后达到约75%。LL2集群中的学生(实线)的准确性保持相对一致。所以应用用户建模框架时,应收集和使用更多的培训数据,特别是随着群集数量的增加。
● 结论
上述研究结果表明,尽管受数据可用性的限制,该方法仍能检测学生行为的有意义的集群,并且可以在学习行为的有效性方面对学生合理分类。