基于深度神经网络的个性化学习行为评价方法

2019-07-23 09:27樊一娜

计算机技术与发展 2019年7期

郎波，樊一娜

(北京师范大学珠海分校，广东珠海 519087)

0 引言

随着信息技术的发展，结合大数据和人工智能技术，在线学习方式成为一种越来越重要的学习方式，这种学习方式由于不受时间、地点的限制，并且为教师和学生提供了更多灵活的互动方式。在《国家中长期改革和发展规划纲要(2010-2020年)》和《教育信息化十年发展规划(2011-2020)年》中都对学习的个性化和教学的多样化提出了要求。与传统的教学方式相比，新型的在线学习方式有利于学习者综合各个孤立的知识点，从而形成完整的知识网络。这种学习方式重点突出了学习者的个性特点，例如，学习者在初期学习的时候对学习时间、学习内容、学习类型和与老师的交流方式有着明显清晰的需求，随着学习的深入，学习者也需要对自己学习之后能力水平的评估，学习前和学习后的差距，后续相关知识的跟踪学习等方面也慢慢产生出了自己的需求，但是这种需求是比较模糊，难以量化的[1]。个性化学习虽能简化学习者的成本和运作方式，但对个性化学习教学效果评价目前却缺少合适的手段[2]，尤其是个性化学习所表现出来的一些独有特征，例如：开始学习前学习者对自己具有的知识结构和范围的认知，通过一段时间学习后应该需要弥补的知识盲点、学习结束后学习能力的提升及偏好等。如果对这些个性化学习的特征把握不准，那么就很难实现真正意义上的因材施教。此外，如果用传统的人工力量去分析每一个学习者的活动，则无法面对学习平台上每时每刻产生的浩如烟海的数据。而利用信息化手段，由机器来分析用户学习行为产生的大数据，保留关键有效特征，从而产生完整而准确的个性化评价。

针对这一核心问题，不少研究人员从各个方面进行了深入研究。例如，针对学习平台上产生的海量大数据，文献[3-4]利用Hadoop技术进行海量学习数据的汇聚、存储和获取；文献[5]通过记录学习者在线学习的行为、记录、习惯偏好等活动，形成多维的立体户数据模型来量化个性化学习过程中学习者的行为模式，从而提供有针对性的个性化服务；文献[6]利用梯度下降的方法对数据进行综合，得到相关数据模型进行学动评估；文献[7]提出了在智能导学环境下个性化学习模型的建立及其应用效能的评价的方法；文献[8]设计了基于数字化学习环境下的学习者数据肖像模型，并在此基础上对个性化学习的内涵和特征进行分析；文献[9]分析了在线学习路径和资源对学习者使用在线系统的影响，提出学习者的能力层次对在线系统使用的影响是比较显著的。无论哪种方法，评价的核心在于对学习者在学习过程中产生的数据如何进行有效分类，并通过合适的方式对描述学习者行为的多维数据特征进行有效降维，既能够保证数据特征的唯一代表性，又能够保证系统平台能够以最小的计算代价实现计算。而如何提高分类的精度并且有效地利用分类结果对后续处理提供帮助，深度神经网络在这方面的表现非常显著，目前几乎在所有有关分类的问题领域，神经网络都有不俗的表现[10-13]。

鉴于深度神经网络在特征训练方面的优势，文中提出了一种基于深度神经网络学习的方法。首先对学习者产生的原始学习数据特征向量进行自动聚类，然后利用深度学习网络DNN对多维数据向量特征进行降维清洗，以保证评价数据的真实有效性和实时性，最后通过相关的实验数据对这种个性化评价行为的有效性进行验证。

1 深度神经网络评价模型

1.1 基于多维数据向量的有效聚类方法

根据布鲁姆理论，人类的认知思维分为记忆、理解、应用、分析、评价和创造这六个层次，所以对于在线学习行为数据特征的抽象采取两个层次，第一层是low level特征，它主要包括登录时间、学习时间、学习次数、选择的知识点、讨论次数、提问次数、回答问题次数、解决疑问次数、完成测验的时间、完成测验的成功率、作业得分等，用Ulow={x1,x2,…,xn}表示。第二层是high level特征，主要包括作业完成程度、作业完成的准确率、学习问题提出的质量、回答问题的质量、解决问题的方案质量等，用Uhigh={y1,y2,…,yn}表示。每个样本又可进一步划分为多维特征，例如xi=(xi1,xi2,…,xin)，yi=(yi1,yi2,…,yin)，其中每一个分量代表学习活动的一种特性，如登录次数、学习时间等。

获得多维数据之后，就可以利用聚类算法来对需要的数据特征进行划分，具体算法如图1所示。

图1 学习数据特征的聚类流程

1.2 聚类数据的特征提取方式

聚类数据的特征提取采取基于DNN的隐马尔可夫模型[14-15]，它是一个包含多个隐层的前向神经网络，输入层表示聚类数据的底层特征，输出层表示降维之后的典型特征，在隐层中每个节点的非线性激活函数采用sigmod，每个节点的非线性输出值为：

(1)

DNN训练参数通过BP网络传播算法进行迭代训练获得，如式2所示：

(2)

初始网络参数通过RBM受限玻尔兹曼机进行初始化，如式3所示：

(3)

文中采用深度神经网络建模单元为基本单位，如图2所示，每个多维特征拆分为三个HMM状态，所有多维特征HMM状态与DNN输出层的各个节点一一对应。实验中采用8维的特征作为输入，采用5个隐层，每个隐层是1 024个节点。

图2 用于特征识别的深度神经网络

如图2所示，深度神经网络的输入是学习活动数据，输出对应降维后进行清洗之后的关键典型特征，通过神经网络的分层处理之后增强特征的区分度，一些区分度比较差不利用突出学习者特点的特征量被隐层处理，这样可以保证最后提取出来的特征在大幅降低维数的同时保持最大的区分度。深度神经网络各隐层节点的激活与否主要由节点的输出值确定，为了使特征分布更加近似于高斯分布，文中采用隐层输出值取平均值，以使得特征输出接近高斯分布，如图3所示。

图3 深度神经网络隐层多维度向量平均输出

(4)

其中，hi,L为第i个特征在第L层上的非线性输出矢量，将每一个隐层特征求取均值作为该特征的网络特征，如式5所示：

(5)

为了得到隐层均值特征中的有效特征分量，利用式6得到最终降维之后的有效特征。

E=Hi,t-F

(6)

2 实验分析

实验以国内某著名视频教学网站为测试平台，对900个学生在平台上的学习活动记录进行对照分析。首先按照学习能力层次将实验样本划分为初级、中级、高级三个组别，每个组别包括300个学生对5门在线课程的某个知识点在一个月内的学习活动记录。原始特征向量为32维，能够从各个方面对参与测试的学习者在学习态度、效率、过程等方面进行全面的评估。每个测试组随机选取80个学习者作为有标记样本，再根据样本的学习应用能力将其分为六个不同层次。首先对每个组进行聚类，设置K的值为6。从每个聚类数据中抽取30个样本组成30×6=180个样本的测试集。训练完成后测试集中的180个样本再由深度神经网络处理降维得到典型特征，获取评价结果。与此同时，这180个样本也由人工完成评价，以此作为学习评价的误差依据。经过聚类之后的结果如图4所示。

从图4可以看出，不同课程的知识点对于不同层次的学习者基本上都是呈现正态分布的模式，不论学习者的能力程度如何，对于课程的知识点的掌握基本都符合同样的原则。由于各门课程的难度系数不一样，所以不同的课程也表现出不同的区分度，例如，可以发现中级组和高级组的分布状态和样式基本上一致，而初级组的分布情况则和其他两组有明显的区别。这说明对于现有测试的五门课程来说，入门程度的高低对于学习者后期学习行为的建立还是具有一定的影响。

图5表示对于学习每门课程在不同组别的表现曲线，主要表示不同课程知识点学习的聚类结果。从图(a)看出，由于《web技术基础》课程对学习者的前导知识要求并不是很高，知识点简单，因此初级组都超过了中级组和高级组，这可能和学习者学习的心态有关。图(b)和图(c)这两门课程对前导知识的要求较高，需要具备一定的计算机和数学基础，所以可以发现高级组的学生对于知识点的把握明显优于其他两组。而图(d)和图(e)由于都是程序设计类课程，学习的知识点大同小异，难度相当，所以表现的曲线也是基本相似，但是很明显能够看出初级组对于知识点的掌握与其他两组相比还是有不小的差距。可以看出，高级组样本的学习能力和行为明显高于中级组和初级组，这和学习者前期的学习经历、知识积累、学习习惯、理解能力等方面都有关系，这也说明学习能力的高低是一个循序渐进的培养过程。

为了进一步衡量本实验评价方法的准确性，引入了人工专家评审的方法与机器学习评价的方法进行对比。选取本专业有经验的教师对每门课程的知识点依照不同层次的组别进行评价，人工评价方法的主要依据仍然沿用传统的方法，例如：上课考勤率、作业完成率、完成质量、测试成绩、项目能力等容易量化的指标，为保证统计公平，设定所有的人工专家都具有一样的权重。统计分析的结果如图6所示。从图中可以看出，高级组由于学习背景和能力的优势，曲线略微与其他级别组和人工组有所变化，而初级组和中级组与人工评审得到的曲线高度一致，说明机器学习评价的方法能够真实反映人类对学习效果的评价标准。

图6 人工专家评价与机器统计评价的结果对比

3 结束语

信息技术的发展必然会带来传统学习方式根本性的变化，如何有效利用网络在线学习平台产生的海量数据，对学习用户产生个性化的准确学习行为评价，让学习者更好地了解自己的学习状态和行为状态，真正实现学习方式的“有的放矢”和“因材施教”。文中使用机器学习的方式对网络平台产生的用户数据进行特征分类，再通过深度神经网络对特征数据进行降维后提取典型特征，这样既可以降低训练的计算代价，又能够保证进行训练的特征最能够体现学习者个性学习的特点。从实验结果来看，机器学习得到的评价结果与人工专家评审得到的评价结果基本一致，这说明在数据量保证的前提下，机器评价可以替代人工评价，而且机器评价更具有客观性、对比性。但是从目前最新的研究结果来看，深度神经网络在训练中会出现梯度不稳定的现象，这种现象的存在会影响到神经网络性能的表现[16]。下一步的研究可以考虑引进不同的学习方式来对学习数据进行分析，以期得到更加普适的个性化学习评价方式。