徐鹏飞 郑勤华 陈耀华 陈丽
【摘 要】 近五年网络教育的变革和深度学习等人工智能技术的飞速发展给学习者模型的研究和应用带来了新的机遇和挑战。目前,教学数据中蕴含的大量价值亟待挖掘,而实践中绝大部分教学环境对学习者的理解、状态跟踪和自适应性仍处于初级阶段。如何从数据中建立学习者模型、如何在教学环境中设计和使用学习者模型是下一阶段教育变革的核心技术问题。为此,本文从知识状态模型、认知行为模型、情感模型和综合模型四个类别分别阐述了具有代表性的学习者模型及其主要应用场景。研究认为,深度学习未来将在学习者模型的研究和实践中扮演重要角色,而基于各种学习者数据对学生进行全面而综合性建模的综合模型应用是大势所趋。
【关键词】 在线教育;在线学习;学习者模型;学习分析;教育数据挖掘
【中图分类号】 G40-057 【文献标识码】 A 【文章编号】 1009-458x(2018)6-0005-7
一、引言
当前,我国的教育信息化发展进入到以有效支持教与学、促进学生个性化发展为核心诉求的新阶段。《教育信息化十年发展规划(2011-2020年)》在基础教育信息化发展水平框架中提出,学校教育教学方式的变革要在学生多样性、个性化学习的改变上取得突破。《国家中长期教育改革和发展规划纲要(2010-2020年)》也指出,“关心每个学习者,促使学生更加主动积极地发展,尊重教育规划和学生身心发展规律,为每个学生提供适合的教育”。在这一进程中,对学习者模型的研究尤为重要。
学习者模型是对真实学习者的一种抽象表示,代表了学习者的知识技能、认知行为、情感体验等方面的水平和特征(Chrysafiadi & Virvou, 2013)。在智能辅导系统中,学习者模型扮演着大脑的角色,它可以在学习者学习的过程中跟踪其状态的变化,并自适应地给学习者提供合适的交互。而在大规模在线学习环境中,学习者模型可以对大规模的学习者进行定性或定量描述,为教师和学习环境设计人员的决策提供重要参考。在大数据和人工智能的时代,学习者模型有着非常广阔的研究空间和应用场景。
构建一个学习者模型的初期要考虑的主要因素包括作为数据来源和应用场景的教学环境、所选择建模的学习者特征以及所采用的建模技術(Chrysafiadi & Virvou, 2013),因此学习者模型可以从教学环境、建模对象、建模技术这三个角度进行分类。本文采取的分类方式是按照建模对象,即“以学习者的哪一个方面作为基准进行建模”来进行分类。本文将按照学习者知识状态模型、学习者认知行为模型、学习者情感模型和学习者综合模型这四个类别,分别介绍目前一些具有代表性的学习者模型,为相关研究人员和从业者提供参考。
二、以知识状态为基准的学习者模型
以知识状态为基准的学习者模型所关注的是学习者在学习的过程中其知识状态的变化。从建模技术角度看,常用的方法有覆盖模型(Stansfield, Carr, & Goldstein, 1976)、铅版模型(Rich, 1979)、偏差模型(Mayo, 2001)、贝叶斯知识跟踪模型(Corbett & Anderson 1994)等。覆盖模型是把学生所拥有的知识集看作是专家知识的子集,通过将学生知识子集与原集进行比较,可以根据学生的知识缺陷向其推送适当的学习内容和学习策略。铅版模型一个简单的分组用户模型,将用户分成几组,每组学生包含学生知识、偏好、兴趣、学习目标、学习历史等。偏差模型记录学生的问题解决路径与专家路径的偏差,这些偏差描述了学生在特定知识点中的某种不足,并且能够根据偏差的类型给出具体的补救措施。张舸等(2012)评述了上述几种典型的学习者模型建模方法,而本小节将重点介绍基于贝叶斯知识跟踪的学习者知识状态模型(Corbett & Anderson, 1994)。
贝叶斯知识跟踪(Bayesian Knowledge Tracing, BKT)模型假设每项知识(或技能)有四个参数:初始概率、习得概率、猜对概率、疏忽概率(如表1所示)。初始概率p(L0)是学生在与学习系统产生交互之前“已掌握”该技能的概率;p(T)是学生在每次学习机会(或问题)之后,从“未掌握”状态转移到“已掌握”状态的概率;p(G)是学生在“未掌握”状态下猜对相关问题答案的概率;p(S)是学生在“已掌握”状态下答错问题答案的概率。前两个参数与知识掌握相关,而后两个参数则与答题表现相关。BKT是一个相当简单和受限的隐马尔科夫模型:其隐式节点代表知识点掌握情况,只有“0”和“1”两种状态,分别代表“未掌握”和“已掌握”;其显式节点代表学生完成练习的情况,也是“0”和“1”两种状态,分别代表“错误”和“正确”。
表1 贝叶斯知识跟踪(BKT)的四个参数
[参数 说明 解释 p(L0) 初始概率 学生在与学习系统交互前掌握知识点的概率 p(T) 习得概率 学生从不会到会的转移概率 p(G) 猜对概率 学生在不会的状态下仍然猜对的概率 p(S) 疏忽概率 学生在会的状态下仍然做错的概率 ]
基本BKT模型中的四个参数分别是针对各个技能点和题目设置的,并没有考虑学生个体在能力上的差异。针对该局限性,Wang和Heffernan (2012)、Pardos和Heffernan (2010)分别对BKT模型提出了多种扩展,通过增加隐式节点使模型能够模拟学习者在个体能力上的差异。Yudelson、Koedinger和Gordon (2013)通过比较各种个性化扩展的方式,发现在习得概率p(T)上的个性化对模型的预测效果有较大的作用;相比之下,针对p(L0)的个性化对模型的预测效果的提升较小。
基本BKT模型的另一个缺点是需要依赖专家建立的技能模型,并需要对每个问题进行标注,将其映射到相关技能或主题。除了知识跟踪模型外,技能模型还可以用于其他场景,比如检查技能与投入度的关系(Doddannara, Gowda, Baker, Gowda, & Carvalho, 2013)。但是,技能模型本身的创建和相关标注是一项具有挑战性且耗时耗力的工作,而且在实际中练习与技能之间的映射关系并不总是简单清晰的,可能是复杂而模糊的,这一方面会提高知识跟踪模型的构建成本,另一方面也会限制知识跟踪模型的应用场景。因此,研究者基于题目中包含的文本和学习者的交互数据,尝试采用主题建模(Thai-Nghe, Horváth, & Schmidt-Thieme, 2010)或技能分解(Desmarais, 2012)等方式来自动发现技能或对问题进行标注。尽管目前看来自动化技能发现和问题标注的效果与专家手动方式的效果相比还有一定差距(Slater, Baker, Almeda, Bowers, & Heffernan, 2017),但随着自然语言处理、知识图谱和人工智能等领域的发展,这种方式可能会逐步代替传统方式,从而使知识跟踪模型更加便捷和通用。
学习者模型近年来也受到深度学习热潮的席卷。Piech等(2015) 认为即便加上诸多扩展BKT依然有其局限性,例如在BKT模型中学生对知识的理解或技能的掌握是二值的,学生的响应数据(对答案的标记)也是二值的;这两个假设在许多场景下也许不太现实,限制了BKT的建模等能力。Piech等(2015) 提出了深度知识跟踪模型(Deep Knowledge Tracing, DKT),它使用循环神经网络模型,基于学生的测验数据对学生进行连续性的隐式建模。和BKT不同的是,DKT对技能掌握和学生响应采用了连续的表示。从实验结果来看,DKT对学生表现的预测更加准确,并且不依赖专家构建的领域知识结构和相关标注。DKT的主要缺点是可解释性不如BKT。有趣的是,在分析了DKT的成功后,Khajah、Lindsey和Mozer (2016) 用已提出的BKT擴展进行适当组合后,获得了非常接近的效果。从他们的实验结果来看,深度模型在学习者建模领域还没有像在某些领域那样取得很大的领先优势。但毫无疑问,DKT是深度学习方法在学习者建模领域的一次成功的具有突破性的尝试,有力地促进了知识跟踪模型领域的研究。
三、以认知行为为基准的学习者模型
学习者知识状态模型一般仅仅基于学习者的测评数据进行建模,但实际上学习者在教学环境中留下的数字足迹远不止测评数据,这一点在学习管理系统(LMS)和大规模在线学习环境下尤为明显。彭文辉等(2006)从信息检索学习行为、信息加工学习行为、信息发布学习行为、人际沟通交流行为、基于问题解决的学习行为五个维度构建了多维度的网络学习行为模型。Veeramachaneni等(2013) 则将MOOCs下学习者的行为分为观察、提交、协作三类。观察类行为指的是学习者浏览和观察网站上的资源,如维基、论坛、授课视频和电子书等的行为;提交类行为指的是学习者提交自己生成的内容和反馈,如作业、考试、测验、练习、笔记、实验等;在协作类下,学习者与其他学习者产生交互,如论坛模块内的讨论、维基模块内的协同编辑等。尽管学习者认知行为模型的研究和应用并不仅仅受限于MOOCs这一个学习环境,但MOOCs由于其较大的学生规模、多样并开放的交互方式,无疑为学习者认知行为模型的研究提供了非常好的土壤。
依据学习者的行为数据,我们可以选取合适的特征对学习者进行分组。例如,Anderson等(2014) 根据观看视频和提交作业的情况,将学习者按照投入模式分为观察型、解题型、全面型、收集型和局外型五个类别。观察型主要观看视频,很少提交作业;解题型与其相反,主要行为是提交作业,而观看视频行为则很少;全面型综合了观察型和解题型,既观看视频也提交作业;收集型也很少提交作业,但他们主要是下载视频,至于有没有观看则无从知晓;局外型则是注册了课程但整体行为量低于一定阈值的不活跃用户。宗阳等(2016)基于学习平台上记录的行为数据和RFM模型将学习者分为八个学习者价值类型,每个类型都具有不同的行为特征。
我们也可以基于行为数据对学习者的认知行为从某个角度进行量化。例如,Sinha等(2014) 认为学习者与教学视频的交互数据是MOOCs环境下覆盖学习者最多的一类数据,而且仅仅通过这单项数据就可以对学习者进行有效的认知行为建模。他们从三个层面研究了学习者观看授课视频时产生的交互数据:最底层是基本操作,包括播放、暂停、向前搜寻、向后搜寻、向前滚动、向后滚动、加速和减速八种点击操作;第二层是有认知含义的行为性动作,包含重看、跳过、快看、慢看、理清概念、核对参考和速率改变;第三层是代表认知投入水平的信息处理指数,由对第二层的动作进行加权重求和得到。该模型显示从最底层的点击数据可以派生出一组有认知意义的度量,并可用于预测学习者的高层行为和学业表现。提交和协作类的数据,比如论坛数据,虽然可能量相对不大,但可能包含了观察类数据所反映不了的重要信息。例如,学习者在协作过程中所形成的社会网络是研究者非常关注的主题 (Joksimovi
论坛、维基等模块中包含的文本数据则可以用计算语言学的工具进行深入的分析。例如,Dowell等(2015) 基于文本数据建立了一个面向语言和语篇的学习者模型,并用它来预测学习者的社会网络中心性和学业表现,是一项很有意思的工作。他们认为尽管社会网络分析具有完善的理论基础并且在教育领域有成熟的应用,但由于大规模在线课程的开放性,MOOCs中的社会网络分析需要更细致的解释。例如,在社会网络中心性和学业表现的相关性上研究者在少量实验上得出的结论可能是相互矛盾的。他们使用计算语言学工具来对每个学习者所贡献的文本数据分别从叙事性、深度衔接性、指称衔接性、句法复杂性、词汇具体性五个维度进行量化,进而对学习者进行建模。实验发现,学业表现出众的人群和处于社会网络中心的人群并不一样,这两组人群在上述模型上的差异主要体现在叙事性、深度衔接性和指称衔接性这三个维度。处于社会网络中心的人群的叙事性较强,而词汇和想法的重合较少;相比之下,学业出众人群的语篇更偏向说明性而非叙事性,词汇和想法的衔接较多。相比其他学习者,这两组人群的共同特点是句法更简单、词汇较抽象。这项工作构建的学习者模型反映了学习者语言和语篇的差别,实验证明该模型可以更好地预测和解释学业表现和社会网络中心性这两个研究者特别关注的点。
和深度知识跟踪模型(DKT)类似,Tang等(2016) 也提出了面向学习者行为的深度模型。该深度行为模型可以根据学习者的历史行为来预测学习者下一步的行为,实验显示和传统模型相比,深度模型在预测准确率上有一定的优势。该深度模型和深度知识跟踪模型(DKT)一样采用循环神经网络来表示学习者,但该行为模型考虑了学习者所有类别的行为数据,而不仅仅是DKT所考虑的评测数据。此类模型的应用场景可能包括自动化推荐系统:系统可以根据学习者的历史行为来预测其下一步行为,评估该行为是否会达到理想的学习结果,并进一步选择是否干预以及合适的推荐内容。
四、以情感为基准的学习者模型
研究者发现情感与认知、动机和行为密切相关,在学习过程中扮演关键角色。根据建构主义理论框架,学习者的情感状态可能会系统性地影响他们处理新资料的方式 (Craig, Graesser, Sullins, & Gholson, 2004)。如果教师和教学环境能帮助最小化学习者的恐惧、受挫、压力等负面情绪,促进学习者的开心、享受等正面情绪,学习者将更有可能成功实现学习目标。因此,在线教学环境中的学习者情感建模受到了越来越多的重视。学习者情感模型可以从几个角度进行分类。根据模型在时间轴上的粒度可以分为快照式情感模型和连续式情感模型:快照式情感模型只建模学习者在关键时间点,如学习前和学习后的情感;连续式情感模型则对学习者在学习过程中的情感变化进行连续的跟踪。情感模型还可以根据模型数据收集的方式分为主观情感模型和客观情感模型:主观情感模型的数据可能来源于学习者通过问卷调查、访谈等方式自己报告的数据;客观情感模型的数据来源于学习者与学习环境的交互数据、视频数据、音频数据等。随着技术的进步,客观连续的情感模型受到越来越多的重视并得到很大的发展,因此下文将主要关注客观连续的情感模型。
情感模型在所关注的情感维度上可能存在一定差异。例如,Pekrun (2005) 通过一系列定性的案例研究发现,学习者最常报告的是正面情感是享受、希望、自豪和放松,而最常报告的负面情感是焦虑、愤怒、无聊和羞愧。Ekman和Friesen (1978) 则集中于和面部表情相关的基本情感。Craig、Graesser、Sullins和Gholson (2004) 用一个手动情感编码系统观察到在智能辅导系统中出现了沮丧、无聊、兴趣、迷惑、欢欣和中性六种情感状态。Kort、Reilly和Picard (2002) 提出一个结合情感维度和学习阶段的四象限螺旋式模型。其中,横向的情感坐标轴可能跨越多个情感集的负面情绪和正面情绪,如焦虑-信心、无聊-入迷、泄气-欣快、沮丧-鼓励、恐惧-兴奋等。竖轴是学习轴,表示了从“反学习”的状态到建构式学习的转变。该模型认为学习者的状态在不同的象限间移动,教师或者学习环境应该跟踪该移动路径来决定合适的干预策略。知识维度也可以作为第三个坐标轴加入该模型中。
情感模型的数据来源可以是多种多样的。例如,Ekman和Friesen (1982) 用脸部动作编码系统研究了情感的表现形式,这套系统认为基本情感可以用脸部的特定特征来编码,这些脸部模式可以用来识别六种基本情感,包括快乐、悲伤、惊讶、厌恶、愤怒和恐惧。这项工作是许多学习环境使用人脸图像进行情感建模的重要参考(Afzal & Robinson, 2010; Ez-Zaouia, Lavou, & Elise, 2017)。但仅仅通过脸部表情或声调变化来进行情感建模可能存在一定的局限性。比如一个内向的学习者可能会控制其情感的显示,而导致算法无法检测其内心的情感波动。由于情感状态也会影响生物指标,如心率、血压、皮肤电传导、颜色和温度 (Picard, 1997)。学习者通常难以控制这些生物指标,因此它们可以为情感建模提供可靠的信息。但单个生物指标往往不足以识别特定情感,因此多模态的数据采集和融合有助于情感建模的准确性。例如,Kapoor、Burleson和Picard (2007) 在实验室环境下使用相机、压力传感椅、压力鼠标和皮肤电传导传感器等多种传感器。此外,文字作为信息传播的一种主要形式,在情感的表达中也具有非常重要的作用,因此学习者在论坛或微博上的文本也可以作为学习者情感模型的数据来源(黄焕, 2014; 疏凤芳等, 2012)。
在采集多模态的数据之后,情感建模往往需借助机器学习领域的模型和技术来处理多模态数据的复杂性和情感识别过程中的不确定性。例如,Kapoor、Burleson和Picard (2007)采用特征提取和情感分类两个模块从多模态数据中构建情感建模。而Conati (2002)则基于人脸、皮肤电传导、心跳等数据,采用动态贝耶斯网络来监控学习者情感。总的来说,有两种多模态数据的融合策略:一种是特征层融合,基于不同模态构建特征向量,用于分类器的输入;另一种是决策层融合,每个模态都有自己单独的分类器,而这些分类器的结果将组合在一起用作一个最终分类器的输入。尽管特征层融合有可能获得更好的识别效果(Caridakis et al., 2008),但是决策层融合无疑具有更加模块化的优势 (Pantic, 2005)。采用决策层融合的策略,开发者可以直接调用第三方提供的情感识别API,从而大大简化了情感模型的构建。
目前,在学习者情感模型中常用的特征有人脸图像或视频、语音和文本等(Ez-Zaouia, Lavou, & Elise, 2017)。可以预见,随着普适计算、穿戴式设备、情感计算和人工智能等领域的发展,学习者情感模型将更加多模化与智能化,其应用场景也更为广阔。
五、学习者综合模型
學习者综合模型指的是对学习者多个方面进行综合而建立的整体性模型。例如,在自适应学习系统中可以通过对学习者的知识水平、认知能力、偏好信息进行综合性建模,提高自适应学习系统适应学习者的能力(贾冰, 2010)。除了在自适应学习系统中的应用外,学习者综合模型还有两类比较典型的应用场景。一类是预测性模型,这类模型为了提高预测准确率而综合考虑了学习者的多种信息;另一类是评价性模型,这类模型为了提高评价的客观性和全面性,也尽可能多地考虑学习者的多种信息。
预测性学习者综合模型的一个典型应用场景是MOOCs环境下的退学预测(Nagrecha, Dillon, & Chawla, 2017)。因为高退学率是MOOCs最显著的一个缺点,所以退学预测一直是MOOCs研究的一个重要主题。退学预测的大多数研究采用的是监督式分类的方法,系统可以采用点击流、作业评分、社会网络甚至人口学信息等多种数据源,通过特征工程和机器学习算法来优化预测准确率。这类学习者综合模型虽然综合了学习者在多个方面的信息,但模型的可解释性存在一定的挑战。目前主要有两种方法可以保留预测性模型的可解释性:第一种方法是需要采用线性模型、决策树等可解释的分类技术,这种方式可能要损失一定的预测表现;第二种方法是使用Parzen (Baehrens et al., 2009) 或LIME (Ribeiro, Singh, & Guestrin, 2016)等模型解释技术。
评价性学习者综合模型的提出则主要为学生评价服务,需要以教学目标作为价值判断的依据和准绳。例如,郑勤华等(2016)以学生综合评价为目标,通过理论演绎和专家访谈构建了以投入度、完成度、调控度、联通度和主动性为核心的五维度综合评价参考理论模型,并通过学习行为数据聚合特征变量,构建了相应的计算模型,如图1所示。其中,投入度从活跃性、持续性等方面对学生在线学习的投入程度进行评价;完成度以课程的教学目标为标准对学生实际完成情况进行评价,对于不同类型的课程教学目标的侧重点不同,完成度的指标以及权重设置也会进行相应调整;主动性包括完成自主学习任务的主动性、参与教师指定教学活动的主动性以及进行交互的主动性等,主动性在一定程度上表征了学习者的学习动机水平与变化情况;调控度从学习的规律性、持续性、效率等方面对学生调控自己学习过程的水平进行评价,是对学生认知策略、自主学习能力进行表征和评价的重要维度;联通度则对学生建立社会化认知网络的能力进行评价,包括建立连接的能力、维护连接的能力等。联通度的评价核心是交互,包括学生与资源的交互、学生与教师及其他学习同伴的交互。
六、讨论和建议
学习者模型是一个涉及认知心理学、教育学、计算机科学等多个学科的领域。学习者模型最初来源于智能教学系统(Intelligent Tutor System,ITS),由于智能教学系统强调在学习过程中诊断学习者的知识,因此早期的学习者模型主要用于描述学习者的知识状态。我们可以看到随着学习环境的变革、相关技术的进步、认知理论的发展,学习者模型也在不断地发展和演化。现在,学习者模型的表示范畴已不仅限于知识状态,它可能涵盖了学习者的情感、认知、元认知等多个方面。
关于学习者模型的一个重要趋势是其应用场景越来越多样化。除了自适应学习系统这一典型应用外,学习者模型还可以用于对学习者的分组(Anderson等, 2014)、对学业表现和重要事件的预测(Nagrecha, Dillon, & Chawla, 2017)、对学习者的综合评价(郑勤华, 等, 2016)、仪表盘(Ez-Zaouia, Lavou, & Elise, 2017)等不同的应用场景。在不同应用场景下,模型使用者对学习者模型的诉求是存在差异的。例如,在预测性应用场景中,模型使用者更关注模型预测的准确率,而较少关注模型的复杂度与可解释性;在仪表盘和分组等应用中,模型的可解释性就显得更为重要,模型的复杂度必须在可控的范围内。总之,学习者模型是对真实学习者的抽象表示,根据不同的应用场景和实际情况,选择合适的学习者表示方式和建模技术至关重要。
学习者模型的构建方式也在逐渐变化。在传统的智能辅导系统中,知识状态跟踪模型的先决条件是领域知识结构以及问题与知识的映射关系的建立,而这项工作传统上是专家手动完成的。与之类似的是,在传统的分组和预测应用中,特征的选取也往往由专家手动完成。而随着自然语言处理和深度学习等技术的发展,这些专家手动完成的工作可能将逐步被半自动或全自动的数据驱动的程序所代替。深度知识跟踪模型(Piech et al., 2015)是此趋势的一个比较典型的案例。在此趋势下,学习者模型的构建将更多地依赖智能的程序和大量的数据,而非专家的领域知识。为充分享受到学习者建模技术的变革成果,从业机构可以从两个方面着手来应对上述趋势:一是根据在机构内部根据实际情况进行相关的数据和人才储备;二是充分了解并借助机构外部的相关资源,例如人脸表情识别等人工智能云服务。
学习者模型应用场景多样化、构建方式自动化这两大趋势都离不开数据这一推手。大规模在线学习环境可以采集到大量的学习行为数据,为学习者模型的构建提供了有力的数据支撑,同时也为学习者模型提供了新的应用场景。传感技术的发展,也在不断地延伸着学习者模型的数据来源和应用场景。基于各种学习者数据,全面对学生进行综合性建模的综合模型具有更广的应用前景。近年来,人工智能尤其是深度学习的发展,使得大规模数据的利用效率、智能模型的学习能力得到了很大的提升,为构建更强大的学习者模型提供了有力支持。
[参考文献]
黄焕. 2014. 面向e-Learning的学习者情感建模及应用研究[D]. 武汉:华中师范大学国家数字化学习工程技术研究中心.
贾冰. 2010. 自适应学习系统中学习者模型的表示及特征值获取方法研究[D]. 长春:东北师范大学教育部数字化学习支撑技术工程研究中心.
彭文辉,杨宗凯,黄克斌. 2006. 网络学习行为分析及其模型研究[J]. 中国电化教育(10):31-35.
疏凤芳,赵呈领,万力勇,等. 2012. 基于qq群的网络课堂交互特性研究. 现代教育技术,22(7):83-88.
張舸,周东岱,葛情情. 2012. 自适应学习系统中学习者特征模型及建模方法述评[J]. 现代教育技术,22(5):77-82.
郑勤华,陈耀华,孙洪涛,等. 2016. 基于学习分析的在线学习测评建模与应用——学习者综合评价参考模型研究[J]. 电化教育研究(9):33-40.
宗阳,郑勤华,陈丽. 2016. 中国moocs学习者价值研究——基于RFM模型的在线学习行为分析[J]. 现代远距离教育(2):21-28.
Afzal, S. & Robinson, P. (2010). Modelling affect in learning environments-motivation and methods. IEEE international conference on advanced learning technologies, 438-442.
Anderson, A., Huttenlocher, D., Kleinberg, J., & Leskovec, J. (2014). Engaging with massive online courses, International conference on World Wide Web, 687-698.
Baehrens, D., Schroeter, T., Harmeling, S., Kawanabe, M., Hansen, K., & Müller, K. R. (2009). How to explain individual classification decisions. Journal of Machine Learning Research, 11(9), 1803-1831.
Caridakis, G., Castellano, G., Kessous, L., Raouzaiou, A., Malatesta, L., Asteriadis, S., & Karpouzis, K. (2008). Multimodal emotion recognition from expressive faces, body gestures and speech. International Federation for Information Processing, 247, 375-388.
Chrysafiadi, K. & Virvou, M. (2013). Student modeling approaches: a literature review for the last decade. Expert Systems with Applications, 40(11), 4715-4729.
Conati, C. (2002). Probabilistic assessment of users emotions in educational games. Applied Artificial Intelligence, 16(7-8), 555-575.
Corbett, A. T. & Anderson, J. R. (1994). Knowledge tracing: modeling the acquisition of procedural knowledge. User Modeling and User-Adapted Interaction, 4(4), 253-278.
Craig, S., Graesser, A., Sullins, J., & Gholson, B. (2004). Affect and learning: an exploratory look into the role of affect in learning with Auto-Tutor. Journal of Educational Media, 29(3), 241-250.
Desmarais, M. C. (2012). Mapping question items to skills with non-negative matrix factorization. ACM KDD-Explorations, 13 (2), 30-36.
Doddannara, L. S., Gowda, S. M., Baker, R. S. J. D., Gowda, S. M., & Carvalho, A. M. J. B. D. (2013). Exploring the Relationships between Design, Students Affective States, and Disengaged Behaviors within an ITS. Artificial Intelligence in Education. Springer Berlin Heidelberg, 31-40.
Dowell, N. M., Skrypnyk, O., Joksimovic, S., Graesser, A. C., Dawson, S., Ga?evic, D., Kovanovic, V. (2015). Modeling learners social centrality and performance through language and discourse. International Conference on Educational Data Mining, 250-257.
Ekman, P. & Friesen, W. (1978) Facial Action Coding System, Consulting Psychologist Press, Palo Alto, CA.
Ez-Zaouia, M., Lavou, & Elise. (2017). Emoda: a tutor oriented multimodal and contextual emotional dashboard. International Conference on learning analytics & knowledge, 429-438.
Joksimovi?, S., Manataki, A., Ga?evi?, D., Dawson, S., Kovanovi?, V., & De Kereki, I. F. (2016). Translating network position into performance: importance of centrality in different network configurations, International Conference on Learning Analytics & Knowledge, 314–323.
Kapoor, A., Burleson, W., & Picard, R. W. (2007). Automatic prediction of frustration. International Journal of Human-Computer Studies, 65(8), 724-736.
Khajah, M., Lindsey, R. V., & Mozer, M. C. (2016). How deep is knowledge tracing? arXiv preprint arXiv:1604.02416.
Kort, B., Reilly, R., & Picard, R. W. (2002). An affective model of interplay between emotions and learning: reengineering educational pedagogy-building a learning companion. IEEE international conference on Advanced Learning Technologies, 43-46.
Mayo, M. J. (2001). Bayesian student modelling and decision-theoretic selection of tutorial actions in intelligent tutoring systems. University of Cantebury, New Zealand.
Nagrecha, S., Dillon, J. Z., & Chawla, N. V. (2017). MOOC dropout prediction: lessons learned from making pipelines interpretable. International Conference on World Wide Web, 351-359.
Pardos, Z. A. & Heffernan, N. T. (2010). Modeling individualization in a bayesian networks implementation of knowledge tracing. International Conference on User Modeling, Adaptation, and Personalization, 6075(12), 255-266.
Pantic, M. (2005). Affective multimodal human-computer interaction. ACM International Conference on Multimedia, 669-676.
Pekrun, R. (2005). Progress and open problems in educational emotion research. Learning & Instruction, 15(5), 497-506.
Picard, R. W. (1997). Affective computing. MIT Press.
Piech, C., Spencer, J., Huang, J., Ganguli, S., Sahami, M., Guibas, L., & Sohl-Dickstein, J. (2015). Deep knowledge tracing. Computer Science, 3(3), 19-23.
Ribeiro, M. T., Singh, S., & Guestrin, C. (2016). "Why Should I Trust You?": explaining the predictions of any classifier. ACM SIGKDD, 1135-1144.
Rich, E. (1979). User modeling via stereotypes. Cognitive Science, 3(4), 329-354.
Sinha, T., Jermann, P., Li, N., & Dillenbourg, P. (2014). Your click decides your fate: inferring information processing and attrition behavior from mooc video clickstream interactions. EMNLP Workshop on Modelling Large Scale Social Interaction in Massive Open Online Courses.
Slater, S., Baker, R., Almeda, M. V., Bowers, A., & Heffernan, N. (2017). Using correlational topic modeling for automated topic identification in intelligent tutoring systems. International Conference on Learning Analytics & Knowledge, 393-397.
Stansfield, J. L., Carr, B. P., & Goldstein, I. P. (1976). Wumpus advisor I: A first implementation of a program that tutors logical and probabilistic reasoning skills. At Lab Memo 381, Massachusetts Institute of Technology, Cambridge, Massachusetts.
Tang, S., Peterson, J. C., & Pardos, Z. A. (2016). Modelling student behavior using granular large scale action data from a mooc. arXiv preprint arXiv:1608.04789.
Thai-Nghe, N., Horváth, T., & Schmidt-Thieme, L. (2010). Factorization models for forecasting student performance. International Conference on Educational Data Mining, 11-20.
Veeramachaneni, K., Dernoncourt, F., Taylor, C., Pardos, Z., & OReilly, U. M. (2013). MoocDB: developing data standards for mooc data science. AIED workshops, 17.
Wang, Y. & Heffernan, N. T. (2012). The student skill model. International conference on intelligent tutoring systems, 399-404.
Yudelson, M. V., Koedinger, K. R., & Gordon, G. J. (2013). Individualized Bayesian knowledge tracing models. International conference on artificial intelligence in education, 171-180.
收稿日期:2017-11-20
定稿日期:2018-01-17
作者簡介:徐鹏飞,博士,讲师,北京师范大学信息科学与技术学院(100875)。
郑勤华,博士,副教授,硕士生导师;陈耀华,博士研究生;陈丽,博士,教授,博士生导师。北京师范大学远程教育研究中心(100875)。
责任编辑 郝 丹