单美贤,上官晨雨
(南京邮电大学教育科学与技术学院,江苏 南京 210023)
近年来在人工智能快速发展的影响下,探讨如何利用信息技术支持协作学习(Computer Supported Collaborative Learning,CSCL)已成为信息科学和学习科学交叉融合的重要研究领域。CSCL 研究领域认为协作的成功取决于建设性、富有成效的社交互动。Adeniran[1]认为情感会影响协作学习环境中的个人绩效与团队互动,在线协作学习环境需要激活个体和团队成员的情感调节,增强协作团体内部的互动与沟通。因此,帮助学习者理解协作学习过程中自身和同伴的情感状态,并给予情感反馈,有助于增强协作团体内部互动与沟通,推动协作知识的建构。
目前CSCL 系统设计的情感反馈研究停留在通过情感可视化方式帮助学习者了解合作过程中的情感状态,或通过情感代理提供激励信息反应困惑、沮丧等负面情感[2],如何反应协作学习环境中学习者丰富的情感状态,并自动作出最佳反应仍鲜有研究。本文通过分析CSCL 环境中情感反馈框架系统的构成和关键技术,为计算机支持协作学习中的情感反馈研究提供清晰的研究线索与方向,为学习者提供有效的情感反馈支持。
协作学习的情感交互过程是不可见的。在传统的面对面协作学习环境中,小组成员可通过表情、语言、姿势等方面直观、及时地察觉协作同伴的情感状态,并实时调整协作任务空间的认知活动和关系空间的社交情感状态,协调团队成员之间的关系,提高团队凝聚力,保持良好的协作关系。对于CSCL 系统而言,亟需嵌入情感状态检测与分析,以“看到”协作学习过程中情感交互的复杂现象,从而帮助学习者了解协作学习过程中自身与小组成员的情感状态,提高情感调节能力,为学习者提供有效的情感反馈,使其处于最佳情感状态,进而改善协作者之间的社交互动。
CSCL 学习系统中关于情感反馈的设计,首先需要实时检测协作学习过程中学习者的情感状态,然后对情感状态进行分析,选择适当的反馈策略反应学习者的情感状态,提供情感反馈,使学习者以最佳状态投入在线学习中。基于情感嵌入会话代理(Emotional Embodied Conversational Agents,EECA)系统框架[3]和学习伴侣系统[4]设计了CSCL的情感反馈系统框架。如图1 所示,框架主要包括3 个组成部分:情感状态获取、情感状态分析及情感反馈处理。
Fig.1 The framework of affective feedback in CSCL图1 CSCL 的情感反馈系统框架
(1)情感状态获取基于多种特征识别用户的情感状态,包括面部表情、身体姿势、文本输入、行为模式、生理参数等。大多数情况下,CSCL 系统通常只依靠文本输入和行为模式,很少依赖声音通道。由于面部表情是情感信息的基本载体,随着技术的发展CSCL 系统可通过图像采集、面部跟踪等技术捕获面部表情,并结合情感识别解决方案和情感表示模型,生成有效的解决方案。
(2)情感状态分析,即分析和诊断感知的学习者情绪状态。目的是理解CSCL 环境中学习者的情感状态(比如满意、自信、困惑、沮丧等),然后解释情感状态,确定导致该情感状态的原因(比如练习的成功或失败、任务的难度、知识的缺失等)。这一模块主要基于文本情感分析、交互行为分析、情感可视化分析等技术实现。
(3)情感反馈处理是情感反馈框架系统的行动层,根据情感反馈推理规则,推理分析协作学习情境中学习者的情感状态和学习状态,根据协作学习情境实例化反馈决策网络的认知和情感状态节点,得到相应场景所需的情感和认知反馈策略组合,最后选择最优的反馈策略组合。行动层将预先定义所有必要的任务,这些任务会依据协作学习过程中的情感状态,借助情感反馈处理机制,使学习者能够高效汲取知识并保持有效的协作学习状态。
总体上,CSCL 情感状态的检测与分析最具挑战性,因为情感模糊边界使得情感状态无法被直接测量。一方面,人类情感的表达和体验过程具有显著的个体差异性,另外情感感知的涉身性也是一个复杂问题,如何利用情感计算技术客观、科学地采集情感信息是目前的主要研究难点;另一方面,团队层面的情感不同于个体,学习者在协作互动中呈现的情感表现和波动更为丰富,情感特征更多样化,个体情感与团队情感相互作用对情感状态的检测和分析造成了困难,这些都是CSCL 研究领域中的核心问题。
其次是情感反馈与干预,Santos[5]分析了26 个使用情感计算的在线学习系统,发现这些系统未能提供情感干预。因为,自动对学习者的情感状态作出最佳反应是一项艰巨的任务,个人的认知和情感之间存在着相互影响的复杂关系,如何将情感模型与基于情感计算技术的情感反馈机制相互结合,解决“什么时候应该提供情感支持、情感支持应该包含哪些内容、如何提供情感支持”是CSCL 情感反馈研究最终需要解决的核心问题。
情感识别是情感计算的重点研究方向,现已在面部表情、姿势、声音等方面取得了重大进展。在情感计算研究中,情感模型可分为“离散情感分类体系”和“连续维度方法”;数据模态可以分为单模态和多模态,多模态融合提高了情感识别的鲁棒性和准确性;根据用户目标数量可将情感识别分为个体或群体情感识别。
现有情感表示模型主要有2 种:
(1)离散情感分类体系。代表人物:保罗·艾克曼(Paul Ekman)、勒奈·笛卡尔(Rene Descartes)和斯尔万·汤姆金(Silvan Tomkins)。该体系认为情感是离散的、具体的实体或类别,在生物学上是固定、共有的基本情感,包括生气、厌恶、害怕、高兴、伤心、惊讶等[6]。这些基本情感能引发更复杂的情感,如内疚、骄傲、羞愧等,且每类情感都存在阈值,当情感强度超过该阈值时,才会对一些外在行为起作用。尽管艾克曼的六种基本情感模型最初并不是为情感识别而提出,但它却是在线学习情感感知解决方案所最为常用的模型。此外,由于在线学习环境中情感识别解决方案更复杂,因此常使用自己的离散标签集解决实际问题[7]。
(2)维度分类体系。代表人物:威廉·冯特(Wilhelm Wundt)、詹姆斯·拉塞尔(James Russell)和丽莎·巴雷特(Lisa Feldman Barrett)。该体系认为情感并非个人或具有特定范畴,而是不同心理维度的组合体。情感反应有2 个维度:效价维度和唤醒/激励维度。维度模型将情感状态表示为多维空间的一个点,使用二维空间的情感坐标表示个体情感。在此基础上,Mehrabian[8]提出了PAD 三维情感模型,认为情感具有愉悦度、激活度和优势度3 个维度,PAD模型可以解释42 种情感量表中的绝大部分内容,而且这3个维度并不限于描述情感的主观体验,它与情感的外部表现、生理唤醒之间存在映射关系。
在梳理代表性情感模型时不难发现,神经生理学是理解情感的基础。然而,仅凭其不足以理解情感,还需结合专注认知心理学方面。Lazarus 的“认知—评价理论”认为情感是人与环境相互作用的产物,认知是情感的必要元素,强调认知评价在确定刺激意义及其应对方式中的重要性。1970 年以来,为了确定隐含在情感中的认知评价标准,开展了大量研究工作[9]。其中最著名的是OCC 模型[10],OCC 模型描述了22 种情感类型的认知结构。与离散情感模型或维度情感模型相比,OCC 模型考虑了情感产生的过程。由此概念衍生出如Picard 根据隐马尔可夫模型提出的HMM 情感模型[11]、Kesteren 等[12]针对外界刺激建立了一种分布式情感模型。
考虑到CSCL 协作交互中情感分析对情感量化有着更高要求,目前艾克曼的六种基本情感模型和OCC 模型在表示复杂情感状态方面依然存在一定的局限性。本文拟采用基于维度理论的PAD 模型进行连续情感状态识别,并借助模糊逻辑推理和专家规则,对协作交互过程中主体及主体间的情感状态进行科学合理的建模与计算。
学习者的情感状态可通过多种不同方法获取,如分析生理信号、脸部表情、姿态行为等后进行提取,或采用情感认知模型进行推理。基于不同模态的情感识别方法如表1所示。
多模态的情感计算主要有2 个步骤:①基于单模态的数据处理与情感计算;②进行多模态融合。多模态情感信息融合包括特征级融合与决策级融合2 种方式:①特征级融合首先对来自传感器的原始信息进行特征提取,然后对特征信息进行综合分析和处理;②决策级融合必须从问题的需求出发,充分利用特征级融合提取的测量对象的各类特征信息,采用适合的融合技术实现,通常采用的方法包括贝叶斯推理、Dempster-Shafer 证据理论等[13]。
Table 1 Emotion recognition methods under different model conditions表1 不同单模态条件下的情感识别方法
CSCL 系统中学习者情感状态信息的获取方法主要有:
(1)心理学工具——自我报告。该方法成本较低,可直接获取用户的主观感受。①口头自我报告:受试者使用预定义的开放式问题和量表,口头表达自身情绪。另外,为了便于受试者表达情感状态,还增加了访谈和日志的采集方式。如学业情感问卷、语义差异量表、情感风格、Geneva 情感环等;②非语言自我报告:包括不引人注意的、与语言无关的工具,如SAM、PrEmo 等[19]。相对于口头自我报告而言,因为不受词汇量的限制,主观因素影响较小,但可评估的情绪范围有限。
(2)生理学工具——利用生理传感器测量生理信号。生理信号大多基于脑、心脏、肌肉和皮肤产生的信号,与面部表情、手势、语言等方面信息的来源相比,生理信号是自发的,不存在欺骗性。另外,它可在任务的执行的过程中连续测量用户的情感状态。但该方法存在的缺陷在于:生理传感器是外在的,可能会影响用户的体验。
(3)运动行为方法——通过测量运动行为和身体的变化反应人的情感体验。该方法是评估日常生活中每个人情感状态的常用技术。通过借助特殊软件,使用PC 摄像头、麦克风、鼠标键盘等传统设备测量用户的情感状态,该方法可收集自我报告或生理信号无法采集的情绪线索,但要求分析人员具有一定的操作经验。
情感信号的采集过程中,由于会使用到昂贵的传感器和复杂的计算机智能设备,因此要求研究人员具有专业知识。测试过程中外在传感器可能会影响用户体验,但如果使用单一、主观的自我报告方式,则无法有效识别情感状态。为此,情感信号检测系统需要注意以下3 个方面:①客观性,生理信号比自我报告更客观;②侵入及干扰性,用于记录面部表情的网络摄像头、测量键盘压力、日志文件的鼠标点击量等标准个人电脑设备不存在干扰性,而使用如专业相机或人工实验室等额外设备、问卷式自我报告则存在一定的干扰;③任务相关性,测量应与用户的实时任务并行进行。表2 罗列了一些情感辅助系统中用于识别情感的方法。
Table 2 Methods for recognizing emotion in affective tutoring system表2 情感辅助系统中用于识别情感的方法
一般情况下,CSCL 研究者常使用多模态整合方法,如通过生理信号、日志文件、眼动追踪、面部表情等进行特征提取。然而,多通道跟踪和分析方法仍然存在一些问题,包括多通道数据时间对齐问题(如对人工agent 提示和脚手架情感反应、外部调节对学习者认知和情感过程监控的影响等)、确定哪些多渠道数据应该作为数据分析的基础等。
CSCL 团队情感状态由个体情感状态和多模态情感特征组成,其中个体情感状态在PAD 情感模型中用三个属性即愉悦度P、唤醒度A 和控制感D 表示,每个属性再设置5个标度。为了实现PAD 情感空间坐标到团队情感模型三维空间的映射推理,需要将PAD 情感空间坐标值的取值范围归一化。计算公式如式(1)所示。
其中,E是情感状态;epleasure,earousal,edominance分别是愉悦度、唤醒度和控制感在坐标轴的值,取值范围为-1~+1。
CSCL 团队情感状态模型中,采用模糊推理结合专家规则实现个体情感状态到团队情感状态的映射推理。首先,通过多模态情感识别和情感融合得到每个协作者的情感状态,并将其映射到PAD 模型空间中;然后采用专家规则和模糊推理方法建立个体PAD 情感模型和团队情感状态模型之间的对应关系;最后融合CSCL 协作团队中所有成员个体情感状态。具体过程如图2 所示。
CSCL 团队情感状态是一个连续变量,在时刻t时情感状态的变化不仅与t-1 时刻的状态相关,还与协作者的当前情感状态有关。故团队情感状态的计算公式如式(2)所示。
其中,f为所有个体情感状态Ei在时间t的函数;n为协作者个体的数量;λ为相关系数,取值范围为0≤λ≤1。
团队情感状态有三个属性,分别为活跃度activity、友好度friendly、亲和度affinity。集合R是个体情感状态与团队情感状态之间的模糊关系,通过模糊推理得到PAD 个体情感状态映射到团队情感状态三维空间。
Fig.2 Team emotional statement model in CSCL environment图2 CSCL 环境的团队情感状态模型
CSCL 环境的情感状态分析常采用的技术有文本情感分析、情感可视化分析与情感交互行为分析。文本情感分析是一种相对成熟且容易操作的方法;与图2 中团队情感状态空间的坐标轴相比,情感可视化是一种更易理解和感知的方法;情感交互行为主要研究复杂时空环境与交互式条件下情感随时间的动态变化规律。
情感识别负责自动识别学生的情感状态。最理想状态是以客观且不干扰用户的方式连续、定量测量用户的情感体验。有研究者指出,检测文本情感是一种侵入性最小的测量方法,因为语言和文本在传递信息的同时也传递情感[25],在测量过程中仅对语言和文本进行测量,无需接触用户。考虑到CSCL 研究人员很难掌握现有的文本分类技术,且不具备把文本分类技术应用于分析任务的能力,Rosé等[26]开发了一个易于使用的自适应编码接口——TagHelper,基于菜单自适应界面向分析人员展示自动预测、分析每段文本的结果,帮助CSCL 研究人员分析语料数据内容。Pontarolo 等[27]基于认知方法提出情感模型,该模型把情感视为参与者对情境认知、评估后产生的感知,并把同伴行为作为情境信息来源。然后,根据OCC 模型的归因情绪组推断四种同伴关系的情感。在此基础上,借助贝叶斯网络建模技术,将学生的人格特质、目标、行为标准、互动和情感之间的因果关系进行映射。
将情感识别阶段获取的数据进行分析处理,然后通过图、表等工具进行呈现。在很多场景下,如果可以“看见”自身与他人的情感,则可增强用户之间的交互体验,使人们可以直观地了解互动过程的情感,进而作出更好的决策。在协作环境中对情感状态意识进行反思非常重要,因为团队自我意识是团队能力的关键部分,有助于提高团队效能[28]。此外,团队内部情感状态的认知与改善沟通、决策和缓解团队冲突密切相关,能够提供丰富的环境信息支持协作学习。由此可见,CSCL 环境中的情感可视化信息,一方面可以激励个体根据团队协作情况调整自身状态;另一方面,如果协作过程中能安慰对方并解释为什么认为是在正确的方向上解决问题,则有助于缓解学生的畏难情绪。
情感可视化研究主要为:
(1)McDuff 等[29]设计了一个支持情感自我意识的可视化工具——AffectAura。Kao 等[30]创建了一种独立于情感获取技术的情感表示方法——情感打印(Emotion-Prints),该方法能用于多点触控系统环境中显示用户情绪效价和唤醒度。此外,该方法支持与任何实时解释情感状态方法相互结合使用。情感打印的目标是提供一种标准化技术,实现在互动发生时呈现用户的情感状态,以增强协作环境中用户对自身情感的感知,并通过情感可视化方式提升用户体验。
(2)Borth 等[31]根据Plutchik 情感轮提出视觉情感分析框架模型SentiBank:首先对普鲁奇克理论中每种情感进行数据挖掘找到相关标签,然后使用文本分析和基于词法情感分析工具查找“极化的”形容词,最后使用情感轮、树状图等可视化工具沿高维情感概念空间对数据集进行交互式探索,并对视觉内容中的情感进行预测。
(3)通过颜色、几何形状和长度分别表示图2 中团队情感状态三维空间模型中活跃度、友好度和亲和度这三个属性。图3 为通过颜色表示团队情感状态的活跃度。
Fig.3 The color axis of the activeness of the team's emotional statement图3 团队情感状态的活跃度颜色坐标轴
当前CSCL 交互分析主要集中在认知过程的知识建构维度,通过构建合适的交互过程模型开展认知交互行为分析。相关研究主要分为基于变量或基于事件的过程模型,基于变量的过程模型常用技术有:回归分析、序列分析法、凝聚子群分析等,通过计算交互行为相关属性之间的比率构建矩阵或概率图,抽象展示协作学习过程特征或学习输出状态;基于事件过程模型常采用的技术有:隐马尔科夫链、朴素贝叶斯分类、序列模式挖掘算法等,通过借助计算机庞大的数据处理能力实现交互行为模式的抽取与识别。
CSCL 交互分析在归纳、总结认知交互行为、协作学习进程或协作组实施效能之间关联规律的同时,需要开展情感交互行为分析研究,因为情感交互活动不仅影响着小组成员的积极性和主动性,还影响协作过程中认知交互活动的进程。情感交互行为研究复杂时空环境与交互式条件下情感随时间动态变化的规律,这种情感时空特征一般具有2 种基本特征:①情感本身所具有的时序演化特征,反映情感的内在变化规律;②用于情感分析的言语、面部表情、生理特征等因素在动态交互过程的时序特征,反映情感外在观测因素的变化规律。情感作为连接学习者内部心理状态与外部环境状态的桥梁,影响着协作学习的全过程。因此,如何在特定的CSCL 时空环境约束下有效融合多种方法挖掘、分析协作过程中学习者的情感交互行为模式和变化趋势是亟须解决的关键问题。
目前CSCL 环境中的情感交互分析研究常采用的方法为基于时空条件下的情感交互计算。首先,使用贝叶斯网络根据图2 的情感模型对检测的个体情感状态和团队情感状态进行分类,构建多模态情感交互行为数据集;然后,针对协作学习过程中的交互行为序列、文本内容、面部表情等过程性数据,采用长短期记忆网络(Long Short-Term Memory,LSTM)对实际协作学习场景中的个体情感状态特征数据和团队情感状态进行时序建模,实时判断和预测学习者当前的情感交互行为特征以及变化趋势,提升情感预测的准确率。具体过程如图4 所示。
目的在于修改学习者的下一步行动,减少当前理解与期望之间的差距,本文基于情感认知评价理论的相关计算模型[32],提出了如图5 所示的情感推理模型。
4.1.1 认知网络
情感评估不是独立的,需高度依赖认知信息,旨在模拟前额叶皮层中的执行功能。认知网络被设计为基于Q 学习的认知架构,称为时差融合结构(TD-FALCON)。其中,TD-FALCON 是自组织的神经网络,使用时序差分算法估计和学习Q(s,a)函数的值,即给定当前状态s,认知网络基于特定策略选择将要执行的动作a,在执行动作后,可获得奖励。然后,认知网络将观察下一个状态s’,并预先选择具有最大Q(s’,a’)值的动作a’。
Fig.4 LSTM network analyzing the emotional state in collaboration interaction图4 LSTM 网络分析同伴协作互动中的情感状态
4.1.2 评价层
提供从认知空间到情感空间的信息单向转换,包括4个评估因素:
(1)期望E 是情感评估的关键,代表人们在特定环境中采取行动时最可能发生的事情。一般认为,随着对积极结果或消极回避的期望增加,情绪强度也会增加。因此,期望应该与情境、行动相关联,并且必须基于学习者的个人体验。期望是根据上下文(包括学习者的体验和当前表现)动态评估的,本文对期望定义如式(3)所示。
其中,Q(s,a)是基于Q学习算法计算在状态s下采取行动a的预期奖励。
Fig.5 Emotional reasoning model图5 情感推理模型
(2)奖励R 是指从环境或行为过程中感知的反馈刺激。通常,奖励在采取行动后发生,被认为是认知学习和情感过程中不可或缺的组成部分。最近研究证明,杏仁核是人脑情感的核心区域,它起到调节奖励的唤醒作用,并联系奖励的感官特性与情感。奖励信号由环境提供的实时反馈If所感测,即R=If。
(3)力量P 是指个人信心的内在状态,被描述为对实现目标充满信心的状态。力量是建立在自身经验的基础上,并受感知反馈和先前力量水平影响。因此,根据反馈信息和当前自信心水平,通过时序差分方程式实时更新P。计算方式如式(4)所示。
其中,参数α∈[0,1]和γ∈[0,1]分别是衰减指数和增益指数。
(4)匹配M 用于衡量期望值与实际反馈信息之间的差异,说明结果满足期望的程度。为此,根据上下文的性能和感知反馈计算匹配度,评估该动作满足期望的程度。并通过式(5)进行实时更新。
4.1.3 情感网络
旨在模拟杏仁核的情感决策,与评价层共同构成情感评估网络。计算方式如式(6)所示。
4.2.1 模糊逻辑系统
模糊逻辑系统为CSCL 系统处理学生各种认知和情感状态的行为方式,模糊系统处理情感值来源于神经网络识别的学生情感状态。例如在Java Sensie 系统中[33],首先从语料库的面部图像中提取特征训练神经网络;接下来,使用神经网络实现情感分类。本文使用RAFD 语料库的数据训练和测试神经网络,该数据库具有8 040 种不同表情的数据库,包含了67 种男女模型。神经网络提取学生的情感状态后,立即将结果发送至模糊系统。然后将特征提取、情感识别与模糊系统相互集成。Java Sensie 系统使用了4个模糊输入以及3 个输出,并使用模糊控制语言建立了144条模糊规则。模糊系统从反向传播神经网络中获取学生当前的情感状态,通过模糊算法计算反馈策略,再将反馈策略发送至教学代理起到调节学生情绪的作用。
4.2.2 线性回归模型
多用于CSCL 系统中学生的情感预测。通过大量的数据集线性回归学生在每个任务的情感状态,并以此模型检测学生在后续任务中的情感状态。Rajendran 等[34]将线性回归模型用于检测沮丧模型中,对挫折特征形成新的线性回归模型。该模型在检测学习者交互过程的挫折感时,首先确定学习者与系统互动的目标,确定每个目标的阻塞因子,基于目标阻塞行为,用前i-1 个状态进行线性回归,建立学生在第i 个状态的挫折指数线性回归模型。挫折指数阈值用于检测学生是否感到沮丧,若感到沮丧则作出反馈。
4.2.3 效用最优情感反馈策略决策算法
该算法使用贝叶斯决策技术选择效用最优的反馈策略组合,如图6 所示。首先根据协作学习情境实例化反馈决策网络中的认知和情感状态节点,并根据协作学习情境中的情感交互行为规律输入决策网络,然后按时间顺序依次实例化决策变量,计算条件期望效用值,当遍历完各认知反馈和情感反馈组合后,得到最大条件期望效用值所对应的认知和情感反馈策略组合即为最优解。
Fig.6 Affective and cognitive feedback decision model description图6 情感和认知反馈决策模型描述
Lazarus[35]认为有2 种策略可用于管理个体的情感状态:以问题为中心和以情感为中心的策略。
(1)传统的情感框架通常采用以问题为中心的策略。该策略基于学习者任务反馈,学习者情感通常在学习过程中产生,根据情感状态为其提供适当的建议和策略,有助于提高学习效率。Cabestrero 等[36]认为基于任务反馈保持适当的水平是至关重要的,因为任务难度水平过高会导致学习者产生焦虑,而任务难度太低则无法激起学习者的兴趣。因此,基于相关领域的情感反馈需要动态调整任务的难易程度,使每个学习者都能产生更高层次的情感价态。
(2)以情感为中心的策略是指与课程领域无关的策略和技术。CSCL 系统的领域无关情感反馈策略基于学习者情感的反馈,即情感反馈系统检测到学习者情感状态后,直接给予学习者鼓励、祝贺或积极的情绪提升学习者的学习动力,从而使学习者处于更适宜的情感状态中完成学习任务。
Arevalillo-Herraˊez 等[37]使 用PAD 模 型 从 三 个 独 立 的两极维度描述情感,每个维度都通过SAM(Self Assessment Manikin)进行评估,旨在根据与学习者情感相关的两个特定意图选择最佳的脚手架水平,进而在每次需要系统干预时触发指导性决策。通过分析训练数据证明,快乐度和支配水平取决于解决问题时提供的脚手架水平,可通过学习主题背景信息和学习者试图解决的问题预测愉悦度和支配度变化。
Wang 等[38]把POMDP(Partially Observable Markov Decision Process)模型中用户的状态空间分为认知状态(目标状态Su与对话状态Du)和情感状态Eu,即S=(Su,Du,Eu);系统的动作空间A =(As,Ae),如图7 所示。
其中,As是目标响应,具体表示检查学习者是否理解概念、向学习者解释概念、判断学习者的答案是否正确;Ae是情感响应,例如赞美、鼓励、引导、同理心等。
用户的状态转移函数表示在给定状态s和动作a的条件下转换为状态s'的转换概率。计算公式如式(7)所示:
奖励值函数计算公式如式(8):
其中,R(su,du,as),R(eu,ae)是行动目标响应和情感响应的奖励;ws,we是权重系数,ws+we=1。
Fig.7 POMDP model(the circle in the dashed frame represents the state that is not observed,the circle in the solid frame represents the observation result,the square represents the action node,and the diamond represents the reward node)图7 POMDP 模型
综上,目前情感反馈研究大多以个体学习者为研究对象,采用情感计算技术实现:①借助机器学习或深度学习技术,构建基于深度神经网络的情感反馈策略模型,开发的情感反馈系统直接映射学生的人格特性、目标、行为标准、互动和情感之间的因果关系,并据此推断情感包含的内容;②采取反馈回路方式:计算机将测得的感知数据映射为情感变量,然后根据识别的情感持续调整用户行为。在情感反馈回路中目前使用的主要方法为监督机器学习,将记录数据分类为一组离散类别,然后根据类别执行特定的命令。此外,本研究团队提出的ATS 系统的情感反馈实施规则同样适用于CSCL 系统,如表3 所示。
Table 3 Affective feedback implementation rules表3 情感反馈实施规则
注:目标是保持高的效价V(为学习者提供支持和积极的体验)、防止唤醒度A 过高或过低(A 过高->焦虑,A 过低->无聊),并为学习者提供一种控制任务的控制感(P)。E(投入参与水平)由V、A 和P 推断得出(2:高投入,1:一般投入,0:不投入)。IA(指示性操作):增加或降低下一个问题的难度级别。情感反馈规则如下:1-当情感状态为中性,不采取措施;2-当学习表现不佳,则触发“提供调节和帮助”;3-当检测到负面效价,则触发情感支持;4-当检测到高激活状态,则给予激励响应。
本文从情感状态获取、情感状态分析和情感反馈处理这三个方面分析了CSCL 环境的情感反馈系统框架:首先从情感状态的表征入手,分析CSCL 中使用多模态情感识别技术的要点;然后介绍了情感状态分析的关键技术,主要包括基于文本的情感分析、情感可视化分析、交互行为分析;最后从情感反馈推理模型、情感反馈策略生成算法和情感反馈策略深入介绍了目前的研究进展,以期为本领域的研究梳理一个相对清晰的整体研究框架视。在认知科学与脑科学的研究基础上,随着深度学习、情感技术等新技术、新方法在学习科学中应用研究的深入,将会进一步推动CSCL 情感反馈研究的理论发展和实践应用,最具突破性的研究工作主要体现为以下4 个方面:
(1)研究CSCL 环境的情感协作学习本体,以描述计算机支持协作学习过程中团队情感的形成及演化特征,形式化描述CSCL 环境中与学习者情感相关要素。
(2)在脑科学与情感计算的研究基础上,通过多模态情感感知方式获取CSCL 环境中学习者的情感状态数据,并通过情感交互行为分析,深入解释协作学习过程中学习者情感状态的产生与变化原因。
(3)研究基于深度神经网络的情感反馈策略生成算法,解决计算机支持协作学习环境中由“情感触发”引起的情感理解和情感反馈策略的生成问题。
(4)加强技术支持下情感反馈对在线协作学习和学生发展重要性的认识,重视协作学习环境中反馈机制的研究,设计融情感、认知、行为等综合一体的、人机协同互惠的双向反馈模型及系统实现。