饶凯平 章凡
1 中国药科大学教务处 南京 210009 2 南京农业大学继续教育学院 南京 210018
近年来,随着人工智能技术的兴起,人机智能交互领域得到了飞速发展。如苹果的siri、微软的小冰、谷歌的Google Now 等等,日常的人机交互能够优雅地为用户解决各类常见问题。在教学交互领域,有人工智能技术加持的人机协作模式可能将成为未来的主流形态之一。国务院及教育部也在近几年提出了关于人工智能技术在教育领域应用的全方位战略部署及规划,2017 年《新一代人工智能发展规划》,2018 年《教育信息化2.0 行动计划》和2019 年《中国教育现代化2035》中都指出要大力发展智能化教育,要以人工智能等新兴技术为基础,推动教学方法改革与生态重构,推动智能技术等在教育领域多维度的应用,加强智能教学助手、教育机器人、智能学伴等关键技术研究与应用,从而全面提升教育的质量及效率。本文旨在研究智慧教育中的智能交互助教学伴体系,利用大数据及人工智能领域当中的NLP(自然语言处理)、机器学习模型以及Word2vec(词向量)及TextRank等技术,为课前教师备课、学生预习,课堂师生交互,课后答疑辅导等多个环节提供智能化人机交互、数据服务等精准的教学辅助服务,减少教师用于学生个性化辅导的精力,同时增加学生的主动学习意愿以达到提高教学效率的目的。
智能交互助教学伴体系为智能问答领域的一个分支,最早的研究可追溯到1950 年的图灵测试,图灵测试是智能问答系统的雏形[1]。在1966 年,weizenbaum 实现的“Eliza”被认为是第一个真正意义上的智能问答系统。从60 年代开始人工智能研究兴起,智能问答领域的研究也步入正轨,而真正面向特定领域的智能问答系统的出现则是BASEBALL 系统(研究美国职业棒球联盟的相关比赛问题)和LUNAR 系统(基于知识库的自然语言理解系统,用于美国阿波罗登月探测的地质数据分析)。20 世纪90 年代,伴随着互联网技术的发展和人工智能技术的进步,智能问答系统的研究进入了开放领域阶段,如1999 年的文本检索会议(Text Retrieval Conference)引入的问答系统评测专项[2],极大推动了智能问答系统的研究和发展。进入21 世纪后,随着云计算大数据技术的出现以及基于深度学习的聊天机器人的问世,关于智能交互的研究则进入一个新的高度,在教育领域不乏优秀案例,如应用在英语学习中的嵌入式智能问答机器人Don Quijote、Mike[3],应用于心理学学科的Freudbot[4]等。
在智能交互助教学伴体系的研究中,运用到了大数据技术,人工智能当中的自然语言处理技术,包括TextRank 关键词抽取技术,word2vec 词向量模型,机器学习模型等。大数据技术具有大规模数据分析及决策预测等特性,可以收集分析教学过程中的学习行为数据,资源数据用于教学的个性化资源推送,学习轨迹预测及教学方案决策等场景。自然语言处理技术是人工智能技术的重要方向,研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。TextRank 是基于PageRank 的一种关键词提取技术[3],将词之间的共现关系作为边建立无向图,根据PageRank 原理中的衡量重要性的公式,初始化各节点的权重,然后迭代计算各节点的权重,直至收敛,最终得到最重要的若干个词即为关键词。Word2vec 是 Google 在 2013 年开源的一款将词表征为空间向量的模型工具,主要采用连续词袋模型(Continuous Bag-Of-Words,CBOW)以及 Skip-gram 模型[5]。Word2vec 通过训练,实现文本内容处理简化为K 维向量空间中的向量运算,运用于用户输入与答案间的语义相似度计算及纠错等。采用条件随机场模型及最大熵模型机器学习方法,训练集经过训练所得数据为智能交互提供支持。
智能交互助教学伴核心引擎采用了大数据和人工智能等多种技术,在整个体系起到了数据服务和智能人机交互处理等关键作用。核心引擎为三个层次:数据训练层,输入处理层和答案呈现层,如图1 所示。数据训练层包括数据预处理、数据训练和数据索引的建立等过程,数据训练层可视为整个体系的地基,所有的服务都是以数据为基础的。输入处理层指的是对用户的输入数据进行分析处理,转化为机器可识别的数据格式,结合数据训练层得到的结果,通过答案检索、匹配初步筛选出若干备选项。答案呈现层主要对备选项进行置信度检验及大数据上下文判断等等,综合得出最优答案呈现给用户,并为用户提供反馈接口,可将用户的输入及反馈数据进行有监督机器学习,更新数据训练层机器学习参数,用户使用量越大,精确度则越高。
图1 智能交互助教学伴核心引擎示意图
数据训练层的数据来源为大数据资源平台,大数据资源平台的建立需要聚合多个系统,如学校的教务、学工系统,MOOC 和SPOC 平台或其他类型的学习交流平台,在这些系统当中,如教务学工系统所提供的数据为学生和老师的基本信息,结合学习平台的历史学习数据形成初步的用户画像,随着数据量的不断扩大,用户画像将愈加清晰,为用户提供的服务也可以更加精准。MOOC 和SPOC 学习平台产生的学习数据中包含很多过程性的数据,如师生的讨论、答疑等等,在数据训练层中,需整合并清洗训练数据得出基础数据模型,并采用数据挖掘技术将非结构化数据转化为结构化数据,最终整合成为核心交互数据模型,为输入处理层提供服务。
数据完成整合后,所有数据作为基础语料库,用结巴分词器分词,去除停用词,通过word2vec进行词向量训练,提取文档数据关键词以词向量表示,并建立倒排索引,即记录词在一个文档或者一组文档中存储位置的映射。将数据进行分词、词性标注、句法分析后作为训练集,进行有监督的机器学习,在句法分析的过程中,采用表1 中的分类方法[6]进行问句分类,采用CRF(条件随机场)算法进行词性标注和句法分类训练,其原理为构建无向图G = (V,E),V 为节点集,是句子当中的所有词的集合,词之间的关联作为节点之间的边,通过条件随机场的训练使无向图中的各个结点呈现线性结构,从而进行线性数据的序列标注工作。CRF 算法的序列标注特性将多个分词的词语按照一定序列组合成完整主体,进而进行主体识别,另外该算法可以自定义标注集,通过给自定义标注集打类别标签的方式在主体识别、词性识别的同时完成句法分类[7]。采用最大熵模型对问题及答案的句法特征组合进行训练,判断哪些问题和答案的组合为正确组合的概率最大。最大熵模型原理为:对一个随机事件的概率分布进行预测时,预测应当满足全部已知的约束,而对未知的情况不要做任何主观假设。这种情况下,概率分布最均匀,预测的风险最小,因此得到的概率分布的熵是最大。该模型的特征函数为一个二值函数:
表1 问题分类体系
用来表示x的某个取值和y的某个取值是否存在联合分布。当x=“问题及答案句法特征”,y=“该组合是否正确”,此时在训练集中有对应情况,所以对应的特征函数对应为1。至于对最后的预测能产生多大的影响,需要由训练得到的该特征函数的权重来决定。训练最终得出的模型可以作为答案置信度判断的依据。举例:如用户输入的问题为:如何报名参加某个活动,该问句为描述型问句,答案应为一段长文本,描述参加活动的过程,那么类型为长文本的答案与当前问题的组合为正确组合的概率较大;而如果用户输入的问题是:负责某项工作的工作人员是谁,该问句为人物型问句,答案则应为人名,那么类型为单个名词的答案与当前问题的组合为正确组合的概率较大,如表1 所示。训练得出的模型具有置信度判断的能力,判断得出的答案与问题是否符合句法逻辑,值得注意的是,该置信度判断仅为统计学意义上的判断,不能百分之百准确。
用户的输入数据在人机交互的时候产生,输入数据的格式为普通的文本。在用户输入后,首先会进行用户的输入纠错和同义词联想,输入纠错主要利用N-Gram 语言模型、二元接续关系查错、汉字转拼音纠错算法以及相似度度量模型[8],将用户的输入通过智能纠错模块进行评估,在满足一定的阈值时自动进行纠错。输入的数据分为两种情况,一种为标准的问句,询问相关事务的具体操作流程;另一种为陈述句,句中包含了用户要搜索的相关信息。如图1 所示,当用户输入文本数据后,同时进行两种情况的执行过程,最终将两种情况执行的结果都进行答案置信度判断,取置信度高的作为最终答案呈现。首先进行分词,去除停用词和词性标注以及提取关键词等操作,并以词向量表示。其中提取关键词将传统TextRank 技术和word2vec 技术相结合,有效提高了用户输入语义的识别率。传统TextRank 技术的原理为构建候选关键词图G =(V,E),其中V 为节点集,由句子分词生成的候选关键词组成,然后采用共现关系(co-occurrence)构造任两点之间的边,两个节点之间存在边仅当它们对应的词汇在长度为K 的窗口中共现,K 表示窗口大小,即最多共现K 个单词,再根据TextRank的公式,迭代传播各节点的权重,直至收敛,取权重最大的T 个词作为关键词。其中每个词汇节点的初始权重均为1,结合Word2vec 技术,引入词汇相似度进行迭代计算,重新定义每个词汇节点的初始权重[9],研究表明可有效提高关键词提取的准确率。
在数据训练层已经将所有的数据格式化为问题对应若干个答案的形式,那么第一种情况将用户输入在所有的问题文本当中对其进行检索匹配,第二种情况则将用户输入在所有的答案文本中进行匹配。将用户的输入数据与匹配到的结果文本进行语义相似度比较,将关键词的词向量组合成为文本向量,此时文本的相似度比较已经转化为向量之间的运算,根据余弦相似度公式:
分子为向量A与向量B的点乘,分母为二者各自的L2 相乘,即将所有维度值的平方相加后开方。余弦相似度的取值为[-1,1],值越大表示越相似。将两种情况计算得出的最相似的N 个结果分别与用户的输入数据结合作为本层的输出数据,输出到答案呈现层结合大数据技术进行进一步答案筛选。
通过用户输入层的处理,已经得到了若干个候选答案,本层的主要目的为对若干个候选答案进行最优判断。一方面,利用数据训练层得出的机器学习模型,对当前的候选答案进行置信度验证,将用户输入的问题及候选答案分别进行句法类型判断,将问题的句法类型与每一个候选答案的句法类型的组合输入到已经得到的模型当中进行置信度判断,得到的概率值越大,证明该组合为正确答案的可能性越高。另一方面,利用上下文感知技术根据用户输入时所处的上下文进行最优判断,并依据用户画像对用户的特征、偏好进行综合分析得出最优解。上下文感知技术指的是结合用户的位置、当前时间、环境参数、相近的设备及人员、用户历史活动等,对可能发生的事情进行判断,可应用在与用户多次有效交互时,结合用户在前面若干次交互的内容进行下一步的答案呈现,再结合用户画像进行综合分析,如根据学生的学习完成进度标签判断,如果学生学习进度较低时,可以相应地给出基础性概念性的内容,帮助学生有效理解知识点。在答案呈现层,还有一个比较重要的环节,即用户反馈。
用户在看到了呈现的答案时,可对当前答案进行反馈,一般可考虑设置两个选项:满意和不满意,当用户进行反馈时,可以将反馈的内容和用户问题输入及答案的文本内容作为有监督机器学习的训练数据,所以当用户的使用量和反馈量越来越多时,机器学习得到的结果更加精确。最大熵模型作为一种有监督的机器学习方法,需要的训练数据为有答案标注的数据,而传统的学习平台有效数据量偏少,即初始数据当中,有标注的数据少,训练的效果一般,而通过后期用户反馈,有标注的数据量增加后,机器学习的优势才能真正体现出来。
智能交互助教学伴体系的架构如图2 所示。
图2 助教学伴体系构建图
助教学伴体系的教学进程维度由课前、课中、课后三部分组成,参与教学的角色组成分别为教师、学生和助教学伴核心引擎,引擎扮演的是辅助教师及学生对他们提供数据及智能化交互服务的角色。
在课前阶段,教师可以根据学生的基础数据制定课前学习资料,不同基础的学生制定的课前学习目标不一样,充分考虑到个性化因素。在此阶段,引擎作为智能助教角色主要是以大数据分析和用户画像来帮助教师进行学生的个性化课前资料及学习目标定制。学生在课前学习时,大多数会遇到难以理解的知识点,传统的方法是以社交软件或在课程学习平台的讨论区,学生提问教师逐一解答,这样会耗费教师大量的精力在回答重复性的提问上,效率很低。智能交互助教学伴引擎先通过自然语言识别相关技术,识别出学生的提问信息,再结合大数据资源平台中的海量数据加以处理分析,得出最优答案推送给学生,同时记录下此次问答过程,教师有权限查看学生的提问及交互引擎为学生解答的内容,如发现有错误,可以将错误纠正自动推送到学生端;另一方面进行有监督的机器学习,作为错误的典型案例进行训练,此类型的训练数量越多,往后发生此类错误的概率将会越小。课前学习评测是对学生课前学习的情况进行初步的掌握,通过收集课前评测数据,结合学生的学习历史情况及用户画像,综合计算预测学生将来可能遇到的问题,初步形成个性化学习路径及方案,如告知学生在哪些知识点上需要多花时间学习,并推送相关的学习资料到学生端。与此同时,将学生的课前掌握情况进行分层,如分为熟练应用、基本掌握和尚未完全掌握等几个层次,便于教师在课堂上进行分组及课堂教学策略的选择,精讲共同难点,略讲大多数学生都掌握了的知识点。
课堂上,教师可以根据课前的内容进行区分,运用教学技能串讲多数学生都已经掌握了的知识点,精讲重点及多数学生都遇到的问题。教师在课堂开始阶段可向学生推送备课时准备好的教学资源,随着教学进程的动态变化,教师可以动态调整切换教学目标和方向,利用引擎实时地从云端获取教学资源和教学路径方案,让教学进程从传统的照本宣科转变为动态的,完全贴合学生需求,符合教学体系中以学生为主体、教师为主导、核心引擎为辅助的模式。课堂上教师能够随时发起实时训练,掌握学生的实时学习情况,学生在实时训练中,遇到困难通过助教学伴交互引擎进行智能交互咨询,引擎通过学生的提问会给出很多导向性的内容,以人机对话的形式逐步地为学生答疑解惑,让学生对知识的印象更加深刻。在分组教学中,教师根据学生课前学习情况和评测结果的分层情况进行分组(基础组、应用组、拔尖组或更多组别),每个组设定一个课堂目标或情境化的课堂任务,组织学生进行小组学习,每个小组朝着不同的学习目标努力,如基础组的目标是在本次课堂中充分理解掌握知识脉络和结构,应用组的目标是能够在不同的应用场景下熟练应用所学的知识,拔尖组的目标是对课堂知识进行发散思维,展开讨论,或研究相关前沿性的话题等等。助教学伴引擎为教师分组提供数据支撑,同时在分组目标决策、各个分组的学习资源推送等多个场景为教师提供智能化的交互数据服务。在对师生提供辅助教学服务的同时,引擎作为智能学伴角色,对学生的学习行为、学习路径和阶段性的学习效果进行了实时的跟踪并在必要时提醒学生,如检测到学生的课堂讨论参与度不高,同时对于教师推送的资源查阅浏览的进度较低时,认为学生有可能上课时注意力不集中,通过终端主动提醒学生。从课堂教学资源的角度出发,可借助引擎的自然语言识别技术,分析相应教学资源的标题,摘要,关键词,主题及标签语义,结合上下文感知技术,建立资源的上下文关系映射,从而在以后类似的上下文时机为其他学生提供智能的教学指导服务。
在智能助教学伴体系中,教师可以根据课堂数据统计,掌握学生的学习情况,对学习完成度不高的学生进行有针对性的微课辅导,微课资源支持直接从云平台中获取,也可以由教师自行录制微课视频推送给学生,或采用直播的形式集中课后辅导。在课后作业方面,作业推送给学生的方式,教师有权限选择自动、半自动抑或是手动分配作业及批改作业,如选择自动,则全部的作业生成和批改都由引擎来完成,引擎将会充分结合学生的课堂学习情况,智能地生成课后巩固练习作业,教师可以待所有作业都提交后直接查看作业完成情况,如果选择半自动或手动模式,则允许教师查看编辑或新增公共的课后作业推给学生。
作业中的错题将会提示学生并且结合知识掌握情况形成个人错题档案,学生可以根据错题档案查漏补缺,在后续学习过程中,根据错题档案生成相关的习题资源让学生再次巩固。助教学伴体系在每一个学习阶段都会基于当前学习情况,生成动态学习报表,报表的内容由教师制定,选择以课程的章节完成情况,知识点掌握情况、应用情况、评测情况等多个维度进行生成,学生对于自己哪些地方需要提高一目了然。如学生认为自己的学情与报表有出入,可以申请修正报表,修正的方式为进行相应章节或知识点的单元测验,通过测验即可修正报表。
完成课时学习后,通过对学生课前课中课后的学习行为、学习情况进行分析打分,如课前知识学习的时长,提问讨论的频率和次数,课堂发言交流等互动情况,课后作业完成的时长及正确率,订正效率等等,如果打分低于阈值,则认为学生有懈怠消极学习的可能性,引擎以智能交互的形式主动与学生进行沟通疏导,教师可以对此类学生进行关注疏导或学业帮扶,防止因学习动力不够产生恶性循环,提高整体教学质量和效率。
本文提出的基于人工智能交互的助教学伴体系,该体系运用了大数据和人工智能自然语言识别等多种技术,为教师和学生提供教学辅助及交互式的数据服务。从自然语言处理及机器学习技术具体实现以及教学体系构建等多个角度,研究了体系当中的各个模块的实现原理以及处理的方法,并围绕相关技术,阐述了在实施过程当中的各个细节。智能交互助教学伴体系为教师备课、学生学情监督、课后辅导等环节提供了辅助,为学生提供个性化资源推送、交互式答疑解惑以及个人错题档案等多种服务,渗入到教学的全过程多环节,为提升教育质量添砖加瓦。