石凤贵
(马鞍山师范高等专科学校 软件工程系,安徽 马鞍山 243041)
随着互联网技术的迅猛发展,人们由网上获取相关信息的需求越来越大。现有搜索引擎(如百度、Google)返回给用户的只是相关页面文档,为了更好地满足用户方便、快捷、准确地获取信息的需求,迫切需要返回给用户一个简短而准确的答案。自动问答(Question Answering,QA)就是在这样的应用需求背景下产生的,涉及自然语言处理、信息检索、信息抽取、机器学习、模式识别等多个研究领域。
随着网络和信息技术的飞速发展,高校课程的教学已不仅仅局限于传统意义上的课堂教学。很多课程都基于校园网建立了自己的课程教学网站,并具有丰富的网络教学资源。这些课程在改革课程教学内容﹑加强新教材建设及改革实践教学等方面发挥着重要的作用。作为课程教学网站的重要组成部分,网上在线答疑在加强教师和学生交流,以及帮助学生明确问题方面具有不可或缺的重要作用。学生可以不受时空限制,随时随地地进行课程学习,极大地提高了学习的自主性。
2018年9月,习近平总书记在全国教育大会上发表重要讲话,对加快推进教育现代化、建设教育强国、办好人民满意的教育作出了全面部署。教育部也相继出台了《教育信息化2.0行动计划》《教育部办公厅关于开展2018年国家精品在线开放课程认定工作的通知》《教育部办公厅关于开展人工智能助推教师队伍建设行动试点工作的通知》,来推动教育信息化的发展。
当今社会科学技术的进步推动了人工智能的飞速发展,使之成为研究热点,其不断革新人与机器的互动方式。纵观科学技术发展史,每一次变革都伴随着交互技术的革新,鼠标和键盘打开了使用PC机时代的大门;触摸屏打开了移动互联时代的大门;语音交互、人脸识别、手势识别等多模态智能交互技术带人们走进全新的人工智能(AI, Artificial Intelligence)时代。本研究讨论人工智能时代高校课程教学模式及课程教学自动问答系统建设。
技术和社会的发展推动了人才培养方案的变革,教育经历了农耕时代的个别教育、工业时代集中批量式教育、智能时代的个性教育。教学内容呈现的介质随着技术的发展在不断更新换代,先后经历了竹简、黑板、投影仪、投影机、PPT、MOOC,教学方式时刻紧扣时代步伐,教学内容的呈现样式多种多样,教学效果越来越好。当前的教学方式大多采用投影机、PPT、MOOC,这种计算机辅助教学方式还是以教师讲授为主,师生缺乏互动融合。
以互联网为载体的在线教育正在逐渐革新传统教育,MOOC是近年来发展起来的一种在线教育,已经吸引了全世界数千万用户。MOOC与传统在线教育不同,不仅把传统授课搬到了互联网上,还将面向科学研究的课程也在线化。MOOC正在颠覆传统的课堂教学,教学和学习不再受时间和空间的限制,但还是缺乏个性化和智能分析,知识概念重叠、没有捕捉用户需求。教育深度开发将是教育发展的趋势,学习者的学习路径和学习轨迹将实行共享,记录成数字档案[1]。
如何用人工智能提升基于MOOC的在线教育质量,改善学生的在线学习效果,实现学习者数据的多源采集和精准分析,助力因材施教,是当前乃至一段时间需要研究解决的问题,也是本研究的重点。人机交互对于在线平台尤为重要,系统和用户之间的交互、用户和用户之间的交互,通过问答、游戏等方式,可以促进用户由被动交互变为主动交互,实现智能化教育。
智能教育以数字化为基础,利用互联网、多媒体技术、机器学习、自然语言处理等。今天的 “大学” 正在变化,打破了传统的时间和空间限制,开放式大学正在形成,“大学” 正在走向智能化。人才的培养将更加关注创新思维能力、人机协同能力和终身学习能力的培养,提供多样化、个性化的学习,构建随时随地人人都能学的开放式学习校园[2]。
随着人工智能技术的发展,越来越多的教育机器人被设计开发并投入使用,形成了专门的教育智能机器人研究领域。在自然语言处理、情感计算、知识追踪等技术的推动下,北京师范大学未来教育高精尖中心人工智能实验室团队设计出交互式学科教育与德育机器人系统,旨在为学生、教师与家长群体提供更愉快的学习体验和更准确的知识内容。教育交互机器人将在促进学生认知发展、培养创造性思维和提升社会交往能力等方面发挥不容忽视的作用[1]。
人工智能已上升到国家战略,已经渗透到人们的日常生活、工作和学习。计算机辅助教学的方式还是不能满足个性化教学的需求。智能化教育以学习者为中心,以学习者需求为导向,培养人的思维和创造能力。应用人工智能技术,遵从教学规律,创新教学方式,优化人才培养方案,人工智能技术与教学深度融合,实现个性学习、实施交互、及时问答。从而改变传统教学与学习方式,实现人机结合;改变课程设计,线上线下同步实施,自动答疑解惑。
随着人工智能的发展,课程教学模式发生了翻天覆地的变化,学习不再受时间、空间的限制,深度开启开放教育,教育资源进一步共享。只要你想学习,AI就是好老师,因材施教。传统教学模式被彻底打破,实现教育 “四个现代化” 即教育大众化、教育产品化、教育个性化、教育持续化。
1.教育大众化
借助互联网、移动互联网、大数据,教育和学习随时随地,学校教育不再圈在围墙内,优质教学资源共享,延伸了教育时空。人工智能具有人类学习和思考能力,可以自学习,能自动分析学习者,了解和分析学习者的心理和思想,从而实现真正意义上的因材施教,担任学习者的私人助理。
2.教育产品化
在人工智能的驱动下,不再以学校为核心,教学为中心,教学内容和流程不再由学校和教师主导,学生被动接受,而是学习者成为学习的主体,形成人机交互。机器承担教师、家长、辅导教师角色,可以陪读、陪练、监督,减轻了教师和家长负担,解决了家长对教学知识体系不熟悉的问题。不再是教师唱独角戏,学生是配角。整合优质教学资源,实现优质教学资源共享,打破教育围墙界线,实现产品化。
3.教育个性化
“学什么”“怎么学” 由学习者决定,机器根据学习者学习情况、知识掌握程度及所学知识结构自动推荐学习内容,实现私人定制。满足不同学习者的需求,自动差异化教学和差异化学习,教育内容和形式因人而异,实现真正意义上的因材施教,从而实现个性化教育[3]。
4.教育持续化
教育是一个漫长的过程,知识的学习一般要经过几个月、几年、甚至几十年。知识的吸收、消化是渐进的过程,而教师的精力和时间是有限的,很多情况下学习者遇到疑问不能及时得到有效解答,对学习者学习的积极性和自信心严重影响。机器可以二十小时不停工作和学习,通过大数据和深度学习几秒就可以掌握一些专业知识,同时也可以获取分析学习者的学习轨迹、学习基础条件、学习能力等。学习者可以自主选择学习内容,随时随地学习,及时答疑解惑。
十年树木,百年树人。人才的培养是一个长期的过程,不能急于求成。教育理念和模式要跟上时代的步伐,与时俱进。当前正处于人工智能时代,教学手段要引入人工智能技术。首先改变传统教育理念,打破传统教学标准流程,标准化教学培养出的人才没有个性,千篇一律。教学标准化流程应交给机器完成,人工智能技术与传统课程教学实现深度融合,有机结合,从而培养出符合社会发展需要的人才[4]。教育教学是一个复杂多变的过程,知识的学习离不课程的设置,课程设置直接关乎到培养什么样的人才。如果课程设置不合理、不科学,教学将是失败的。课程开发与设置要结合人工智能技术,充分发挥机器与学生互动的机制。教学中教师是实际操作者,人工智能时代对教师也提出了新的要求和挑战,不仅要掌握知识,还要掌握人工智能应用技术。因此,要实现教育智能化,首先需要提升教师的人工智能应用水平,教师需要不断学习,接受继续学习和继续教育[4]。
以某省的精品课程网站为例,现有的精品课程网站大都具有 “在线答疑” 这一栏目,但教师与学生的信息交流方式仅局限于E-MAIL、留言版或论坛等。E-MAIL方式的缺点是不及时,而且对所有学生的所有问题都是 “有问必答”,这将极大地增加教师的解答负担,特别是对于那些基本的具有很大共性的问题。留言版、论坛方式虽然相对前者及时性有较大改善,但因为教师不可能时刻在线而造成有的问题不能得到及时的解答。据申请者对某高校校园网上现有精品课程的统计,18门省级精品课程中,主页中有答疑栏目且可用的有6门(占统计总数的33.3%,2门是基于E-mail,4门是基于留言版或论坛),有答疑栏目但不可用的有1门(占统计总数的5.6%),无答疑栏目的有11门(占统计总数的61.1%)。20门校级精品课程中,主页中有答疑栏目且可用的有3门(占统计总数的15%,1门是基于E-mail,1门是基于论坛,1门是基于静态课程知识库),有答疑栏目但不可用的有2门(占统计总数的10%),无答疑栏目的有15门(占统计总数的75%)。从这些精品课程网站的统计结果来看,具有答疑功能的比例较小(省级的为33.3%,校级的为15%),而且全部都是基于E-mail、留言版﹑论坛或静态课程知识库。如果能让计算机自动地、及时地解答学生的疑问,无疑将会大大地减轻教师的答疑负担,同时也会极大地提高学生自主学习的质量和效率。
基于上述对某省高校精品课程教学网站在线答疑功能的实际调研和分析,构建具有智能性的基于课程知识库的课程教学网站智能交互平台,平台基于B/S模式,网络结构如图1所示。
图1 平台网络结构
平台允许学生以自然语言(汉语或英语等)问句的形式提出问题,并及时地将相关的答案返回给学生。如果没有找到相关的答案,则将该问题转发到课程教师的邮箱或提交到留言版和论坛,待解答后返回。通过开发这样一个平台,目的是改革高校课程网站,特别是精品课程网站的在线答疑模式,充分调动学生学习的自主性,提高课程网站本身的资源利用率。
平台以课程知识库检索为主,同时辅以E-mail﹑留言版和论坛等多种答疑手段。
1.准确理解学生问题
学生可以通过自然语言(汉语或英语)来提问。形式可以是多样的,可以是问句的形式,也可以是一般问句的形式。
2.答案以权重的高低排序
若平台对学生问题没有检索到准确答案,返回相似度非常高及权重高的问题的答案。
3.专家解答
对学生问题没有检索到答案,将返回相关问题的答案供参考,并记录该问题等待解答。平台除了记录其状态等待教师解答,同时提交到论坛,并以邮件的形式发送到相应教师的邮箱。提交到论坛的问题在线学生(学生和教师)都可以看到,大家可以在线回答并可讨论回答情况。
4.自学习
对于没有解答的问题,若该问题得到了解答,平台自动将该 “问答对” 加入课程知识库库。未解答的问题会通过三种途径得到回答:通过论坛、邮件、教师进入平台直接回答。
5.师生交流与互动
通过论坛,学生与学生、学生与教师可以在线讨论学习、生活,未解答的问题也可以得到及时解答,集思广益。学生还可以给相应教师留言,对教学提出相应的意见或建议,从而提高教学效果,有利于教师改进教学。
6.反馈教学效果
平台会记录学生所问问题并计算问题(包括学生问题和课程知识库中问题)的访问频率,教师可以根据学生问题了解学生的困惑及薄弱环节,通过问题的访问频率可以了解学生对相关知识点的掌握情况,后期教学可以有针对性的补充和复习。
课程网上智能交互平台的实现涉及对学生所提问题的分析理解,以及课程知识库的检索等。其中,涉及问题分析理解的关键技术包括:文本分词以及关键词抽取和扩展,结合普通词典、专业词典及语义词典(采用哈尔滨工业大学信息检索研究室提供的《同义词词林扩展版》)来实现对学生问题的分析理解。
涉及课程知识库检索的关键技术主要是句子相似度的计算,通过对一般的关键词方法和向量空间模型方法作相应的改进(分别引入了位置信息和概念语义信息),并按照一定的权重组合综合考虑关键词方法和向量空间模型方法来实现学生问题和课程知识库库中问题的相似度计算。在实现平台的自学习功能方面,采用机器学习的方法。
平台包括三个主要部分:问题理解、文档检索和答案抽取[5],体系结构如图2所示,体系结构图中同时体现了平台的业务处理流程。
图2 平台体系结构
平台实施过程中充分利用现有的互联网信息检索工具(google和百度等搜索引擎)、开源的机器学习软件包(SVM和CRF等学习模型)及常用的文本聚类算法和概念格建格算法。在所需基础语言技术处理模块(分词、词性标注、命名实体识别、依存分析等)和相关语料资源(中文问题集等)方面,通过调用中科院计算所的分词组件及哈工大信息检索研究中心LTP(Language Technology Platform)平台的相关模块来实现。
人工智能技术的发展,促进了传统教育模式和观念的改变,深度融合到课程教学网站中,提供智能人机交互,提升教学与学习效果。文中详细介绍了课程网站智能交互平台所涉及的相关知识及平台的实现,包括课程知识库的构建与组织、基于分词和关键词提取等自然语言处理技术的问题分析理解、基于语义的课程知识库检索、课程知识库的自学习等。学习者可以不受时空限制,随时随地地进行课程学习,极大地提高了学习的自主性。学习者不需要对搜索引擎返回的答案进行筛选,平台根据学生问题自动进行答案提取,并且具有自学习功能。