李俊杰 张建飞 胡 杰 盛守卓
基于自适应题库的智能个性化语言学习平台的设计与应用*
李俊杰1,2张建飞3胡 杰3盛守卓3[通讯作者]
(1.讯飞教育技术研究院,安徽合肥 230088;2.安徽信息工程学院 大数据与人工智能学院,安徽芜湖 241000;3.科大讯飞股份有限公司,安徽合肥 230088)
近年来,自适应题库技术、智能语音评测技术、语音合成技术、云计算等技术的发展及成熟,为构建智能个性化语言学习平台提供了可能。文章首先分析了智能个性化语言学习平台所需的关键技术和方法;然后介绍了如何借助这些技术设计能提供多种学习途径的平台框架,并提出了一种配套的语言学习模型;最后以少数民族学习普通话作为应用案例,介绍了平台的建设过程及方法,并对学习者的学习效果进行了对比分析,发现平台的应用效果良好,有效提升了语言学习者的基本语言能力。
自适应题库;个性化学习;人工智能;大数据
传统在线语言学习系统一般是依靠电子学习资源、网络学习社区及网络信息技术搭建的自主学习平台,国内较为知名的在线语言学习系统有英孚在线英语培训中心、新东方在线网络课堂等。这些平台的功能一般包括在线视频课程、教师在线授课、在线练习等,平台功能较为单一,只是简单地将授课形式从线下教学转变为以录像或在线课程为主的线上学习,课程无法做到实时地进行评价和反馈,也无法满足学习者个性化的学习需求。而个性化学习是未来教育发展的趋势,它是当代教育积极倡导的学习理念和模式,注重学习者的个体差异,采取恰当的学习手段满足学习者个性化的学习需求[1]。
语言学习平台的用户一般是以第二语言为学习内容的学习者,其特点是水平参差不齐,且语言技能发展不均衡。但是受传统技术手段的限制,传统的语言学习平台学习资源呈现单一,难以精准测量每个学习者的语言水平,无法根据其学习行为推荐个性化的学习资源,也无法实时有效地衡量学习效果,故个性化语言学习一直难以真正地推行和实施。作为促进个性化学习发展的关键技术,人工智能和大数据分析技术在近年得到了较大的发展[2]。本研究基于语言评测、语音合成等人工智能技术、教育大数据分析技术,借助构建的自适应题库,设计了以学习者为中心的、自适应测试的智能个性化语言学习平台,为实现语言的个性化学习提供了支持。
计算机自适应测试是基于项目反应理论(Item Response Theory,IRT),以计算机为辅助工具,每个学习者建立适合自己能力的个性化测验[3]。自适应题库就是以IRT为理论基础而构建的试题库。相较于传统的基于经典测量理论(Classical Test Theory,CTT)建立的题库,自适应题库可实现计算机自适应考试(Computerized Adaptive Testing,CAT),能更准确、更迅速地测量出每个学习者的真实水平。
IRT是针对CTT的不足而提出来的,其原理是根据测试者回答问题的情况,经过题目特征函数的计算,推测测试者的能力水平。研究者基于IRT构建了多种模型:第一种模型是1952年Lord提出的双参数正态肩形曲线模型;随后,Rasch提出了用于测量被试能力水平与项目难度关系的拉希模型,由于模型中只有一个项目参数,故也被称为单参数模型;1957~1958年,Brinbaum改进了Lord的双参数模型,提出了三参数模型[4]。三参数模型的应用较为广泛,其计算公式如公式(1)所示。
公式(1)
在个性化学习中,自适应测试可在学习初期较为准确地诊断出学习者的水平,并将此作为学习起点;在学习过程中,可根据学习者当前的能力水平,提供个性化的学习效果测试资源。
语音评测是利用计算机自动对人的语言进行标准程度评估、发音错误检测和口语内容质量评分的技术,目的是利用人工智能技术,提高语言学习的效率。语音评测主要涉及语音识别、自然语言处理、深度神经网络等人工智能技术,其使用场景不仅覆盖客观题(如字、词、句和篇章)中的发音检错和评分,而且支持开放性题型(如话题表述)的发音和表述内容的评分,能帮助学习者有针对性地纠正学习过程中的错误,相当于学习者的机器口语老师。语音评测引擎由语音评测技术封装而来,封装过程中可针对不同的学习人群对声学模型、评分标准等模块定制,形成针对此学习人群的定制化评测引擎,能更精确地给出评测结果。
语音合成(Text To Speech,TTS)是指将文本状态的文字信息转化为可听的声音信息的技术,相当于给机器装上了人工的“嘴巴”。语音合成可为学习者动态地合成所需的学习资源,可实现学习者自主录入资源进行学习。同样,语音合成引擎也可定制,定制项目包括发音人音库、语速、音量、语调、背景音等,可使合成后的学习资源灵活多样。
根据杜婧敏等[5]的研究,教育大数据可定义为面向教育全过程、全时空的多种类型的全样本的数据集合。基于教育大数据的个性化推荐技术是指使用学习行为分析技术,从海量的教育大数据中挖掘有价值的信息,从而得出学习者模型,再根据学习者模型使用推荐算法推送个性化学习资源——学习者模型一般包括个人信息、初始知识水平、学习兴趣、知识模型、学习风格等特征信息。该技术的核心是个性化推荐引擎,其输入是学习者的学习行为数据(如学习目标、练习历史等),输出为个性化的学习资源。
在前文所介绍的智能语言学习技术的基础之上,本研究设计了基于人工智能及大数据分析平台的智能个性化语言学习平台架构(下文简称“平台架构”),以期通过建设自适应题库,利用人工智能辅助学习手段和学习行为分析技术,帮助学习者建立智能化、个性化的在线语言学习平台,从而提升学习者的语言水平。平台架构设计采用经典三层架构:表现层、业务逻辑层和数据访问层,目的是减少各模块单元之间的耦合性,提高系统的可维护性和扩展性,如图2所示。
图2 基于自适应题库的语言个性化学习平台架构
①表现层。表现层是用户接触的界面层,主要功能是展示系统界面、处理用户交互请求并展示处理结果。系统界面展示支持多语种界面切换的需求。
②业务逻辑层。业务逻辑层是平台的核心部分,其主要功能是完成所有业务逻辑的处理。根据功能的不同,各项业务逻辑可分为两大类:基础业务服务,这是平台基础业务集合,提供诸如用户注册验证、数据统计、个性化资源推荐等功能;人工智能与大数据服务,为平台提供核心AI能力和大数据分析能力,提供如语音评测、语音合成、学习大数据分析等功能。所有服务能力通过接口方式提供,实现前后台分离,可满足多平台(如PC端、Android、iOS移动端)的开发需求。
③数据访问层。数据访问层的主要功能是负责数据库的访问,对数据库完成增加、删除、修改、查询操作。平台架构主要包括用户库、自适应题库、业务库、文件库和学习者模型库。其中,自适应题库中存储所有试题内容和自适应参数,用于自适应测试抽取;而学习者模型库中存储了所有学习者的学习模型,用于个性化课程资源推荐。
整体业务流程设计如下:学习者登录平台后,完成能力诊断,形成诊断报告并初始化学生模型;根据诊断结果,确定课程体系中的学习起点开始个性化学习,学习过程中收集学习行为数据至云端;学习后完成考试中心的自适应考试任务,并将考试数据汇总至管理中心集中统计分析。具体业务流程如图3所示。
图3 平台业务流程
平台业务流程详细描述如下:
第一步,初次登录平台的用户需诊断其能力水平。诊断过程为填写个人基本信息(如年龄、学业背景、过往相关语言等级考试情况等)用于确定初始量表,自适应测试过程中测试题目会根据选题策略动态变化,使得诊断结果能较为准确地反映学习者的真实水平。能力诊断同时会将学习者模型初始化,根据其诊断结果确定其能力水平并初始个性化学习资源。
第二步,学习者可在课程体系中从其诊断的初始能力层级(如中级)开始学习,每个能力层级包含不同数量的课时,每个课时又包含根据能力层级要求而制作的课程资源。学习者完成所有课时后即可发起升级测试,测试通过后即可进入下一层级的学习。学习者在学习课程内容的同时,也可以进入资源中心自主学习。资源中心的学习内容由个性化学习资源推荐引擎根据学习者模型推荐,如在基础语音模块中,推荐引擎根据该学习者过往口语发音练习的学习行为,有针对性地为其推荐发音易出错的资源。本平台利用先进的AI云平台中的语音评测、作文评测、语音合成等人工智能技术,个性化地提升学习者的听说读写能力。
第三步,经过一段时间的学习后,管理人员发起考核任务,学习者在考试中心接收到考试任务后完成一次自适应测试,考试结果自动上传至后台管理中心。
第四步,管理人员可监控所有学习者的学习和考试情况,也可查看全局统计信息。后台学习数据和前台埋点收集的数据可通过大数据分析平台进行数据挖掘分析,形成每个学习者的学习行为模型,可供第二步中的个性化学习使用。
本研究以应用于少数民族学习普通话的国家通用语言学习平台(下文简称“学习平台”)为例,研究对象为新疆T地区使用该学习平台的所有中小学少数民族教师。学习平台的注册人数约8100人,使用人数约7600人,使用人数占比93%以上,人均每天使用学习平台的时长约0.56小时,学习平台的应用时长约一年。
首先,搭建一套符合少数民族群体的课程体系,包括语言能力模型和课程资源库,主要由B大学经验丰富的语言专家协助完成。语言能力模型的建设过程如下:首先,由专家对听、说、读、写这四个方面的语言能力进行细分,形成二级能力树(听力二级能力树如图4所示);随后,将所有的能力进行归类,划分出五个等级,再按照每个等级中的能力要求开发对应的课程单元,设置单元目标;最后,根据学习方法的不同,设计并制作不同的课程资源。课程资源库为语言能力模型配套的资源库(包括文字、图片、视频等),不仅存储了具体的课程资源属性,还存储了课程目标、学习方法与课程资源的对应关系,以便资源的检索。
图4 听力二级能力树
图5 学习者使用与未使用学习平台的平均成绩对比
其次,开发自适应题库,题库中试题的区分度、难点和猜想系数可在入库初期由语言专家根据专业经验来标定。在试题使用过程中,参考学习者在自适应测试中得出的结果对试题参数动态修正。通过反复、大量的修正,试题的参数趋于理想值,使得测试数据可以更好地反映出测试者的真实水平。自适应测试的关键是如何从自适应题库中选取测试题目,也就是选题策略的确定。本研究采用的是当前较为常用的最大信息量选题策略[6][8],即根据当前测试者的能力选择题库中信息量最大的试题提供给测试者。基本步骤如下:
①根据能力诊断结果设定学习者初始能力值(答对题数与答错题数比值);
②利用当前的能力值计算题库中每道试题信息量,计算方法为Logistic回归模型;
③选取信息量最大的试题作为下一道试题呈现给学习者。
再次,构建基于大数据的个性化推荐系统。该系统的构建分为两步:第一步是采集学习行为数据。本研究根据系统功能模块与学习行为观察,制定了详细记录学习行为的数据埋点方案,如表1所示。埋点收集的数据会上传至讯飞Odeon大数据分析平台,在此平台中完成数据清洗、存储、挖掘分析等工作。该步骤可根据学习者的学习行为数据,结合题目特征,构想学习者的知识模型[7],并作为学习者模型的中间数据进行分布式存储以便实时获取。第二步是个性化资源推荐引擎,分为三个模块:①学习者模型获取模块,其功能是从大数据分析平台中获取学习者模型的中间结果,结合平台的用户子系统中存储学习者的个人信息、当前阶段能力水平等信息,规整为最终的学习者模型;②诊断模块,其功能是根据学习者模型信息,对比其同构目标和课程体系,获得该学习者最应学习的知识点、考点等薄弱集合;③资源检索和获取模块,其功能是根据学习者的能力值和薄弱点,从自适应题库中检索相应的学习资源。
表1 学习行为数据埋点方案
最后,完成学习平台的开发工作。学习平台技术选型采用当前主流的Java Web开发框架,前后端分离以支持多平台(如PC端、移动端)的开发需求。开发语言采用Java,Web服务器使用Tomcat,数据库选型为MySQL,架构采用经典三层架构模式。为支持弹性和分布式部署,学习平台同时采用了阿里巴巴开源分布式计算框架Dubbo作为服务治理。
本研究对比了学习平台应用前后学习者(即新疆T地区的中小学少数民族教师)的国家少数民族汉语水平等级考试(MHK)成绩,学习结果如图5所示。图5显示,学习者使用学习平台后,其所有题型的平均成绩均高于未使用学习平台的学习者,说明使用学习平台者的学习效果要比未使用学习平台者好。从通过率来看,使用学习平台的学习者的MHK三级通过率提升了6.7%,而未使用学习平台的学习者的三级通过率仅提升了1.7%。此外,学习平台在使用期间持续稳定运营,产品功能得到了教育主管部门和学习者的高度认可,学习者的国家通用语言水平亦有了快速提升,产生了较好的社会价值和经济价值。
本研究借助于自适应题库、学习行为分析技术、教育大数据分析技术等技术搭建了可较为精确测量学习者真实能力水平并个性化精准推荐学习资源的在线学习环境。同时依托语音评测、作文评测等相关人工智能技术,构建了一个陪伴式虚拟老师,实时地精确地诊断学习者在听说读写等方面的问题,帮助学习者有针对性地学习。通过平台的验证,对比传统学习方式,个性化、自适应在线语言学习系统是提升语言学习效率的有效途径。
[1]王艳芳.支持个性化学习的e-Learning系统研究[J].中国电化教育,2008,(3):102-107.
[2](美)斯伯克特著.任友群译.教育传播与技术研究手册第四版(上册)[M].上海:华东师范大学出版社,2015:520-521.
[3]李昕,荆永君,刘天华.自适应测试与辅导系统设计与实现[J].现代教育技术,2013,(4):106-109.
[4]漆书青,戴海琦,丁树良.现代教育与心理测量学原理[M].北京:高等教育出社,2002:86-90.
[5]杜婧敏,方海光,李维杨,等.教育大数据研究综述[J].中国教育信息化,2016,(19):1-4.
[6]王鹏,荆永君,王海敏.最大信息量选题策略的自适应测试系统[J].计算机系统应用,2013,(6):149-152.
[7]岳俊芳,陈逸.基于大数据分析的远程学习者建模与个性化学习应用[J].中国远程教育,2017,(7):34-39.
[8]张鸿.计算机自适应题库的建立[J].计算机技术与应用,2009,(8):152-154.
Design and Application of Intelligent Personalized Language Learning Platform based on Adaptive Testing Bank
LI Jun-jie1,2ZHANG Jian-fei3HU Jie3SHENG Shou-zhuo3[Corresponding Author]
In recent years, with the development and maturity of adaptive testing bank technology, intelligent speech evaluation technology, speech synthesis technology and cloud computing, etc, it became possible to build an intelligent personalized language learning platform.This article firstly analyzed the key techniques and methods required for the intelligent personalized language learning platform. Then, the article introduced how to use these theoretical techniques to design a platform framework that could provide multiple learning approaches, and further proposed a supporting language learning model. Finally, the construction process and method of the platform were presented by using minority’s learning Mandarin as an application case. In addition, a comparative analysis of the effect of the platform on learners’ performance was conducted. Results showed that the platform had favorable application effect and improved language learners’ basic language ability.
adaptive testing bank; personalized learning; artificial intelligence; big data
G40-057
A
1009—8097(2018)10—0005—07
10.3969/j.issn.1009-8097.2018.10.001
本文为国家语委“十三五”重大课题“智能语音及人工智能技术在语言学习中的应用研究”(项目编号:ZDA135-4)的阶段性研究成果。
李俊杰,讲师,硕士,研究方向教育大数据、智能教育,邮箱为jjli5@iflytek.com。
2018年6月2日
编辑:小西