基于试题网络的个性化学习推荐系统研究*

2018-07-06 07:11中国科学技术大学大数据分析与应用安徽省重点实验室安徽合肥230027科大讯飞股份有限公司安徽合肥230088
现代教育技术 2018年6期
关键词:通项答题关联

(1.中国科学技术大学 大数据分析与应用安徽省重点实验室,安徽合肥 230027;2.科大讯飞股份有限公司,安徽合肥 230088)

引言

个性化教育体现了公平、尊重和差异性教育,目标是实现每一位学习者的心智发展,是教育的追求。个性化教育强调通过调查、测试、考核和诊断,根据学习者的能力和潜在特征,为每位学习者量身定制学习目标、学习计划。2010年7月颁布的《国家中长期教育改革和发展规划纲要》指出:“实施个性化教育,是促进教育改革创新的一个重要抓手,是实施素质教育的重要措施,是教育贯彻以人为本科学发展观的具体体现”[1]。然而,常见的教学模式为大班教学,在师生数量失衡的情况下,学生难以实现个性化学习、自主学习,个性化教育难以在日常教学中开展。随着移动互联网的快速发展,在线学习逐渐进入学生的日常学习中,在此背景下,累积了海量的学生在线学习和答题历史数据。伴随这些数据的不断累积,个性化教育的开展迎来了新的机遇。因此,如何利用现有的海量学生在线学习和答题历史数据,实现学生自主学习和个性化学习,从而突破师生数量失衡的现状,推动个性化教育的开展,具有重要的现实意义。

一 研究背景

信息技术革命与经济社会发展的交融,带来了数据的爆炸式增长,2010年,全球产生数据1.2x109TB。Intel预测,到2020年,这一数字将上升至44ZB(1ZB=10亿TB)。在现今的社会,大数据的应用越来越彰显其优势,占领的领域也越来越广阔,如线上交易、物流配送、O2O等各种利用大数据获得发展的领域正在协助企业不断发展新业务,创新运营模式[2]。与此同时,在线教育平台也在不断涌现,由孟加拉裔美国人Khan创立的可汗学院、由吴恩达和Koller创办的Coursera、网易公开课、学堂在线等大规模在线开放课程(Massive Open Online Courses,MOOC)正在全球范围内广泛流行。伴随平台不断被使用,大量的教育数据随之产生,这为教育领域带来了新的机遇和挑战。如何利用人工智能技术挖掘教育大数据,并从中产生有价值的信息,进而揭示教育的规律,指导教师、学生等教育主体来优化教与学的方式方法,是目前非常有价值的研究课题。

最近,Chen[3]从理论层面介绍了一些以学生为中心的教学与评估方法,通过改善师生关系、引入新概念、减少课程时间、每周评估测试等方法来提高学生的学习积极性。Bienkowski[4]采用教育数据分析学生阅读在线课程资料,挖掘出导致学生学习成绩表现不良的信息,并给出一些干预性指导,确保学生以最高效的方式学习,改善学生出勤率、辍学率,提高学习成绩,改进教学。然而,国内基于大数据推进个性化教育方面的应用研究相对较少,仅有少数研究从理论层面提出了如何打造智能教育应用生态系统、推进教育走向个性化[5][6][7][8][9]]。这主要源于当前主流教学模式为大班教学,在师生数量严重悬殊的情况下,个性化教育难以开展。已有学者证实了大班教学模式会导致个性化教育难以开展[10][11]:

①个性化学习难以实现:我国的教育总体上呈现出了重共性、轻个性的局面,像工业流水线上生产机器一样,培养的学生都是一个模子出来的“标准件”,极大地压抑了学生的个性发展,在统一的模具下培养出来的学生其独特的才华有可能被活生生地消磨乃至消灭。在大班教学中,师生数量严重失衡,教师没有精力根据每个学生学习情况进行有针对性的培养,学生的个性化学习难以实现。

②课下自主学习难以实现:教师和学生不仅需要在课堂上“下工夫”,更需要在课堂外“用劲”。在传统的课后练习和自学中,学生在没有很好地了解自身能力的情况下,盲目地做简单题、难题、偏题,课下的自主学习难以实现。

最终,本研究通过挖掘试题之间的相互关系,构建试题推荐系统,来解决上述问题。具体而言,本研究首先基于人工智能技术对试题进行表征,挖掘试题之间的隐含关系,构建试题关联网络;之后,进一步构建试题推荐系统,自动为学生推荐合适的试题,并为其选择做题路径,帮助学生课下自主学习,实现个性化学习,达到个性化教育的目的。

二 试题关联网络构建与推荐方法

试题题面表征是指通过人工智能技术词嵌入(Word Embedding)[13]将试题题面文本转化为密集、连续的向量,方便对试题进行后续处理。聚类技术是指通过无监督的数理统计方法对已有的数据(如试题)进行聚簇分析,挖掘它们之间的共性。本研究基于试题题面表征结合聚类技术得到试题类簇,利用频繁模式挖掘技术,挖掘学生历史答题序列得到试题难度序列,然后结合试题类簇和试题难度序列等构建试题关联网络。在此基础之上,实现了试题推荐系统。

1 试题关联网络构建方法

本研究以智学网中的试题题面信息和学生答题信息为主要数据基础,结合人工智能技术,设计试题关联网络。试题关联网络构建技术路线图如图1所示。具体而言,首先通过人工智能里的词嵌入技术将收集到的试题题面文本转化为试题向量,实现对试题的表征,之后再基于这些试题向量对试题进行聚类,将试题分为若干簇;另一方面,通过统计分析以及频繁模式挖掘技术挖掘学生历史答题序列,分别得到学生答题得分率和频繁答题路径。由此,可以找到相同簇下试题之间的难度和序列关系,按照试题难度由易到难、答题顺序由前向后的原则便建立了试题关联网络。图 2是一个构建好的试题关联网络样例,为了便于读者直观理解,该图只展示了每道试题所关联的知识点信息,而没有给出试题的题面信息。例如,对于考察了“数列通项公式”和“等差数列的通项公式”的两道试题,首先,由于这两道试题考察知识点相似,因此它们的题面文本相似,对两道试题进行试题表征后再聚类会将其聚类到同一簇中。同时,通过频繁模式挖掘技术,发现学生做完“数列通项公式”的试题之后会紧接着做“等差数列的通项公式”的试题,并且学生在“等差数列的通项公式”试题上的得分率低于“数列通项公式”试题,这样就找到了两道题目之间的难度和序列关系,从而将“等差数列的通项公式”试题定义为“数列通项公式”试题的后继节点。重复以上过程,便可构建出按照知识点划分的、难度可把握的试题关联网络,如图2所示。

图1 试题关联网络构建技术路线图

图2 试题关联网络样例

2 试题推荐系统

在试题关联网络的基础上,通过学生历史答题序列来评估学生能力水平,构建试题推荐系统。具体而言,学生回答试题后根据答案的正确与否更新学生对该试题考查知识点的掌握程度,之后推荐系统根据学生知识点的掌握程度向学生推荐难度合适的试题。重复上述过程,最终试题推荐系统自动为学生推荐个性化答题路径,实现学生自主学习和个性化学习,达到个性化教育的目标。基于试题关联网络的个性化学习推荐效果如图3所示,箭头中的“答对”表示学生答对该试题,箭头中的“答错”表示学生答错该试题,箭头“开始答题”和“答题结束”分别表示学生开始和结束做题。从图3可以看到,学生选择从“数列”知识点开始答题,然后试题推荐系统给学生推荐“数列通项公式”相关的试题;学生答对后,试题推荐系统继续给学生推荐难度更大的“等比数列通项公式”试题,之后重复此过程,直到学生答错“等比数列和的最值问题”试题,此时试题推荐系统给学生推荐比其简单但知识点相关的“数列通项公式的单调性”试题;再重复此过程,直到学生答题结束。通过这样的做题模式,学生做题变成了一种自主的个性化学习方式,每次答题都能得到及时的调整。当学生做错试题时,可以推荐做简单的试题恢复自信心,并巩固薄弱知识点;当做对试题时,可以了解知识的掌握程度,并继续做更难的试题,直到较好地掌握该知识为止。

图3 基于试题关联网络的个性化学习推荐效果图

试题推荐系统的开发和应用,可以有效破解个性化教育面临的难题,个性化学习成为现实。根据每个学生的答题结果,试题推荐系统可以分析学生能力水平,根据学生的表现给学生自动推荐不同答题路径。学生也可以根据自己的做题情况调整学习计划。试题推荐系统可以自动为学生推荐合适的试题。课下学生只需登陆网上账号,使用试题推荐系统,即可练习符合自身学习水平的试题。学生的学习变得更加自主化,进而达到个性化教育的目标。

三 试题关联网络推荐系统的验证研究

本研究选择在黄冈中学广州学校使用试题关联网络推荐系统,以验证其实际教学效果。

1 研究对象

从2017年9月开始至今,本研究选取黄冈中学广州学校七年级到高三的69个班级的学生作为研究对象,在其数学、物理、化学三门学科的教学过程中使用试题关联网络推荐系统,参与学生共计3773名。

2 研究过程

教学开始前,试题关联网络推荐系统的管理人员向学生和教师详细介绍如何使用试题关联网络推荐系统。随后,在每周讲课结束后,教师根据本周课堂教学内容,指定试题关联网络中的试题,学生在线进行自适应练习;试题关联网络推荐系统则针对不同学生的错题情况自动推荐关联试题,以此实现课下自主学习和个性化学习。

教学结束后,抽取学生在线做题记录及系统使用前、后两次测试成绩展开对比研究,同时进行推荐系统使用效果满意度调查,以此验证并分析该推荐系统的使用效果。

3 研究结果

在对比研究中,抽取69个班级学生使用系统前、后的两次考试成绩进行对比分析发现,经过一学期的试题关联网络推荐系统应用,大部分学生的成绩都有提高,其中,大约 70%的学生成绩明显提高,且提高幅度为7%,其余30%的学生成绩变化不太明显。在调查研究中,从上述69个班级中随机抽取一个班级(共56名学生)为代表,通过问卷调查了他们对试题关联网络推荐系统的使用效果满意情况,以此进一步验证该系统的使用效果。该调查问卷主要从推荐试题的难易程度、推荐试题的合适程度、试题解析的详细程度、推荐错题的价值、查看并补全薄弱知识点的效果、提高学习兴趣的程度这 6个维度反映学生总体使用效果满意度。问卷采用李克特五点量表,5分表示很满意,4分表示比较满意,3分表示一般,2分表示不太满意,1分表示很不满意。具体调查结果(即56名学生从不同维度给出的评分平均值和标准差)如表1所示。

表1 试题关联网络推荐系统使用效果满意度调查结果

从表1可以看出,在推荐试题的难易程度、合适程度、试题解析详细程度等6个维度上,被试学生的满意度均处于中等偏上水平(均值均高于中间值3)。这一结果表明,学生不仅认可系统推荐试题的难易程度和合适程度,还认为推荐系统的错题价值和试题解析质量均非常高,可以很好地查看并补全薄弱知识点,更可以提高学习兴趣。综上所述,试题关联网络推荐系统可以帮助学生更好地实现自主学习和个性化学习,提升学习效果。

四 总结

目前,个性化教育已经成为未来教育的发展趋势,国内对于个性化教育的研究正在从概念、理论层面逐步向实际应用转变。本研究以教育大数据为数据基点、以人工智能为技术基点,研究试题之间的相互关系,构建试题关联网络和试题推荐系统,来破解个性化教育在国内实施的难题。实践证明,本研究基于试题表征构建的试题推荐系统能够有效地揭示试题之间的内在关联,自动为学生推荐个性化答题路径,实现了学生课下自主学习和个性化学习,有效地推进了个性化教育的发展。

[1]国务院.国家中长期教育改革和发展规划纲要(2010-2020年)[OL].

[2]中国大数据.大数据时代——价值与漏洞并存的时代[OL].

[4]Marie B, Feng M , Barbara M. Enhancing teaching and learning through educational data mining and learning analytics:An issue brief[OL].

[5]王亚飞,刘邦奇.智能教育应用研究概述[J].现代教育技术,2018,(1):5-11.

[6]吴晓如,王政.人工智能教育应用的发展趋势与实践案例[J].现代教育技术,2018,(2):5-11

[7]万海鹏,汪丹.基于大数据的牛顿平台自适应学习机制分析——“教育大数据研究与实践专栏”之关键技术篇[J].现代教育技术,2016,(5):5-11.

[8]刘淇,陈恩红,朱天宇,等.面向在线智慧学习的教育数据挖掘技术研究[J].模式识别与人工智能,2018,(1):77-90.

[9]刘淇,陈恩红,黄振亚,等.面向个性化学习的学生认知能力分析[J].中国计算机学会通讯,2017,(4):28-34.

[10]柳丽平.中学实施个性化教育问题研究[D].太原:山西大学,2013:1-57.

[11]刘小兰,杨立国.个性化教育困境的原因探析——基于个人理论的视角[J].衡阳师范学院学报,2014,(5):157-159.

[12]Mikolov T ,Chen K, Corrado G, et al. Efficient estimation of word representations in vector space[J].International Conference on Learning Representations,2013,(1):1-12.

猜你喜欢
通项答题关联
邀你来答题
邀你来答题
数列通项与求和
邀你来答题
不惧于新,不困于形——一道函数“关联”题的剖析与拓展
邀你来答题
n分奇偶时,如何求数列的通项
巧求等差数列的通项
求数列通项课教学实录及思考
“一带一路”递进,关联民生更紧