杨虹
(咸阳师范学院外国语学院,陕西咸阳 712000)
在科学技术高速发展的时代,伴随高速推进的数据传输技术、不断下降的网络成本、不断提升的移动设备覆盖率,网络线上学习的发展速度也大幅度提高,随之而来的就是不断改头换面的线上课程以及线上学习平台[1-2]。线上学习的主场地也从网站逐渐漫延到移动MOOC 平台、微信应用程序、喜马拉雅应用程序,甚至是一些教育相关的用户创造内容平台。
语言学习属于线上学习的核心方向,不管是在客户端还是在手机上,到处都在进行相应的学习。MOOC 平台以及各个教育机构都开展了新一轮的课堂直播和视频录制。在手机应用市场上有近100 款英语学习软件,如流利英语、Happy 词场、VOA 慢速英语、常用英语阅读等,还有在线更正网站、微信推送等,这说明语言学习者比以往任何时候都能获得更多的资源。学习者也慢慢地改变传统观念,逐渐适应内容少、结构多样的碎片化学习方式[3],这在英语词汇学习上的变现更加显著。在这种情况下,也会导致一系列问题产生,学习者不知道怎样进行应用程序的选择,已经出现的单词记忆软件的功能有很大的重叠,软件的设计方式没有区别性,难以满足学习者的个性化需求。
基于此,文中基于自适应学习的实质性特征和学习风格理论基础,构建英语智能词汇推荐系统的各模型,从而完整建立该系统模型,为提高英语学习者的词汇学习效率提供有效方式。
自适应学习本质上是一类计算机程序[4]。该程序能够在解决问题的同时生成新的规则,也可在过程中添加新的规则,进而使得类似的问题得到高效解决。自适应学习包括4 个方面,分别是目标者、出处、时间和方式,进而能够分析自适应学习研究过程中学习核心因素的答案。
自适应学习可以被理解为个体自主解决问题的一种学习方式,也就是适应性学习能够将学习内容进行改变,或者通过辨别任务的难度水平进而改变内容的表现形式以及路径选择方式。个体学习内容的变化主要关注的几个维度包括学习的对象、学习参数、与系统的互动以及教与学之间的变量。在什么时间进行改变则要先根据学习对象的特征进行调整,接着根据交互性参数进行连续建模及调试。自适应学习过程中,个体具体的改变方式需要考虑系统控制的适应性,包含学习对象进行学习环境和内容的完全控制,以及对适应的共享控制。
我国对学习风格的通用定义是,具有持续性人格特征的学习者的学习风格,属于学习方式以及学习倾向的集合[5]。学习风格的基本属性有3个:1)学习对象具有不同的学习风格倾向,这一属性通常比较稳定且持续的时间较长。2)产生学习风格的过程不但包括内在的心理和生理因素,还包括外在的环境影响,比如受教育的程度、家庭氛围、外界社会和文化因素。3)学习对象会因为学习风格不一而具有不同的信息处理习惯和态度,学习行为也存在差异,比如学习策略等。根据相关研究,可以把学习风格分为4 个方面[6]:首先是学习观,指的是学习对象在学习过程中具有怎样的态度以及理解方法,比如在完成家庭作业时具有怎样的想法,对教师角色的认识是什么。其次是学习动机,指的是学习对象进行学习的目的是什么,包括学习对象的目的、意愿以及学习的期待。最后是加工和调节方式,加工方式指的是学习对象在学习活动中使用的不同认知加工方法,如有的学习对象擅于使用词根词缀完成联想,有的则运用多次重复的方法进行单词记忆。而调节方式是需要学习对象对学习行为进行管理协调以及控制的方法。Vermont 的分类精简高效,可以准确地描述所有学习风格元素,是文中所参考的学习风格基础理论。
首先,构建学习对象特征模型。准确的推荐算法应该基于对学习者特征和资源特征的合理提取。单词记忆软件的资源特征更加显著,根据语音到文本、文本分割、提取关键词以及文本关联计算等方法,能够对各种资源特征进行有效地提取。学习对象的特征提取与教学有关,它的实施需要基于教学理论展开。基于学习对象的能力组成,把智能词汇推荐系统中对每种学习能力的评价变成实际能够进行测量的学习对象数据。经过提取和清洗学习对象的基本信息以及学习相关数据,可以获得用于量化和对比的数据信息[7],使得学习对象特征模型能够顺利构建,如图1 所示。
图1 学习对象特征模型
衡量记忆、理解等陈述性知识的基本学习能力,可以根据学习对象在阶段测试中表现的统计来判断。从学习对象注册时的学习目标、线上学习时间和自我评价能力等方面对自主学习、主动学习和同伴帮助进行测量,发现学习对象的学习积极性和学习动机水平。针对学习对象的习惯和方式、解决难题的能力、发散性思维能力等学习能力的挖掘,上述信息的挖掘要展开初步的模型建立以及验证。可促进词汇记忆的方面包括分析学习对象的上网时间、时间间隔同学习规律的关系,资源收集次数、学习的平均时间、上网间隔同时间间隔测试之间有没有关联。从不同维度对学习对象的能力特征进行衡量,可以促进对学习对象的详细描绘,有利于挖掘同类型学习对象,从而进行词汇推荐[8]。
其次,构建学习对象的学习风格模型。文中对不同学习风格模式的维度进行了分析总结。基于现实情况和分析结果,对不利于词汇记忆和学习情况的项目进行删除,最后构建词汇记忆学习风格模型。该模型研究了针对不同学习风格的学习对象定制智能推荐策略和提高智能推荐模型性能的核心功能题,如图2 所示。
图2 单词识记-学习风格模型
单词识记学习方式分为学习目标、学习管理以及信息加工3 个维度。学习目标是指学习的期望,其中模仿型学习对象受考试压力的影响,认为词汇学习是简单的知识记忆[9]。意义导向型学习对象主要受到个人兴趣、能力培养等内在动机的激励,他们对词汇学习的看法符合建构主义学习理论[10]。应用型学习对象的学习目标主要是出国留学、在大学工作和学习、专业学习等实际需求倾向于实用主义学习理论的观点。信息加工指的是学习活动中的认知方法。浅加工指学习对象在单词学习中更倾向于使用机械化的记忆方式,这样花费的时间更少。注重深度加工的学习对象就注重知识的重组和构词,经常用联想、类推以及造句等方式来促进记忆,需要花费很长时间。学习管理指的是学生根据自己的能力水平调整学习速度,对学习活动进行合理规划的能力。计划型学习对象的主动性高,知道自己的能力水平,能独立控制学习活动以及进度。随机学习对象则缺乏学习积极性,不能清楚认识自己的能力,一般都需要外界的帮助来规划学习活动,对学习进度进行合理分配。
最后,建立智能词汇推荐模型。在大多数自适应学习系统中,用户建模使用静态和动态数据。静态数据采集需要用户填写基本信息,更新学习文件,并完成一系列关于兴趣主题和技能水平的问卷,以确定自己的学习偏好。然而,学习风格问卷基于学习者对自己有清晰认识的假设,基于自我报告测量,而不是能力测试,其效度存在很大问题。现有的动态数据挖掘方法能够获取到大量学习者的行为相关数据,然后通过贝叶斯网络[11]、Markov 模型[12]和其他机器学习[13]分类算法或深度学习神经网络[14]来处理学习者的动态交互数据,从而推断出学习者的风格。文中建立的智能词汇推荐模型如图3 所示。
图3 智能词汇推荐模型
在学习对象学习时,模型一直进行学习对象的行为数据收集,把收集到的文本和信息数据转换为学习对象的特征和资源特征,发送到服务器,计算特征向量之间的相似度。在帮助学习对象记忆单词时,系统根据学习对象的能力模型计算单词使用的数量。根据对象特征之间的相似度,为对象匹配学习伙伴,并向新对象推荐学习伙伴新单词列表中的单词。为了提高用户背诵单词的效率,可以提前预测学习对象不熟悉的单词。当学习对象想学习新的话题词时,学习伙伴的新词也可以成为推荐词汇的重要来源。对于历史记录为空白的新用户,由于缺乏数据,很难提取学习能力特征。该系统还可以通过挖掘用户已学习单词的相似单词来生成推荐词汇。最后,在将词汇直接推送给学习对象之前,系统根据词汇记忆学习风格模型提取学习对象的学习风格[15]特征,为不同学习风格的对象实现个性化推荐服务。它不仅推荐单词的内容,还对推荐的总量、出处、时间以及表现方式都进行个性化的适应对策分析,从而大幅提高词汇学习效率。
根据上文各个模型以及学习对象特征分析,建立的英语智能词汇推荐系统如图4 所示。
图4 英语智能词汇推荐系统
系统分成3 个层:学习用户层、业务层以及数据信息层。数据信息层主要进行数据存储,保证数据的可靠性以及安全性。根据用户的需要,语料库包括数据存储层,如用户评论、测试数据等。业务层的功能是分析系统的主要业务逻辑,包含类似词挖掘和相似用户挖掘。采用基于用户的协同过滤算法[16]向学习者推荐单词,利用聚类算法定位用户学习方式,进行推送方式的规划。学习用户层的功能主要是学习对象与系统的交互,服务器对学习对象的请求进行回应并显示交互结果,如词汇学习、数据注册、应用评论、语料库传输、测验完成等,该层产生的全部学习对象行为数据信息都会在日志数据库中进行记录。
1)特征向量标准化处理。文中使用聚类算法进行标准化处理,设特征向量的数据为R,样本的均值为M,样本的方差为D,则标准化处理R′的公式为:
2)学习风格的聚类。利用通用型的K-means 聚类分析算法进行学习风格聚类,设开始的聚类对象为N个,把所有数据聚类成C个簇,那么簇H的表达公式为:
要使其损失函数为最小,损失函数的表达式为:
其中,mx代表簇H的中心点,且:
该算法的优点是运算速度快以及效率高,但是需要提前设定聚类数C的数值。
3)运用SPSS26.0 对系统性能以及词汇统计结果进行可视化分析。
设年龄相似度权重为λ,学习对象相似度阈值为γ,根据提出的算法对系统的语义感知性能进行分析,结果如图5 所示。
图5 系统语义感知性能统计结果(1:λ=0.1 γ=0.1;2:λ=0.3 γ=0.3;3:λ=0.5 γ=0.5;4:λ=0.7 γ=0.7;5:λ=0.9 γ=0.9)
由图5 可以看出,系统内仅考虑学习对象的相似度实现词汇推荐,将年龄相似度的权重设定为0.1~0.9,步长设定为0.2,用户相似度阈值同年龄相似度权重的取值范围相同,二者都是随着参数值的提高而不断上升,取值到0.8 时,二者都获得最优数值。
对学习对象在系统内的词汇使用记录以及聚类效果进行统计和分析,结果如图6 所示。
图6 统计和分析结果
由图6(b)可以看出,当簇数设定在13 以内时,轮廓系数值上升迅速,但超过13 以后,增长非常缓慢,说明此时的聚类效果不再明显,也就表示提出的对应模型是有效的。由图6(a)可以清楚地看到学习对象在登录到系统内所学习过的单词记录,包括该单词的使用次数,说明对应的模型是有效的。
文中基于自适应学习的实质性特征以及对学习对象的学习风格进行理论分析,分别提出学习对象特征模型、学习对象的学习风格模型以及智能词汇推荐模型,运用上述模型设计了英语智能词汇推荐系统,并对系统的语义感知性能和学习对象在系统内的词汇使用记录以及聚类效果进行统计和分析。结果表明,通过系统参数的调节能够获得语义感知最佳状态,而且提出的聚类算法和模型都是有效的,能够实现预期的词汇推荐效果。该研究也存在一定的不足之处,对于系统的界面没有进行设定和构建,影响了系统的完整性,这也是下一步的研究重点。