基于深度学习和大数据的英语自主学习模式探讨

2021-04-15 01:08:47郝小静
卷宗 2021年19期

李 光 郝小静

(内蒙古科技大学外国语学院,内蒙古 包头 014000)

深度学习是继机器学习、云计算之后最为热门的人工智能技术之一[1]。大数据又可称为“海量数据”[2]。在大数据背景下,学生可以通过多种途径进行自主学习,这就对以往传统的教室加课本的教学模式带来了巨大的冲击。与此同时,现有的学习平台或工具在引入大数据时需要拥有个性化学习内容推荐功能、能精准捕捉客户的学习特性和学习习惯,制定出符合用户自身需求的个性化自主学习模式。

深度学习技术通过对大数据进行提取和分析构建出非常有价值的学习模型。目前全国各个开展自主学习模式的高校都保存了至少十年以上的自主学习数据,因此建模所需要的训练数据来源可相对容易地获取到。从网络上可以获取到许多具有公开源码和训练效果优异的深度学习模型。那么在英语自主学习系统中应用深度学习技术和大数据技术应该能提高英语的自学效率、改善学习环境和巩固课堂上的教学内容。

1 利用传统自主学习平台的进行外语学习的缺陷

目前的自主学习平台和方法已经大幅提高了学生自主学习英语的效率和热情,但是传统的自主学习平台仅能提供固定内容和模式的学习资源,在这种情况下即使利用移动设备来提高学习效率也会遇到瓶颈。当前大部分大学生都有独立搜索学习资源的能力,但是对于获取到的英语学习资源,许多学生缺乏辨别这些学习资源是否适合自己的能力,使得整个学习过程即枯燥无味又不能达到预期的学习效果,从而浪费了学生的时间和精力,学生学习英语的自信心受到严重打击。最后,由于在高中阶段许多学生受到学校和家里的严格管控监督,他们尚能以较好的态度将大多数精力投入到学习中,一旦进入大学校园由于没有了以往的管控和监督,本可以用来提高自身英语水平的手机、iPad或电脑等电子设备就成为他们的娱乐工具(尤其是部分男同学,他们的手机和电脑大部分时间都是来打各种网络游戏),轻松和自由的学习环境使这部分学生很快就会沉沦于各种电子设备所带来的乐趣,失去继续进取的上进心,从而荒废学业、浪费大好青春。

影响学生学习英语的另一个主要原因是:尽管各个高校中使用的自主学习平台拥有内容丰富的学习资源、定期更新学习内容和不断补充最新的学习资料,但是这些平台并不会分析整体和个人的学习情况,只能给学生提供固定的学习模式,缺乏对学生学习方法的个性化指导。经我多年观察我校的自主学习中心学习使用状况,发现当前的英语自主平台由于自身内部算法的局限性,其会将固定的题型甚至是相同的题目分配给整个班级的同学,从而忽视了个体间的具体情况,这也就无法达到因材施教的效果。因此,现有的英语学习平台尽管拥有海量的英语学习资源,但是由于其自身内部的局限性导致学习资源分配不合理、学习内容匹配性不高和学习方式陈旧等传统自主英语学习平台难以解决的问题,这使得海量的英语学习资源无法得到充分合理的应用以至于学生的学习效率低下。

2 基于深度学习和大数据的英语自主学习策略探究

2.1 使用深度学习模型对各类英语资源进行分类

目前在互联网上存在大量公开源码的深度学习模型,它们在各自的领域都取得了较好的识别分类效果,对科技的进步有长足的影响。为了对各类英语资源进行分类识别,我们需要把这些英语资源的基本信息转化为文本数据,在此基础之上,一些公开源码的深度学习模型只需要经过小幅度的改造就可对各类英语资料进行分类。事实上,整个过程可以看作为使用深度学习(CNN、RNN 和Attention)技术来解决大规模文本分类问题。例如:TextCNN方法就是一类利用卷积神经网络对文本进行分类的算法[3],其使用一维度卷积来获取句子中的特征表示。由于其在短文本搜索领域和对话领域取得了较好的分类效果,我们可以使用该方法来提取各类英语资源的浅层文本特征,从而获得一个运行速度快、分类精度高的文本分类模型。

2.2 使用深度学习模型对学生的学习情况进行解析

在上一步的工作中,利用深度学习模型可以从各类英语资源中提取的有价值的文本特征,但是依据什么来给学生分配这些英语资源又是一个值得去探讨的问题。目前各个高校的英语自主学习中心都存放有数十年的英语自主学习成绩,这些成绩从客观地反映了各高校学生的英语水平和学习状况,每个学习单元的成绩又能从细节处反映出学生在学习英语中的薄弱环节和优势项目。但是数十年的英语自主成绩又是一个海量数据(以内蒙古科技大学为例,我校每届新生为六千人左右,每个学生需要进行四个学期的自主学习,那么十年就产生了大约24万条自主学习记录),对于动辄几十万的记录来说,单靠人工来分析的话几乎是一个不可能完成的任务。由于深度学习模型对处理大数据具有先天的优势,而且学生的总体英语成绩也是由各个单元成绩所组成,从数学上来看学生成绩可以看作为一个向量,这个向量中的每一个元素都是代表了某一个学生在某个英语测试项目上获得的成绩。在此基础之上,我们认为可以引入现有深度学习方法来对现有的海量英语成绩进行训练,从而构建出一个学生成绩分析模型,该模型能够根据一个学生前面几个学期或者以往其他同学英语学习成绩预测出在下一步的学习中该学生的可能会出现问题的地方。

2.3 使用深度学习模型给学生分配学习资源

虽然说自主学习是以学生为主体的一种学习策略,但是对于许多学生来说由于高中时期形成的根深蒂固的学习模式,使他(她)们在面对更加自由的学习模式时显得手足无措,这就需要对这部分学生的自主学习内容给予指导和帮助,对学习资源根据每一个学生的学习情况给予推荐。如果我们采取人工方式来从英语资源中寻找适合每一个学生的学习资源(即由教师来分配和推荐),这在大数据时代是几乎不可能完成的任务。因此在这一小节,我们再次引入深度学习方式来解决这个问题,即利用英语资源分类结果和学习情况解析结果来推荐给每一个学生适合的学习内容,这相当于给出学生们一部分适合他(她)们自己的学习内容,并从这些内容中选择感兴趣的英语资源进行自主学习。从另一个角度来看,这相当于用网上公开深度学习方法训练一个用于分配学习资源的深度学习模型,该模型使用英语资源分类结果和学习情况解析结果作为训练数据,训练好的模型应该具有适应性强、英语资源分配准确等特性。

3 结语

本文通过解析外语自主学习的优缺点,提出了构建一种全新的英语自主学习模式,该模式利用深度学习方式和大数据来训练一个为学生推荐学习资源、分析学习结果、判断学习情况的深度学习模型,从根本上缓解英语任课老师的工作强度,提高学生学习英语的热情和效率。