数据挖掘技术在英语教学评价中的应用

2019-09-27 00:38□关
产业与科技论坛 2019年16期
关键词:语法结构英语考试总成绩

□关 博

目前,很多高校都开始将数据挖掘技术运用在英语教学评价中,将学生的成绩作为数据库构建基础,通过数据挖掘技术进行合理的归纳和分析,可以找到学生成绩受到影响的最真实原因。

一、数据挖掘技术简介

数据挖掘也被称为是数据采矿、资料探勘等,是数据库知识发现中的一个重要步骤,该技术主要是指在海量的数据中利用一些算法搜索到隐含的信息过程。数据挖掘技术一般都是通过情报检索、统计、数据分析、机器学习、模式识别以及专家系统等诸多方式来实现的,和计算机科学有非常重要的关系[1]。近几年以来,数据挖掘技术也得到了越来越多的运用,在各行各业都储存和积累了大量的数据,可以被广泛地深入运用,如何将其更好地转换为有效的知识和信息也得到了更多的关注。数据挖掘技术是一个相对比较复杂的过程,一个反复循环的过程,对于其中的每一个步骤都要达到前期设计的目标,如果没有实现就会返回前面的步骤继续进行调整再执行[2]。

二、数据挖掘技术在英语教学成绩评价中的运用

目前,在英语教学过程中教师对于学生考试成绩数据已经积累了大量的数据,但是对于数据的处理,很多都是停留在简单的分析统计成绩好坏方面,比如常说的优秀率,良好率以及不及格的人数等方面[3]。本文列举了某高校1,000名大一新生第一学期英语考试成绩为基础的数据挖掘技术,希望可以根据挖掘到的隐含信息了解影响学生成绩的重要因素,从而用来帮助教师分析相关结果,改善日后的教学工作,不断地提高学生学习成绩和英语能力。

(一)数据挖掘算法。对学生英语学习成绩数据库进行数据挖掘,主要是利用ID3算法,这种算法学习能力较强,而且理论比较清晰,适用于处理一些大规模的数据信息[4]。

(二)数据准备工作。在进行数据挖掘的工作前应该做好数据准备工作,这也是数据挖掘过程中非常重要的一个环节。学生英语成绩数据库主要包括以下几个字段:学生的姓名、学号、完形填空、词义连线、改错、语法结构、翻译、阅读理解以及总成绩。通过查看相关试卷可以得到信息,再将部分信息录入到系统中。数据准备工作可以分为以下几个方面。

1.数据清理。教师在对学生成绩进行分析的过程中,发现部分学生存在作弊或缺考的行为,导致最终没有实际考试分数,因此,对上述两种情况的空白成绩进行删除清理操作,经过清理操作后最终剩余符合标准的记录条数为992条,占据总调查人数的99.2%。

2.数据归纳。根据英语考试相关内容诸如试卷的题型、语法结构、翻译、完形填空、总成绩等相关属性来构建决策树模型,这样可以构建学生英语考试成绩的分析数据表[5]。

3.数据转换。在构建决策树的时候往往需要一些离散变量,但是学生的英语成绩本质是属于连续值,因此就需要提前将其转换为所需的离散值。在此,根据英语成绩的实际情况,将学生英语总成绩分为两个主要部分:60分以下的不合格类以及60~100分的合格类。具体的代码如下所示:

Update 训练数据集

Set 总成绩=‘不合格’

Where 总成绩<60;

Update 训练数据集

Set 总成绩=‘合格’

Where 总成绩≥60;

在学生英语考试题型中完形填空占据的分值大约是40%,因此按照学生实际的考试分数将其分为小于24分、大于等于24分小于34分以及大于等于34分三种类型,等级分别是C,B,A三类。

Update 训练数据集

Set 完形填空=‘C’

Where 完形填空<24;

Update 训练数据集

Set 完形填空=‘B’

Where 完形填空≥24 and 完形填空<34;

Update 训练数据集

Set 完形填空=‘A’

Where 完形填空≥34;

语法结构和阅读理解在学生英语考试总成绩中都占据了大约15%的比例,因此可以根据卷面的分数将其划分为大于等于9分和小于9分两类,分为A和B两类。

Update 训练数据集

Set 语法结构(阅读理解)=‘A’

Where 语法结构(阅读理解)≥9;

Update 训练数据集

Set 语法结构(阅读理解)=‘B’

Where 语法结构(阅读理解)<9;

翻译在学生英语考试总成绩中占据了大约30%,因此可以根据实际的考试成绩将其分为以下三类,大约等于25的A,大于等于18小于25的B以及小于18的C。

Update 训练数据集

Set 翻译=‘C’

Where 翻译<18;

Update 训练数据集

Set 翻译=‘B’

Where 翻译≥18 and 翻译<25;

Update 训练数据集

Set 翻译=‘A’

Where 翻译≥25;

然后根据学生英语考试的实际成绩进行分析,并将数据进行相应的处理转换为对应的概化关系,如表1所示。

表1 概化关系表

接下来就需要采用ID3算法来构建决策树模型,以及根据实际情况构建分类规则。为了能够更好地掌握影响学生英语考试成绩合格的最关键因素,在此提取的规则主要是以“合格”为主要的参考,其规则可以分为以下几个方面。

If完形填空=“A”and翻译=“A”and阅读理解=“A”then总成绩=“合格”;

If完形填空=“A”and翻译=“B”and阅读理解=“A”then总成绩=“合格”;

If完形填空=“A”and翻译=“C”and阅读理解=“A”then总成绩=“合格”;

If完形填空=“B”and翻译=“A”and阅读理解=“B”then总成绩=“合格”;

……

综上所述,经过上面的相关分析,可以得到以下几个方面的结论:如果学生的阅读理解成绩和完形填空的成绩相对较好的时候,即使该学生的翻译能力出现较差,或者一般的情况也不会影响最终的总成绩,仍然处于一个合格的状态;如果某个学生的翻译和完形填空成绩都可以得到很高的分数,那么即使语法结构和阅读理解成绩相对较差,对于总成绩的影响也不是很大,也会达到一个合格的状态。因此,英语教师在后期的教学工作中,应该更加注重学生对于完形填空的运用能力,不断提高学生英语成绩考试的合格率,这样才能达到让学生更好地具有英语应用能力的目的。

猜你喜欢
语法结构英语考试总成绩
馒头
提升中职英语考试复习效率的点滴体会
全国高水平后备人才基地举重锦标赛顺利举行
中国大学英语考试能力构念三十年之嬗变
长沙方言中的特色词尾
浅析古代汉语的名词动用
谢文骏与刘翔110m栏分段成绩与总成绩的灰色关联度对比分析
培养阅读技巧,提高阅读能力
飞镖比赛
大学英语B级等级考试词汇用法和语法结构解题技巧