我国外语教育数据挖掘研究综述❋

2018-04-21 01:37:33钟瑜

外语与翻译 2018年1期

关键词：数据挖掘外语聚类

钟瑜

辜向东

肖巍

重庆大学

1.引言

数据挖掘又称数据库中的知识发现，可通过一定的算法从大量数据中发现隐藏的模式与知识。近年来，随着教育信息化进程的加快和教育大数据的爆发式增长，教育数据挖掘的重要性逐渐凸显（牟智佳、俞显、武法提2017）。2012年美国教育部发布蓝皮书《通过教育数据挖掘和学习分析促进教与学》。2015年中国国务院发布《促进大数据发展行动纲要》，明确提出要建设教育文化大数据，成立教育大数据应用技术国家工程实验室。这标志着教育数据挖掘在中美两个大国的教育和人才培养中都被提高到了国家战略的高度。

我国外语教育界的专家学者也意识到了教育数据挖掘的重要性，指出：中国外语教育政策的制定、外语教育科研、外语测试的社会化转向都必须依赖外语教育大数据的支撑，我们应该意识到收集和挖掘外语教育大数据的必要性、迫切性和责任感（刘润清2014；李晨、陈美华2015；蔡基刚、林芸2016）。数据挖掘技术不断在外语教育研究中得到应用。本文将对国内期刊发表的外语教育数据挖掘研究进行分析，回顾研究现状，指出研究不足，对未来研究提出建议并进行展望，以期进一步推动我国外语教育数据挖掘研究的发展。

2.数据来源与研究方法

本文以CNKI数据库为文献来源。检索时，刊物级别限定为EI和CSSCI，学科限定为“外国语言文字”，以数据挖掘相关术语为关键词进行文献初选。关键词参照数据挖掘教材（Han，Kamber&Pei 2011）和教育数据挖掘研究综述（Pena-Ayala 2014）选取，包括数据挖掘、分类、预测、回归、聚类、关联分析等50个词。对初选文献进行逐篇审读，剔除非实证研究文献和无关文献，并从保留文献的参考文献中溯源检索，最终得到有效文献176篇（均为CSSCI期刊论文）。

对于这些文献，本文采用“先总后分”的方式进行综述。首先采用文献计量的方法，对文献的年度分布、学科分布、数据挖掘技术使用分布等的整体特点进行梳理，然后采用内容分析的方法，对文献的具体内容进行分析，归纳出其特点和不足。

3.结果分析

3.1 文献分布特点

3.1.1 年度分布

文献的年度分布表明研究的发展趋势。图1显示，我国外语教育数据挖掘研究起步于21世纪初，之后相关研究的数量虽略有起落，但总体呈上升趋势。这表明数据挖掘在外语教育领域逐渐受到关注。然而，从论文的绝对数量看，我国外语教育数据挖掘研究仍然较少，表明数据挖掘在外语教育领域尚有极大的应用空间。

图1 文献年度分布

3.1.2 学科分布

文献发表的期刊反映不同学科对外语教育数据挖掘研究的关注情况。通过整理文献所发表的期刊发现（图2）：共有176篇论文发表于45种期刊，其中，128篇发表于11种外语类期刊，28篇发表于16种教育学期刊，7篇发表于7种心理学期刊，3篇发表于3种情报学期刊，10篇发表于8种综合性社科期刊。这表明，我国外语教育数据挖掘研究得到了以外语和教育为主的多学科期刊的关注。

图2 期刊学科分布

文献作者的学科背景也能反映出学界对外语教育数据挖掘研究的关注情况。通过整理作者所在的院系发现（图3）：137篇论文的作者为外语背景，10篇为心理学背景，7篇为教育学背景，4篇为计算机、通信和经济管理背景，还有18篇为外语和其他学科学者跨学科合作。这进一步表明，我国外语教育数据挖掘得到了外语等多个学科学者的关注，而且初显跨学科趋势。

图3 作者学科分布

3.1.3 数据挖掘技术使用分布

数据挖掘的方法很多，常用的有分类/预测、聚类、关联规则挖掘、时间序列挖掘、文本挖掘、WEB挖掘等。分类/预测是根据训练数据建立模型并预测新数据的取值或所属类别。聚类是把大量数据按照某种标准归为若干个有意义的群组或类别。关联规则挖掘是通过频繁项集的形式发现大型数据集中的隐藏的有意义联系。时间序列挖掘是对一系列时间点上的采样数据进行分析以发现其长期趋势和周期性变化特征。文本挖掘和WEB挖掘则是综合利用多种数据挖掘技术，挖掘文本或WEB数据中的知识与模式。不同方法有各自不同的特点和使用范围，需要根据具体研究的需要加以采用。

为了解目前国内外语教育研究中对数据挖掘方法的使用情况，我们对文献中用到的数据挖掘方法进行了统计。结果发现，我国外语教育数据挖掘研究中最常用的方法是分类/预测，其次是聚类，此外还有3项研究使用文本挖掘，1项研究使用WEB挖掘，1项研究未指明具体使用的方法（见图4）。对于关联规则等常用挖掘方法和深度学习等新兴方法则完全没有涉及。这表明，目前我国外语教育数据挖掘研究使用的方法非常有限。

图4 据挖掘方法使用分布

每一类方法下有多种具体的技术。由于分类/预测和聚类是使用最多的两类方法，我们对这两类方法中使用到的具体技术也进行了统计。图5显示：在分类/预测研究中，使用最多的技术是回归分析（主要为线性回归），其次是决策树。线性回归和决策树都是较为经典的分类/预测技术。前者可建立两个或多个变量之间的线性方程，进行连续变量取值的预测。后者可根据若干输入变量的值构造出一个逐层分类的模型，以预测输出变量的值，并将决策/分类过程以树形结构展现出来。然而，除了这两种经典技术，其他分类/预测技术的使用还十分有限。

图5 分类/预测技术使用分布

图6 显示：聚类研究中使用最多的技术是系谱聚类和K-means聚类。系谱聚类和K-means聚类技术出现较早。前者是一种快速聚类方法，可随机设置类别数k，适合处理分布集中的大样本数据集。后者不需要预先设定类别数k，每次迭代时仅将距离最小的两个样本/簇聚为一类，对数据分布的适应性强，可以有效处理稀疏数据。可见，对聚类技术的使用同样限于少量经典技术中。

图6 聚类技术使用分布

总体而言，外语教育领域对少量经典数据挖掘技术已有较为广泛的应用，但对于其他常用的或新兴的数据挖掘技术使用非常有限。由于每种技术都有各自的适用范围（如线性回归不能处理非线性关系，决策树不适合处理连续型数据），技术种类的局限必然会限制可处理的数据类型及可研究的问题。同时，部分研究未指明使用的具体技术，其学术规范性有待进一步加强。

3.2 研究内容分析

目前，我国外语教育数据挖掘研究按研究内容可以分为四类：外语学习（125篇）；外语教学（26篇）；外语测试（18篇）；文献计量（7篇）。下文将依次对这四类研究的内容进行分析。

3.2.1 外语学习

外语学习的数据挖掘研究主要关注三个方面：外语整体水平、单项外语技能、外语学习认知心理。

外语整体水平是学习者外语能力的综合体现，在研究中通常用学生外语考试（如TEM、CET、期末考试）的总成绩来反映。我们共检索到29篇研究外语整体水平的文献。研究者利用线性回归、粗糙集、决策树、K-means聚类等技术探测多种因素对外语整体水平的影响。这些因素主要分为四类：1）认知心理因素，如学习策略、学习动机、学习风格、学习观念、学习自主性、自我效能、人格特质；2）语言因素，如外语基础、听说读写等分项技能、词汇知识、语法知识；3）行为因素，如课堂表现、上网行为；4）人口统计学因素，如专业、性别。研究表明：这些因素的不同维度会对外语整体水平产生不同程度的影响。例如学习策略中的元认知策略对外语整体水平有正向预测力（谭霞、张正厚2015），而情感策略在不同条件下对外语整体水平有正向、负向或者零预测力（袁凤识、刘振前、张福勇2004；康建东2010；冯立新2013）。

单项外语技能是外语整体能力的有机组成部分。我们共检索到67篇研究单项外语技能的文献，涉及写作、阅读、词汇、口语、听力、语音、语法、语用等方面，其中对写作（20篇）、阅读（16篇）、词汇（11篇）的研究最为丰富。研究者通常用测试成绩来表示技能的高低，并利用线性回归、系谱聚类和决策树的方法探讨多种因素对这些技能的影响。以研究最多的写作为例，研究者主要探讨五类因素对两种写作类型（独立写作、综合写作）、四种写作体裁（议论文、说明文、概要写作、学术论文）的写作质量的影响。这五类因素包括：1）作文文本特征，如流利度、准确度、易读度、词汇和句法复杂度、衔接手段、引用特征；2）认知心理因素，如学习动机、学习兴趣、学习策略、自我效能、情绪、模态转换能力、自动评分技术感知；3）写作任务因素，如题型、提示特征；4）语言因素，如词汇、口语、听力和阅读水平；5）人口统计学因素，如性别、专业。研究表明，上述因素的不同维度会对不同类别写作的质量产生不同程度的影响。例如，反映准确度的T单位正确率、反映复杂度的作文型符比、反映连贯性的衔接手段型符均能有效预测考生议论文的成绩，但只有T单位正确率能有效预测考生的概要写作的成绩（张新玲、李清华、张洁2010）；积极向上的长时情绪有助于写作创新（梁汇娟、初彤2013），而焦虑会对写作质量产生负面影响（李航2015）。

外语学习认知心理也受到一定关注。我们共检索到25篇探讨外语学习认知心理的文献，主要涉及学习动机、学习策略、学习焦虑、学习兴趣、学习目标、学习自主性等话题。研究者采用线性回归和K-means聚类的方法探讨它们的影响因素。一方面，教师教育行为和方法、教学内容和教学环境等外界因素会影响学生外语学习的认知心理。另一方面，外语基础、智力、计算机素养、自我效能、性别角色及个性/人格特征等学习者内部因素也会影响外语学习认知心理。此外，还存在各因素交互影响的情况。例如学习目标、学习动机影响学习策略（王家明2007；温宏兰、曾志宏 2013），学习动机、学习策略、学习目标又影响学习自主性（徐锦芬、李斑斑 2014）。

上述三方面的研究共同表明，影响外语学习的因素极其复杂，而且影响因素彼此交错。使用数据挖掘技术有助于厘清这些关系，更好地探究和构建外语学习的内在机制。

3.2.2 外语教学

外语教学的数据挖掘研究主要涉及三个方面：教学质量、教学支持系统、教师发展。

教学质量指教学活动及其结果满足社会需要和学生个体成长发展需求的程度，是外语教育成败的关键，受到多种因素的影响。我们共检索到15篇研究教学质量的文献。研究者利用线性回归、决策树、K-means聚类、系谱聚类、EM聚类等技术探讨影响外语教学质量的因素。这些因素主要分为三类：1）教师因素，如教学投入、教学管理策略、教学模式、多媒体教学手段的使用情况、课外与学生的沟通程度、教师学历和科研水平、教师国籍等；2）学生因素，如学习目的、学习期望、学习行为、学习焦虑、交流意愿、计算机操作技能、性别等；3）教学环境因素，如学校类型、课程类型、课件长度和形式、教学设备特征等。相比于传统的同行评价和学生评价，基于数据挖掘的教学质量评价，可融合更大数量、更高维度的数据，能更加客观、全面、准确地探测因素间的关系。例如王彩虹、高新琳、高旭阳（2015）结合全国性英语教育项目，对大量教师版和学生版课堂效能评价表、课堂教学调查问卷中的密集数据进行聚类分析，研究新课程标准下全国全程英语教育的现状和发展动态。吴羊（2010）基于决策树方法，以学生考试成绩明显进步为质量指标，考察教师、学生和教学环境等三方面共13个因素对教学质量的影响，明确各因素的重要程度和层级关系。此类研究可为教学质量体系的构建提供新的技术路线和更为客观的依据。

教学支持系统可以有效地支撑教学，提高教学效率和质量。我们共检索到7篇研究外语教学支持系统的文献。研究者利用神经网络、文本挖掘、WEB挖掘、决策树、贝叶斯、条件随机场、K-means聚类等技术，开发智能伴学系统、学习预警系统、教学材料甄选辅助系统，建设专门用途语料库，或者构建新型写作能力培养模式、学术摘要语步自动识别模型等。例如孙力、张凯、丁波（2016）利用K-means聚类和决策树方法，通过对网络学历教育本科学生英语相关课程成绩及学习信息的分析，构建可实现考试成绩细分预测的学习预警系统，该系统可在考前数月对考生成绩进行预测，准确率在80%以上，可提前对高风险学生进行必要的干预。刘华（2008）基于文本分类和聚类方法，对大规模的对外汉语教学报刊阅读新闻进行话题聚类和分级，实现可自动更新的教学材料甄选辅助系统，避免传统教学中依靠话题有限、内容滞后的教材和教师人工选材耗时耗力的弊端，并可有效辅助教材和词表编写。这些研究从实践应用的角度出发，利用数据挖掘技术实现对教学的自动化支持，突破传统教学的局限。

教师是教学的主体，教师发展是提高教育质量的有效保障。我们共检索到4篇教师发展的研究。研究者利用线性回归的方法，探讨影响教师发展不同方面的因素，主要涉及研修成效、教学态度、教师信念、职业适应等方面。研究表明，海外研修对高校教师开设全英文专业课程、转变涉外课程教学方式效果显著（刘春香、赵中建2014）；外语教师信息素养自我效能对教师网络教学态度有显著影响（王琦2010）；教师信念受到外部环境因素（考试文化、学校文化、家长、同事）和教师个人因素（专业发展观、学历）的共同影响，其中影响最大的因素是教师专业发展观（张凤娟、刘永兵2011）；随着时间的推移，自主学习能力对英语教师的职业适应能力和专业发展越来越重要（庄玉莹2016）。从这些研究可以看出，教师要取得自身长远的发展，既需要良好的外部环境支持，更需要积极的内在观念、能力和行为支撑。

上述对外语教学的研究表明，数据挖掘技术不仅可以帮助探明影响教学质量和教师发展的复杂因素及其关系，推动教学理论的发展，还可以用于教学自动化支持系统的开发，为教学实践提供切实支撑。

3.2.3 外语测试

外语测试的数据挖掘研究主要集中在三个方面：自动评分、试题开发、智能测试。

自动评分是近年外语测试领域关注的一个焦点，旨在让计算机最大限度地模拟人工评分。我们一共检索到10篇自动评分的文献，涉及翻译和写作。研究者利用线性回归、聚类、决策树、贝叶斯、支持向量机、文本挖掘等方法，提取与翻译或写作质量相关的文本特征集，结合人工评分结果，构建自动评分模型，并通过测试和比较检验模型效果。翻译自动评分研究涉及说明文、记叙文、英译汉三种体裁，英译汉和汉译英两个方向，字词、句子、篇章等多个层面的数十个甚至上百个特征。例如袁煜（2016）分析了单语、双语、语言模型三个层面共167个译文质量相关特征，用模拟退火算法挑选出最优特征集，用支持向量机和贝叶斯模型构建评分系统。结果表明该特征集可从内容充分性和语言流畅性两方面对译文质量进行有效评估，该系统具有不依赖参考译文、不受译文语篇限制的优点。写作自动评分研究主要集中在写作表现测量指标的类别及特性分析（陈慧媛2010）、作文语法评分模块构建（贺俊杰、王昉2012）、写作内容质量评分新方法开发（刘力、麦陈淑贤、金檀2013）等方面。相比于人工阅卷，自动评分更加经济、客观、稳定、高效，系统复用性高，这些研究可为大规模考试评卷实践提供支撑。

试题开发旨在为考试提供有效的题目集合，是考试顺利实施的前提。我们一共检索到3篇试题开发的文献。两项研究利用线性回归分析了TEM4听力文本可听性特征对听力题目难度的影响（彭康洲、张艳莉2013）和高考英语试卷多选题选项可猜性对猜测概率的影响（邓杰2012），为试题开发质量保障提供了支撑。一项研究利用遗传算法实现大学英语试卷听力和阅读题型的智能组卷（朱正才、杨惠中2008），极大提高试题开发的效率。这些研究均以大规模高风险考试为对象，试题开发的质量和效率尤为重要。目前的研究仅限于部分题型，更多的数据挖掘技术可以用于辅助更多考试和题型的开发。

智能测试侧重于施测的智能化，目前流行的有自适应测试和网络化测试。我们一共检索到3篇智能测试的文献，分别对这两方面进行了探索。两项研究利用贝叶斯等方法设计大学英语语法与词汇自适应测试与辅导系统（李昕、荆永君、刘天华2013）和基于语音评测的英语口语智能导师系统原型（梁迎丽、梁英豪2012），可为学习者提供个性化的测试和即时反馈。一项研究利用线性回归发现影响学生网络化外语测试适应度的四大因素（测试环境、测试规程、网考输入和回答方式），为智能测试改进提供了参考（王春渝、邹晓玲2011）。这些研究可以提高智能施测的效率和针对性。

随着外语考生数量的不断增加和考生背景越来越多样化，外语测试逐渐转向智能化和社会化是不可避免的趋势，大数据资源以及人工智能和数据挖掘等技术有助于这种转向的实现。目前国内相关的研究有助于推动我国外语测试研究和实践的智能化和社会化。

3.2.4 文献计量

相比于传统的文献综述，基于数据挖掘的文献计量有明显优势，可实现对大量文献快速而客观的量化分析，挖掘文献中反应的热点和隐藏的趋势，并用可视化图谱的方式将结果呈现出来，非常清晰、直观。

在外语教育领域，研究者利用CiteSpace和SPSS等工具进行文献计量研究，主要使用K-means聚类和系谱聚类技术分析国内外学术热点。一些研究以SSCI期刊文献为来源，分析商务英语方面的研究热点及对我国商务英语教育和研究的启示。一些研究以CNKI期刊文献为来源，分析大学英语课堂教学和阅读教学、外语教育信息化以及二语习得哲学思想等方面的研究热点及对我国外语教育的启示。例如陈坚林、王静（2016）通过对我国外语教育信息化研究20年共2896篇文献的系谱聚类，发现该领域的十五大研究热点并基于此展望“互联网+”深度融合的新常态。类似研究有利于研究者把握学科发展的现状和趋势。

基于数据挖掘的文献计量研究的优势显而易见。但是，目前的文献计量工具只能对一些容易量化分析的指标进行分析，对文献中的细节和存在的问题较难把握，这恰恰是人工梳理的优势。在实际研究中，可根据实际需求选择或结合使用。

4.不足与建议

目前，我国外语教育界已经利用数据挖掘技术展开较为广泛的研究，取得了一定成绩，但是仍然存在一些明显的不足。理清这些不足不仅有助于我们理解研究现状，也可为未来的研究指明发展方向。下文将依次阐释主要的不足及其原因，并提出改进建议。

技术方面，存在使用的技术种类较少、技术使用不够规范的不足。在技术种类方面，目前的研究主要使用线性回归、决策树、系谱聚类、K-means聚类四种经典技术，而其他技术较少或没有使用。由于每种技术都有自身的适用范围，技术种类的局限必然会限制可处理的数据类型及可研究的问题。未来研究可以加强对更多技术的应用甚至针对外语教育研究的特殊需求进行必要的改进。在技术使用规范性方面，一些研究存在未说明具体使用何种技术、选择的技术与数据特点不匹配、未说明数据分布检验、未区分训练集和测试集、缺乏模型交叉检验的必要步骤等问题。这些不规范都可能会降低研究结果的可靠性。造成这些不足的原因可能在于外语教育界缺乏数据挖掘技术的引介，研究者大都为外语背景，缺乏数学和计算机基础，较难掌握复杂技术，过于依赖现成工具（如SPSS）中集成的少量数据挖掘技术等。外语教育界应该加强数据挖掘技术的引介、培训、教材编写和人才培养，积极推进跨学科复合知识体系构建和跨学科合作，逐渐突破技术的限制。

数据方面，存在数据量较小、数据来源有限的不足。在本综述涉及的176篇文献中，数据量在100以内的研究有42例，100-500的研究82例，500-1000的研究26例，1000-5000的研究9例，5000以上10例。数据量最小为15，最大为5.2亿。另外还有个别研究未说明具体的数据量。数据挖掘的优势在于处理大数据，分析小数据容易出现模型不稳定的情况。未来研究应当满足所选择的数据挖掘技术对数据量的基本要求，当数据量较小时，也可尝试用多重交叉验证等方法弥补，并可使用不同数据量建立多个模型，探测最佳数据量。进一步的分析表明，小样本数据大都采用问卷调查、测试、课堂观察等外语教育领域常用的数据收集方法。这些方法容易受人力、物力和财力的影响，一般较难获取大数据，而且搜集到的数据可能存在不够客观的现象。大样本数据主要来自语料库、文献数据库、各级别教务/考务系统、网络课堂等，但这种研究数量较少。目前，国家和许多研究者越来越多地公开教育数据，各级教学管理单位对数据挖掘需求不断增加，持有教育数据的企业寻求合作研究逐渐增多，文献数据库和语料库越来越丰富和完善，以网络课堂、网络测试平台、移动学习系统等为代表的新型教育环境逐渐成为常态。这些都将利于外语教育大数据的搜集和利用。未来研究可以加强对公开数据集和新型教育环境的利用，并通过跨界合作实现共赢，充分发挥数据挖掘技术的优势，为外语教育服务。

研究内容方面，存在研究对象集中、实践应用研究偏少的不足。首先，研究人群过于集中。85%的研究以学生为研究对象，其中90%以大学生为研究对象。造成这一现象的原因可能是研究者大都是高校教师，而高校学生是高校教师接触最多、有最多感性和理性认识、相对最容易获取数据的群体。然而，除了大学生，教师和中小学外语学习者也是非常重要的外语教育相关群体，以他们为对象的研究还非常有限。未来研究可以加强对不同群体的挖掘。其次，研究语种过于集中，94%的研究集中在英语上，过于偏重英语教育研究必然不能支撑我国整个外语教育体系的发展。未来研究可以加强对其他语种的挖掘。再次，实践应用研究偏少。大部分研究只是利用数据挖掘技术进行偏理论的因素间关系探讨，只有少量研究从工程应用的角度出发，通过模型构建、算法设计、系统设计等方式切实解决外语教育中的实际问题。其原因可能在于这样的研究往往对技术要求较高，一般研究者难以胜任。但是，理论与应用研究互相依托，才能进一步推动我国外语教育的发展。研究者可以加强数据挖掘技术素养，未来可以加强实践应用研究。

5.结语与展望

本文结合文献计量和内容分析的方法，对我国CSSCI期刊上发表的176篇外语教育数据挖掘研究进行了分析，梳理了国内该领域的研究现状。研究表明相关研究数量不断增加，得到了多个学科的期刊和学者的关注，广泛使用了经典技术。研究内容主要涉及外语学习、外语教学、外语测试、文献计量四个方面，取得了一定成绩。然而，目前研究尚存在使用的技术种类较少、技术使用不规范、数据量偏小、数据来源有限、研究对象较为集中、实践应用研究较少等不足。我们分析了这些不足的原因并提出了改进建议。

我国是一个外语教育大国，外语学习者和考生数量位居世界前列，目前我国外语教育正处于深度改革和转型期，有着进行外语教育数据挖掘研究的天然优势和迫切需求。教育数据挖掘上升为国家战略，相关研究必然会得到更多的政策和资源支持。数据挖掘技术的不断进步也为外语教育数据挖掘研究提供了有力的技术支持。相信随着数据挖掘技术在外语教育界的不断普及、外语教育研究者数据挖掘意识和能力的不断提升、以及跨界融合的不断加深，数据挖掘技术将在外语教育领域得到更为广泛而深入的应用，有望为我国外语教育的改革和优化提供强有力的支撑。

Han,J.W,,Kamber,M,&Pei,J.2011,Data Mining Concepts and Techniques Third Edition[M].Morgan Kaufmann.

Pena-Ayala,A.2014.Educational data mining:A survey and a data mining-based analysis of recent works[J].Expert Systems with Applications（4）：1432-1462.

蔡基刚、林芸，2016，大数据时代下的外语社会化考试[J]，《中国电化教育》（6）：127～131。

陈慧媛，2010，英语写作表现测量指标的类别及特性研究[J]，《现代外语》（1）：72～80。

陈坚林、王静，2016，外语教育信息化进程中的常态变化与发展——基于教育信息化的可视化研究[J]，《外语电化教学》（2）：3～9。

邓杰，2012，选项可猜性评判与命题质量控制——我国高考英语多选题可猜性实证研究[J]，《外语电化教学》（1）：28～36。

冯立新，2013，网络多媒体环境下大学英语自主学习策略的有效性研究[J]，《现代教育技术》（1）：59～63。

贺俊杰、王昉，2012，语法自动分析与计算机辅助写作评分[J]，《外语与外语教学》（6）：61～65。

康建东，2010，理工科大学生英语学习自我效能、学习策略与语言水平的关系研究[J]，《中南大学学报（社会科学版）》（2）：103～108。

李晨、陈美华，2015，新技术环境下的中国外语教育政策思考——第五届国际语言教育政策学术研讨会启示[J]，《外语电化教学》（2）：78～80。

李航，2015，大学生英语写作焦虑和写作成绩的准因果关系：来自追踪研究的证据[J]，《外语界》（3）：68～75。

李昕、荆永君，刘天华，2013，自适应测试与辅导系统设计与实现[J]，《现代教育技术》（4）：106～109。

梁汇娟、初彤，2013，情绪对二语写作创新影响的调查与实证研究[J]，《中国外语》（2）：61-66。

梁迎丽、梁英豪，2012，基于语音评测的英语口语智能导师系统研究[J]，《现代教育技术》（11）：82～85。

刘春香、赵中建，2014，从课程国际化视角看高校教师海外研修之成效——基于上海27所高校的实证调查[J]，《教师教育研究》26（2）：108～112。

刘华，2008，面向对外汉语教学的话题聚类研究[J]，《外语研究》（5）：55～60。

刘力、麦陈淑贤、金檀，2013，写作测试内容质量评分研究——分层决策树法[J]，《现代外语》（4）：419～426。

刘润清，2014，大数据时代的外语教育科研[J]，《当代外语研究》（7）：1～6。

牟智佳、俞显、武法提，2017，国际教育数据挖掘研究现状的可视化分析：热点与趋势[J]，《电化教育研究》（4）：108～114。

彭康洲、张艳莉，2013，文本可听性对听力理解的影响[J]，《外语教学》（3）：50～53。

孙力、张凯、丁波，2016，基于数据挖掘的网络教育学习成绩细分预测的研究与实现——以本科成人学位英语考试为例[J]，《中国远程教育》（12）：22～29。

谭霞、张正厚，2015，英语学习策略、自主学习能力及学习成绩关系的分析[J]，《外语教学理论与实践》（1）：59～65。

王彩虹、高新琳、高旭阳，2015，基于全程英语教育项目的大数据监护服务实践[J]，《情报资料工作》（6）：83～87。

王春渝、邹晓玲，2011，影响学生网络化语言测试适应度的因素研究[J]，《现代教育技术》（5）：79～83。

王家明，2007，英语专业学生的目标倾向与学习策略的关系[J]，《外语教学理论与实践》（3）：22～26。

王琦，2010，外语教师在线发展的心理取向：信息素养自我效能与网络教学态度关系研究[J]，《西北师大学报（社会科学版）》（5）：96～102。

温宏兰、曾志宏，2013，融入型学习动机和内在学习动机与英语学习策略的关系研究[J]，《教学与管理》（30）：76～79。

吴羊，2010，数据挖掘在大学英语教学质量分析中的应用研究[J]，《现代教育技术》（4）：73～76。

徐锦芬、李斑斑，2014，学习者可控因素对大学生英语自主学习能力的影响[J]，《现代外语》（5）：647～656。

袁凤识、刘振前、张福勇，2004，英语专业和非英语专业学生学习策略差异研究[J]，《外语界》（5）：25～32。

袁煜，2016，翻译质量自动评估特征集[J]，《外语教学与研究》（5）：776～787。

张凤娟、刘永兵，2011，影响中学英语教师信念的多因素分析[J]，《外语教学与研究》（3）：400～408。

张新玲、李清华、张洁，2010，不同类型读写作文语言特征和分数预测因素研究[J]，《现代外语》（3）：287～296。

朱正才、杨惠中，2008，大学英语考试的计算机化组卷探新[J]，《外语电化教学》（6）：3～8。

庄玉莹，2016，自主学习能力与职业适应能力的相关研究——基于粤东某高校三届毕业生的调查[J]，《高教探索》（7）：117～124。