大数据在外语教学中的价值、来源与技术分析

2021-03-07 11:37黄敏
外国语文 2021年3期
关键词:外语学习者分析

黄敏

(西南大学 外国语学院,重庆 400715)

0 前言

全球知名咨询公司麦肯锡称:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。”(郭晓科,2013)自2009年维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》问世以来,大数据成了各行各业的流行词汇。一般认为,大数据具有四大特征,分别为数据体量浩大(Volumn)、数据多元(Variety)、生成快速(Velocity)、价值回报高(Value),俗称4V特征(Mayer-Schonberger et al., 2013)。根据互联网数据中心IDC(Internet Data Centre)的定义:至少要有超过100TB可供分析的数据才叫大数据。大数据种类繁多,具有异构和多样性,包括文本、网络日志、音频、视频、图片、地理位置信息等。大数据的意义在于对多种类型数据构成的“数据集”进行分析和研究,提取有价值的信息,获得某种洞见或规律,从而帮助人们在解决问题时作出科学的决策或预测。大数据将给社会带来的三大变化有:(1)海量数据甚至“全部数据”将使人们不再依赖小样本的推断统计; (2)为了获取更好的洞察力,不再热衷于追求精确度,但并不是就此放弃;(3)不再热衷于追求因果关系,而更注重相关关系。这三条将彻底改变我们科研和教学的本体论、认识论和方法论(刘润清,2014)。

在教育领域,以信息化带动教育现代化已然上升为国家战略。随着教育信息化的深入,对大数据的利用成为学者、教师和管理人员共同面临的新课题。教育大数据作为大数据的一个子集,是整个教育活动过程中所产生的以及根据教育需要采集到的,一切用于教育发展并可创造巨大潜在价值的数据集合(杨现民 等,2015)。教育大数据从战略高度被定位为推动教育变革的新型战略资产、推进教育领域综合改革的科学力量以及发展智慧教育的基石,其最终价值体现在与教育主流业务的深度融合以及持续推动教育系统的智慧化变革上(杨现民 等,2016)。外语教育作为我国教育体系重要组成部分在大数据时代也同样面临着机遇与挑战。正如刘润清教授(2014)所言,现在教育经历“结构性调整”,不仅要更换结构,更重要的是革新理念和生产方式。虽然利用大数据能帮助我们更加清楚地认识外语教育的真实面貌和客观规律,找准理念和实践创新的突破口,提升教学效率,但外语教育领域却十分缺乏基于大数据的学习分析研究。因此,本文试图回答以下三个问题:(1)外语教学中大数据究竟能产生怎样的价值?(2)外语教育中的大数据有哪些重要的来源?(3)我们对收集到的大数据又该进行怎样的技术分析呢?

1 大数据在外语教学中的价值

大数据能为外语教学带来怎样的价值呢?总的来说,大数据能优化外语学习过程、助力个性化教学的实现,深化对外语学习者特征的分析,精准反映教学要素之间的互动,简化外语教学评价方式、克服经验式评价弊端。

1.1大数据能优化外语学习过程,助力个性化教学的实现

国内外研究表明个性化教学能最大限度发挥学生潜能、提高学生学习动力、维持良好的学习习惯,对提升学习效果具有积极的意义(Creed, 2010;Kalivoda, 2010)。个性化教学一直是我国外语教育领域的不懈追求;从教育部颁布的《大学英语课程教学要求(试行)》(2004年)到《大学英语教学指南》(2017年)都把确立多元教学目标、体现个性化教学理念、提供多种学习选择作为其核心观点和任务(王海啸,2004;蔡基刚,2016)。但受制于传统教学模式的局限,个性化指导和评价机会有限,个性化教学效果不理想(文秋芳, 2006, 2012)。信息技术新时代,教学模式以学生为中心,使其成为学习过程数据的生产者、使用者和受益者。通过学习过程大数据,可以完善个性化学习者档案、分析和预测个性化学习行为、进行以数据驱动的教学决策和个性化学习辅导;自适应学习系统能根据学生学习数据预测其性格特点和喜好,推送符合学生兴趣爱好和级别的学习材料,构建个性化的知识和能力体系。如在慕课或精品资源公开课中,平台可以收集学生的所有学习数据,大数据与云计算的结合使教师可以通过对数据的分析掌握学生在教育资源库上的操作痕迹,如点击流(Clickstream ),了解学生学习动态需求,了解不同学生的学习风格,提供不同的学习支持,进行及时、有针对性的干预和帮助(Gao, et al., 2019;Deng, et al., 2020)。如姜强等(2018)基于AprioriAll算法,挖掘分析相同或相近学习偏好和知识水平的学习群体的轨迹,并以学习者特征与学习对象媒体类型、理解等级、难度级别的匹配计算为基础,生成精准化个性学习路径,为差异化教学提供新思路。陈长胜、孟祥增等(2020)以中国大学MOOC平台中7967名学习者的学习行为记录为对象研究了慕课学习者的时间分配,发现慕课学习者在线学习行为时间序列呈现非平稳特征,课程周期内学习者学习时间分配存在三段式节奏,学习者资源交互行为的时间分配存在显著差异,不同成绩等级的学习者群体资源交互行为与学习时间分配存在显著差异。因此提出了课程运行中及时关注“低访问频次低时间投入”和“高访问频次低时间投入”学习者的分类教学建议。

1.2大数据能深化对外语学习者特征的分析

根据第二语言习得理论,学生个体差异,如年龄、学习风格、动机、学习目标、元认知等会影响语言学习的成效(Stephen, 1981;Rod, 1997;Dornyei, 2005)。传统的教学研究只能利用获取的随机抽样数据,用统计手段进行推断,过程复杂,研究结果存在误差,影响后续教学干预的准确性。信息网络技术可以采集微观的学习过程数据,包括学生的基本信息(姓名、性别、年龄、专业等)、学习行为日志数据信息(如学生在哪段视频上停留了多少时间、阅读某篇文章花了多少时间、先后浏览顺序、作文写作经历了怎样的修改过程等细颗粒度的行为)、兴趣偏好信息(语言技能类、文化类、应试类等)、认知行为信息(视觉型、听觉型、冲动型、稳重型等)、学习结果信息(作业成绩、测试成绩、自评成绩、互评成绩等);教学过程由以前不可量化到可量化(Cantabella et al., 2019; Shen et al., 2020)。如刘三女牙等(2016)以哈佛大学和麻省理工学院在edX平台上的课程学习数据为样本,从学习者类型、性别、学历、年龄、课程等五个维度对学习者学习行为进行差异性分析,其研究结果深化了对外语学习者特征的了解。赵慧琼等(2017)利用多元回归分析方法判定影响学生学习绩效的预警因素,在此基础上建构了干预模型,并将其应用于教学实践,对产生的学习数据进行二元Logistic回归分析,结果表明基于大数据的学习分析能及时发出预警信号并提供个性化干预对策,增强学习动机,培养学习者毅力。乔璐、江丰光(2020)选取“学堂在线”平台上参与慕课学习的1068名学习者进行研究,以视频观看比例、平时作业得分率、期末考试得分率、课程得分率四个变量来表征学习者的学习行为特征,并运用凝聚层次聚类分析、K-Means聚类算法、相关性分析和逻辑回归分析处理课程数据,研究结果把学习者分成了积极学习者、一般学习者和单纯注册者三类,并讨论了四个变量在三类学习者群体之间存在的差异。

1.3大数据能精准反映教学要素之间的互动

互动是外语学习的普遍特征,也一直是国内外研究者和教师关注的热点(Stoch, 2008; Oxford, 2011; Sato , 2013;徐锦芬 等,2018; 徐锦芬 等, 2019)。大数据时代,以社交媒体为特征的技术能记录学生与学习内容、环境(包括虚拟环境和AI 机器人)、同伴和教师之间复杂交互过程产生的大量数据。例如在慕课平台上选择同一门“跨文化交际”课程的数以万计的学生可以通过网络社交平台进行积极的讨论,教师也可加入引导讨论的方向和内容,交流的广度和深度前所未有。其产生的庞大数据可以通过社交分析软件(如Ucinet、Gephi)、内容分析等精准掌握互动的模式、频率、范围、内容等 (Chen et al., 2019; Fang et al., 2019; Lu et al., 2020)。如李艳、张慕华(2015)采用质性研究的方法,利用质性研究分析软件NVivo 8对收集的231条在线学习日志进行编码,围绕学习者、教师、课程、技术、环境五个维度进行内容分析。发现学生在与他人互动方面,相比在线交流,偏好面对面的交流讨论,而教师对学习者的指导与鼓励非常重要,多元评价方式能让学习者体验到学习过程比最后得分更为重要。

1.4大数据能简化外语学习评价方式,克服经验式评价弊端

在传统教学中,对学生学习过程情况的收集复杂、低效。而教育技术新时代,学习者在学习平台上的学习过程数据能被终端记录并存储下来,为教师评价提供了最直接、最客观、最准确的依据。同时,基于大数据建立的考试网络空间能使学生在虚拟环境中与AI机器人进行对话,系统根据设定的评价指标给出评价分数,改变了以往教师靠经验和主观判断评分的局限性(Engwall et al., 2020; Engwall et al., 2020; Hass, Vogt et al., 2020)。

2 外语教学与科研大数据来源

2013年被媒体称为中国的大数据元年,从这一年起,国内教育技术领域掀起了基于大数据技术促进教育改革和创新发展相关研究的浪潮,大数据教育应用迅速发展起来。2014年3月,教育部办公厅印发的《2014年教育信息化工作要点》中指出:加强对动态监控、决策应用、教育预测等相关数据资源的整合与集成,为教育决策提供及时和准确的数据支持,推动教育基础数据在全国共享。大数据与教育领域的深度融合成为当代教育事业发展的必然趋势。2016年,教育部印发的《教育信息化“十三五”规划》中提出要积极利用云计算、大数据等新技术,创新资源平台、管理平台的建设、应用模式;要依托网络学习空间逐步实现对学生日常学习情况的大数据采集和分析,优化教学模式。2018年,教育部印发的《教育信息化2.0行动计划》指出要利用大数据技术采集、汇聚互联网上丰富的教学、科研、文化资源,为各级各类学校和全体学习者提供海量、适切的学习资源服务,实现从“专用资源服务”向“大资源服务”的转变。

Piety等(2014)认为教育大数据可以围绕教学、学习者、教育机构、基于数据的决策四个方面收集。Cope和Kalantzis (2014) 认为大数据可以来自过程性、场景性和课堂评价,以技术为中介的心理测量,自主学习和其他一些更为复杂的学习表现。为了满足外语学习者的需求,基于技术增强型的学习方式也是多种多样,如正式学习与非正式学习,同步学习与异步学习,现实世界、虚拟世界与混合世界的学习,移动学习、无缝化学习和特定场景的学习,常规课堂学习、MOOC学习和开放式课程软件学习(Lan et al., 2017)。基于此,我们归纳出外语教学大数据的几个主要来源:(1)外语真实课堂活动中直接产生的数据,如学生考勤、课堂回答问题频次、课堂测试、参与讨论互动情况等。这些数据的采集可以用问卷、课堂观察、录视频、访谈的方式获得,也可以通过如QQ学习平台上的签到、抢答等功能记录。(2)外语学习平台产生的学习数据,如学习进度、正确率、发帖情况、测试成绩等。北京外语教学与研究出版社Unipus学习平台、清华大学大学英语数字化互动教学平台等,能提供学生每单元每一部分的学习时间、成绩以及学生在平台上参与互动讨论等的显性结构化数据。(3)慕课学习平台,包括中国外语MOOC平台、学堂在线、超星慕课平台、各级精品开放课程平台等。因为这些平台是面向公众开放,数据量都比较庞大,一线教师不容易获取,需要与慕课运营平台进行沟通。(4) 移动设备端自主学习数据。例如学生学习词汇的百词斩、扇贝单词、拓词等能自动记录学生词汇记忆的时长和进度情况。(5)教学管理活动中通过数字化校园平台、智慧校园平台采集到的数据,如学生基本信息、图书馆借阅书目情况、借阅时间长短、大型考试成绩情况等。

3 外语教学大数据分析技术

面对不同来源的大数据,只有对数据进行有效的处理,才能使其变成有价值的信息,为教学决策、教学过程和评价提供有价值的参考。近年来,以云计算、数据挖掘与分析等为基础的大数据技术为教育研究带来了数据获取、存储、分析和决策等方面的支持。

大数据的发展促进了大数据分析方法的发展,包括机器学习、数据挖掘、预测模型、数据的可视化等。在教育领域,学习分析(Learning analytic)非常重要;学习分析是对“学习者和学习环境的数据测量、收集、分析和汇报”,它能为教师、研究者和政策制定者提供有用的信息,改进教学,改善教学结果。Greller 和Drachsler(2012) 提出了一个系统全面的定义,从六大关键维度来定义学习分析。这六大关键维度分别是内部限制、外部限制、工具、数据、目标和关益者。内部限制指学生的能力和对相关知识的接受度;外部限制包括平台的规范及与学生、教师的约定;工具有技术、算法、理论等;数据主要是来自学生的公开数据和隐私数据;目标是反思教育模式和预测学生发展前景;关益者包括机构、教师、学生等。Ferguson 和 Buckingham (2012)归纳了五种学习分析方法:社交网络分析、话语分析、内容分析、性格分析和情境分析。近年来,随着人工智能和自然语言处理等领域技术的突破和整合,学习分析工具也更加多样和先进。如支持对原始帖子进行标注或编码、交叉引用和简短评论的工具Nvivo和Atlasti;支持基于词典的文本分析工具CATPAC和LIWC;智能化内容分析工具VINCA;社会网络分析工具Ucinet;预测学生学习参与的实时模型工具Solutionpath StREAM;分析计算机辅助合作学习的工具Meerkat-ED;为教师提供学生情况实时反馈的工具LOCO-Analyst;用于系统建模的工具Coordinator;专门的数据挖掘工具,SQL SERVER Analysis Service (SSAS)、Weka、SPSS 等(张浓芳,2010; 魏顺平,2013; Romero et al., 2020)。除此之外,还有Degrees of Reading Power(DRP)、DRA1+,Pearson’s Ordinate Technology Coh-Metrix、Point of Originality、OpenEssayist和Asiya等分析工具(甘容辉 等,2016)。大数据的算法也为分析大数据提供了支持,例如运用逻辑斯谛回归方法和支持向量机算法对成绩进行预测(贺超凯 等,2016;吕品 等,2019),利用决策树算法对学生在线学业成就影响因素或学生教学满意度进行分析(舒忠梅 等,2014;孙发勤 等,2019),基于Apriori 算法对学习群体行为进行分析(姜强 等,2018),利用adaboost 算法构建预测干预模型(韩梅梅,2018)等。

4 结语

依靠现代教育技术产生的大数据对外语教学价值凸显,为外语科研人员和教师带来了机遇,但拥有大数据绝不是取代科研人员和教师的作用(Mayer-Schonberger et al.,2013)。在实践中,我们仍然需要注意几个问题。

(1)大数据能提供小数据时代不能想象的海量数据,几乎能实现“样本=总体”,是一种新的研究范式,但在数据分析和解释上仍然需要教师和研究者结合语言习得理论和教学实践进行判断、分析、归纳和总结。(2)高效、科学的学习管理数据收集平台和管理系统(Learning Management System)需要研究人员、教师、编程人员的共同研发。根据知网CNKI的检索结果,我们注意到,目前研究者的兴趣普遍集中在英语写作教学平台大数据的收集和分析上,缺乏对语言教学其他技能学习平台的开发和学习过程的研究。(3)质性研究方法,如访谈、问卷、有声思维,仍是支撑大数据分析的有效三角验证方法。(4)大数据分析本身具有数据、计算和系统复杂性的特点,研究人员和教师要充分估计大数据收集、储存和分析中出现的挑战,找出应对之策。

猜你喜欢
外语学习者分析
隐蔽失效适航要求符合性验证分析
你是哪种类型的学习者
十二星座是什么类型的学习者
青年干部要当好新思想的学习者、宣讲者、践行者
电力系统不平衡分析
外语教育:“高大上”+“接地气”
电力系统及其自动化发展趋势分析
大山教你学外语
大山教你学外语
高校学习者对慕课认知情况的实证研究