蔡 文
(江汉大学外语学院 湖北 武汉 430100)
随着信息技术的进步和社会的发展,硬软件信息系统在各行业和领域快速增长。这些ICT系统采集、处理、积累的数据量越来越大,数据增速也越来越快,以至用所谓爆炸性增长等词汇已无法形容数据的增长速度。在大数据时代,让科学研究及教育领域能够凭借信息技术的发展从宏观群体走向微观个体,让跟踪每一个教授与被教授者的数据成为了可能,从而让全方位研究“教学互动双方的行为”成为了可能。特别对于我们教育工作者来说,我们将比任何时代都更接近认识真正的学生。
数据分析是学生核心素养之一,是指针对研究对象获取数据信息,运用数学方法进行整理、分析、推断和运用,形成关于研究对象认识的素养。数学经验再生,是学生在直接感性经验基础上,经过体验、反思与加工而形成,具有再抽象、再加工特征,是个体对数学活动过程的重新认识。教学数据分析需要在数据收集、整理、分析和应用阶段深化发展学生数据分析观念和能力,在数据分析各个阶段实现数学经验再生,促进数据分析素养发展。
2011年知名咨询公司麦肯锡全球研究院发布了一份题为《Big data: The next frontier for innovation, competition and productivity》的报告。报告中指出,数据已经渗透到每一个行业和业务职能领域,逐渐成为重要的生产因素;而人们对于大数据的运用预示着新一波生产率增长和消费者盈余浪潮的到来。第二年美国政府通过网站发布了《Big Data is a Big Deal》,表示将投资2亿美元启动“大数据研究和发展计划”,在发布这一倡议同时,6个美国联邦部门和机构承诺,这些资金将用于大大改善从海量数据信息获得、组织和收集知识所必需的工具和技能,并透露多项正在进行中的联邦政府计划,以应对大数据时代以及大数据革命带来的机遇和挑战。
那么我们如何通过大数据分析来实现认识真正的学生,了解学习行为数据背后的原因,从而真正读懂我们的学生?期末考试的一张英语试卷,它带给我们的数据是什么?是简简单单的一个90分?如果我们了解正确的技术与方法,充分利用IT系统的计算能力,我们可以得到许多隐藏在试卷背后的数据:可以是每一大题的分数分布,每一小题的得分,客观题选择了什么选项,每一题的平均用时,检查了哪些题目,修改了哪些答案,亦或者不同专业分数的差异分布……等等,这些远远比简简单单的分数所透露的信息要有价值得多。其实除了考试,课堂面授、远程辅导、课外活动的各个环节都渗透了这些大数据。
在《国家中长期教育改革和发展规划纲要(2010-2020年)》中特别强调:强化信息技术应用。教师应该提高信息技术水平,更新教学观念,改进教学方法,提高教学效果;应该鼓励学生利用信息手段主动学习、自主学习;应该增强运用信息技术分析解决问题的能力。
纵观人类历史,每一次划时代的变革都是以新工具的出现和应用为标志的。蒸汽机把人们从农业时代带入了工业时代,计算机和互联网把人们从工业时代带入了信息时代,而如今大数据时代已经到来,它源自信息时代,又是信息时代全方位的深化应用与延伸。大数据时代的生产原材料是数据,生产工具则是大数据技术,是对信息时代所产生的海量数据的挖掘和分析,从而快速地获取有价值信息的技术和应用。
业界(IBM 最早定义)将大数据的特征归纳为4个“V”(量Volume,多样Variety,价值Value,速Velocity),或者说特点有四个层面:第一,数据体量巨大。大数据的起始计量单位至少是P(1000个T)、E(100万个T)或Z(10亿个T);第二,数据类型繁多。比如,网络日志、视频、图片、地理位置信息等等。第三,价值密度低,商业价值高。第四,处理速度快。最后这一点也是和传统的数据分析有着本质的不同。
几位行业领军任务的观点也更鲜明的揭示了大数据思维的本质。“今天的数据不是大,真正有意思的是数据变得在线了,这个恰恰是互联网的特点。” “非互联网时期的产品,功能一定是它的价值,今天互联网的产品,数据一定是它的价值。” “你千万不要想着拿数据去改进一个业务,这不是大数据。你一定是去做了一件以前做不了的事情。”所以说,探求数据价值取决于把握数据的人,关键是人的数据思维;与其说是大数据创造了价值,不如说是大数据思维触发了新的价值增长。
数据分析,又称为知识发现(Knowledge Discovery),是通过分析每个数据,从大量数据中寻找其规律的技术。知识发现过程通常由数据准备、规律寻找和规律表示3个阶段组成。数据准备是从数据中心存储的数据中选取所需数据并整合成用于数据分析的数据集;规律寻找是用某种方法将数据集所含规律找出来;规律表示则是尽可能以用户可理解的方式(如可视化)将找出的规律表示出来。如果能够对这些数据进行分析,探寻其数据模式及特征,进而发现某个群体或组织的兴趣和行为规律,专业人员就可以预测到未来可能发生的变化趋势。这样的数据分析过程,将对工作有很多帮助。
在线教育市场风起云涌,无论是新创业公司还是老牌互联网公司都盯上了在线教育市场,这说明在线教育将迎来市场的爆发阶段。
新东方无疑是传统精英面授教学的最强者,通过网罗优秀教师、强化记忆方法、研究考试要点等创造了英语教学的中国合伙人神话,这里无意讨论新东方的成功之处,仅就互联网时代在线英语教育市场对它的冲击探讨未来高校英语教学者利用大数据策略的必然。
另一个典型的例子是批改网,上线半年累计批改英语作文近3000万篇。我们非常想了解批改网的评分标准,对此充满兴趣,据了解批改网总共有192个判断维度,包括平时我们所熟悉的拼写、语法、词汇、搭配错误等,这192个维度正是批改网的大数据技术核心。一组实验数据:把老师批改过的作文让批改网再重新批改,其中人工评分和机器评分的基本一致率达到92.03%。现在,积累的数据足以对每一个用户的英语能力做出评价,而这个评价又会在用户下一层次的学习中起到分类作用,方便用户定制个性化的英语学习。
中国高校英语写作教学协会同创新联盟通过在线形式在一个月的时间里搜集到近30万篇英语作文,在较短的时间里获得数量如此庞大的英语作文电子数据,这在过去没有相应技术支持的情况下是难以想象的。《中国学生英语写作能力调查蓝皮书》对海量数据进行分析,获取有助于英语作文评判的数据标准,同时对提高学生英语写作能力提供有针对性的建议。
由于信息时代的来临,在线教育无处不在,对高校英语教学也产生了深远的影响。首先,传统的教学模式受到了严峻的挑战。信息时代的今天,学生们对于手机和电脑的操作已经非常熟练,任何感兴趣的内容通过网络,视频,微信“扫一扫”等功能都能快速的查询到。学生已经非常习惯于这种信息获取渠道的即时性与便捷性,教师的角色定位经历了几次变化,由教学的主体变成了现在的主导者。而在大数据时代,教师的作用更是会发生翻天覆地的变化。教师将很有可能成为课堂的组织者,以及学习方法的授予者。
在高校英语教学实践中可以利用大数据分析工具开展以下方法:
第一,对学生的发展进行多元评估,实现教学过程评估,发现学生的常态,改造课堂的流程。如果有一个课堂交互APP,通过对学生在课堂中点滴微观行为的捕捉,帮助我们了解学生对知识的掌握程度以及感兴趣程度,进而反思我们的教学是否满足了学生的需求。
第二,大数据实现了学生课外在线学习的积累,可以通过后台数据库统计一个学校、一个区域的整体情况,获得有价值的数据报告。
第三,分析和发掘作业和考试背后的有效数据,通过数据的归类与分析,能够帮助我们了解每一个学生的需求,实现个性化教育。
维克托·迈尔-舍恩伯格在《大数据时代》一书中举了百般例证,都是为了说明一个道理:在大数据时代已经到来的时候要用大数据思维去发掘大数据的潜在价值。书中,作者提及最多的是Google如何利用人们的搜索记录挖掘数据二次利用价值,比如预测某地流感爆发的趋势;Amazon如何利用用户的购买和浏览历史数据进行有针对性的书籍购买推荐,以此有效提升销售量;Forecast如何利用过去十年所有的航线机票价格打折数据,来预测用户购买机票的时机是否合适等。
总之,大数据分析是顺应潮流,大势所趋,它将改变英语教学的未来。