肖维青 曾立人
(1.上海外国语大学 英语学院,上海 200083;2.浙江师范大学 外国语学院,浙江 金华 321004)
词汇是语言的基石。很多学者认为词汇学习和语法以及语言其他环节的学习一样重要(Huckin et al.,1993)。由于英语日益成为国际商业和贸易以及科学和技术交流的首选语言,英语词汇学习已成为我国各级教育的主要活动之一,对词汇学习支持技术的研究也因此成为教育技术研究的热点。
词汇学习消耗了英语作为第二语言(ESL)和英语作为外语(TESOL)教学中的大部分时间(McCarthy,1990),但结果却令人失望。例如在中国,有超过1.3亿的英语学习者,其中大多数人都学过三年初中和三年高中英语,但是由于词汇能力不够,精通英语的人为数很少。这种词汇学习效率低下的现象有以下几个原因。
第一是学习者一直是在“黑暗中摸索”。因为他们不知道具体一个单词已经学了多久、总体上已经掌握了多少单词、离开自己的学习目标还有多远,还需要学多久才能达到目标等信息。由于“看不到隧道的尽头”,他们渐渐就失去了信心,而没有了信心,学习速度也就更慢,学习效率也就更低了。这种恶性循环最终会使他们完全放弃英语这门课。
第二,学习者在学习过程中不但要学习新的单词,还要受到已掌握单词的干扰。这种卷积效应不仅增加学习者信息处理上的负担,还会使学员产生心理上的厌倦,因为他们一次又一次地看到似曾相识的单词,觉得自己是在原地踏步,因而最终也对词汇学习失去热情。(Oxford&Scarcella,1994:231-243)
另一个导致词汇学习效率低下的因素是词汇学习的主要方式是死记硬背。多数学习者,特别年龄较小的小学初中学生,很难有意志力来维持他们长时间的学习兴趣,这是中小学英语课普遍存在的问题。
除上述因素外,每个学习者都有自己的学习目标、学习风格、记忆曲线和词汇能力水平。所有这些因素都使得课堂词汇教学没法针对每一个具体的学生。一般的做法是以班级里中等学生的水平为目标建立课程目标和讲授课程内容,使得其他的学生完全被抛弃在外。家长更是爱莫能助,无法参与或监督孩子的学习过程。
计算机化的词汇学习系统出现后,提供了个性化的交互性学习,超越了传统的词汇学习方法。这些系统开始出现于20世纪80年代后期(Kukulska-Hulme,1988),设计原则和规范也逐渐发展和成熟(Goodfellow,1994)。
自从90年代早期互联网和万维网出现后,离线的单机版应用系统已逐渐被在线网络版取代。随着技术从网站的电子学习(Lin & Hsieh,2001)、移动学习(Chang et al.,2003)发展到随时随地的学习(Wilkerson et al.,2005),词汇学习系统也发展成为可在移动电话(Leech et al.,2001)或个人数据助理(PDA)上运行的有高度移动性和可及性的“软件即服务”(software-as-a-service)应用系统,即“云服务”学习系统。
一个理想的词汇学习系统应该是高度互动的,并且能够提供个性化学习。它应该给学员播放适合他们能力水平的词汇,使他们不被已掌握的词汇困扰而浪费时间,而始终面临新词的挑战;学员可以设置和自己课程或考试有关的目标。同时,系统还应该有一个支持和鼓励学员间沟通和互动的环境,它也应该允许家长和教师参与到学习过程中去。
目前文献中记载的一些系统,如Chen&Chung(2008)和Wang et al.(2009),已经能提供相当高的互动性,但其他问题尚未能解决。我们的目标是,在理想系统特性的指引下,克服技术困难,构建一个具有理想系统特征的词汇学习系统。
这个互动英语词汇学习系统由系统管理员模块、教师/家长模块和学员模块三部分组成。这三个模块通过聊天Agent连接从而实现学员、教师和家长间的同步和异步通信。会话Agent作为一个沟通的平台,增加了词汇学习过程中所有利益相关者的互动,增强了他们的社区和归属感,使学员的学习效率更高(Rovai,2002:319-332)。这三个模块,可以集成到一个网站,也可以分布到PDA、袖珍电脑和移动电话网络。系统架构如图1所示。
2.2.1 系统管理员模块
系统管理员模块首先有管理员界面Agent。通过此A-gent,管理员可以登陆系统,进行系统公告发布、更新词汇数据库、管理学员及教师/家长数据库,或执行其他系统相关的任务。在商业化运行系统中,管理员还可以添加或删除付费或没付费用户,或控制他们的权限。
系统管理员模块还有三个数据库:第一个是学员数据库。它用来存储学员家庭和学业背景信息的个人档案;学习状况和成绩的统计信息;目标词汇表、暂已掌握词汇表和已掌握词汇表。此数据库也包括他们的同步(聊天记录)和异步(电子邮件)通信历史,以及付费状况等信息。
第二个是教师/家长数据库。它记录了教师/家长的个人资料,他们监管的学员名单以及他们布置给学员的任务列表。通信历史和付费信息同样也存储在这里。
第三个是词汇数据库,它包含系统运作所需要的全部词汇信息。它下分三个列表:词频表、大纲/考试要求词汇表和单词定义表。
词频表根据英语常见单词在语言中出现的频率对其进行排名。出现频率较高、最简单的单词等级最低,用一个较小的数字表示,是优先要学的词汇。例如“the”这个单词在英语中出现的频率最高,排名第一;“in”这个词出现频率第五高,排名第五,两者都是最先要学的词汇,等等。
我们采用了来自英国国家语料库的词频表,因为这个语料库的采样文本来自各种媒体(有书面的和音频、视频的)和领域(政治、法律、科技、医疗和体育等等),有比较全面的覆盖性和代表性。在这个列表里,每一个常见的单词都有一个排名。
大纲/考试要求词汇表列出了各级大纲和考试所要求的英语单词,例如:小学、初中、高中的英语教学大纲规定词汇、高考大纲规定词汇;TOEFL和GRE考试要求词汇,等等。本数据库需要经常更新,以增加因教学大纲或考试要求变化而引起的词汇变更。为使系统能提供与学员词汇能力相匹配的单词,所有的单词难度都必须定级。很自然,单词在词频表中的排名顺序就是其难度等级。不过,因为五位数的排名顺序对系统算法有一定压力,也不直观,所以我们采用了一个1到20的数字系统,而这个数字大致与小学到研究生的正规教育年数相同。由于各级教学大纲有特定的单词数,而各个层次的教育之间是顺序渐进的,所以每个层次教育的要求词汇数大致应该等于这个层次要求的最难单词的词频表排名数。如全国小学英语教学大纲要求,完成小学阶段的英语教学后,学生能掌握1290个单词,这就是说其最难的单词应该是在词频表上排名为第1290位的单词。在总结了大纲要求词汇数、词频排名顺序和系统等级的关系后,得出了表1。
表1 系统难度等级、大纲/考试要求词汇数和词频表排名的关系
从表1中我们可以看到,为使每个等级的单词数大致一样,小学大纲的1290个词汇被分为四级,每级三百多个。这样也大致符合小学阶段从三年级开始学英语,到六年级为止,每年需掌握三百个单词的要求。
从具体单词来看,例如常见词“I”,在词频表中排名第十一位,是个全国小学英语教学大纲要求的常见词汇,现在被指定为1级里309个字中的一个,是最先要学的单词之一。而“Technology”一词,在词频表中排名第1501位,是全国中学英语教学大纲要求词汇,被定为5级。其余可以类推。
单词定义表就像一部双语词典,不仅列出了各级大纲/考试要求词汇表中的所有单词的中英文双语释义,还有单词的词性。这样使学员不仅可以根据等级、也可以根据词性选择单词进行学习。
将词频表、大纲/考试要求词汇表和单词定义表结合后形成的词汇数据库,如表2所示(片段)。
2.2.2 学员模块
学员模块是本系统最重要的模块。学员只要告诉系统他的注册信息、目前的词汇水平,想要达到的目标(具体单词数或考试级别),系统就会播放与他的实时词汇水平相适应难度的词汇。图1中的A区描述了实现这些功能的系统组件。在此方块中,目标设定Agent让学员通过一个列有各级教学大纲(如初中、高中)和考试(如高考、托福等)的下拉菜单来设定自己的学习目标。
目标设定后,目标设定Agent就从大纲/考试要求词汇表中提取相应的词汇,并将其存储在学员数据库中作为他的目标词汇表。
学员档案Agent有一个界面让学员输入已学英语的年数、自估的英语能力和已掌握的大致英语单词数。这些数据传递给学员建模Agent(Tsiriga& Virvou,2004),建模Agent将这些数据和存储在数据库的典型学员数据进行对比,找出与其最近似的学员典型,并将其词汇水平等级设定为学员的初始水平等级。
当目标词汇表和学员的初始水平等级确定后,图1中B区中所示的词汇推荐Agent就开始为学员播放词条。
表2 单词数据库词条样例
词汇推荐Agent有几个学习模式可供学员选择。首先是可以将单词以文本或音频方式播放,同时词汇释义也可以是中文或英文。另外,学员可以做多项选择或听写(根据读音将整个单词拼出),也可以根据单词的词性(如根据课程要求只选择动词或名词等)进行学习。
词汇推荐Agent只播放学员目标词汇表中的词汇,难度从学员的初始水平等级开始,除非答案评估Agent降低或者升高难度等级。
答案评估Agent将学员提交的多项选择答案和词汇数据库中的释义相比较。如果答案错误,会向学员显示正确的释义并将单词退回到学员目标词汇表中,以便以后重新播放。如果答案正确,这个单词将进入学员的暂时已掌握词汇表中。
遗忘曲线Agent控制暂时已掌握词汇的重复播放时间和次数。一般会在单词首次出现并答对后的1分钟、2分钟、10分钟、1小时、24小时、7天和14天时重复播放此词。根据艾宾浩斯的理论(Ebbinghaus,1885),这些间隔都是典型的人类遗忘曲线。如果在这些时间节点上播放单词,那么这个词的记忆将得到大大加强。当然这些间隔时间值只是系统推荐的缺省值,完全可以通过系统管理员模块来变更全系统的间隔时间,也可以通过学员模块根据学员个人的遗忘曲线和学习风格来调整。
若学员在学习过程中的任何一步提交了错误答案,这个单词都会被退回到学员目标词汇表中,整个重复过程又将重新开始。如果一个单词在14天内都没做错,那就被当做已掌握单词而进入已掌握词汇表中。词汇推荐Agent将不再播放此词。
成绩记录Agent记录了下述信息,给本人、教师以及家长参考:
·系统使用数据,如系统使用时间量
·每日平均使用时间(智能算法可以通过监控键盘和鼠标动作来扣除系统闲置时间)
·已学单词总数和正确答案的百分比
·暂时已掌握词汇表
·已掌握词汇表
·根据每日平均学习时间和已学的单词数推算的完成既定目标的大致时间
2.2.3 教师/家长模块
本模块的目的让教师、家长监控孩子或学生的学习状况,或给他们分配学习任务。这两个功能分别通过学员监控Agent和任务布置Agent来实现。而这两个Agent都是通过教师/家长接口Agent访问的。
学员监控Agent允许教师/家长通过成绩记录Agent中记录的学员学习数据来查看学员学习状况和进度。
教师/家长可以登录到系统,主动监控学员的学习状况,也可以少花时间进行“被动”监视,通过订阅信息服务,只在学员偷懒或成绩下降时收到系统自动发送的电子邮件或手机短信。
教师/家长还可以通过给学员布置单词任务来参与到学员的学习过程。教师/家长布置的词汇会结合到学员自己制定的目标词汇表中。除了布置具体单词外,教师/家长还可以指定学习速度(每天应学的单词数)、持续时间(开始和结束日期)等参数。
例如,教师要求学生完成英语教材第一章的50个单词,她可以将这些单词分配给他的25名学生并且指定学生完成任务的起止时间。如果要求学生10天内学完这些单词,那么每天至少需要掌握5个单词。如果学生不能按时完成任务,系统则会向学生发出警告,并同时发送提示信息给教师/家长。然后教师/家长就可以当面在家里或课堂上督促其完成任务了。
假如教师手下有几个班级,那么他还可以将学员纳入不同的班级或小组进行管理。这样,他既可以监视学员个人的学习状况,也可以一目了然地查看整个班级或小组的成绩、进度或其他学习状况参数。
2.2.4 会话 Agent
会话Agent让系统所有的利益相关者进行同步或异步沟通。同步信息将显示在弹出的文本框中,而异步通信则是通过电子邮件和手机发送。
这个通信平台其实是一个社交网络,使社区成员能够寻找相似背景和情况的学员、教师或家长,形成互助团体,分享学习或教学经验等。它能营造一个浓郁的学习氛围,提高学员的学习效率和满意度(Arbaugh,2000)。
系统的典型流程可以归纳为图2。当学员设定目标后,目标设定Agent就会根据学员所设定的目标从大纲/考试要求词汇表中甄选出对应的词汇,形成一个目标词汇表,存储在学员数据库中。如果教师家长同时给学员布置了作业,这些词汇也将被添加到目标词汇表中。
然后学员建模Agent根据通过学员档案Agent提交的个人资料计算出学员的初始水平等级。该等级是通过比较学员资料和系统中已经经过测试和验证的学生模型数据来决定的。学员建模Agent里有若干学生模型的数据,其初始水平等级由学员已学习英语的年数、目前的年级、自估已知的单词数等参数以一定的百分比计算决定。这个百分比经过测试后固定下来。初始水平等级不十分精确没有关系,因为后面的答案评估Agent会校正误差。
确定了初始水平等级后,词汇推荐Agent就会播放一个难度等级和初始水平等级相同的单词。同一难度等级的单词可以随机或按字母顺序播放。词汇推荐Agent不播放学员已掌握词汇表中的单词,从而不会浪费学员的时间和精力。
学员提交答案后,答案评估Agent将比较所提交的答案和词汇数据库中的单词定义列表中的释义。如果两者不一致,则答案判断为不正确,该单词将回到目标词汇表中等待下一次播放。
图2 流程图
如果答案正确,此单词将被存储到暂时已掌握词汇表中。该词表中的单词由遗忘曲线Agent管理,并在系统设定的时间间隔内播放。学员可以设定适合自己学习风格和记忆特点的遗忘曲线。
答案评估Agent同时也检测答案正确率。如果正确率低于系统设定的最低值(系统缺省值根据测试为95%时最能使学生保持信心、难度也不至于太低或太高,但是可以在全系统或由学生个人更改),它就会通知词汇推荐Agent降低词汇难度。这个机制可确保播放的单词在学员的能力范围之内,使学员对学习保持兴趣和信心。学员也可以关掉系统的自动难度升降级机制,手工维持、降低或提高单词的难度水平。
一个在暂时已掌握词汇表中的单词若经过14天的重复播放周期而没有任何错误,就被添加到已掌握词汇表中,以后不再播放出现。如果在进程中的任何一环节发生错误,此单词将返回到目标词汇表中重新进行学习。
成绩记录Agent记录学员的成绩和学习状况数据,在学员同意的基础上供教师和家长监视。
我们已初步建立了一个系统原型。图3是该应用软件的界面。其中A区显示的是词汇播放的位置,在显示词汇文本的同时,也播放该词的音频。这样,学员不但熟悉单词的拼法、释义,也熟悉了发音。当然学员也可以关闭音频。单词播放有五种模式可供选择:单词加中文释义、单词加英文释义、音频(单词不显示)加中文释义、音频加英文释义和听写(没有单词和释义,只要求学员将单词拼写出来)。
学员还可以选择四种晋级模式,以便学员根据需要灵活选择要学的单词:“上蹿下跳跑”模式,这是系统根据正确率而调整词汇难度水平的系统默认模式。在这个模式下,只要答案正确率高于系统设定的缺省值,词汇难度就一直往上升,当正确率低于此值时难度就开始下降。这个模式的好处是词汇难度一直维持在与学员实时水平相匹配的水平,使学员热情不减,兴趣高昂。
“天天向上”模式从学员的初始水平等级难度开始,逐级往上升,不会往下降,这样,初始水平等级以下的单词都被略过了。这个模式有利于学员着重学习难度较高的词汇。
“从零开始跑”模式会由易到难,从第一级开始逐级播放所有单词,直到练完目标词汇表里的所有单词止。这个模式的好处是“一网打尽”不放过任何一个单词。
“临时级别跑”模式允许学员临时跳到任意等级学习,尝试不同等级的词汇的难度差别,看看自己到底能做到几级,等等。但是高于设定目标最高难度的单词学习成绩不会进入统计数据。
图3 系统原型界面
系统界面还提供根据单词词性选择词汇、在目标词汇表中增加或删除某个特定单词、显示与单词相关的例句等功能。
B区实际上是C区的一个内容摘要视图。它简要显示了学员目前的水平等级、准确率、开始日期和系统使用时间。
在C区中,进度条直观地显示了目标词汇表中已学过的单词百分比。点击“查看目前进度成绩”按钮可以看到该生的日平均使用分钟数(已剔除系统闲置时间)、已掌握词汇表,暂时已掌握词汇表和预计完成目标任务所需的时间等信息。
通过点击“更改学习目标”按钮,学员可以酌情更改学习目标。在“查看作业列表”下,还可以拒绝或接受教师或家长布置的学习任务。
D区显示的是会话Agent,注册会员可以在此寻找并添加联系人、相互聊天和发送信息。
为了创建社区氛围和相互竞赛的学习环境,系统还在界面的显著位置显示积分最高的学员信息,有总体积分排名最高的“牛人排行榜”和每周积分最高的“进步最快排行榜”,来鼓励大家积极进取、天天向上。学员积分是通过有效系统使用时间、所学单词的难度系数(单词难度越高系数越高)、答案准确率和已掌握词汇个数来计算的。
我们结合词频研究成果和遗忘曲线的原理,设计并开发了一个面向中国学生的在线实时交互词汇学习系统,目前已经上线测试。它也可以在手机、PDA和袖珍电脑上运行。在现有框架下对界面稍加改动,系统即可适应其他语言背景的英语学习者。
通过浙江师大外语学院和行知学院几十名学生数月累计几百个小时的使用测试,我们选择了部分学员进行了小组讨论。这些学员认为,英国国家语料库比较客观地反映了词汇的真实难度。词频排名、系统难度等级与各级大纲/考试要求词汇表的关系总体上也比较准确。其结果是,该系统能够与学员充分地互动,并能根据学员的错误率高低,精确地提升或降低词汇难度水平。
学员们反映,进度报告可以帮助他们精确地了解他们完成任务用了多长时间、学会了多少单词(可以看到具体的单词)、完成目标还需多长时间等,因此感觉到每天都在进步,这给他们增添了很多自信心和满足感。由于学员可以添加或删除目标词汇表中特定的词,他们可以打开词汇表浏览并删除他们事前已经掌握的单词,从而减少列表中的一大部分词汇,加上词汇推荐Agent不提示通过14天周期后的单词,消除了已知词汇造成的卷积效应,学员们觉得每一点滴时间都用在新单词上,使他们能保持新鲜感和积极性,产生正向激励,双重提高了学习效率。
大多数学员认为该系统的默认遗忘曲线间隔是准确的,无需调整,而且重复周期确确实实能帮助他们记住单词。学员喜欢会话Agent的社交网络特性。他们试着在上面寻找另外一个学院的学员,但由于编程缺陷,这个功能目前尚不能无故障运行。学员们喜欢类似游戏拼搏的“进步最快排行榜”和总体积分“牛人排行榜”,经常互相攀比谁的积分高,形成了一个你追我赶、力争上游的学习气氛。
我们希望在更多的学员使用该系统时能够收集词汇学习的研究数据。我们已在系统里设立了学员信息收集模块,记录学员的母语和教育背景等。如果来自不同国家的学员使用该系统,我们还将能够找出某种母语的学员的共同问题,比如他们最难掌握的单词是哪些,掌握这些词汇需要重复多少次等等。这将对词汇学习和教学提供依据,因为这些数据都是来自系统的实际使用数据而不是实验数据,从而更能避免实验引起的霍桑效应。
总体来说,我们认为该系统已达到预期的效果,有较高的实用价值。后续的工作将是调试该系统,使其功能鲁棒性更强。我们还需要监测学员的学习成绩和状况,并跟踪该系统对学员词汇学习的长期影响。
[1]Arbaugh,J.B.Virtual Classroom Characteristics and Student Satisfaction in Internet-based MBA Courses [J].Journal of Management Education,2000(1):32–54.
[2]Chang,C.Y.et al.Concept and Design of Ad Hoc and Mobile Classrooms[J].Journal of Computer Assisted Learning,2003,(19):336-346.
[3]Chen,C.M.& C.J.Chung.Personalized Mobile English Vocabulary Learning System Based on Item Response Theory and Learning Memory Cycle[J].Computers& Education,2008,(51):624-645..
[4]Ebbinghaus,H.Memory:A Contribution to Experimental Psychology[M].New York:Teachers College,Columbia University,1885.
[5]Goodfellow,R.Design Principles for Computer-aided Vocabulary Learning[J].Computers and Education,1994,(23):53-62.
[6]Huckin,T.et al.Scond Language Reading and Vocabulary Learning[M].Norwood,NJ:Ablex Publishing Corporation,1993.
[7]Kukulska-Hulme,A.A Computerized Interactive Vocabulary Development System for Advanced Learners[J].System,1988(16):163-170.
[8]Leech,G.et al.Word Frequencies in Written and Spoken English:Based on the British National Corpus[M].London:Longman,2001.
[9]Lin,B.& C.Hsieh.Web-based Teaching and Learner Control:A Research Review[J].Computers& Education,2001,(37):377-386.
[10]McCarthy,M.Recent Directions in Vocabulary Teaching[J].The Language Teacher,1990(12):9-11.
[11]Oxford,R.L.& R.C.Scarcella.Second Language Vocabulary Learning Among Adults:State of the Art in Vocabulary Instruction[J].System,1994(2):231-243.
[12]Rovai,A.P.Sense of Community,Perceived Cognitive Learning,and Persistence in Asynchronous Learning Networks[J].The Internet and Higher Education,2002(4):319-332.
[13]Tsiriga,V.& M.Virvou.A Framework for Initialization of Student Models in Web-based Intelligent Tutoring Systems[J].User Modeling and User-Adpated Interaction,2004,(14):289-316.
[14]Wang,T.I.et al.An English Vocabulary Learning System Based on Fuzzy Thoery and Memory Cycle[R].Lecture Notes in Computer Science,Advances in Web-based Learning– ICWL 2009.DOI:10.1007/978-3-642-03426-8_50.
[15]Wilkerson,M.et al.Ubiquitous Presenter:Increasing Student Access and Control in a Digital Lecturing Environment[J].The 36th SIGCSE Technical Symposium on Computer Science Education,2005(36):116-120.