徐使超 黄新海
《普通高中英语课程标准(2017年版2020年修订)》(以下简称《课程标准》)提出,普通高中英语课程应充分利用信息技术,实现大数据等新技术有效促学功能的目标。人工智能、大数据技术与英语教学深度融合已成为当下英语教学研究的重点。本文以突破当前词汇教学瓶颈为出发点,围绕深度学习理念,探讨Python赋能词汇学习的技术路径与课堂实践方法。
一、英语词汇教学存在的问题
词汇是中小学英语教学的一大难题。根据笔者的观察与研究,当下英语教学存在“南辕北辙”与“蜻蜓点水”两大问题。
(一)“南辕北辙”问题
教师盲目根据自己所理解的语言知识开展教学活动,词汇教学目标不明确,目标词汇不突出。教师词汇教学中缺乏计划性,导致词汇教学重点不突出、讲解内容过多或过少,这都影响了词汇教学的质量[1]。同时,很多教师在教学中喜欢孤立地呈现单词,忽略语境和语篇的重要性,只关注单词的形态和意义的讲解,忽视了单词内部的音形意义关系和单词之间的联系。
(二)“蜻蜓点水”问题
教师教学以“单词听读讲解—课后背诵记忆—后续课堂听写”的流程为主,由于讲解不深,引导学生对所学词汇进行归类、开展主题化词汇教学活动不足,因此学生的词汇理解深度不足,对单词的存储和记忆处于杂乱和无序的状态,单词遗忘现象十分严重。正确的词汇教学应是将单词学习与语境认知有机结合,并在语言应用的过程中帮助学生巩固词汇[2],同时改变碎片化、脱离语境讲解词汇的教学方式[3]。
如何帮助学生进行词汇知识的深度学习,從而摆脱词汇学习困境,已成为现阶段教师教学改革的迫切需要。
二、Python赋能英语词汇深度学习的方法与路径
人工智能赋能教育是指人工智能技术在教育领域的应用和实践,它是支持学、教、管、评等教育活动的技术手段[4]。Python作为一种不受局限、跨平台的开源编程语言,兼有系统语言的运行高速性和脚本语言的开发简单性[5],几乎能够实现任何方向的技术编程,在爬虫、科学运算、云计算、人工智能等方面,都有相应的库为其提供全方位的支持[6]。本文主要探讨Python在主题分析、词汇网络构建、词块挖掘以及语篇比对四个方面是怎样赋能学生词汇深度学习的。依赖的Python模块工具包括:(1)NLTK(Natural Language Tool Kit)3.7,主要作用是进行词汇频率、形态、发音等信息的统计,语篇主题词汇的提取,以及语篇易读性的计算; (2)NetworkX 2.6.2,主要作用是实现词汇关系的网络化、可视化呈现;(3)Gensim 3.8.3,主要作用是进行基于词向量与潜在语义分析的词义相似度计算;(4)Stanford Core NLP,主要作用是进行词块挖掘与词块特点统计。
深度学习强调学习中的过程体验,强调知识的联想互动与结构建构,重视学生对于本质的掌握、对于变式的理解,以及灵活应用所学开展迁移创新的能力。在Python相关模块工具包的辅助下,首先,人工智能技术的语篇主题挖掘能够更好地帮助教师确定单元情境的主题意义,并以此为基础设计与主题情境相关的问题与任务,从而提升学生学习的体验。其次,人工智能建构的词汇网络能够将词汇知识网络化、可视化,从而帮助学生更好地进行词汇知识的联想与结构。再次,词块挖掘提供了学生词汇学习的基础语境单位——词块。在词块的支撑下,学生能够更好地掌握词汇知识的本质,理解词汇知识的变化形式。最后,语篇比对能够根据主题语境、词汇应用、阅读难易度,为学生提供知识迁移创新所需的适切情境(如图1)。
(一)主题引领提升词汇学习体验
在词汇学习中,围绕一定的主题带领学生开展系列学习活动,能够让学生在词汇学习中拥有良好的体验。以单元主题意义为基础开展单元词汇教学,笔者在主题意义的提炼过程中通过Python中的NLTK工具包计算文本秩频分布与对数似然率,获取单元内相关文本的主题意义。
1. 运用秩频分布分析
借助秩频分布获得文本主题需要计算h点[7]。h点是秩频率分布的临界点,是将文本中每个词(型符)按照频次降序排列,并从1到V(V指语篇词类总数)依次编号,每个频序r都对应一个频次值fr,h点就是词的秩频分布中r=fr的那个点。h点之前多为功能词,若有实词,则认为这些实词是文本的主题词汇。
2. 运用对数似然率分析
秩频分布方法所得语篇主题词仅与语篇自身内容相关,运用观察语料库则能计算语篇的相对主题。语料库语言学中的主题词,通过对比观察语料库中的词汇频率,计算、提取微型语料库中具有超常使用频率的词汇获得。运用log检验或卡方检验计算两个语料库中出现频次存在明显差异的词汇即为主题词[8]。在本文讨论的对数似然率分析中,笔者以布朗语料库为参照语料库。相较于秩频分析中的主题词,参照语料库计算对数似然率得到的主题词表,更侧重语篇主题差异性、特殊性的体现。
(二)词汇网络促进词汇知识建构
深度学习强调联想与结构的学习样式。信息时代的语言学习活动,不再是简单的信息传递,而是对于语言知识、意义的内在建构。语言学习过程中,随意地或以列表的形式记忆词汇不是有效的方法。以一种组织精密而相互关联的方式存储,即心理词库的形式,学生可以更好地理解和记忆英语词汇,并能更容易地使用它们[9]。词汇习得,一方面意味着逐渐扩大积累词汇的广度,另一方面也是学生逐渐加深所记住的词的印象,并逐渐建立词与词之间的网络关系,构建学生的心理词库[10]。因此,Python能够通过融合人工智能的词义、词形、词音对比计算,借助NetworkX等构图工具,实现词汇知识“所见即所想”的网络化、可视化呈现,从而落实词汇深度学习中的联想与结构。
运用Python构建词汇网络,能够根据学生高中、学年或单元学习目标,控制词网中词汇的来源与层次。本文所述词网以《课程标准》词汇表为词汇来源,做到了与学生高中学习目标一致。同时,词网图片易保存,无须通过网络链接搜索,方便学生随时调取查看。
1. 构建词汇的语义网络
笔者运用基于词向量的潜在语义分析方法计算词汇的语义联系(即词义相似度),并在此基础上建立了词汇网络(如图2)。同时,在语篇主题已被挖掘的前提下,选择语篇中语义关系紧密的词汇配对,构建语篇的词汇网络(如图3)。
潜在语义分析是一种计算机进行自然语言处理的方法,主要运用词向量的方法,通过矢量语义空间提取文档与词中的概念,进而分析文档与词之间的关系[11]。词向量在当下被广泛应用于机器翻译、语义提取、人机对话等自然语言处理相关应用之中。本文讨论的语义分析使用Python语义分析工具包Gensim的词义相似度模块Similarity计算。
2. 构建词汇的形态网络
归纳整理学生英语学习中易于混淆拼写的词汇,能够帮助学生更好、更准确地记忆与运用词汇。因此,构建词汇的词性网络能够帮助学生进行词汇的深度学习。借助Jaro-Winkler距离算法,笔者获取了与目标词拼写形式相近的单词,生成词汇学习的词形网络(如图4)。
Jaro-Winkler 距离算法是一个计算两个字符串之间编辑距离的度量标准。该算法根据两个词汇之间单字符转换的最小数量计算词汇的词形相似度,并对目标词汇的前缀相似情况进行额外赋值,更加符合学生词汇记忆中对于形近词的记忆特点。
3. 构建词汇的发音网络
Python可借助Jaro-winkler距离算法对不同词汇的语音相似度进行计算,对比分析词汇之间音素与音节的相似情况。由于高一学生存在音节运用能力不足的問题,因此,笔者以音素为基本单位进行发音相似度的比对(如图5)。
(三)词块挖掘呈现词汇应用本质
词块是词汇构成语言应用的最小单位,它们是锚定新话语内涵的结构框架,以便语言使用者/接受者根据不同的立场、语篇结构、语域状态解释语言信息[12]。笔者尝试运用Python相关技术帮助学生挖掘主题语境词块、句法目标词块、记忆规律词块,由此促进学生词块积累、词汇学习生成化,跨越“本质”,掌握“变式”。
斯坦福自然语言处理工具包能够将句子根据句法组成关系进行分析和切分。它在进行句法成分分析时运用了成分向量语法,通过递归式神经网络训练句法分析器[13],分析所得词块符合英语语言认知的句法规律,同时计算词块的内容与长度(如图6)。
1. 根据主题语境挖掘词块
学习基于词块认知的单词,要以语境作为依托,这样更符合语言认知规律。以词块为单位运用语言,记忆效果更好,形成的语言更为地道、合理。
笔者在教学中引导学生通过概念网络复现文本内容,利用词块回忆语篇阅读中掌握的语篇内容,进行语言输出,回忆主题词汇、主题词块、主题语境,复现、记忆知识内容。
2. 根据句法目标挖掘词块
在挖掘主题语境词块的同时,借助Python,笔者按照单元教学目标,在句法教学中,主要开展句法短语学习,以名词短语、形容词、副词短语为教学重点。以名词短语、动词短语等句法词块为考查重点的练习对语篇进行选择填空复现,可巩固学生的词汇记忆,加深学生对于词汇的理解。以输出促输入,运用指向输出的语言运用练习,能够实现隐性的句法成分输入。
3. 根据记忆规律挖掘词块
人类词汇认知的短时记忆极限在5~9个有意义联系的单词构成的词汇组合,主要受单词数量影响,受单词长短及音节数的影响相对较小[14]。因此,在筛选单词的过程中,可根据教学对象的实际情况设置词块长度上限,对能力较弱的学生进行词块训练时可设置以5词为词块长度上限,能力较强者可设置9词为词块长度上限,一般情况下,7词可作为大部分二语学习者(高中生或大学生)的词块长度上限。
(四)语篇比对助力词汇能力迁移
在词汇迁移学习中,通过情境的主题语境、词汇应用、阅读难度计算,教师能够为学生提供多样化的迁移情境,从而有针对性地引导学生进行横向与纵向迁移以及低通路与高通路迁移的学习活动。
1. 根据主题语境配置迁移文本
在引导学生进行互文性语言情境学习的过程中,教师应首先考虑迁移对象与学习内容之间主题的相似性。Python能够通过分析语篇的主题词相似度以及主题词语义相似度,进行语篇的主题相似度计算。
2. 根据词汇应用配置迁移文本
根据艾宾浩斯等人的研究,记忆遗忘的速度由快而慢,因此应从识记之初便通过各种活动材料的重复运用防止遗忘。词汇学习中,学生对于词汇知识的记忆需要一定程度的重复学习。因此,在迁移学习中帮助学生挖掘词汇应用相似的语境文本至关重要。
3. 根据阅读难度配置迁移文本
语篇易读性的分析以文本的平均句长、平均词长等表面特征为判断依据。借助Python模块工具包,计算机能够统计音节与句长,并获得Flesch-Kincaid易读性指数(Efk=0.39 ×SL+11.8×SW-15.59,其中Efk指可读指数,SL指语篇平均每词的音节数),以获得语篇的易读性,进而帮助学生设置符合其需要、难度适宜的情境,开展迁移学习。
三、Python赋能词汇学习的单元教学实践
以下就本文所述Python赋能词汇深度学习的方法路径,结合人教版英语必修三第三单元的词汇教学进行简单说明。
(一)确定单元整体学习主题
课堂教学之前,教师要运用Python对单元文本进行处理,得到单元文本的主题词汇。以本单元为例,经过文本处理,根据秩频分析与对数似然率统计,单元Reading and Thinking课时的语篇主题词分别为“city”和“city、art、Chinatown”。在此基础上,结合本课时的教学参考意见,以“城市”为主题构建情境,设计相关阅读问题与学习活动。在解答问题与完成任务过程中,学生围绕单元主题会自发性地进行单元词汇的输入与输出,从而实现词汇知识的隐性学习。
(二)构建单元词汇学习网络
在教学前,教师用Python构建围绕主题词汇的词义网络:可以根据教学实际需要构建高中英语学习主题词义网络,也可针对单元学习词汇构建词义网络。同时,围绕主题词汇构建词型网络与词音网络。
接着,在单元教学中充分运用词汇网络。以本单元教学为例,笔者依托高中整体词汇构建的主题词网可用于单元学习的导入环节,修改词汇语义网络(如图7),即在热身环节引导学生猜测单元主题,激活学生的已学知识与联想网络。
词形网络、词音网络可帮助学生在课堂学习之外,通过辨识相似单词,更好地记忆词汇。围绕单元词汇构建的词义网络,适用于阅读课时或单元复习阶段,作为学生对单元内容回忆、重构、复述的学习支架,帮助学生更好地通过意义建构组织词汇知识的记忆。
(三)设计单元词块积累活动
在单元词块学习中,运用Python对单元词块进行挖掘与标注,是本教学内容有效开展的基础。以本单元为例,通过对文本进行处理,相关词块及其性质可通过表格呈现与归类。
此后,可根据教学需要,将以上词块与相应的单元教学课时相结合。在单元阅读教学中,设计绘制词块概念图等与主题语境、语篇词块密切相关的阅读任务,使学生在解决问题的过程中通过隐性学习积累词块。
在单元语法教学中,融入单元词块能够更好地帮助学生理解相关语法单元在语言表达中的意义及担当作用。在单元写作教学中,可在写作前的头脑风暴过程中,引导学生回忆单元学习中积累的词块,指导学生在写作中应用词块,实现语言输入与输出的紧密结合。
在单元复习教学中,使用Python技术,笔者从文本中提取句法词块,再根据系统标注的词块长度和类型(本语篇中,在小于7词的短语内选择较长的动词、名词、形容词短语作为训练内容),结合实际的教学目标,对文本进行挖空处理,设计词块填空练习(如图8)。在语法成分短语强化训练中,学生记忆语篇内容,实现语篇内容的再建构。
(四)落实单元词汇知识迁移
为单元学习提供各方面较为相似的迁移学习材料,是落实单元词汇知识巩固迁移的有效途径。在Python相关工具包的帮助下,笔者根据主题词汇相似、文本风格相似、阅读难度相似的迁移目标,运用人教版文本语料库、新概念英语语料库,对其中的文本进行计算与统计,获取适合学生围绕本单元进行互文阅读的学习材料。经过比较与分析,笔者选择阅读语篇“California”一文作为阅读迁移对象。该文易读性为11.7,阅读难度较大,但适合学生开展课外拓展阅读。同时,语篇的主题词为California、usa、spanish、mexico、attracted等,与Reading and thinking主题相近,文本中包含与本单元主题息息相关且学生不易掌握的单词“immigrant”,适合帮助学生在迁移学习中夯实、巩固所学词汇知识。
确定迁移学习的内容之后,笔者根据学生单元课堂学习进度,设计相关的教学任务,包括寻找迁移文本的语篇主题、比较课堂文本与拓展文本主题意义方面的相同与不同、作为读者分析对两个文本的偏好等。在拓展阅读过程中,学生能够更好地建构对单元主题意义的认知,巩固课堂上学到的词汇知识。
依赖NLTK等工具包,Python能够有机结合词汇学习与学生的语篇学习、单元学习,增强学习的整体性、知识的关联性、学习的实践性、迁移的灵活性,让词汇学习突出过程与体验、联想与结构、本质与变式、迁移与创造,指向学生词汇的深度学习。同时,人工智能赋能教学也转变了教学过程中学生与教师的职能与定位,二者形成“学习共同体”:学生由知识的被动接收者转变为主动建构者,教师由知识灌输者转变为学生学习的同伴与帮助者。此类教学过程中,学生更加具有主动性与中心性,学习更加深化,有利于培养学科核心素养。笔者认为,当前运用人工智能相关技术辅助词汇学习、促进学生词汇深度学习已然具有可行性与实用性,人工智能等技术辅助学科教学的契机日趋成熟,信息技术与英语学科教学的深度融合已成时代所需。
注:本文系2017年度教育部人文社会科学研究规划基金项目“基础英语课程深度学习的教学模式建构研究”(项目批准号:17YJA880081)、2022年浙江省教育信息化研究专项课题“主题意义引领下的‘人工智能+’单元词汇教学实践研究”(立项编号:2022ETC024)、2022年度海宁市教育科学研究规划课题“基于主题意义的词汇教学人工智能模式探究”(立项编号:22HG005)的阶段性研究成果。
参考文献
[1][2]罗少茜,赵海永,邢加新.英语词汇教学[M].南宁:广西教育出版社,2016:165-167.
[3] 何亚男,应晓球.落实学科核心素养在课堂·高中英语词汇教学[M].上海:上海教育出版社,2021:7-8.
[4] 彭绍东.人工智能教育的含义界定与原理挖掘[J].中国电化教育,2021(6):49-59.
[5] 沈殊璇,薄亚明.适合于科学计算的脚本语言Python[J].微計算机应用,2002(5):289-291.
[6] 刘卫国,李晨.程序设计教学的NLTK模块应用案例设计Python[J].计算机教育,2019(3):92-97.
[7] 刘海涛.计量语言学导论[M].北京:商务印书馆,2017:134-135.
[8] 许家金.语料库与话语研究[M].北京:外语教学与研究出版社,2019.
[9]MEARA P. Towards a New Approach to Modeling Vocabulary Acquisition[A]. In Schmitt N, McCarthy M, Vocabulary: Description, Acquisition and Pedagogy[M]. Cambridge:Cambridge University Press,1997:109-121.
[10]徐浩,孙桐,蒋炎富.英语词汇教学[M].北京:外语教学与研究出版社,2017.
[11]DEERWESTER S, DUMAIS S T, FURNAS G W, et al. Indexing by Latent Semantic Analysis[J]. Journal of the Association for Information Science & Technology,2010,41(6):391-407.
[12]BIBER D, CONRAD S, Cortes V. If you look at…: Lexical Bundles Vin University Teaching and Textbooks[J]. Applied Linguistics,2004(3).
[13]MANNING C D, SURDEANU M, BAUER J, FINKEL J, BETHARD S J, MCCLOSKY D. The Stanford CoreNLP Natural Language Processing Toolkit[C]//Proceedings of the 52nd Annual Meeting of the Association for Computational Linguistics: System Demonstrations,2014:55-60.
[14]SIMON H A. How Big Is a Chunk?: By Combining Data from Several Experiments, a Basic Human Memory Unit Can Be Identified And Measured[J].Science,1974,183(4124).
(作者徐使超系浙江海宁市高级中学教师;黄新海系浙江嘉兴教育学院教师)
责任编辑:孙建辉