军事英语语料库和例句检索在大学英语词汇教学中的应用

2020-12-14 04:01林敏刘志国
科教导刊 2020年19期
关键词:自然语言处理语料库大学英语

林敏 刘志国

摘 要 本文主要研究通过使用Python编写爬虫从中国军网英文版爬取语料,建立军事英语语料库,进行例句批量检索和保存,根据大学英语实际教学需要,将例句融入大学英语词汇教学。检索词汇为大学英语词汇表,在增加词汇军事例句的同时,最大限度地减轻学员学习负担;通过引入军事英语例句,实现单词学习中的语境凸显,激发学员学习兴趣,提升学习效果;使大学英语教学更具时效性,有效提升学员的跨文化交流能力;为通用英语教学和军事英语ESP课程的衔接打好坚实的基础,充分体现了军校大学英语教学的军味。

关键词 军事英语 大学英语 Python 自然语言处理 语料库

中图分类号:G424                                       文献标识码:A    DOI:10.16400/j.cnki.kjdks.2020.07.066

Abstract This paper mainly studies how to use Python to compile crawlers to crawl the corpus from the English version of the Chinese military network, build the military English corpus, retrieve and save the sample sentences in batches, and integrate the example sentences into the college English vocabulary teaching according to the actual needs of college English teaching. The retrieval vocabulary is a college English vocabulary, which not only increases the vocabulary of military examples, but also reduces the learning burden of the students to the maximum extent. By introducing military examples, the context in the vocabulary learning can be highlighted, the learning interest of the students can be aroused, and the learning effect can be improved; the college English teaching can be more timely, and the intercultural communication ability of the students can be effectively improved; the general English teaching and the connection of military English ESP courses has laid a solid foundation and fully embodies the military flavor of Military college English teaching.

Keywords Military English; college English; Python natural language processing; corpus

新軍事变革和大学英语教学改革对军校大学英语教学提出了新的要求。随着国内外军事交流与合作的日益频繁,军校学员既要精通军事专业技能,同时又要具备扎实的外语交流能力。目前,军校学员一般在大学的前两个学年进行通用英语教学,在高年级进行ESP军事英语教学。而如何做好通用英语和军事英语教学的衔接,既满足学员参加大学四、六级英语考试的需要,又能提升学员的军事英语能力和英语综合应用能力就显得尤为重要。本文从军事英语例句如何融入大学英语词汇教学出发,力图为军校大学英语教学特色的凸显,通用英语教学和军事英语教学的有机衔接提供新的思路和操作方法。

1 “注意”假设理论在词汇教学中的运用

施密特(Schmidt)提出的“注意”假设理论为军事英语例句在大学英语词汇教学上的应用提供了理论基础。“注意”假设理论认为:语言输入并非都是等价的,真正被吸纳的信息必须是被有效“注意”到并且经过加工处理的信息。影响“注意效果”的因素包括频率、凸显、教学、学习者个体在注意和提取信息等方面的差异、中介与系统的现状和任务要求。斯凯恩认为:“施密特的理论强调了‘注意在语言习得中的重要性,只有学习者真正注意到的语言信息才会被理解和吸收。”[1]在大学英语的词汇教学中,相当一部分词汇既有日常用语的涵义,也有军事英语的特定涵义。通过对比同一个词汇在两个语域中的例句,提供两种迥然不同的语境,起到互相凸显的效果,从而引起学员的注意和思考,进一步激发学员学习兴趣,最终使学员能够内化和应用所学词汇。

2 军事英语语料库建设和例句搜索

本文使用的军事英语语料库语料由自主编写的爬虫从网络爬取。http://eng.chinamil.com.cn是中国军网的英文版,内容以新闻报道为主,包含各个军种的新闻报道、外交部发言、以及国内外最新的军事新闻等。进行文本处理所使用的第三方库为NLTK(Natural Language Toolkit)。NLTK是由宾夕法尼亚大学的Steven Bird和Edward Loper基于Python开发的第三方库,主要应用于科研和教学,是自然语言处理较为常用的模块。

2.1 Python爬蟲编写和使用

自主编写爬虫从网站获取需要的信息,在本文研究范围内主要获取的是文本信息,如文章的标题,发布时间和正文等。获取文本信息后保存为文本文件,作者本次共爬取近期文章文本约20万字。使用Python自主编写爬虫可以定期爬取语料,保证了以新闻文本为主的语料库具有较强的时效性。语料库的内容便于根据需要定制和拓展,可以进一步获取文章的图片信息,甚至是声音视频等多媒体信息,与文本信息相结合,构成多媒体语料库。

2.2 单词例句批量搜索和文本保存

与传统的语料库软件Antconc和WordSmith等相比,用计算机语言自主编写语料库搜索引擎具有更大的灵活性,语料库的使用可以根据教学内容进行量身定制。针对本文所研究的例句搜索,具体步骤为:(1)首先获得本单元的单词词表,以文本文件格式保存;(2)通过自主编写的程序读取文件,在语料库中自动为每个单词查找匹配到的例句,并合并为一个文本文件保存,便于进一步根据教学需要进行筛选、简化和翻译。部分代码如下:

自主编写代码进行例句搜索的优势是:可以更方便地批量导入生词表,对生词表的单词数量没有限制;可以进一步拓展例句筛选功能,如设置例句长度、选择高频词汇例句、设置例句数量、文本时间、制作双语例句等;例句本文可以自动保存为文本,便于进一步语料处理。

3 在大学英语教学中使用军事英语例句应当注意的问题

军校大学英语教学在补充军事英语的同时,仍应坚持以通用英语教学为主体,例句筛选应当体现因材施教原则。大学英语课程作为军校军事语言教育的基础课程,主要学习的是通用英语课程,为学员学习高年级军事英语课程打下坚实基础。因此,在补充军事英语例句时应当注重适量和适度,应以通用英语教学为主,不能喧宾夺主,影响到通用英语教学的完整性和原版英文课文赏析的美感。

在例句的筛选过程中,应充分体现因材施教的原则,军校学员在大学一年级刚开始大学英语学习,往往语言基础比较薄弱,而军事英语新闻例句往往结构比较复杂,词汇难度较大。如果直接引入难度过大的例句,虽然保持了例句的原汁原味,但是过多的新概念和词义可能会让学生产生畏难情绪,起到适得其反的效果。因此,教员应当充分做好学情分析,在最大程度上保证文本信息完整性的同时,对原版例句进行大胆的简化和缩写,用更容易理解的表达,保留例句的核心含义和语境,减少修饰性成分,保留数量和难度适宜的专业术语,并进行对照翻译和适当处理,确保例句语境凸显和有效信息输入。随着学员英语水平的提高,可以逐渐减少或无需对句子进行简化和缩写,直到能够完全适应实际使用的军事英语表达。

应当注重翻译语料的整理和保存。网络获取和自主翻译的双语对照例句以及术语,可以进一步制作成TRADOS翻译记忆库和术语库,利用机辅翻译逐渐加快翻译的速度和准确性,进一步减轻备课负担,提升备课效率。

4 结语

在信息技术蓬勃发展的今天,应当充分利用现代信息技术,在保持外语教学材料经典性的同时,又能确保外语教学材料时效性,紧跟时代步伐,及时补充相关领域最新的发展趋势和语言材料。自主编写代码搜索语料,使用自然语言处理工具可以更方便地对文本进行批量处理和量化分析,极大地提升了文本分析效率。自然语言处理中复杂的语言模型在外语教学和翻译上,还有广阔的应用和发展空间,值得进一步的研究和探索。

参考文献

[1] Skehan,P. A Cognitive Approach to Language Learning[M].Oxford University Press.1998:48-51.

猜你喜欢
自然语言处理语料库大学英语
基于语料库翻译学的广告翻译平行语料库问题研究
运用语料库辅助高中英语写作
基于组合分类算法的源代码注释质量评估方法
校园网络背景下大学英语大班教学的缺陷探究
情感教学法在大学英语课堂教学中的应用
非英语专业《大学英语》课程中语音教学现状与重要性简析
浅析支架式教学模式下大学英语教师的角色定位
面向机器人导航的汉语路径自然语言组块分析方法研究
汉哈机器翻译中的文字转换技术研究
HowNet在自然语言处理领域的研究现状与分析