韩锦堂
航海类专业大学英语教材篇际词汇重复特征研究
韩锦堂
(大连海事大学外国语学院,辽宁大连116026)
以《大学英语》(航海类专业适用)教材为基础,通过语料处理与数据分析,研究其篇际词汇重复特征,进而探究其对于学生词汇习得的影响,并为该教材的教学提供参考。研究发现,该教材词汇量及增速同本族语语料相似,且词汇量远高于通用大学英语教材词汇量,学生通过学习该教材可以习得更多词汇;一次词占比高于通用语料库,能够为学生提供海事英语专业词汇;篇际重复数5-15次及以上词汇占总词汇比例较小,应采取相应的教学措施。
航海类专业英语教材;篇际词汇重复;一次词
词汇为语言结构中的基本材料(桂诗春2006)[1]。词汇习得是二语学习的主要内容。研究表明,词汇量不足制约着学习者语言水平的提高(Nation,1990)[2]19。学习者词汇量的提高需要在大脑中形成对于单词的长期记忆。要形成长期记忆,词汇的多次输入十分必要。词汇习得的过程在于心理映射,低频词在重复输入后,学习者得以建立牢固的心理映射,从而掌握词汇。词汇的习得主要在于频率(Frequency)。Nation(1990)[2]54认为,单词长期记忆的形成需要在不同篇章中的5至15次重复。
学习大学英语教材是大学生接触、学习词汇的普遍方式。在中国,外语学习基本上仍停留在课程上,中国的外语学习者差不多只有在外语课堂内才会有词汇输入(陈新仁,2002)[3]。刘英蘋(2008)[4]通过研究轮机英语的篇际词汇分布,探讨了轮机英语学习者词汇缺乏的主要原因;罗卫华,邓耀臣(2009)[5]224以英国国家语料库(British National Corpus)(简称BNC)为基础,研究了本族语语料库中一次词、篇际重复数为5至15次及以上词汇的分布特征,并揭示了长度相似任意两语篇的重复程度。罗卫华,赵小东(2014)[6]推导出计算篇际词汇覆盖率的鲁棒理论数学模型,并计算其95%置信区间;罗卫华,佟大明(2011)[7]发现,篇际中零重复词的增长模式可以用幂函数模型描述,该模型与零重复词的增长曲线有很好的拟合。
英语水平、应用能力和跨文化沟通能力是提升我国航海人才队伍在国际海运界话语权和影响力的关键所在(刘正江,2013)[8]。因此满足航海类专业英语教育需求的教材显得尤为重要。《大学英语》(航海类专业适用)教材[9]是国内首套专门为航海类专业编写的大学英语教材,在航海类专业的英语教学中发挥着重要作用。该教材在满足普通大学英语教学要求的基础上,创新性地加入了与海事相关的题材和内容。然而,对该教材的篇际词汇重复特征尚未有研究。
本文以语料处理与数据分析为手段,研究《大学英语》(航海类专业适用)教材的篇际词汇重复特征,并与本族语语料库BNC作比较,探究其对于学生词汇习得的影响,并为该教材的教学提供参考。
1.1 研究问题
本研究以《大学英语》(航海类专业适用)教材为基础,通过语料处理及数据分析,回答以下问题:
(1)该教材与本族语语料相比,形符数相同时,其词汇量及增速如何?
(2)该教材一次词(hapax legomena)分布有何特征?
(3)该教材篇际5至15次及以上重复数的单词分布有何特征?
1.2 语料采集与处理
《大学英语》(航海类专业适用)教材共4册,每册包含8个单元,每个单元2篇主课文,共64篇课文,总形符71 001,平均形符数为1 109,最大和最小形符数分别为2 586和744。
本研究通过计算机软件实现对于文本的处理。本研究以FoxPro9.0编写了若干程序,其中有文本切分程序token.prg,词元化程序 lemmatizer.prg,篇际词汇增长统计程序growth.prg,一次词增长统计程序hapax.prg,以及多次词增长统计程序multitable.prg等。
(1)文本切分(tokenization)。
程序token.prg删除标点、数字及其他特殊字符,以空格变行的方式提取每个形符,并统计频次。缩略词被还原,如he’s还原为he is,阿拉伯数字和特殊符号被除去。所有文本被切分为单个形符。形符(tokens)指两个相邻空格间的连续字符串,文本一共有多少个词,就有多少个形符。(杨惠中,2002)[10]
(2)词元化(lemmatization)。
词元化就是把所有的词还原为词元(lemmas)(Sinclair,1991)[11]。 比如,像 breaks、breaking、broke这些词会还原为break。程序lemmatizer.prg将所有词元相同的词形归并,并统计频率。
(3)数据处理。
程序growth.prg按顺序统计每篇课文的形符与类符,并对形符和类符进行排序。如第一册第一篇课文形符数为934,类符数为316;第二篇课文形符数为882,类符数为329。前两篇课文累积形符数为1816,累积类符数为542,以次类推。
程序hapax.prg统计每篇课文一次词数量,及其随累积词汇量的增长情况。如第一册第一篇课文词汇量为316,一次词数量为171;第二篇课文词汇量为329。前两篇课文累积词汇量为542,累积一次词数量为311。
程序multitable.prg统计该教材篇际5至15次及以上重复数的单词随篇际词汇量增长的分布。如第一册前两篇课文累积词汇量为542,5次及以上重复数的单词数量为79,6次及以上重复数的单词数量为62,7次及以上重复数的单词数量为55,8次及以上重复数的单词数量为48,9次及以上重复数的单词数量为38,10次及以上重复数的单词数量为31,11次及以上重复数的单词数量为27,12次及以上重复数的单词数量为24,13次及以上重复数的单词数量为23,14次及以上重复数的单词数量为20,15次及以上重复数的单词数量为17。
各套程序处理语料完毕后,本研究以SPSS16.0软件和Excel2007软件处理所得数据并形成图表。
2.1 篇际词汇增长曲线
所得数据由SPSS16.0进行统计,课文词汇量的基本数据如下:课文总词汇量为7 012,平均词汇量为419,单篇课文最大词汇量为583,最小为241。
图1 篇际词汇增长曲线
本文以Foxpro编写程序,实现对于64篇文本的累积形符统计与累积类符统计。所得数据导入Excel2007,并形成图表以观测数据走势。图1表明,累积类符相对于累积形符的数量增长速度先快后慢,累积形符数超出20 000后,累积类符的增长速度趋缓。形符数为20 000、40 000时,本族语语料词汇数为3 236、4 870,该教材词汇数为3 203、4 736。在BNC语料库中,形符数为20 000、40 000时,类符数为3 249、4 921。
该教材总词汇量及增速同罗卫华(2009)[5]226基于BNC语料库的研究结果中本族语语料的总词汇量及其随形符增速基本一致。同时,本族语语料库中,形符数累计为80 000时,词汇量约为7 123(罗卫华,2009)[5]226,当形符数为80 000时,该教材词汇量略高于7 000,与本族语语料近似。
2.2 一次词的分布
图2 累积篇际一次词的分布
由图2可知,该教材一次词整体来看是在不断增长的,且一次词数量和累积词汇量的关系几乎是线性的。前一册、前二册、前三册、前四册累积词汇量分别为2 543、3 982、5 507、7 012,其相应一次词数量分别为 1 305、1 899、2 609、3 208。一次词在总词汇量中所占比例较大,前一册、前二册、前三册、前四册中,一次词占累积词汇量比例分别为51%、48%、47%、46%。该教材总体一次词数量占总词汇量比例为46%,本族语语料一次词占比为37%(罗卫华,2009)[5]226,即该教材一次词占比高于本族语语料。
2.3 累积篇际重复数在5至15次及以上词汇的分布
图3所示为5-15次及以上篇际词汇重复数的分布。
图3 课文累积篇际重复数在5至15次及以上词汇的分布
该教材累积篇际重复数5次及以上、6次及以上、7次及以上、8次及以上、9次及以上、10次及以上、11次及以上、12次及以上、13次及以上、14次及以上和15次及以上词汇在总词汇量中所占比例依次为26%、22%、20%、17%、16%、14%、13%、12%、11%、10%、10%。5至15次及以上重复数的单词随篇际累积词汇量的增长呈线性分布。累积词汇量为2 543时,5至15次及以上重复数的单词数量为475、400、344、299、257、228、208、195、175、166、154;累积词汇量为3 982时,5至15次及以上重复数的单词数量为928、766、667、588、514、452、416、388、348、324、301;累积词汇量为5 507时,5至15次及以上重复数的单词数量为1 354、1 156、991、876、788、726、655、597、546、503、470;累积词汇量为 7012时,5至15次及以上重复数的单词数量为1 816、1 574、1 393、1 224、1 100、995、905、832、758、710、670。
本研究表明,该教材与本族语语料相比,形符数一致时,其词汇量及增速与本族语语料基本持平。该教材总词汇量为7 012,已经超过了王守仁(2008)[12]提到的《大学英语课程教学要求》规定4 795个单词的一般要求和6 395个单词的较高要求。同时,与通用大学英语教材相比,前者平均词汇量为3 953(陈潇潇,2012)[13],《大学英语》(航海类专业适用)教材词汇量显著高于前者,因此航海类专业学生在两年的英语学习中通过该教材能够习得更多词汇。
该教材课文篇际一次词相对于词汇量呈线性增长,且占总词汇量比例较高。前一、二、三、四册一次词数量分别占相应累积词汇量的51%、48%、47%、46%。该教材一次词占比高于本族语语料。该教材为航海类专业适用教材,包含大量海事英语内容。作为专门用途英语(English for Specific Purposes),海事英语包含大量专业词汇,而罗卫华(2009)[5]225所采用的BNC语料库为通用语料库,因此,该教材一次词占比高于后者。换言之,该教材能够为学生提供更多海事英语词汇。
本教材课文中重复数在5至15次及以上词汇占总词汇比例较低。如仅靠教材让学生对单词形成长期记忆,以重复数为5次及以上单词为例,其占总词汇数26%,学生最多只能掌握1 816个单词,因此,在教学活动中,教师应加大学生的课外阅读量,或增加课文的学习次数。
[1]桂诗春.英语词汇学习面面观[J].外语界,2006(1):57-65.
[2]NATION,I.S.P.Teaching and learning vocabulary[M].New York:Newbury House Publishers,1990.
[3]陈新仁.外语词汇习得过程探析[J].外语教学,2002(4):27-31.
[4]刘英蘋.轮机英语篇际词汇分布研究[J].大连海事大学学报,2008(2):109-112.
[5]罗卫华,邓耀臣.基于BNC语料库的英语篇际词汇重复模式研究[J].外语教学与研究,2009(3):224-228.
[6]罗卫华,赵小东.英语篇际词汇覆盖率研究[J].中国外语,2014(6):53-61.
[7]罗卫华,佟大明.篇际零重复词分布和增长模式实证研究[J].教学研究,2011(6):53-87.
[8]刘正江.把握航海教育发展新形势,全面提高航海人才培养质量[J].航海教育研究,2013(3):7-12.
[9]罗卫华,王海华,鹿学军.大学英语读写教程(航海类专业适用)(第2版)[M].大连:大连海事大学出版社,2016.
[10]杨惠中.语料库语言学导论[M].上海:上海外语教育出版社,2002:341.
[11]SINCLAIR, J.Corpus, Concordance, Collocation[M].Oxford:Oxford University Press,1991.
[12]王守仁.进一步推进和实施大学英语教学改革——关于《大学英语课程教学要求(试行)》的修订[J].中国外语,2008(1):4-10.
[13]陈潇潇.大学英语教材的课文篇际词汇重复模式研究[J].江西科技师范学院学报,2012(3):65-71.
责任编辑:富春凯
Inter-textual Vocabulary Repetition Features of College English for Marine Majors
HAN Jin-tang
(Dalian Maritime University, Dalian 116026, China)
Via corpus processing and data analysis, studies inter-textual vocabulary repetition features of College English for Marine Majors, so as to explore its effect on students′vocabulary acquisition and to make proposals towards the teaching of this textbook.It is found that vocabulary size and growth rates are similar to that of native English corpora.Its vocabularyis larger than that of general College English textbooks.Students hence can enlarge their vocabulary;the ratio of hapax legomena is greater than that of general corpus and it provides students with maritime vocabulary;the ratio of words with a frequency of 5 to 15 times and above is relatively low which calls for corresponding teaching measures.
College English for Marine Majors;Inter-textual vocabulary repetition;Hapax legogema
G642
A
1674-6341(2017)05-0118-03
10.3969/j.issn.1674-6341.2017.05.040
2017-05-15
中央高校基本科研业务费专项资金资助项目(3132017101)
韩锦堂(1993—),男,安徽蒙城人,硕士研究生。研究方向:外国语言学及应用语言。