陈 蕊
(河南理工大学 外国语学院,河南 焦作 454000)
基于语料库的中外期刊学术论文词块对比研究
陈 蕊
(河南理工大学 外国语学院,河南 焦作 454000)
在两个自建中外学习者期刊语料库的基础上,通过运用语料库分析软件,讨论比较两个语料库中常用词块呈现的特点。研究结果表明,中国学习者与英语本族语者在学术论文的高频词块选择上无较大差异,在功能类型上也基本一致;不同之处在于中国学习者在某些词块的使用上存在过多或不足的倾向。这说明虽然中国学习者已具备了较熟练运用英语进行学术论文创作的能力,但在规范性与准确性上仍需提高。
期刊语料库;英语学术论文;词块;功能类型
词块是语言学的一个重要概念,语言学界对它的关注早在19世纪就已开始。但学界至今对词块概念仍没有一致的定义,众说纷纭。语言学家们从不同角度对词块进行研究并提出了自己的定义,如称词块为词束(lexical bundle)、词丛(lexical cluster)、词汇短语 (lexical phrase)或预制块(prefabricated chunks)等。
国内语言学者如王立非、张大凤(2006)认为词块通常由多个词构成,具有两个特征,即词汇和语法特征,并具有特定的活动功能。王立非(2006)指出,词块是事先预制好且被频繁使用的多个词的组合,有自己特定的结构和相对稳定的意思,它以整体形式被记忆储存,在即时交际时被整体提取,不需要运用语法规则加工分析。国外语言学家多从语法和认知语言学角度对词块进行阐释,其中具有较强普遍性和实用性的是Michael Lewis对词块的分类:单词和短语;固定搭配;惯用句型;句子框架和引语。但被广大语言学研究者采用较多且分类较全面的是Biber (1999)的分类方法。Biber从结构层面和功能层面对词块进行分类。结构层面上有七种主要类型词块:名词词块、动词词块、介词词块、形容词词块、连词词块、副词词块、句干词块,主要类型之下再细分为12种子类型。功能层面上词块分为4种类型:立场词块、组篇词块、指示词快和会话词块。
Biber对词块的分类与他人不同之处在于他从二维角度结合结构和功能两个层面分类,而不是一维角度,这为语言学研究者对词块的认识提供了一个全新的视角。学界对词块概念虽没有一个统一的定义,但多数学者对词块的特征和功能认知基本一致,即词块是由大于或等于两个词语的多词组成,可用于构成句子或话语,能表达较完整的意义,实现一定语法、语篇或语用功能形式和意义。本文对词块的理论研究基础即是基于此理解及Biber的词块分类。
学术英语是指学术研究人员在科研学习、撰写学术文章或进行学术交流时针对某个特点问题或概念进行阐述时所使用的英语,属特殊用途英语的一个分支。学术研究者的学术英语水平不仅决定着他们学术知识的深广度,同时也决定他们能否将所学准确地传播给世界。学术研究人员要运用学术英语准确地传播学术不仅仅要有丰厚的词汇积累,更要具备扎实的语言基本功,能完整准确地组织语言表达学术概念或个人观点等。这时,在语言组织过程中,作为一种具备“特定语法和语用功能的意义集合体”(马广惠,2011),词块就起着非常重要的承接和引导的意义。鉴于此,本文选取中外学术期刊论文中词块作为研究对象,运用语料库方法对比两者中词块的使用情况及结构、功能特征,归纳总结学术英语词块对中国英语学习者学术学习和学术创作的重要性。
本研究将采用语料库方法对学术英语词块进行研究。
第一步,建立中国学习者期刊语料库和英语本族语者期刊语料库两个语料库,对其中学术英语词块分层抽样、随机选取。两个语料库的语料均来源于发表在中外学术期刊上的英语论文,库容基本接近:中国学习者期刊语料库含论文115 篇,总次数894 809;英语本族语者期刊语料库含论文103篇论文,共计879 034词。两个语料库的主题均是关于用英语进行写作的学术论文,词数也基本接近,因而可比性较高,结果也会较为客观,可信度较高,可行性强。
第二步,确定语料分析软件,以分析所建语料库中的学术英语论文。本研究将选用语料库研究中常用的语料分析软件WordSmith用于提取目标词块、查询特定单词或词块频数及分析相关数据。
第三步,明确界定所选词块概念。笔者在理论背景部分已指出,语言学界对词块概念的阐述与界定纷繁多样,因此,确定本研究中将提取分析的词块应具备怎样的特征,如何定义就显得至关重要,即明确研究对象为何物。本研究针对的是国内外学术期刊上的英语论文,学术论文内容客观,主题规范,逻辑严谨,所以,本研究所提取的词块也要具备这种规范严谨的特征,即要“意义完整,且符合传统语法规则”。如果不能满足这一特点,即便是在语料库中高频出现的词块,也不会被选取作为本文的研究对象进行比较讨论。
第四步,确定词块提取标准。Biber(2004)和Cortes(2004)认为在学术英语文本中“至少出现在5个不同文本且频数不少于40次/百万词”的4词词块相较于其他词块具有更重要的研究意义。本研究的词块提取标准即参照Biber的这一发现,将提取中国学习者期刊语料库和英语本族语者期刊语料库中的高频4词词块进行比较分析。
最后,分析所提取词块的功能特点。根据Biber(1999)对词块的分类方法,从功能层面对两个语料库中提取出的高频4词词块进行分析比较,以求归纳总结中国科研人员英语学术论文写作特点并为其英语水平提升提供思路。
1.高频4词词块对比
如上文研究方法所述第四步,本研究参照Biber和Cortes的研究发现确定以“至少出现在5个不同文本且频数不少于40次/百万词”为高频词块提取标准。随后,参照提取标准对所建中国学习者期刊语料库和英语本族语者期刊语料库中出现的高频4词词块进行提取、筛选。然后,本研究选取其中提取结果中最具代表性的出现频数最高的前8位高频4词词块列表如下,通过这样直观的对比图分析比较中国学习者和英语本族语者英语学术论文中高频词块的使用情况及特点。
表1 中国学习者期刊语料库和英语本族语者期刊语料库高频4词词块对比
通过上表所示的中国学习者期刊语料库和英语本族语者期刊语料库出现频数排名前八位的高频4词词块及相应频数,读者不难发现,其中有四个词块是相同的:at the same time、on the basis of、it could be seen和on the other hand。这四个相同词块的不同点在与它们出现在这两个语料库中的频数,以上四个词组在中国学习者期刊语料库和英语本族语者期刊语料库中出现的频数依次为70 和 97 、62 和 86 、57 和 75 、87 和 74。这些数据之间的频数差多保持在10左右,说明中国学习者和本族语者在词块的选取与使用上相差不多、基本一致,中国学习者在运用英语进行学术论文写作时能做到已熟练运用不同词块。
虽然有高频出现的词块有半数相同,但表格中有一点也需引起读者关注,即出现的前3位高频4词词块完全不同。中国学习者期刊语料库中高频4词词块频数出现前3位的词块分别是on the other hand,频数87;by the use of,频数80;with the increase of,频数77;然而本族语者期刊语料库的前3位高频4词词块则是at the same time、on the basis of、it could be seen,频数分别为97、86、75,与前者无一重复。这种不同说明中外科研人员在撰写学术论文时在最常使用的词块上选择不同,而这些不同的词块选择及频数也折射出中国科研人员在一些词块的运用上较之本族语学者存在不足或过度。如表1中所列词组at the same time,它在本族语者期刊语料库中出现的频数是97,而在中国学习者期刊语料库中的频数则为70,说明中国学习者对该词块的选择及使用存在不足;但对于上表中的另一词组on the other hand,中国学习者则表现出过度使用的情况,这点可以通过它在中国学习者期刊语料库中出现的频数87(所有词块中最高的)和在本族语者期刊语料库中的频数74(居中)上看出。这些差异也能反映出中国学习者在语言的学习和运用上还有很多需要矫正提高之处。
2.词块功能类型分析
词块在语言的使用中起着重要的作用,主要表现为生成语言、表达理解等,这种作用就是词块的功能,因此分析词块的功能在研究中亦是非常必要的。
笔者参照上文提到的本研究采用的词块提取标准进行检索,从中国学习者期刊语料库和英语本族语者期刊语料库分别提取到6632个和6758个符合标准的词块。随之,根据Biber (1999)和Cortes (2004)对于学术词块功能的分类标准对所提取的高频词块分类,结果如下表所示。
表2 中国学习者期刊语料库和英语本族语者
笔者和读者均可从以上数据分析出两个所建语料库在词块功能类型使用上的特点。
第一点,中国学习者期刊语料库和本族语者期刊语料库均包含了Biber和Cortes针对学术词块在功能层面所划分的几种类型,如指示标记类、立场表达类和文本组织类。
第二点,两个语料库所占比例最高的词块功能类型均为指示标记类词块,分别占功能类型总数的50.54% 和 51.88%,立场表达类和文本组织类词块在两个语料库中所占比例均不到百分之二十,且数值接近,这表明中外学者在撰写论文中对词块的使用在功能上是相同的。
第三点,通过上表数据不难发现,两个语料库中指示标记类词块比例最高且数值相近,说明中外学习者在学术论文撰写中多选择能实现文本想要阐述的某个客观对象属性的词块,如“the nature of the”等。这主要由学术论文需要清楚阐释某一客观事物或现象或问题的性质所决定。
第四点,上表数据还表明,立场表达类和文本组织类词块在两个语料库中所占比例较小,均不到百分之二十。立场表达类中国学习者期刊语料库所占比例15.8%,本族语者期刊语料库为18.3%;文本组织类相应的比例分别为18.79%和17.48%。这些较小且数值接近的比例说明在两个语料库中表明说话人态度的词块或衔接上下文逻辑关系的词块使用均不多。这也是受学术论文的基本性质所限,即学术讲求科学客观,应尽可能地减少主观评价用语。
结语
综上,本研究发现,中国学习者与英语本族语者在学术论文的高频词块选择上无较大差异;在功能类型上,两者也基本一致,这些都说明中国学习者在用英语进行学术论文创作时,已具备了较熟练较高的水平。
但在高频4词词块选择上体现出的差异性也让笔者发现一些问题,即在运用英语进行学术论文写作时,中国学习者需要提高质的问题,即对词块的恰当使用。要解决这一问题,中国学习者可通过多研究学习英语本族语者在学术创作领域常用的学术词块特征,多阅读英语原文文本、背诵及模仿本族语者常用词块,增强自己对常用学术词块的理解掌握,提高语言运用能力,创作出更加规范、标准、地道的英语学术论文。
[1]Biber, D., S. Johansson,G. Leech, S. Conrad & Finegan. Longman Grammar of Spoken and Written English [M].Beijing: Foreign Language Teaching and Research Press,1999.
[2]Biber, D., S. Conrad & V. Cortes. If you look at...:Lexical bundles in university teaching and textbooks [J].Applied Linguistics, 2004,25(3).
[3]Cortes, V. Lexical bundles in published and student disciplinary writing: Examples from history and biology [J].English for Specific Purposes,2004(23).
[4]Lewis, M. Implementing the Lexical Approach: Putting Theory into Practice [M].Language Teaching Publications,1997.
[5]Lewis, M. The Lexical Approach [M].Language Teaching Publications,1993.
[6]Skehan, P.A Cognitive Approach to Language Learning [M].Oxford: Oxford University Press,1988.
[7]马广惠.词块的界定、分类与识别[J].解放军外国语学院学报,2011(1).
[8]王立非,张大凤.国外二语预制语块习得研究的方法进展与启示[J].外语与外语教学,2006(5).
Class No.:H031 Document Mark:A
(责任编辑:宋瑞斌)
A Corpus- based Research of Academic Paper Chunks from Chinese and Foreign Periodicals
Chen Rui
(School of Foreign Studies, Henan Polytechnic University, Jiaozuo, He’nan 454000,China)
Based on two established corpora of Chinese and foreign periodicals, the paper compares and discusses the features of chunks which are frequently used in the two corpora by applying the corpus analysis software. The research results show that in choosing high-frequent academic chunks, there is no obvious difference between Chinese learners and native English speakers. Nor is the functional feature. The difference lies in the tendency of excessive or insufficient use of certain chunks in papers of Chinese learners, which shows that although Chinese learners have a good command of writing English academic paper, the accuracy of the language still needs to be improved.
periodical corpus; English academic thesis; lexical chunks; type of function
陈蕊,硕士,讲师,河南理工大学外国语学院。研究方向:英语国家社会与文化。
河南省教育厅人文社会科学研究资助计划项目(项目号:2017-ZZJH-193);河南省教育科学“十三五”规划项目(项目号:2016-JKGHB-0197);河南理工大学教育教改研究项目(项目号:2015JG099);河南省哲学社会科学规划项目(项目号:2013BYY023)阶段性研究成果。
1672-6758(2017)02-0129-4
H031
A