语料库驱动的医学英语词汇语块研究

2014-05-25 02:26彭咏梅李萍凤
湖北科技学院学报 2014年8期
关键词:语块语料库英文

彭咏梅,李萍凤,龚 研

语料库驱动的医学英语词汇语块研究

彭咏梅,李萍凤,龚 研

(江西中医药大学 人文学院,江西 南昌 330004)

本研究通过收集中医药核心期刊论文的英文摘要,自建了一个5万词的中医药论文英文摘要语料库。利用语料库驱动的方法,对论文的英文摘要进行了词汇语块提取,统计和分析。研究发现了中医药论文英文摘要词汇语块在结构分类和功能分类方面的特点,总结了与医学学科密切相关的词汇语块。

语料库驱动;词汇语块;结构分类;功能分类

一、前言

词汇语块(lexical bundles)是指经常一起出现的词汇序列组合。英语词汇语块的研究一直受到研究者们的关注(如Wray&Perkins,2000;Biber,2006)。语料库语言学作为一种新兴的语言研究手段,主要有基于语料库和语料库驱动两种方法。一些研究者已利用基于语料库的方法研究英语词汇语块(如Biber,2006)。研究者通过预先选取词汇语块,然后分析语料,以便发现这些词汇语块是如何运用。很多研究者也采用语料库驱动的方法对英语词汇语块进行研究(如,Biber,Conrad& Cortes,2004;Gray& Biber,2013)。语料库驱动的方法用于词汇语块研究,一般是通过频率提取来辨认词汇语块,分析词汇语块。

近年来,有一些研究者对医学英语的词汇进行过探讨。Marcro(2000)研究了英文医学论文,发现与名词/介词相关的the…of,a….of和be….to等词汇语块类型最常见。Turo(2012)调查了从句语块“so ADJ/ADV that”在医学英语写作中的情况,发现这个语块在英文医学写作历史过程中一直使用,而且倾向于用在学习者的文本中。

从以前的研究可以发现,虽有一些研究开始关注医学英语,但研究语料多为国外的西医论文。中医药论文英文摘要是二语学习者学术英语水平的重要体现。然而,很少有研究关注中医药论文英文摘要中的词汇语块。本研究利用语料库驱动的方法,对中医药论文英文摘要中的词汇语块进行全面探讨,对提取的词汇语块进行结构分类和功能分类,并总结与医学学科密切相关的词汇语块。研究结果将对医学研究者的写作有指导意义,也可以给医学英语的词汇、阅读和写作教学等提供帮助。

二、研究设计

1.研究问题

本研究关注中医药论文英文摘要的词汇语块。通过语料库方法,对中医药论文英文摘要中的词汇语块进行探讨。本研究拟回答以下3个问题:

(1)中医药论文英文摘要中的词汇语块结构分类如何?哪类结构类型最多?

(2)中医药论文英文摘要中的词汇语块功能分类如何?哪类功能类型最多?

(3)和医学学科密切相关的英语词汇语块有哪些?

2.语料来源

本研究通过收集中医药核心期刊论文的英文摘要,自建语料库。语料来源于以下9种中医药核心期刊,包括:《北京中医药大学学报》、《广州中医药大学学报》、《天然产物与开发》、《针刺研究》、《中草药》、《中成药》、《中国中西药结合杂志》、《中国中医基础杂志》和《中药材》。被收集的论文时间跨度为2009-2013年,每种杂志每年5篇,一共225篇英文摘要,共53,456词。

3.词汇语块的识别和分类

研究者采用语料库驱动的方法,利用软件AntConc3.2. 5,对自建语料库语进行了词汇语块的提取和频率统计。根据Biber,Johansson,Leech,Conrad&Finegan(1999),词汇语块应该每百万词至少出现10次,至少应该出现在5个不同的文本中。本研究提取的词汇语块频率相对较高,每10万词出现10次(指对原始数据进行标准化运算后),出现在5个文本以上。,研究者对提取结果进行了人工排查,排除了一些无意义的词汇语块。

本研究的结构分类和功能分类标准参照的是Biber,Conrad&Cortes,(2004)的分类。结构分类有三类:VP-based bundles(动词词汇语块),dependent clause bundles (从句词汇语块)和NP/PP-based bundles(名词/介词词汇语块)。功能分类有四类:stance bundles(立场词汇语块),discourse organizers(话语组织词汇语块),referential bundles(参照性词汇语块)和 special functions(特殊功能词汇语块)。

三、结果与讨论

本研究利用语料库驱动的方法,对中医药论文的英文摘要进行了词汇语块检索。排除无意义的词汇语块之后,有意义的词汇语块的具体使用情况如图1所示(以下数据均为标准化后的数据)。

从图1我们可以看出,随着构成词汇语块的词的数量的增加,词汇语块出现的频率会逐渐下降。2词,3词和4词的词汇语块更普遍,5词和6词的词汇语块较少。根据Biber et al.,(1999),更短的词汇语块可以通过追加,变成更长的词汇语块。为了缩小研究范围,本研究将重点对中医药论文摘要的4词词汇语块进行研究(其他更短的或更长的词汇语块也可以采取相同的研究方法)。

图1 中医药论文英文摘要的词汇语块频率

图2 中医药论文英文摘要的 词汇语块结构分类频率

1.词汇语块的结构分类

研究者参照Biber,Conrad&Cortes(2004)的结构分类,对有意义的4词词汇语块进行了结构分类。发现中医药论文英文摘要的词汇语块的结构分类可分为4类,具体使用频率如图2所示。

从图2我们可以看出,中医药论文英文摘要中,名词/介词类的词汇语块使用最频繁,动词类的词汇语块其次,名词加动词的词汇语块较少,从句类的词汇语块最少。

名词词汇语块的广泛使用与Biber et al.(1999),Biber,2009;Biber&Gray,2010)的结果一致。以前研究发现,在学术写作中名词和介词的使用相当频繁,名词化的现象也很普遍。由此体现了学术写作名词/介词词汇语块高频的必然性。在中医药论文摘要中,内容一般要包括多方面,如研究目的,研究方法,实验过程,实验结论等。摘要起到向读者传递整篇文章信息的作用,在写作过程中,读者和作者并不共享一个语言环境。作者需要借助于名词、冠词和介词的使用,对某物体或某现象进行准确的描述,以让读者在没有共享环境的情况下能够理解作者表达的意思。

中医药论文摘要对实验操作要陈述清楚,以备后来研究者进行考证或者重复。因此,作者通常会借助一些动词来描述实验过程。本研究中,动词词汇语块仅次于名词词汇语块,比名词加动词的词汇语块频率更高。这一结果与Cortes(2013)的研究结果一致。仔细观察动词词汇语块,发现他们可细分为三类:一类用动词原形,一类用动词不定式,一类用动词被动语态。动词原形的词汇语块占21. 8%,动词不定式的词汇语块占20.6%,动词被动语态的词汇语块占57.6%,而且时态均为过去时。名词加动词的词汇语块中的名词是实验对象,所有的动词全是动词被动语态的过去式。这些词汇语块主要用来描述对某个物体进行了某个操作。在实验过程中,实验操作者一般是该文的作者,研究者无需过多陈述。同时,为了体现实验过程的客观性,选取实验对象为主语来描述。研究者对实验对象进行了的具体操作使得动词被动语态的过去式出现比较频繁。

从图2可知,从句类词汇语块较少。这一结果与Biber,Conrad&Cortes(2004)的结果一致:在学术论文中,短语类的词汇语块比从句类的词汇语块更频繁;从句类的词汇语块的相对较少。学术写作是个描述具体事实和操作的过程,以便清晰明了地向读者传递实验和学术信息。从句语块会相对使用更少,符合学术写作的要求和目的。

2.词汇语块的功能分类

研究者对有意义的4词词汇语块进行了功能分类。词汇语块的功能分类的具体使用频率如图3所示。

图3 中医药论文英文摘要的词汇语块功能分类频率

从图3可知,中医药论文英文摘要中,参照性词汇语块使用最频繁;其次是话语组织词汇语块;使用最少的立场词汇语块,没有特殊功能类的词汇语块。

词汇语块的特殊功能主要包括礼貌,简单询问和转述三个小类。从小类可知,这类词汇语块的功能反映的是互动性特点,这些特点更多体现于口头表达 。学术写作是一种非常正式的书面表达,读者和写作者是独立的情境,不涉及互动性。因而中医药论文英文摘要中没有出现词汇语块充当特殊功能的作用。表达态度或立场的词汇语块称为立场词汇语块。中医药论文英文摘要中的立场词汇语块不多,这是合乎学术写作的客观性、描述性的特点。通常在建立人际关系的时候需要表达自己的态度或立场。然而学术写作的过程是向读者客观陈述、传递信息的过程,而不是通过互动和交流建立人际关系,不需要作者频繁地表达态度或立场。

本研究中,参照性词汇语块最频繁。这一结果与Biber (2009)的研究结果一致;而且词汇语块的结构分类和功能分类有联系。大部分的参照性词汇语块是由名词/介词词汇语块构成的。本研究也符合这个规律。本研究的参照性词汇语块绝大部分都是名词/介词词汇语块。中医药论文英文摘要中的名词/介词词汇语块的高频带来了参照性词汇语块的高频。这些参照性词汇语块的使用有助于清楚、详细地描述实验过程。

话语组织词汇语块在中医药论文英文摘要中也起着重大作用。学术写作要求有清晰的组织性和逻辑性,话语组织词汇语块可以充当这个作用。医学实验过程要求有条理性和目的性,话语组织词汇语块可以帮助实现这些目的。因此,中医药论文英文摘要中话语组织词汇语块也比较频繁,能否正确使用话语组织词汇语块关系到论文能否发表。

3.与医学学科密切相关的英语词汇语块

总结与医学学科密切相关的英语词汇语块,研究者主要参照外语教学与研究出版社2008年1月出版的《中山英汉汉英医学词典》和2013年1月出版的Dorland's Illustrated Medical Dictionary,32nd Edition这两本医学辞典。研究者对抽取的词汇语块进行了仔细审核,总结了中医药论文英文摘要中和医学学科相关的英语4词词汇语块,使用频率共计363,占本研究4词词汇语块的30.6% 。具体的词汇语块见附录。仔细观察后发现,这些词汇语块主要以以下这几个医学词汇相关:effect(效果),treatment(治疗),chemical(化学物质),rats(老鼠),wavelength(波长),therapeutic(治疗的),flow rate(流率,流速)。和医学学科密切相关的词汇语块具体的结构分类和功能分类如图4和图5所示。

图4 与医学学科密切相关的词汇语块结构分类频率图

图5 与医学学科密切相关的 词汇语块功能分类频率

如图4所示,与医学学科密切相关的词汇语块的结构分类中,动词词汇语块频率最高,名词加动词和名词/介词词汇语块相差不大,没有从句类词汇语块。根据上述,从句词汇语块本研究中的频率不高,所以与医学学科密切相关的词汇语块中没有这一类属正常。因为所收集的论文涉及医学实验,所以用动词词汇语块来描述实验过程,和医学学科相关的词汇和动词一起出现在实验过程的描述中。名词性词汇语块是用来描述实验对象,与动词一起结合描述实验过程。

如图5所示,参照性词汇语块最多,话语组织语块其次,立场词汇语块最少,没有词汇语块充当特殊功能。这些功能类别和使用频率和图3一致,体现了与医学学科密切相关的词汇语块的功能分类和4词词汇语块的功能分类的一致性。

四、结语

本研究对核心期刊中医药论文英文摘要的词汇语块进行了全面、系统的探讨,分析了这些词汇语块的结构分类和功能分类方面的特点,并解释了原因。该研究把二语学习者的学术英语词汇语块的特点进行了详细的分析,可以为从事医学研究的人提供写作帮助,明白学术写作英文摘要注意的特点。和医学英语密切相关的词汇语块的总结,可以为医学英语的阅读和写作提供帮助。阅读者和写作者可以通过努力,牢记一些词汇语块。在今后的阅读和写作中这些词汇语块可以通过组块的形式辨认和提取,有助于促进阅读和写作的流畅性。从事医学英语教学的老师也可以根据中医药论文英文摘要词汇语块的特点,有意识地提醒学生写作中应该注意哪些特点,争取减少中文式英语,进行更规范的英语写作。

本研究也有局限性。本研究中的语料选取范围可以更广些。今后可以收集SCI收录的医学英文论文,和中医论文英文摘要进行对比,可以对比母语者和二语习得者学术英语的词汇语块。语料选取年代可更久远些,可分20年为一个阶段。研究者可以对不同年代的语料进行历时的词汇语块对比研究。

[1]Biber,D.,S.Johansson,G.Leech,S.Conrad&E.Finegan. The Longman grammar of spoken and written English[M]. London:Longman,1999.

[2]Biber,D.,S.Conrad&V.Cortes.If you look at…:Lexical bundles in university teaching and textbooks[J].Applied Linguistics,2004,25,371~405.

[3]Biber,D&B.Gray,Challenging stereotypes about academic writing:Complexity,elaboration,explicitness[J].Journal of English for Academic Purposes,2010,9:2~20.

[4]Cortes,V.The purpose of this study is to:Connecting lexical bundles and moves in research article introduction[J]. Journal of English for Academic Purposes,2013,12:33~43.

[5]Dorland,S.,Dorland's Illustrated Medical Dictionary[M]. 32nd Edition,Elsevier.USA,2013.

[6]Gray,B&D.Biber,Lexical Frames in Academic Prose and Conversation[J].International Journal of Corpus Linguistics,2013.

[7]Marco,M.J.L.,Collocational frameworks in medical research papers:a genre-based study,English for Specific Purposes,2000,(19),63~86.

[8]McEnery T.,Xiao,R.&Tono,Y..Corpus-Based Language Studies[M].London:Routledge,2006.

[9]Turo,H..So ADJ/ADV that clause patterns in Early Modern English medical writing[J].Journal of Historical Pragmatics,2012,(2),313~335.

[10]Wray,A.and Perkins,M.R..The functions of formulaic language:An Integrated model[J].Language&Communication,2000,20(1),1~28.

[11]王晓鹰,章宜华.中山英汉汉英医学词典[M].北京:外语教学与研究出版社,2008.

G642

A

2095-4654(2014)08-0094-03

2014-04-18

江西中医药大学校级课题“语料库驱动的医学英语词块研究”(2012RW008);江西省社科规划课题青年项目“语料库驱动的医学英语词汇语块研究”(13YY21);江西省社科规划外国语言教学研究专项课题“基于ESP理论的医学英语课程体纱构建研究”(13WX209)的阶段性研究成果

猜你喜欢
语块语料库英文
《语料库翻译文体学》评介
英文摘要
英文摘要
英文摘要
英文摘要
基于COCA语料库的近义词辨析 ——以choose和select为例
基于JAVAEE的维吾尔中介语语料库开发与实现
英语语块在汉英翻译中的积极作用
从语块类型看英语专业大学生语块获取能力与听力理解能力的相关性研究
语块的性质及汉语语块系统的层级关系