英文医学论文引言结构与编写模板研究

2018-05-15 01:29雍文明
中国科技期刊研究 2018年4期
关键词:时态语料语料库

■雍文明

新乡医学院外语学院,河南省新乡市金穗大道601号 453003

论文的引言应能提供足够的信息,准确反映论文的研究内容,使编辑充分了解论文的学术价值,判断是否需要阅读论文的全部内容。如果引言写作不当,未能反映论文的创新性和科学性,那么编辑会对论文内容失去兴趣,不再阅读全文,进而影响科研成果的采纳推广。简练而精彩的文章引言对于一篇论文而言可谓是事半功倍[1]。Elsevier科技部中国区副总裁安诺杰指出“由于缺乏写论文的历史传统,许多来自中国的稿件在格式和语言方面都存在一定的问题,编辑弄不懂论文的学术主张与学术价值,导致大量论文被拒”[2]。张美慧[3]归纳了英文科技论文引言写作的4种常见问题:篇幅失当、文献引证失当、概括研究工作的目的及意义失当和英文表达失当。自Swales[4]提出CARS(Create a Research Space)模型以来,论文引言写作引起了国内外学者的广泛关注。然而,对CARS模型的研究主要侧重于宏观结构和语步(Move)的修辞功能。虽然国内外学者对学术文本的修辞研究日益深入,但是关于学术论文引言将具体的语步和语言使用特征相结合的研究还鲜有报道[5-8]。刘锋等[9]研究了农业科技期刊英文论文引言结构与内容特征及编写,认为引言宏观结构大都以“获取读者认同—吸引读者关注—引入论文主体”的方式推进,人际功能的完善则得益于引导式元话语和互动式元话语的结合。目前关于医学学术论文引言的语步结构和写作模块的研究还很少。计算机技术和语料库语言学的发展使研究大规模文本中隐含的语言特征成为可能。鉴于此,本研究旨在利用语料库数据驱动的方法,分析总结医学学术论文引言的体裁结构与语言模块,力求构建引言的语步结构模型和语言使用模块,为医学论文写作者提供参考启示,使科技期刊引言的编辑加工更加有章可循。

1 研究方法与研究设计

1.1 预制语块的定义和分类

Lewis[10]曾经指出,使用母语的人大脑中储存了成千上万的词块,他们自然知道哪些词语能够同现搭配,哪些词语不符合搭配条件。语言的流畅和精确主要是通过从大脑储存中搜索出记忆板块,将它们组合在一起而实现。这些记忆板块就是预制语块,也是本研究中的“模板”。Lewis将预制语块分为4类:(1)聚合词,即固定短语,例如for example;(2)习惯搭配,例如in case of,strongly believe;(3)惯用句型,例如What’s the population of ...;(4)句子框架和引语,例如This paper begins by....It will then go on to...。许多学者从认知角度研究预制语块,发现语言以组块的形式存入大脑,整体记忆。需要提取时,以整体形式产出,无须学习者临时构建,缩减了信息加工时间,提高了信息处理效率[11]。通过学习这些语块,学习者能够进行流利的二语输出,减少因语法重组、母语干扰、文化差异等因素造成的固化错误。目前,国外研究二语预制语块主要通过语法学方法、语料库语言学方法和心理语言学方法,这3种研究方法彼此互补[12]。本研究采用语料库语言学方法提取英文医学论文引言部分惯用句型、句子框架进行研究。

1.2 体裁分析法

医学研究型论文引言部分具有与其他学科的研究型论文不同的交际目的,主要是为了引起读者的兴趣,提供足够的信息以初步理解论文,因而有其特定的体裁结构。为探讨英文医学论文引言部分的体裁结构,笔者采用Swales的CARS模型ESP (English for Specific Purpose)体裁分析法(语步-步骤法)[13],建立本研究的语步模式(表1)。从语言学的角度分析文本形式和交际目的之间存在的内在关系,研究型论文的引言结构独特,高度约定俗成,因此,在构建语篇时,必须遵循这种特殊体裁的约定[14]。

表1 学术论文引言语步模式

注: 3A1和3A2必选其一。

1.3 研究方法

1.3.1 语料来源

遵循 Nwogu[15]提出的“代表性”“权威性”和“可获性”原则,笔者选取医学类国际权威期刊TheNewEnglandJournalofMedicine(NEJM)和TheLancet作为语料的来源期刊。为保证研究结果的客观性、准确性和说服力,通过随机抽样的方法选取论文引言部分,所选语料均来源于2016年1月至2017年6月发表的研究型论文,所选论文均可以免费获取,2种期刊各选取论文50篇,共计100篇论文。使用WordSmith Tools 4统计2个语料库的总体信息:形符数共43750条,类符数共5023条,标准化形符与类符的比值为40.20,平均每篇引言字数为437,每句字数为57。

1.3.2 语料加工

语料库的标注程度与检索价值有较大的关系。生语料库只能检索词汇层级,因而此类语料库的价值有较大的局限性。为了深入研究,使用CLAWS 7对语料库文本进行自动词性标注。CLAWS 7已经成为国际上大多数语料库采用的基本标注方法,准确率超过99%。

1.3.3 语料提取

无论是语料库的建设,还是语料库研究数据的处理,都需要对语料库进行加工与处理[16]。PowerGREP是一款基于正则表达式的文件处理与搜索软件。不仅具备检索功能,还具备数据编辑、替换以及数据采集等功能,其检索功能可以用于词汇搭配研究、类联接研究等;数据编辑、替换与采集功能可用于语料库的加工与处理[17]。使用语料库工具PowerGREP,通过编写语法正则表达式提取语料库文本。正则表达式是一种具有特殊属性的、可以实现高效查找和匹配的字符串,主要用于描述和匹配具有相同或相似属性的字符串,通常由普通字元(可称为常量)及一组具有特殊意义的字元(大多为变量)构成[18]。

采用梁茂成[18]教授提出的正则表达式与词性赋码语料库检索方法和正则表达式辅助编写工具PatternBuilder,检索分析研究所需要的语料。PatternBuilder是一款非常方便的词性赋码语料库检索工具,可以让用户便捷编写复杂的正则表达式。以一般现在时提取过程为例说明语料提取的方法,正则表达式代码参照CLAWS 7 Tagset词性赋码集。一般现在时由实意动词第三人称单数(S+_VVZs)、实意动词原形(S+_VV0s)、be动词am(S+_VBMs)、be动词is(S+_VBZs)、be动词are(S+_VBRs)、助动词does(S+_VDZs)、助动词do(S+_VD0s)所构成。将这些正则表达式组合在一起,检索研究所需的一般现在时语料,其他时态的检索方法相同。一般现在时语料检索正则表达式为S+_VVZs|S+_VV0s|S+_VBMs|S+_VBZs|S+_VBRs|S+_VDZs|S+_VD0s。

其他3种时态的正则表达式分别为:(1)一般过去时,如S+_VBDZs|S+_VBDRs|S+_VDDs|S+_VVDs;(2)现在完成时,如S+_VHw*s(S+_[RX]w+s)*S+_VwNs;(3)过去完成时,如S+_VHDs。

2 研究结果与分析

2.1 时态分析

检索2个语料库发现了5种时态,分别是一般现在时、现在完成时、一般过去时、一般将来时和过去完成时。各时态出现频次见表2,其中过去完成时出现频率极低:TheLancet出现3次,NEJM出现4次,并且都是出现在从句中,例如:(1)... individuals whohadreceivedIBCM counselling after ...;(2)... increasing among patients whohadmissedat least one appointment in the previous 12 months。本研究对过去完成时不作详细分析。

表2 The Lancet 和NEJM论文摘要的时态使用情况

一般将来时出现频率也很低,TheLancet出现8次,NEJM出现25次,用于撰写论文之后发生的动作、存在的状态或提出下一步的研究方向,并且未发现be going to形式,只有will一种形式表示一般将来时,例如:(1)... however, results from these studieswillnotbereportedfor several years; (2)... and subsequent decisions on financingwillbemadeby the Global Alliance for Vaccines and Immunization。本文也不作详细讨论。

从统计结果分析英文医学论文引言部分的时态,一般现在时、一般过去时和现在完成时在TheLancet中分别占66.10%、20.25%和12.68%;在NEJM中分别占58.87%、24.27%和14.58%。说明引言以一般现在时为主,同时作者可以根据具体表达内容需要,灵活选择一般过去时和现在完成时等不同的时态。

2.2 3个语步的高频语言模块

语步1为了表明需要关注的议题通常采用3个步骤:1A确立中心议题;1B概括主题内容,以一般现在时为主,所占比例为61.28%;1C回顾研究成果,主要总结前人在本研究领域的发现,解释对该研究的影响,属于必要成分,对过去文献中具体信息讨论时,用现在完成时,所占比例为24.36%,对具体研究回顾时用一般过去时,所占比例为14.36%。语步1中高频词汇、时态以及语言模板见表3,由表3可知,语步1的步骤1A、1B主要用来表示确立对该研究领域的兴趣和概括研究内容,语言使用非人称主语以一般现在时或现在完成时表达,较少使用从句。为了吸引读者的注意力,作者在步骤1C中经常使用一些修饰性副词,例如however、particularly、specially等。

表3 语步1中高频词汇、时态以及语言模板

语步2的功能是建立研究空间,其高频词汇、时态以及语言模板见表4。步骤2A指出研究差距,步骤2B补充已知,3种时态各有分布,但是以一般现在时为主,所占比例为68.54%,现在完成时占比24.12%,一般过去时占比7.44%。由表4可知,在逻辑关系方面,语步2最为显著的特征是反预期,提出与前人研究相反的观点。会使用一些让步的逻辑关联词;模糊限制语使用次数最多;使用带否定意义的动词和形容词模块表达研究空白,避免伤害前人学术社团的面子。在充分肯定前人研究的基础上再指出其不足,也使作者观点更容易得到认可和接纳。语步2是介绍研究论文的关键步骤。在语步2结束时,读者应该对于语步3会发生的事情有一个预期认识。

表4 语步2中高频词汇、时态以及语言模板

语步3的功能是填补研究空白,其高频词汇、时态以及语言模板见表5。步骤3A1和3A2列出研究目的和通报当前研究,使用一般现在时和一般过去时,所占比例分别为85.16%和14.84%,不使用现在完成时,并且句式固定,多使用不定式。步骤3B、3C、3E~3G中3种时态均有分布,以一般现在时为主,所占比例为79.84%,现在完成时和一般过去时很少使用,但是步骤3D概述研究方法中大量使用了一般过去时。由表5可知,语步3通常提及“本研究”,常见this、the present、reported、here等高频词汇。该部分作者也会从使用非人称主语转向人称主语we、I。语步3是作者研究的展示,因此凸显语使用较多,尤其多使用引述动词,例如report、suggest、show、find等,表明作者对所持观点有较大把握,引述动词有助于构建一个权威的研究者形象。将作者直接与这些命题建立联系,表明作者对于研究过程亲历亲为,对于研究结果也愿意承担责任。

表5 语步3中高频词汇、时态以及语言模板

2.3 高频动词使用情况分析

2.3.1 be动词的各种形式以及使用情况

检索2个语料库,统计语料库中各种动词的使用情况。由表6可知,英文医学论文引言中实意动词和be动词的使用频率最高,这2项占所有动词使用率的84.68%。由图1可知,be动词的各种形式中is、are、was、were占比为73.08%。is和are主要用于描述不受时间限制的客观存在的事实,或者写论文之时的感觉、状态、关系等。was和were用于作者对所做工作的描述,例如描述实验材料、方法和结果等。

2.3.2 实意动词的各种形式使用情况

通过对语料库中实意动词的进一步分析发现,转述动词report、show、identify、suggest占高频实意动词的28.57% (表7),其原因在于:(1)引言部分要客观、公正地描述前人的研究,以表明作者查阅过相关文献;(2)指出研究目的、内容、方法以及观点,为研究的展开创造空间。

表6 高频动词使用频数

图1 be动词使用情况

高频实意动词使用频数/次高频实意动词使用频数/次report105identify45associate81suggest40assess73compare39aim69find38result69investigate31improve64remain29show62understand23reduce56

这些转述动词常见使用模板如下:

这些转述动词主要有2种功能:一是表明作者的态度;二是不带有个人态度,仅描述研究相关内容。使用过程中结构固定:一是人称主语与转述动词和作者态度相结合;二是研究内容与转述动词和研究结果相结合。

其他高频动词都是和研究过程相关的动词,结构也非常固定,其出现频率非常高,也是科研人员必须掌握的。例如,be associated with出现66次,占associate所有形式的53.23%。aim to、aimed to、aims to、aiming to、aim is或was to结构共计56次,占aim 所有形式的81.16%;aim of结构共计13次,占aim所有形式的18.84%。

引言的要求非常高,一个好的引言相当于文章成功了一半。保持语步间鲜明的层次感和极强的逻辑性是紧密结合的,在符合逻辑性的基础上建立层层递进的关系,要求灵活掌握英语动词时态。

模块化写作方法中,写作内容被组织成一系列特定的模块。与书籍上以线性为导向的写作方法相比,这些离散的内容块可以在论文写作中重新排列、使用,模块化写作的优势就是快速重构。通过研究目标期刊来源文章的语言模式,了解杂志的语言风格,进而修改论文,提高论文被录用的比例。

3 结论与启示

采用基于语料库的专门用途英语体裁分析法,分析英文医学研究论文引言部分的体裁结构和语言表达。研究发现2个语料库引言部分的体裁结构模型与Swales的CARS模型一致;每个语步都有各自的功能并且通过固定的语言模板体现;各部分之间互相依存,紧密结合。在写作方面,建立引言的结构模型可以提高引言的写作质量与写作效率,写作的规律性更强。在编辑实践中,采用引言的结构模型,有针对性地修改引言的结构,可显著提高编辑的工作效率。由于所选语料较少,覆盖面不广,体裁结构的精确性还需要进一步探讨。后续研究可以进一步丰富语料,结合学术论文的其他部分对医学及其他学科英文论文的体裁结构进行分析,丰富写作模块研究。

[1] 贺萍. 英文科技论文中引言的撰写与编辑[J]. 中国科技期刊研究,2005,16(2):261-263.

[2] 王丹红. 学术欺诈案频发,学术期刊如何应对——专访Elsevier科技部中国区副总裁安诺杰[N]. 科学时报,2008-04-02(A02).

[3] 张美慧. 英文科技期刊引言写作的常见问题探析——《光电子快报(英文版)》审读稿件的实践[J]. 科技与出版,2016(2):68-71.

[4] Swales J. Genre analysis:English in academic and research settings[M]. Cambridge:Cambridge University Press,1990.

[5] 李晶洁,卫乃兴. 学术文本中短语序列的语篇行为[J]. 外语教学与研究,2013(2):200-213.

[6] 马广惠. 词块的界定、分类与识别[J]. 解放军外国语学院学报,2011,34(1):1-4.

[7] 徐昉. 中国学习者英语学术词块的使用及发展特征研究[J]. 中国外语,2012(4):51-56.

[8] 王丽,李清婷. 二语学习者学位论文引言中词块的结构、功能以及语步特征[J]. 解放军外国语学院学报,2014,37(4):32-39.

[9] 刘锋,张京鱼. 农业科技期刊英文论文引言结构与内容特征及写编建议[J]. 中国科技期刊研究,2017,28(12):1134-1140.

[10] Lewis M. Implementing the Lexical Approach:Putting theory into practice[M]. Hove:Language Teaching Publications,1997.

[11] 冯涛,沈刚. 预制语块与二语输出教学研究[J]. 中国教育学刊,2016(S1):19-21.

[12] 王立非,张大凤. 国外二语预制语块习得研究的方法进展与启示[J]. 外语与外语教学,2006(5):17-21.

[13] Swales J. Research genres:Exploration and applications[M]. Cambridge:Cambridge University Press,2004.

[14] 朱叶霜,喻纯,史元春. 基于语义的英文短语检索与搭配推荐及其在辅助ESL学术写作中的应用[J]. 计算机学报,2016,39(4):822-834.

[15] Nwogu K N. The medical research paper:Structure and functions[J].EnglishforSpecificPurposes,1997 (16):119-138.

[16] 许汉成. 基于语料库的军事术语抽取方法初探[J]. 外语研究,2017(5):43-46.

[17] 严华,王立非. PowerGREP与语料库加工[J]. 外语电化教学,2010(3):57-62.

[18] 梁茂成. 词性赋码语料库的检索与正则表达式的编写[J]. 中国外语教育,2009,2(2):65-73.

猜你喜欢
时态语料语料库
基于归一化点向互信息的低资源平行语料过滤方法*
超高清的完成时态即将到来 探讨8K超高清系统构建难点
平行语料库在翻译教学中的应用研究
《语料库翻译文体学》评介
《苗防备览》中的湘西语料
国内外语用学实证研究比较:语料类型与收集方法
语篇元功能的语料库支撑范式介入
现在进行时
易混时态辨析
异种语料融合方法: 基于统计的中文词法分析应用