杨 元 媛
(商丘师范学院 外语学院,河南 商丘 476000)
EST语料库的关联标识分析
杨 元 媛
(商丘师范学院 外语学院,河南 商丘 476000)
“关联标识”是一种聚焦和凸显关键内容的话语组织标记。分析自建EST语料库中的关联标识,了解到在EST论文写作中,本族语作者最常用关联动词模式强调重要内容,其中最常用的为V clause型式,另外,1p pers pron V n/clause型式出现频次也较多。其次为名词模式中的MN v-link型式。对这些关联标识型式的关注,可以帮助科研工作者和学习者快速获取并恰当表达论文重要信息,促进EST领域的学术交流。
EST;语料库;关联标识;模式
EST (English for Science and Technology),即科技英语,是科学家和技术人员为国际交流的需要,在应用中逐渐形成的一种语言变体。EST这种独特的语体拥有准确、清晰、简明等特征,在国际学术交流中广泛使用。EST这样一种文体形式出现在全世界大部分的科技作品,包括期刊论文、官方出版物、技术报告、实验报告、技术标准和公开出版的专利产品介绍中。鉴于这种语言形式在科学交流中的重要地位,及对人们的生活和语言使用的影响,语言学家对于EST的语法结构和修辞格开展了研究和总结。
“关联标识”(Relevance marker)是引用自Hunston 的一个术语[1]198,它指言辞或视觉上明显标志出相对重要性或关联性的词汇语法手段,这种元话语手段具有明显标识出内容相对重要话语的特征。Bednareks将其称为“重要性参数”[2],Heino, Tervonen, & Tommola[3]128称它为“显著性标识”(Saliency marker)。
话语组织标记被广泛接受为提升语言理解度的重要手段[4][5][6][7],然而对于强调重要或关联信息的言语标识却研究甚少。Deroey & Taverniers认为,“关联标识”通过建立话语中语言点重要程度上的一个层级关系,起到组织话语的作用[8];Thompson & Hunston指出,关联标识提供话语的“重要性或关联性参数”,以呈现发话者的态度与评价[9]24。这些研究丰富了关联标识的定义。对关联标识研究产生重要推动作用的是Crawford Camiciottoli,其辨识出了小型商业学讲座语料库中起到“面向听众的关联标识”作用的12个词汇语法模式,包括关联形容词(如important)、元语言名词(如point)等[10]93[11]98。Deroey & Taverniers基于英国学术口语语料库,对英国课堂语言中的关联标识作了较系统的分析[12]。但是,对于学术论文中关联标识及其语法模式的研究尚未出现。
国内外开展ESP(English for Specific Purposes),即专门用途英语,需求分析的研究不少,如蔡基刚[13]、罗娜与陈春梅[14]、Abdelgawad Ahmed Alastal 等[15]。这些研究发现了学术英语技能方面的缺失,以及国内外对专门用途英语特别是学术英语学习和研究的迫切需求[16]。科技英语(EST)是整个外语教学,甚至专门用途英语或学术英语中最具有实践价值和实践意义的学科。相比目前流行的通用英语和热门的商务英语,它更应引起我国外语决策者的重视,因为它涉及我国高校各学科能否实现学术国际化,这是建设一流大学和学科的关键;涉及我国科学技术和经济发展的根本,涉及能否告别上一代科学工作者不能用英语阅读专业文献、写学术论文的尴尬局面[17]。
研究数据基于作者创建的英语国家EST论文语料库。自Elsevier Science(世界上公认的高品位学术出版公司,也是全球最大的出版商,已有100多年的历史。除了出版图书外,还是当今世界最大的学术期刊出版商,出版内容涉及生命科学、物理、医学、工程技术及社会科学)中的国际著名工程技术类期刊:“Computers & Electrical Engineering”, “International Journal of Engineering Science” 和 “International Journal of Mechanical Sciences”,下载了100篇英语本族语作者论文,主要涉及机械、电子工程等学科。这些论文经识别、整理后建成语料库,总库容529,668词[18]。语料库建成后,运用CLAWS软件自动附语法码,以有利于对语法模式的检索。
根据Swales & Burke[19]17、Crawford Camiciottoli[10]97和Giannoni[20]207的研究结果,在复现的词汇语法模式中,起到关联标识作用的词汇主要有四类,其研究同时给出了这四类词的列表,如形容词Basic, Critical, Essential, Interesting, Significant等;元语言名词Idea, Message, Point, Question, Bottom line等;动词及动词结构Remember, Stress, Be interested in, Bear in mind, Bring attention to等;副词Essentially, Importantly; Significantly等。在这些关联标识的词汇和语法模式提取中,人工摒弃了一些未对论文内容进行评价和强调的纯话语组织元素。
关联标识索引行中包含的相似元素和结构可以用固定的模式(Pattern)表达出来[21]20。根据主要元素,或者“聚焦点”[22]49的不同,可以分为形容词、名词、动词、副词模式。
编写正则表达式,应用语料库软件PowerGREP,对一些主要的关联标识模式进行提取、频数统计和分析,可以发现许多属于英文EST论文的独特词汇语法特征。
(一)形容词模式
形容词的关联标识模式中主要包含一个传递关联性的形容词,另外,一些表达个人评价和观点的形容词也被涵括在内,体现出涉及内容的重要性和人们对它的关注程度,如crucial[19]16,interesting[10]88[23]。
在PatternGrammar[21]的符号系统中,为呈现索引行的表层结构,某一Pattern的语法类别以大写字母的形式表示,如形容词模式:ADJ,动词模式:V;Pattern中的其他元素用小写字母表示,而其中包含的具体词用斜体。本文沿用这种表达方式。
形容词模式中所包含的形容词都用作表语(见表1):动词(v-link)将形容词和指示词(deic)、元语言名词(mn)、先行词it或what链接起来。在外置结构中,形容词出现在从句之前;在wh-分裂句中,它出现于名词(‘n’)或补语从句之前。
1.deic v-link ADJ
这种模式的基本结构为:具有回指作用的指示词this或that,接系动词,之后接形容词,对前文中的陈述作出评价。此模式出现频次较低,在EST语料库中共出现2个,都使用形容词important,且important前常有副词very修饰,如:
(1)Thisisveryimportantin order to reduce the average localization error, as we will explain in Section 7.1.3.
(2)Thisisimportantfor reducing the probability of unnecessary retransmissions, but it introduces extra delay and makes network resources under-utilized.
2.mn v-link ADJ
这种模式中的元语言名词对前文提到内容的相关性进行评价。此模式在EST语料库中仅有一例,说明这种包含形容词的评价模式很少被用来突出关键内容。
(3) This latterpointissignificant, since it will enable planning applications that require continuous monitoring, e.g., average annual daily travel.
与deic v-link ADJ类相同,元语言名词的涵盖关系使上下文更加衔接,但同时,读者也需要对此类信息进行更多的处理,以便推测所指的具体内容。
3.it v-link ADJ clause
这一模式主要包含一些评价性的形容词[24]92[23],用来强调一些突出的观点[25]209。这里主要使用的形容词有important和interesting,先行词it之后常跟that引导的主语从句,完整地呈现出论文要突出和强调的话语内容。此模式在语料库中出现23次,说明EST作者常用先行词it加系动词,再加形容词,后跟that引导的主语从句这一模式,阐述重要观点和内容。
(4)Itisimportanttonotethatthree aforementioned ion-selective electrodes were a part of the sensors array and thus, electronic tongue data included measurements with these three electrodes as well.
(5) However,itisinterestingtoseethatthere is a threshold in the signal strength, below which the Gaussian model is not valid anymore.
4.whatv-link ADJ v-link n/clause
一般情况下,wh-分裂句在语言表达中会起到强调的作用,但是在EST语料库中,wh-分裂句中出现起强调作用形容词的情形比较少见,仅出现一次。
(6)Whatisimportanttohighlighthereisthatneither the EO statistics nor the residual statistics computed from a large number of simulated, realistic networks can identify differences between the two AP sets in question under all circumstances where it is most critical to do so: object reconstruction.
表1 形容词模式及其出现频数(N=27)
(二)名词模式
在名词模式中,中心词是一个元语言名词(MN),其前可以出现起修饰作用的关联形容词。
此类相关标识大多具有前瞻性的特征,其中常见的元语言名词有idea, point, question和thing等(参见Crawford Camiciottoli[10]92[11]98; Swales[26])。
1.deic v-link MN 与deic v-link adj MN
名词模式deic v-link MN在语料库中出现4次,而在Deroey & Taverniers[8]中出现频次较高的deic v-link adj MN模式,在EST论文语料库中未见出现。
如deic v-link MN模式的范例:
(6)Thisistruebecause the path is unique and the property of the FIFO channel ensures that a confirmation message will never surpass the late message.
(7)Thisisnecessarywhen a message arrives and confirmation messages are required for it may happen that a new message arrives, which by being kept in the buffer, is confirmed along with the one that arrived previously.
2.MN v-link
这种模式是名词性关联标识中最常见的一种,在语料库中出现29次。作者在论文中常重复性地使用这种关联标识模式。此种模式包含下列几种情形:元语言名词未被修饰的,较为常见的情形(ca.62.1%)(例8),元语言名词后紧跟起修饰作用的介词短语(ca.24.1%)(例9),元语言名词后紧跟起修饰作用的关系从句(ca.13.8%)(例10)。
(8) In SLAM theideaisto generate a model of the environment via sensor inputs acquired by a mobile robot.
(9) Thusthepointofsampleacquisitioniskey to successfully monitoring of pollutant fate.
(10)Onequestionthatwasnotstudiedherewashow to pick the number of targets in the model for all our simulations we simply used.
Deroey & Taverniers[8]中,课堂语言里常用的adj MN v-link,there v-link MN 和there v-link adj MN模式,在EST论文语料库中没有对应的范例。这说明,以上三种包含元语言名词的关联模式在正式的书面语中基本不出现,即学术论文中基本不采用这些模式来突出关键内容。
表2 名词模式及其范例与频数(N=33)
(三)动词模式
动词模式(见表3)中常含有以第一人称代词为主语或无主语的心理或交际动词,这些句子多为祈使句,在结构上多包含不定式形式。
1.1s pers pron V n/clause
1s pers pron V n/clause模式标示出作者本人对某一具体内容的评价,将第一人称单数代词I与动词(如emphasize)等结合起来。动词emphasize之前常出现表示意图的情态动词would,或表示意愿的结构would like to。这一模式在EST写作中出现概率较少,语料库中仅出现3次。
(11)Iwouldemphasizethatthis formulation, if required, solves the joint problem of concurrent fusion, tracking, navigation, and detection, along with association among data and sensors.
(12) Yet,Iwouldliketoemphasizeanother aspect of the problem: often mathematical theories of the mind where proposed before the necessary physical intuition of how the mind works was developed .
2.1p pers pron V n/clause
这种模式中,第一人称复数代词we与心理动词结合在一起使用,产生一种论文作者集体认知的效果,将读者和论文的内容紧密联系起来。这一模式在语料库中使用较为频繁,出现65次。
含有动词模式关联标识的句子,以第一人称复数代词we开头的频数远远多于以第一人称单数代词I开头的频数。这说明,在EST语料库中,作者常以复数人称代词为主语,强调关键内容。
(13) However,wewouldliketoemphasizethatthe surface reconstruction methods, illustrated in this paper are still effective irrespective of the type and number of sensors deployed in the data acquisition system.
(14)Weareinterestedinexaminingwhetheradding conjugation to such known boronic acid fluorescent reporters would result in more favorable spectroscopic properties in terms of wavelength and magnitude of fluorescence property changes.
3.V clause
含有这种模式的句子具有一定的祈使意味。一般的,这种模式中存在一个心理动词,动词之后为补语从句。在所有的关联标识模式中,此模式出现频次最高,频数为349。说明这一动词模式在EST论文中使用非常频繁,被作者用来强调要突出的重要信息。此类结构较为复杂复合句的大量运用,也体现出科技论文的文体特征。
这种模式中最常出现的动词为remember,remember之后常紧跟补语从句,提醒读者再次关注之前提到的信息,使得这“重新激活”的信息在给读者留下更加清晰深刻的印象。
(15)Itisimportanttorememberthatthere is no a priori association among data from different sensors; although n always stands for ns, these are independent indexes and no association among sensors is assumed.
(16) Perhaps,itismoreimportanttorememberthatthe contextual detection methods and the Dynamic Detection Model are based on mutually independent information.
除remember之外,动词note也常见于此模式中,大多数情况下用于引起读者对于某种具体方法的关注。
(17)Itshouldbenotedthatmethods like JPDA involve track maintenance but not track initialization.
Deroey & Taverniers(2012)中,课堂语言里另一些常见的动词模式,如2 pers pron V n/clause,即以第二人称代词做主语的祈使句;1s pers pron v clause + 2 pers pron V n/clause,第一和第二人称代词结合使用的祈使句,如:I want you to notice...;TO-INF n/clause,以及动词不定式结构后接从句表示强调等,在EST论文语料库中均没有出现。这也体现出学术论文区别于课堂话语的独特语体特征。
表3 动词模式及其范例与频数(N=417)
(四) 副词模式
副词模式(见表4)中包含一个传达某项内容重要意义的副词短语。起关联标识作用的副词主要有importantly,significantly和essentially,且常出现在句首。副词关联标识在语料库中共出现20次。
(18)Importantlywe note that the mobility threshold M.T = 0 was included in the simulations to test the effectiveness of such an extreme setting.
(19)Essentially, any behaviour or physiological component reflected in an external movement, no matter how small, can be measured and recorded.
常见的关联副词之前一般有程度副词most修饰,体现出重要程度的加强。
(20) Mostimportantly, the approach is not subject to combinatorial complexity during data association.
(21) Mostsignificantly, these techniques are not in situ methods of analysis, and require environmental and patient sample collection to be performed separately and independently from laboratory-executed identification, detection and analysis.
此外,一些不提示关键内容的副词形式被排除在关联标识之外。如,当significantly修饰形容词,表示数据上的差异时:
(22) The region to the right of the vertical dashed lines for left side and right side anomaly measure curves in the top plate on left column of Fig.10 can be considered to be the boundary of the crack initiation and crack propagation phases, where the growth of anomaly measure issignificantlyfaster than that in the crack initiation phase.
另外,当significantly提示产品性能改变的程度时:
(23) The results clearly show that the algorithm was able to automatically identify trackable objects (targets) in the presence of clutter, and that sensor fusion resulted in tracking and localization performance that improvedsignificantlywith an increase in the size of the UAV swarm.
表4 副词模式及其范例与频数(N=20)
综合以上各种关联标识模式,依据其分布特征和频数,可以得到如下结果:动词、名词、 形容词和副词关联标识模式中,动词模式出现频数为417次,副词模式出现频数为20次,名词(33次)和形容词(27次)模式介于其间。
图1 动词、名词、形容词、副词关联标识QQ图
如图1所示,动词模式关联标识出现频数最高,远高于名词、形容词和副词模式的频数,而副词模式出现频数最低。动词、名词、形容词和副词模式频数形成非正态分布。
而在动词关联模式中,最常出现的为V clause类型(349次),其次为1p pers pron V n/clause类型(65次),名词模式中的MN v-link类型(29次)与形容词模式中的it v-link ADJ clause类型(23次)居于其后,接下来为副词模式(20次)。deic v-link MN,1s pers pron V n/clause,deic v-link ADJ,mn v-link ADJ,what v-link ADJ v-link n/clause类型出现频数很低,为4次及4次以下。
图2 各类关联标识模式的箱线图
如图2所示,V clause模式被归为异常值,说明这种模式出现频数远远多于其他模式的频数,在提示论文关键内容上起着非常突出的作用。中位数值较低,下边缘线与下四分位数重合,说明有较多关联模式的出现频数较低,这更突出了其他频数较高关联模式在展示论文重要内容中的意义和作用。
对于科研工作者来讲,快速把握英语EST论文中传递的思想和强调的重点内容,并能够用恰当的形式展示所写论文的主要内容,突出关键信息,是一件很有意义的事情。然而,传统的ESP研究未能从词汇语法的角度,对句子中的许多关联标识加以列举,仅使用一些不是从语料库中选取的范例,或者关注于一些看似典型,但实际并不常见的关联标识,如the important point is。本研究表明,在实际应用中,关联标识涵盖的范围相当宽泛,而其中最常见的类型,如V clause、1p pers pron V n/clause、MN v-link等类型是我们一般情况下凭借直觉想象不到的。研究可以帮助科研工作者和学习者识别各种真实常用且富于变化的关联标识形式,引导他们去关注那些在EST论文写作中频繁出现、功能多样的关联标识,了解这些广为接受的语言偏好,以快速把握论文的关键信息,促进在这一领域里的有效交际。
[1]Hunston, S.Evaluation and organization in a sample of written academic discourse.[A].In M.Coulthard (eds.)AdvancesinWrittenTextAnalysis[C].London: Routledge, 1994.
[2]Bednarek, M."An increasingly familiar tragedy": evaluative collocation and conflation [J].FunctionsofLanguage, 2008, 15(1).
[3]Heino, (A), Tervonen, E.and Tommola, J.Metadiscourse in academic conference presentations [A].In E.Ventola, (C) Shalom and S.Thompson (eds.)Thelanguageofconferencing[C].Bern: Peter Lang, 2002.
[4]Allison, D.and Tauroza, S.The effect of discourse organisation on lecture comprehension [J].EnglishforSpecificPurposes, 1995,14(2).
[5]Björkman, B.The pragmatics of English as a lingua franca in the international university: Introduction [J].JournalofPragmatics, 2011, 43(4).
[6]Jung, E.H.The role of discourse signaling cues in second language listening comprehension [J].TheModernLanguageJournal, 2003, 87(4).
[7]Titsworth, B.S.and Kiewra, K.A.Spoken organizational lecture cues and student notetaking as facilitators of student learning [J].ContemporaryEducationalPsychology, 2004, 29(4).
[9]Thompson, G.and Hunston, S.Evaluation: An introduction [A].In S.Hunston and G.Thompson (eds.)Evaluationintext:Authorialstanceandtheconstructionofdiscourse[C].Oxford: Oxford University Press, 2000.
[10]Crawford Camiciottoli, B.Audience-oriented relevance markers in business studies lectures [A].In G.Del Lungo Camiciotti & E.Tognini Bonelli (eds.)Academicdiscourse:Newinsightsintoevaluation[C].Bern: Peter Lang, 2004.
[11]Crawford Camiciottoli, B.Thelanguageofbusinessstudieslectures[M].Amsterdam: John Benjamins, 2007.
[12]Deroey, K.L.B.and Taverniers, M.Just remember this: Lexicogrammatical relevance markers in lectures [J].EnglishforSpecificPurposes, 2012, 31(4).
[13]蔡基刚.“学术英语”课程需求分析和教学方法研究[J].外语教学与实践, 2012(2).
[14]罗娜,陈春梅.理工科硕士研究生学术英语需求分析[J].当代外语研究, 2012(5).
[15]Abdelgawad Ahmed Alastal and Munir Shuib, Investigating the academic English language target needs of undergraduates at the Faculty of applied science at Al-Aqsa University: Students’ Perceptions [J].TheAsianESPJournal, 2012.
[16]蔡基刚,陈宁阳.高等教育国际化背景下的专门用途英语需求分析[J].外语电化教学, 2013(5).
[17]蔡基刚.国际科学英语和中国科技英语学科地位研究[J].浙江大学学报(人文社会科学版), 2016 (3).
[18]杨元媛.基于语料库的科技英语论文四词词簇特点研究[J].外语教学理论与实践, 2013(4).
[19]Swales, J.M.and Burke, (A) "It's really fascinating work": Differences in evaluative adjectives across academic registers [A].In P.Leistyna and (C) F.Meyer (eds.)Corpusanalysis:Languagestructureandlanguageuse[C].Amsterdam: Rodopi, 2003.
[20]Giannoni, D.S.Mappingacademicvaluesinthedisciplines:Acorpus-basedapproach[M].Bern: Peter Lang, 2010.
[21]Hunston, S.and Francis, G.Patterngrammar:Acorpus-drivenapproachtothelexicalgrammarofEnglish[M].Amsterdam: John Benjamins, 2000.
[22]Hunston, S.and Francis, G.Verbs observed: A corpus-driven pedagogic grammar [J].AppliedLinguistics, 1998, 19(1).
[23]Peacock, M.A comparative study of introductory it in research articles across eight disciplines [J].InternationalJournalofCorpusLinguistics, 2011, 16(1).
[24]Hunston, S.and Sinclair, J.A local grammar of evaluation [A].In S.Hunston and G.Thompson (eds.)Evaluationintext:Authorialstanceandtheconstructionofdiscourse[C].Oxford: Oxford University Press, 2000.
[25]Hewings, A.and Hewings, M.Anticipatory 'it' in academic writing: An indicator of disciplinary difference and developing disciplinary knowledge [A].In M.Hewings (eds.)AcademicwritingincontextPapersinhonourofTonyDudley-Evans[C].Birmingham: The University of Birmingham, 2001.
[26]Swales, J.M.Metatalk in American academic talk: The cases of point and thing [J].JournalofEnglishLinguistics, 2001, 29(1).
【责任编辑:郭德民】
2017-03-05
河南省教育厅人文社会科学研究项目“基于TED演讲语料库的关联标识分析与混合式学习GUI构建”(编号:2016-gh-141)。
杨元媛(1978—),女,河南商丘人,讲师、硕士,主要从事语料库语言学与应用语言学研究。
H05
A
1672-3600(2017)07-0103-06