吕桂,何安平
(1. 华南师范大学 外文学院,广东 广州 510631; 2.南方医科大学 外国语学院,广东 广州 510515)
专门用途英语词汇语义共选特色探究
吕桂1、2,何安平1
(1. 华南师范大学 外文学院,广东 广州 510631; 2.南方医科大学 外国语学院,广东 广州 510515)
本文以医学英语为例,参照语料库语言学的共选理论及研究方法、以关键词作为切入点来探究专门用途英语的词汇语义共选特色。研究基于对比自建百万词次医学英语语料库与英语国家语料库而生成的前500医学英语关键词,先后进行了关键词语义范畴分类以及各类关键词样品的语境共选词的语义偏好分析。结果发现关键词的显著性高频搭配词的语义分类与关键词自身的语义范畴分类高度重合;而且医学关键词的搭配词语义偏好与这些关键词在普通英语环境下的搭配语义偏好也有明显差异,由此凸显医学专业独特的词汇语义共选特色。以上发现虽然仅具倾向性,但对于专门用途英语的词汇教学和词典编纂仍有重要启示。
医学英语;关键词;语义共选;共选理论视角
本文采纳语料库语言学的共选理论及研究方法,以关键词作为切入点从语义共选的角度研究专业文本内的词汇语义关系。核心概念之一是共选理论视角下的语义共选关系。共选理论源自语料库语言学的两大发现:一是语言使用中有很多意义(如果不是绝大多数)都需靠一个以上的词组合起来才能实现,表现出语言意义单位的短语取向性(phrasal tendency);二是用词与词之间的共选模式来构建意义能够表现词语在语篇中更真实和更深层的意义,比以往的任何描述方式都更加强有力(Sinclair & Carter,2004:29)。这里的词语共选模式包括构建意义单位的多个层面,如词与词的共选(如词语搭配collocation)、词汇与语法的共选(如类联接colligation)、以及基于这两种共选所形成的在语义类别和语用功能等更高层面上的共选关系(如语义偏好semantic preference)和语义韵(semantic prosody)等(同上:34)。本文所聚焦的是语义共选模式,也即语义偏好。它关注核心词具有的“与一系列共享某种语义特征的词语的共选倾向”(Stubbs,2001:65)。例如,unemployment常和含 “统计”类语义的词搭配(Stubbs,1995:254),sheer通常搭配volume、size等表“容量”或“体积”语义的词,或和joy、terror、panic等表强烈情感的词一起使用(Partington,1998:34),large倾向于搭配表示 “数量和尺寸”的词(张继东、刘萍,2005),等等,均表现出词或词组在使用中有语义共选的倾向。
核心概念之二是专业关键词。以往对专门用途英语词汇的考察往往由专业人士凭借经验和直觉来收集和认定,而如今借助语料库检索软件(如WordSmith)(Scott,2010)可以快捷而客观地提取某一专业巨量语料的词频表和关键词表。语料库视角下的关键词(keyword)是指某一文本与参照语料相比较有着不同寻常的使用频率的那一部分词。基于语料库的关键词分析跨距扩展到整个语篇,Mason & Platt (2006) 将其称为“语篇搭配词(textual collocates)”。关键词表其实就是简化了的语篇,关键词表现出某些语篇、某种语篇类型以及知识范畴(如医学和自然科学)的特征(Stubbs,2008)。关键词表中的实词和虚词可称为文本的内容标识(aboutness indicators)和文体标识(stylistic indicators) (Scott & Tribble,2006:55);探索关键词内部以及关键词与其周边搭配词的各类关联(keyword linkage)可以揭示语篇的本质属性(同上,2006:28)。本文拟将关键词作为探究专业英语词汇语义共选的切入点。
国内外有不少学者的研究涉及专业文本内词汇(包括专业关键词)的语义特征。卫乃兴(2001)指出专业文本内的某一词汇和其它一些词汇如果以大于偶然的概率共现,可实现专业文本的概念意义(如报告实验、实验控制)和篇章意义(如评述或质疑以往研究、宣布研究内容)等。还有学者通过关注词语搭配分布来辨析专业英语同义词/近义词的不同意义特征(秦平新,2011)。Marco(2000)通过搭配框架来研究医学英语语义特征,表明搭配框架内吸收的搭配词明显带有医学论文这一体裁语言的语义特征。Nelson (2006) 对商务英语关键词语义偏好的研究在理论和实践上对本研究尤其有启发。Nelson(2006)将自建商务英语语料库和BNC Sampler语料库相比照生成了关键词表,并对前1000关键词进行直观辨识,将其分为5个语义范畴,然后从每个范畴各选取10个词(共50个关键词)作为样品来研究其语义偏好,最后归纳出这5类关键词倾向与10类具有明显语义偏好的搭配词共选,由此从词汇搭配的语义层面凸现了商务英语词汇更深层面的特征。
本研究从专门用途英语中的一种——医学英语(English for Medical Purposes,以下简称EMP)的关键词入手,借鉴上述Nelson(2006)的思路和方法,即将关键词视为核心词,通过调查关键词周边惯常搭配词的语义特征归类,寻找关键词在构建意义过程中与周边词语在语义上的共选关系,由此归纳由这些关键词带出的医学语域中独有的词汇使用特征。具体探究以下问题:
(1)医学英语的关键词具有哪些语义范畴?
(2)医学英语关键词具有哪些语义偏好特征?
(3)医学英语关键词语义偏好特征与相同词在普通英语语境中的语义偏好有何不同?
本研究的EMP语料库由笔者所在单位自建①,内容涵盖基础医学和临床医学,包括解剖、病理、生化、内科、外科、妇儿科、诊断学、神经精神病学等,均选自英美该学科名家专著、教材或知识性的医学英语读物;相当部分语料用于医学双语教学或医学英语课程教学。EMP总词量为972,530(形符),词形总数为28,369(类符);标准类符/形符比S-TTR为40.15。
首先使用Wordsmith 5.0软件生成EMP库词频表并和BNC词频表②作比照,生成医学英语关键词表,截取关键值(keyness)最高的前500词并且将其中or、of、the、in等虚词(即文体特征的标识类词)排除在本次研究范围之外;关键词表中的实义词率属于“直观上可以辨识的语义范畴(intuitively identifiable semantic fields)”(Stubbs,2008)。对这些关键实词,研究者及教学团队(包括语言专家和医学专家)对其语义范畴进行归类;对归类存在困难的词汇,则团队成员共同探讨,直到达成共识。第二步,从归类后的每个语义范畴中取10个关键值最高的关键词作为样品来做其语义偏好分析。具体操作参照Sinclair & Carter(2004)对短语意义单位构建的典型工作程序,对每个抽样关键词的语境共现行(数量从100行至500行不等)作词汇搭配和语义偏好分析。对关键词的搭配词范围跨距界定为-4/+4(即4L—4R);搭配词的显著性界定为至少出现5次及以上且T值达2.0或以上。对搭配词的语义偏好分析关注显著搭配词中的名词、动词、形容词等实词的语义归类。第三步是从样品词中再选出几个有代表性的例词,分析它们在普通英语语料库BNC中的语义偏好并与其EMP的偏好特征进行比照,从而探究医学英语环境和普通英语环境中同一词项的语义共选特征的异同。
本节首先展示医学环境下关键词的语义范畴分类结果;接着是每个范畴抽样关键词的语义偏好特征;最后是某些医学关键词的语义偏好与其在普通英语语境中的语义偏好的对比结果。
4.1 医学英语关键词的5种语义范畴
除去占43.3%的or、of、the、in等虚词外,关键词表中的实义词(占56.7%)按照语义大致归入5个范畴(见表1)。研究者咨询的多位资深医学专家均认为该语义分类客观展现了医学英语区别于其它专业范畴的语义内容特征;表明在医学文本中显著性高频出现的词汇其实在很大程度上隶属于数量有限的语义集群。
表1 医学英语关键词的5种语义范畴
(*百分数是各类词汇出现频次在500关键词出现总频次中所占的比例)
在5个语义范畴中从关键值最高的关键词开始提取,每个语义范畴提取10个样品词来做其语义偏好分析。个别关键值虽不是很高,但研究者根据经验判断,将有研究价值的关键词也纳入样品词(比如“医治”类的therapy因和treatment是近义词,故未入选,反而选取了关键值低于therapy的examination、drug等词 ),另外隶属于“活动”类的关键词相对较少故只入选7个,结果共计47个(见表2)。
表2 医学英语关键词的样品词(47个)
4.2 抽样关键词的语义偏好特征——个案分析
限于篇幅,本节仅列出 “人/人体类”和“描述类”这两个语义范畴的各10个关键词样品的搭配词语义趋向(见表3、4)。除却虚词外,这两类范畴关键词的出现频次在500关键词出现总频次中的比例位居第一和第二位,故具有代表性。表3和表4关键词各类语义搭配偏好下均呈现了一个典型的高频搭配词(T值在3.7—16.3之间)。
表3 人/人体类关键词的6项语义偏好特征
表4 描述类关键词的7项语义搭配偏好特征
就同一范畴内部的关键词语义偏好而言,我们发现 “人/人体类”范畴10个关键词的显著搭配词聚焦于6种语义偏好特征(表3); “描述类”10个关键词的显著搭配词聚焦于7种语义偏好特征(表4)。 “计量”类语义搭配偏好是指表数量、体积、水平等可精确“计量”的词汇。以associated为例(见图1),其索引行表明病况和各种精确量化的因素之间密切联系,这种搭配符合科学事实,体现了医学的严谨。
图1 associated的计量类搭配词
表3、4还表明关键词“描述”和“人/人体”两类范畴的语义偏好相同度为85.7%, “描述”类关键词的7项语义偏好中有6项和“人/人体”类关键词的搭配偏好相同,体现了医务环境下词汇语义搭配趋向于固定和有限。但是值得关注的是一些关键词虽和其他关键词共享某种语义偏好特征,但具体含义、范围、角度等存在差异。试举一例,patient的“描述” 类搭配词包括诸如年龄(如younger、older)、 性别(如female、male)、健康状况(如ill、healthy)等,而与hormone共选的“描述”搭配词仅表性质(如important),与medial共选的“描述”搭配词仅有表方位的lateral、posterior、superior三词。
对表3、4 “人/人体”和“描述”两类语义范畴关键词的分析表明各语义集彼此联系、共现和包孕。具体表现:1)两组各10个关键词各自通过部分甚至全部语义偏好的共享而实现语义集的共现和联系。2)关键词自身的5类语义范畴属性都可在“人/人体”、“描述类”关键词语义搭配偏好的特征属性中找到。3)两类关键词样品均存在互为搭配词的现象,例如“描述”病症轻重的词对mild和severe、severe和acute;又如cell和normal,等等。
4.3 语义偏好和医学英语——整体讨论
笔者从语义偏好视角对隶属于5个语义范畴的47个关键词的搭配行为进行观察和统计,发现以上对“人/人体”和“描述”两类语义范畴共20个关键词样品的语义偏好分析其实是整体发现的一个缩影,因为整体分析也得到了类似结果(见图2)。
图2 医学界47个关键词共享的6类语义偏好
图2椭圆内数字表示47个关键词中和该语义集相联系的关键词数量。它们表明47个关键词样品的搭配词绝大多数都可纳入“人/人体”、“描述”、“疾患”、“活动”、“医治”、“计量”等6类语义范畴;而这6类语义偏好分类与关键词自身的5种语义范畴分类重合率高达83%。约15个样品词和 “计量”类语义发生联系。除前述表3、表4隶属“人/人体”及“描述”的多个样品词和“计量”类词汇有联系外,还有属“活动”、“医治”范畴的关键词也都存在此种语义搭配偏好(如metabolicrate, theamountof drug等),体现了医学的严谨。为何研究者没有发现“计量”类的关键词范畴,可能是因为day、age、amount、number、time等类似词汇极为普通,在BNC语料中也高频出现,因而不成为医学英语中异乎寻常的高频词汇。另外和“阶段/过程”语义联系的关键词只有normal、severe、acute和occur等约4个,此种搭配词义可视为没有代表性,忽略不计。
图3 47个抽样关键词在真实文本中的语境共现相貌图
同时输入5个范畴的47个高频关键词于EMP,可获得它们在真实语境的近距离呈现相貌(图3),出现的抽样关键词涵盖了“人/人体”(patient,blood,fluid)、“描述”(common,severe,normal)、“疾患”(pain)、“活动”(cause,occur)、“医治”(treatment)这5种语义范畴。
总体而言,无论是同一语义范畴内的关键词之间、隶属于不同语义范畴的关键词之间、关键词和搭配词之间、以及搭配词和搭配词之间都呈现出彼此联系、共现和包孕的语义倾向。正是这些关键词及其搭配词生成相互关联、包孕并经常同现的语义群模式,组成了意义统帅的、相互联系的医学词汇世界。
诚然,以上所总结的语义搭配特征不能“绝对化”。第一,关键词的搭配词虽共享某些语义特征,但角度、具体含义和所占比率可能不同;所以即使一些关键词语义搭配关系总体趋向于相同,但搭配特征却存在隐性不同。第二,医学英语关键词与某些语义偏好相联系,但其搭配语义并非局限于此。一些典型搭配词很难进行语义归类,并且一些关键词还有大量非典型的搭配词,彰显出医学界部分关键词搭配的灵活性和开放性;归纳出的语义偏好通常占关键词所有语义搭配的一部分(见表5例举的5词)。关键词语义搭配偏好覆盖频率存在差异,可见其搭配潜力不同,如localized的搭配词隶属的语义范畴全部加起来比率高达92.4%,而normal重要的语义偏好所占比率仅为35.3%。
表5 语义偏好覆盖比率
4.4 医学关键词的语义偏好与其在普通语境的语义偏好对比结果
从47个医学关键词样品中选出occur、cause(动词)、normal、severe、treatment作对比分析。其中 occur, cause 和normal 同时也是日常用语中的高频词;而severe和treatment两词则有用于医学领域的倾向。同时这5词含有名、动、形三种词性。5词中或许除treatment外,并没有医学英语核心词汇;即便是treatment也存在多种含义,并不局限于医学界。将这5个词在BNC中的语义偏好分析结果与EMP的相比照,结果见表6(表中的数据因语料库库容不同,已作标准化处理)。
表6 EMP和BNC中5个单词语义搭配偏好(Semantic Preference,简称SP)比较
表6显示5个关键词在BNC中搭配的语域分散性和在EMP中的医学语域聚焦性形成了鲜明对照。它们在这两个不同语类的语料库中呈现的语义偏好有三点不同。
第一,EMP中各词的搭配词语义范畴较固定。表现为上述5词在EMP中的语义偏好覆盖率大于BNC(见表6),而这些词在BNC中的搭配词几乎是开放性的, 如我们在研究中发现normal、cause均有大量T值小于2的偶然搭配词项。
第二,EMP中各词的搭配趋向明显体现出语域色彩。如normal一词在EMP库中被吸引到语境里与之共现的词项均广泛应用于医学界;但在BNC随机抽取出的500索引行中, 我们并未发现明显的医学语域色彩,可能跟医学相关的搭配词项仅有patient、mucosa、health三词。
第三,虽然一些关键词在两个库中共享同一语义偏好,但其具体内容和所占份额却有不同。例如EMP中的severe与带有“疾患”含义的词搭配在一起占所有5类语义搭配的19.8%。而BNC中severe的“疾患”类搭配词仅占9.13%,不及前者的1/2。又如EMP库和treatment 共现的“描述类”搭配词中有一类评述性形容词用于对治疗进行描述、评价;这些形容词有84.8%带有积极含义(如vigorous、satisfactory),带有否定和中性意义的评述性形容词仅占2.5%和12.7%。现实中医学治疗不可能总是成功,这里高频呈现的积极类形容词似与语言使用中人们的心理特点有关,即一切治疗活动都旨在取得成功,所以倾向于将有效、充分、恰当的治疗视为必须的目标。但这种搭配词的语义特点并未从随机抽取的500例BNC语料中发现(见表7)。它再次表明语域对词汇的使用具有决定作用。
表7 EMP和BNC中与treatment搭配的评述性形容词比较
本文从词语共选多个层面中的语义共选、也即语义偏好这一层面切入,基于关键词对医学界的词汇语义搭配概貌进行调查,归纳出医学英语关键词的5类语义范畴以及这些关键词的6种语义搭配偏好特征;且6种语义偏好中的5种和关键词的5类语义范畴重合;这些均反映了医学界研究的关注重点,是语言对现实世界的直接体现;同时结论也彰显了关键词在专业英语学习中的重要性。与Nelson(2006)归纳的商务英语关键词的5类语义范畴以及关键词的10种语义搭配偏好结论对比,医学领域关键词语义搭配偏好更为集中,关键词自身的语义范畴属性和关键词语义搭配偏好的特征属性重合率更高(重合率分别是83% 和约50%),即医学领域语义集更为集中地复现。两个领域有独特的词汇语义共选特色,体现出各自的语域特征。在这一表层差异下我们却看到了医学英语和商务英语都围绕一些循环复现的语义集来呈现专业领域的文本内容特征。而且这两个研究都运用语料库语言学的频数驱动方法,通过关键词表检索以及对关键词进行语义偏好分析来揭示专业英语的词汇使用特色,比以往单纯通过主观判断来制定专业特色单词表的方式有所突破。它一方面体现了研究手段的科学化带动认识深化,另一方面对教学也有应用价值。
目前很多专业教科书基本都只有显示注音、词性、语义等表层词汇信息的简单词汇表,而本研究将单词研究拓展到了词语搭配研究(虽然仅聚焦词汇语义层面)。它表明透过词汇与其结伴词的语义共选,可以把握词汇的总体语义趋向以及具体的、不易察觉的语义搭配特点,从而为专业语言教学提供有价值的信息。 比如医学英语教材可标明医学界关键词是如何围绕有限的几个语义集来呈现专业知识,英语教学也可结合频数驱动的方法让学生了解医学关键词所吸引的典型搭配词具有怎样的语义特点,等等。
此外本研究500关键词和47个关键词样品中均有三分之一左右的词汇属于医学界的半技术词汇表(详见Wang,2008)。鉴于目前的医学英语词典多收录专业技术词汇而未涵盖那些在专业文献中频繁出现的居于技术词汇和普通词汇之间的半技术词汇,笔者认为专业英语词典编纂者有必要在词典中涵盖医学半技术词汇,同时应将词语共选模式包含的多个层面的内容体现在词典编纂的内容和形式中,为读者提供准确、充分的用法信息,如词与词的共选、词汇与语法的共选、在语用功能层面的共选以及本研究涉及的在语义类别上的共选关系(即语义偏好)。
本研究虽揭示了在医学英语读物及教材和专著中关键词的语义搭配倾向,但是此种倾向是否在更广泛的医学专业英语文本中也具普遍性?这还有待进一步考察。其中的一个途径便是建立库容量更大、包含不同体裁(比如论文、病例报告、药品说明书、医用广告等)的医学英语语料库;另一个途径是选择批量更大的关键词,以便对其语义偏好倾向在更大范围内进行考察,从而获得更具广泛意义的结论。而且用这种研究方法也可以对其他专门用途英语关键词的语义搭配偏好进行类似的细化研究。
注释:
①感谢南方医科大学外国语学院梁平教授课题团队无偿提供的医学英语语料。
②下载地址:http://www.lexically.net/downloads/v.../BNC_World.zip
[1] Marco, M. J. L. Collocational frameworks in medical research papers: A genre-based study[J].EnglishforSpecificPurposes,2000,(19): 63-86.
[2] Mason, O. & R. Platt. Embracing a new creed: lexical patterning and the encoding of ideology[J].CollegeLiterature, 2006,33( 2): 155-170.
[3] Nelson, M. Semantic associations in Business English: A corpus-based analysis[J].EnglishforSpecificPurposes,2006,(25): 217-234.
[4] Partington, A.PatternsandMeanings:UsingCorporaforEnglishLanguageResearchandTeaching[M]. Amsterdam: John Benjamins, 1998.
[5]Scott, M. & C. Tribble.TextualPatterns:KeywordandCorpusAnalysisinLanguageEducation[M]. Amsterdam: Benjamins, 2006.
[6]Scott, M. Word Smith Tools Version 5[J/OL].2010, http://www.lexically.net/wordsmith/version5/index.html. [2010-08-06].
[7] Sinclair, J. & R. Carter.TrusttheText:Language,CorpusandDiscourse[M].London: Routledge, 2004.
[8] Stubbs, M. Corpus evidence for norms of lexical collocation [A]. In G. Cook & B. Seidlhofer (eds.).PrincipleandPracticeinAppliedLinguistics:StudiesinHonorofH.G.Widdowson[C]. Oxford: Oxford University Press,1995. 245-256.
[9] Stubbs, M.WordsandPhrases:CorpusStudiesofLexicalSemantics[M]. Oxford: Blackwell, 2001.
[10] Stubbs, M. Three concepts of keywords[J/OL]. 2008, http://www.uni-trier.de/fileadmin/fb2/ANG/Linguistik/Stubbs/stubbs-2008-keywords.pdf.[2012-07-13]
[11] Wang, J(王京). Establishment of a Medical Academic Word List [J].EnglishforSpecificPurposes, 2008, (27): 442-458.
[12] 秦平新. 基于语料库的建筑专业英语词语搭配研究[J]. 山东外语教学,2011,(1):28-33.
[13] 卫乃兴. 专业性搭配初探——语料库语言学方法[J]. 解放军外国语学院学报,2001,(4):19-23.
[14] 张继东,刘萍. 基于语料库同义词辨析的一般方法[J]. 解放军外国语学院学报,2005,(6):49-52,96.
Semantic Co-selection among Words in English for Specific Purposes
LÜ Gui1、2,HE An-ping1
(1. School of Foreign Studies, South China Normal University, Guangzhou 510631, China; 2.School of Foreign Studies, Southern Medical University, Guangzhou 510515 , China)
The current study explores semantic co-selection among words in English for specific purposes from a perspective of co-selectiveness, focusing on semantic preference of key words in English for Medical purposes. A 500-key-word list in the medical environment was created by comparing a self-established English for Medical Purposes corpus with the British National Corpus(BNC). These 500 key words were subdivided into 5 meaning categories, and the semantic p
of the representative words from each category was investigated. The study presents word groups with semantic similarity which are found to regularly collocate with these representative key words in the medical environment. We also find words in the medical environment have semantic preferences unique to medical world, which are highly consistent with 5 meaning categories of key words. The research also notices that these preferences often represent strong tendencies for lexical relations, rather than a firmly fixed relationship. The research findings have implications for vocabulary teaching and dictionary compilation as well.
English for medical purposes;key words; semantic co-selection;a perspective of co-selectiveness
2013-01-10
本文是国家社科基金项目“‘短语理论’与语料库的‘教学加工’” (项目编号:09BYY067 ) 阶段性成果之一。
吕桂(1976-),女,汉族,四川西昌人,副教授,华南师范大学在读博士生。研究方向:语料库语言学及ESP。 何安平(1950-),女,汉族,广东广州人,教授,博导。研究方向:语料库语言学,英语教学。
H03
A
1002-2643(2014)01-0036-07