主题词分析及其在商务话语研究中的应用

2015-10-22 06:16:44胡春雨
广东外语外贸大学学报 2015年3期
关键词:信函主题词语料库

胡春雨

(广东外语外贸大学 国际商务英语学院,广州 510420)

一、引言

在当代语言学中,主题词 (keywords)是一个较为模糊的概念,人们往往以隐喻的方式来理解它。意大利语言学家Marina Bondi认为,“语言中的词各司其职,其地位都是平等的,但在具体文本中,每个词的地位却又各不相同。文本中的所有词都促成意义建构,但只有部分词称得上主题词,即那些在文本中起着特殊作用的词”(Bondi,2010:1)。在语料库语言学中,只有那些通过“观察语料库”(observed corpus)与“参照语料库”(reference corpus)进行对比,使用频率达到统计显著性的词才叫主题词 (Scott&Tribble,2006)。需要指明的是,语料库语言学研究中的主题词不同于“文化关键词”(Williams,1976),甚至不一定是影响文本主体思想的实义词,因为这些主题词主要靠频数对比提取。

主题词分析是语料库语言学的核心技术之一,也常常是调查专用语料库的出发点。就商务英语研究而言,主题词分析具有两大功能:帮助研究者界定商务英语词汇并在此基础上更好地开展商务英语词汇的分类研究;帮助研究者找出话语轨迹,挖掘出商务语篇中隐藏的商务知识及体裁 (genre)特征,进而更好地理解商务话语及商务交际的本质。鉴于我们已经探讨过主题词在商务英语词汇研究中的作用 (胡春雨,2011),本文将重点探讨主题词分析在商务话语研究中的应用,并指出开展此类研究时应注意的问题。

二、主题词分析技术

主题词的语料库提取一般遵循以下几个步骤。首先,根据研究目的,建立“观察语料库” (或“观察文本”),并选择合适的“参照语料库”。参照语料库一般为通用语料库,其规模通常大于观察语料库。其次,使用语料库软件生成两个分别基于观察语料库和参照语料库的词表。由于同一个单词可能具有多种形式,研究者需要考虑使用语料库的词形还原 (lemmatization)功能,将语料库中词汇的屈折形式进行归并。譬如,把rise,rises,rose,risen,rising都归并到RISE中。第三代语料库分析工具 (如 AntConc,WordSmith Tools等)内嵌了词形还原程序,但需要用户提供一个用于词形还原的词表;第四代语料库检索工具 (如Sketch Engine)不但内嵌词形还原程序,还提供用于词形还原的词表,研究者只需根据自己的研究需求选择Word或Lemma即可。最后,通过对比观察语料库和参照语料库中词语各自的频数及两个语料库各自的规模 (参照表1),就可以把差异显著的词语提取出来。

表1 生成主题词表所依赖的四组数据

差异的显著性通过卡方 (chi-square或X2)检验或对数似然比 (Log-likelihood ratio,简称LL)检验来确定。X2(或LL)值越高,主题性越强。有时候,我们只需报道X2(或LL)值对应的显著水平的p值即可:p值越低,显著性水平越高,判断该词是主题词的把握就越大。

图1 商务电邮中的主题词

图1是以Nelson(2000)所建百万词的BEC(Business English Corpus)子库BEC_emails为观察语料库,以一亿词的BNC(British National Corpus)为参照语料库,所得到的商务电邮主题词截图。其中,第3纵行的Freq.指主题词在观察语料库中的频数,第4纵行的%指主题词频数在观察语料库所有词中的百分比,第5纵行的RC Freq.指主题词在参照语料库中的频数,第6纵行的RC.%指主题词频数在参照语料库所有词中的百分比①。不难看出,在商务电邮中,除了使用一般电子邮件的常用词 (dear,yours,sincerely,please等)外,还较多使用和商务相关的词(companyname,registered,FAX,TEL,chamber,invoice等)以及帮助构建企业和客户关系的第一人称代词复数 (our,we)。

主题词分析技术也被用来提取核心主题词表。核心主题词 (key keywords)是指那些在多篇相关主题文本中以主题词形式出现的词。该词出现的语篇数越多,关键性越强。图2是笔者以BEC为观察语料库,以BNC为参照语料库,所得到的商务英语核心主题词的截图。其中,排在第一位的#代表语料库中的数字。在构成商务英语语料库的28个文本中,主题词business出现的篇数要明显高于其他主题词,说明它与整个语料库的主题有着更密切的联系,因此是BEC的核心主题词。观察图2中的核心主题词不难发现,除了business,company,customer,product等典型的商务类词汇外,还有一些代词 (如we,our,you)、情态动词 (如will)等能体现商务话语语体特征的词。进一步的研究则需要深入到每一类商务文本中,从而发现最能体现该类商务文本体裁特征的核心主题词。

图2 商务英语中的核心主题词及其联想词

联想词 (associates)是指和核心主题词同现在多篇文本中的主题词。比如business的联想词包括product,sales,financial,companies,#,customers,customer,company;company的联想词包括 our,financial,companies,product,customers,#,sales,business;而另一个核心主题词market的联想词则包括 share,customers,sales,businesses,business,company,financial等。通过主题词、核心主题词及联想词,可以观察分析商务英语词汇群在商务话语中的功能。

三、主题词分析技术与商务话语研究

商务话语是商业机构开展商务活动所产生的口头或书面语的总称 (Bargiela-Chiappini,et al,2013:3)。商务话语研究受到会话分析、批评话语分析、语用学、人种志、体裁理论、组织行为学、系统功能语言学、认知语言学、语料库语言学等诸多学科的影响,具有典型的跨学科特征。语料库语言学的三大核心技术 (词表分析、主题词分析、索引分析)可以帮助研究者从不同侧面挖掘商务话语中蕴藏的语言信息及商务信息。限于篇幅,本文只从众多的研究案例中选择三个,重点介绍主题词技术在商务话语研究中的作用。

1.主题词分析在公司使命陈述研究中的应用

公司使命陈述 (corporate mission statement)是企业的“理想自我”(ideal self),是企业品牌形象的内部和外部投射。使命陈述型文本常常采用这样的标题:“Our Mission”、“Our Vision”、“Message from the CEO”、“The essence of our company”、“Strategy”等。尽管不同公司的使命陈述存在不同,但因为它们共享相同的交际目的而被视作同一体裁。这些交际目的中最为重要的是:对企业内外的利益相关者(stakeholders)传递企业的抱负、核心价值 (Fox&Fox,2004:31)。实现这一交际目的的决定性参数 (defining parameter)通常包括:最高级词汇 (如“the best customer experience”),absolute quantifiers(“each,”“everywhere”),第一人称复数“we”和道义情态(“it has been necessary to do so”)(Fox& Fox,2004;Swales& Rogers,1995)。公司使命陈述的体裁特性决定了主题词分析是研究该类文本的良好切入点。

Koller(2009:51-52)从财富500强 (Fortune Global 500)网站中收集2003年的前50强和后50强公司的使命陈述,建立起一个29925词的小型语料库。她把所建语料库上传到语料库工具Wmatrix平台后,选择BNC样本作为参照语料库,生成2012个主题词。过滤掉公司名称等专有名词,最能代表公司核心概念的前15个词是:innovation,respect,excellence,integrity,performance,trust,teamwork,responsibility,growth,committed/commitments,creativity,competitive,transparency,professionalism,fairness。进一步的研究表明,这些主题词往往用来进行积极评价,如:

(1)We will invest in those businesses that promise the greatest value growth.(Continental AG)

(2)The exceptional quality of our workforce is a valuable competitive edge.(Mobil)

企业决策者经常使用BRANDS ARE LIVING ORGANISMS/PEOPLE这样的隐喻模式。这些词代表公司话语中居主导地位的价值,因此也是公司品牌人性化 (personality)的特征。

2.主题词分析在商务信函研究中的应用

商务信函是另一类较为常见的商务文本。主题词分析对商务信函中作者-读者关系的把握方面很重要。主题词分析和体裁分析的联合使用,提供了理解职业语境下语言使用特征的强有力的工具。Scott&Tribble(2006:109-129)通过使用小型商务信函语料库,探讨主题词分析和语步分析的结合,这种分析法可以有力地帮助研究者理解语言在专业背景下的使用状况。他们首先对商务信函文本 (信件和传真)进行体裁分析,辨认出读者和写者之间的关系。这种关系可以用以亲近 (close)与疏远 (distant)为横轴、内部 (internal)与外部 (external)为纵轴的坐标系来表达。不同的商务信函文本根据其写者/读者的关系而分别被标注为“内部-亲近”、“内部-疏远”、“外部-亲近”、“外部-疏远”,并被归入坐标轴四个不同的象限中,如图3所示:

图3 商务信函的分类 (Scott&Tribble,2006:111)

其次,生成商务信函的主题词表。考虑到主题词hope的主题性较高且该词在构建写者/读者之间亲近远疏关系中的特殊地位,Scott&Tribble对hope在不同类别信函中的用法进行了更为深入的探讨。图4展示的是写给关系较为疏远的读者的一封信 (其标签为EXT-DIST),其交际目的是‘拒绝’。信函的主体部分 (body)分为三个语步:语步1是对语境的陈述 (statement of context),语步2是‘拒绝’(rejection),语步3则是‘交流渠道的保持’ (channel maintainer)。不难看出,hope后的补语从句是带有关系词that的:

图4 “外部-疏远”类信函示例 (Scott&Tribble 2006:113)

图5展示的是写给关系较为亲近读者的一封信函 (其标签为EXT-CLOSE),其交际目的尽管是也‘拒绝’,但hope之后并不使用that。

图5 “外部-亲近”类信函示例 (Scott&Tribble 2006:114)

总之,Scott和Tribble的研究表明:无论信函属于哪种类型,主题词hope都会出现在交流渠道的保持语步中;关系疏远时,使用带有that的补语从句以保持和读者之间的距离;关系较为亲近时,使用省略that的补语从句会让相关的商务人士感到舒适。

3.主题词分析在口头商务话语研究中的应用

口头商务话语语料较之于企业使命陈述、商务信函等书面语料的收集要困难得多,因而此类研究的数量也要少得多,且主要集中在对商务会议语言的研究中。商务会议是企业的命脉,是企业得以存续的重要交流方式 (Bargiela-Chiappini&Harris,1997:6)。商务会议的研究在过去的很多年内主要从管理学的视角切入,近年来也逐步出现了语言转向 (Clarke,et al,2012),学者们从跨文化交际、英语作为商务通用语、商务会议的语用特征和语用策略等多种视角开展了丰富多彩的研究。从语料库语言学的视角切入的商务会议研究当首推英国诺丁汉大学的语言学及应用语言学团队②,主要成员包括 McCarthy,Carter,O'Keeffe,Handford等。该团队建立了百万词的“剑桥与诺丁汉商务英语语料库 (Cambridge and Nottingham Corpus of Business English,CANBEC③),开展了一系列卓有成就的研究 (Mc-Carthy& Handford,2004;O'Keeffe,et al,2007),并最终出版了专著The Language of Business Meetings(Handford,2010)。下文将择其要对该团队的研究给以介绍。

为了对比商务口语和学术口语、日常会话的区别,O'Keeffe,et al(2007)分别提取了三类语料库的主题词。表2是CANBEC和ACAD(学术口语语料库)的前50主题词对比。

O'Keeffe,et al(2007:209)注意到CANBEC中的主题词有以下特征:

1)在CANBEC的前50个主题词中,第一人称复数代词 (如we/us/our)非常凸显,而第一人称单数代词I和第二人称代词you都没有出现在CANBEC的前50个主题词中。第一和第二人称代词在ACAD中都不是主题词。

2)Need在CANBEC的主题词表中排名第9,它却不是ACAD的主题词。

表2 商务口语与学术口语中的前50个主题词(O'Keeffe,et al,2007:209)

3)CANBEC中有很多和商务相关的 (business-oriented)主题词 (如 custom(s),sales,product(s),order(s),market(s/ing),company,stock等)。

4)CANBEC的前50个主题词中包含so和problem,这两个词没有出现在ACAD中。

O'Keeffe,et al(2007:210)把主题词表看作一个快照(snapshot),研究者不但可以从中发现与领域相关的词汇(如 prices,customs,meetings,paperwork,examples,facts,interpretations等),还可以发现不同领域文本在功能词使用中的倾向性 (如第一人称代词we,us,our、情态动词need等)④。他们认为,来自CANBEC的主题词以及它们所在的语境可以展示口头商务话语的三个特征:1)分享日常口语交际的特征;2)分享机构话语的一些特征;3)具有日常会话和学术话语不具备的特征,这种特征体现的是一种特殊的语域 (register)或体裁,该体裁可通过观察参与人士的关系、认同感及企业文化的创造来描述。

O'Keeffe,et al(2007:215)发现,主题词problem(s)在CANBEC中的频率是其在另外两个语料库ACAD和CONV(日常会话语料库)中的4倍。他们认为,该词在CANBEC中的高频,源于商务会议话语的固有特质,即:商务会议召开的主要目的是探讨并解决存在的问题。问题必须被评估并按重要性排序,这一点也可以从CANBEC中反复出现的语块 (如the main problem,the other problem,a big problem,the biggest problem,the only problem)中得以体现。在评估和探讨问题的解决之道时,与会者往往可以使用玩笑、故事、习语、隐喻等多种方式。O'Keeffe,et al借用以下会话,来分析习语和隐喻在商业人士看待问题时的态度:

[以下商业会谈的主要参与者为S1(一家IT公司的销售人员)和S2(潜在客户),他们在讨论计算机服务器问题]

S1:Erm as you know with application problems you just it it's+

S2:Yeah.

S1:+it's it's

S2:It's a nightmare.

S1:Yeah.[sighs]

S2:Sometimes the experts don't know.

[laughter]

S1:Yeah exactly.But it can be a real+

S2:Okay.

S1:+er can of worms.So.[inhales]

...[6 mins]

S2:+then if there is a problem and it's irretrievable they lose a day's transactions.

S3:Yeah.

S1:Yeah.Yeah.Which you can't+

S2:And that's a nightmare.

S1:Yeah.

...[20 mins]

S2:But we don't get the hosting+

S1:Mm.

S2:+on this particular customer because they we weren't offering a credible twenty four by seven+

S1:Yeah.Yeah.

S2:+erm support.

S1:Sure.

S2:And doing anything on their site is a complete nightmare+

S1:Mm.

...[20 secs]

S2:Because they're running something like sixty sites on one machine.

S1:Yeah.

S3:Wow.

S2:But but it it just is a nightmare.

不难看出,会议参与人员对问题的不同态度:S1(销售人员)把problem称作can of worms,而S2(客户)却把problem隐喻为“噩梦” (nightmare)。这种隐喻和习语的使用反映了商务交际的特征。

四、结语

本文介绍了主题词表及核心主题词表的语料库提取技术,并重点综述了该技术在三类商务话语 (公司使命陈述、商务信函、商务会议)中的应用。不难看出,主题词技术本质上是计算机程序把所研究的观察语料库分割成词表,然后和来自参照语料库的词表对比,从而把巨量文本分解成很简单的型式,展现其内在的规律。在商务话语研究中,主题词往往体现商务文本的体裁特征及文本的命题内容,是文本意义的重要识别因素,可以促进对文本主要观点的理解。

需要强调的是,在分析商务话语的语言特征时,研究者不能只局限于主题词分析,因为“一个主题词表只提供给研究者语言型式,为了回答特殊的研究问题,研究者必须进行深入的阐释”(Baker,2004:348)。只有把主题词放到其所产生的上下文语境并对定量的语言型式作定性研究(如体裁分析、会话分析或批评话语分析),才能透过词汇现象看到话语的本质,把研究推向深入。此外,考虑到主题词技术往往会产生太多的主题词,研究者也可把主题性分析从主题词拓展到主题语义域 (Rayson,2008),通过对主题词自动归类来减少研究者的分析负荷。目前这类研究在商务话语领域尚不多见 (Afida,2007),但将是未来研究的趋势。

注释:

①两个语料库的词次不可能完全一样,所以比较的它们的百分比,然后再看百分比的差别有无显著性意义。

②此类研究在Bargiela-Chiappini&Harris(1997)中已有所体现,该研究的语料来自英国和意大利的18个小时的商务会议录音。此外,Poncini(2004)所建成的企业间会议语料库也有一定影响力。

③该语料库收集了包括对英国、欧洲大陆以及日本等多个国家和地区26家企业64次商务会议的全部录音文字(912734个单词)。会议类型多样、规模不一,既包含企业间会议,也包含企业内部会议;226与会人员中的80%母语为英语,且多数为中、高层经理。

④后续研究发现主题词we're,we've在企业外部会议中的使用频率远高于企业内部会议(Handford,2010:108)。

胡春雨.2011.语料库与商务英语词汇研究[J].广东外语外贸大学学报(2):55-58.

Afida M A.2007.Semantic Fields of Problem in Business English:Malaysian and British Journalistic Business Texts[J].Corpora,2(2):211-239.

Baker P.2004.Querying Keywords[J].Journal of English Linguistics,32(4):346-359.

Bargiela-Chiappini F,Harris S T.1997.Managing Language:The Discourse of Corporate Meetings[M].Amsterdam:John Benjamins.

Bargiela-Chiappini F,C Nickerson,B Planken.2013.Business Discourse(2nded)[M].Palgrave Macmillan.

Bondi M.2010.Perspectives on Keywords and Keyness:An Introduction[C].∥Bondi M,M Scott(eds.).Keyness in Texts.Amsterdam:John Benjamins:1-18.

Clarke I.,Kwon W.& Wodak R.2012.A Context-sensitive Approach to Analyzing Talk in Strategy Meetings[J].British Journal of Management,23(4):455-473.

Fox R,Fox J.2004.Organizational Discourse:A Language-Ideology-Power Perspective[M].Westport,CT/London:Praeger.

Handford M.2010.The Language of Business Meetings[M].Cambridge:CPU.

Koller V.2009.Cutting Across the Senses:Imagery in Wine Speak and Audiovisual Promotion[C].∥Forceville,C & Eduardo Urios-Aparisi,Multimodal Metaphor.Berlin/New York:Mouton de Gruyter:45-73.

McCarthy M J,Handford M.2004."Invisible to us":A Preliminary Corpus-Based Study of Spoken Business English[C]∥Connor U,and Upton T.(eds.)Discourse in the Professions.Perspectives from Corpus Linguistics[C].Amsterdam:John Benjamins,167-201.

Nelson M.2000.A Corpus-based Study of Business English and Business English Teaching Materials[D].Unpublished PhD Thesis.Manchester:University of Manchester.

O'Keeffe A,McCarthy M,Carter R.2007.From Corpus to Classroom:Language Use and Language Teaching[M].Cambridge:Cambridge University Press.

Poncini G.2004.Discursive Strategies in Multicultural Business Meetings[M].Bern:Peter Lang.

Rayson P.2008.From Key Words to Key Semantic Domains[J].International Journal of Corpus Linguistics,13(4):519-549.

Scott M,Tribble C.2006.Textual Patterns:Key words and Corpus Analysis in Language Education[M].Amsterdam:John Benjamins.

Swales J M,Rogers P.1995.Discourse and the Projection of Corporate Culture:The mission statement[J].Discourse and Society,6(2):223-242.

Williams R.1976.Keywords:A Vocabulary of Culture and Society[M].London:Fontana.

猜你喜欢
信函主题词语料库
《语料库翻译文体学》评介
朱自清致逯钦立信函之五(1942.10.28)影印件
朱自清致逯钦立信函之四(1945.6.25)
把课文的优美表达存进语料库
现代英文商务信函的个性化写作风格初探
基于JAVAEE的维吾尔中介语语料库开发与实现
语言与翻译(2015年4期)2015-07-18 11:07:45
我校学报第32卷第6期(2014年12月)平均每篇有3.00个21世纪的Ei主题词
我校学报第32卷第5期(2014年10月)平均每篇有3.04个21世纪的Ei主题词
2014年第16卷第1~4期主题词索引
《疑难病杂志》2014年第13卷主题词索引