基于语料库的“become/get/go/turn+adj.”构式搭配关联强度及形容词语义聚类研究

2018-12-21 07:26韦小庭
宿州学院学报 2018年10期
关键词:词素构式形容词

韦小庭

广西大学外国语学院,南宁,530004

第二代认知科学的研究表明:语言不是自治的,句法的建构不是独立于意义的,而是为了表达意义的;不是独立于交际的,而是与交际策略相一致的;不是独立于文化的,而经常是与文化的最深层次相一致的;不是独立于身体的,而是来自感知动觉系统[1]。Langacker建立认知语法,认为语言不是自治的、句法也不是自治的,并提出了语言的“体验观”和“象征观”,认为语法是人们对客观世界的体验和认知基础上形成的,语言在本质上主要是象征性的[2]。近年来认知语法中的构式语法流派引起人们较多的关注,其代表人物有Fillmore[3]、Lakoff[4]、Goldberg[5]、Croft[6]和束定芳[7]等。构式语法认为,语言是由大量的、各种类型的构造组成的,所有构造都是形和义的配对体[2]。认知语言学视角下的构式语法研究代表了当前语法研究的最新进展[8]。学者们期望能以构式语法对语言作出一个统一的、简约的解释。Goldberg认为某一语言形式,如果其形式或功能不能严格地从其组成成分或已知的结构中得到预测,就可以称为是一个“构式”,构式是“形式和意义的配对”[5]。Langacker认为,≥2 的象征单位才可视为构式[9,10]。在Croft看来从词到抽象的句法、语义规则,都可表征为构式,前者为实体构式,后者为抽象构式[6]。学者对于构式的定义虽有所不同,但都把语法看作是形义集合,即既关注构式内部组成成分,也重视构式整体表达的抽象构式意义[11]。可以说,构式体现的是整体大于部分之和。在构式语法研究框架中,研究者探寻各种构式的中心语义以及词位与构式之间的语义关联和互动关系[12]。本文旨在探究获得构式允准进入“become/get/go/turn+adj.”构式中的形容词与构式搭配关联强度,并进一步考察此类形容词的语义聚类。

1 构式搭配分析方法及相关研究

“搭配”(collocation)的字面意思是“放置在一起”。搭配即语言使用中两个或两个以上词语在给定跨距内(如 Span=±5)的重复同现,反映了语言中“词语就像人一样结伴”的现象[13]。“搭配”问题很早前就被学者提出,可以追溯到十八世纪的词典编纂。Firth是较早将搭配作为普通语言学术语使用的学者之一。在他看来,要了解一个词得看与它搭配的词,换过来讲,知道了与这个词相互搭配使用的词,那么对该词也就会有一定的认识。搭配除了是一种可以观测的语言现象之外,还可以用来帮助解释语言模式[14]。搭配的重要性甚至超过语法,在确定语义和生成语言方面都具有不可忽视的重要意义[15]。语料库技术的发展进一步推动了搭配研究[16]。构式搭配分析方法是Stefan Th.Gries 和 Anatol Stefanowitsch开发的一种新的统计方法[17],Stefanowitsch和Gries试图把意义单位理论与构式语法、认知语法等结合起来,通过搭配词素与构式之间的构式搭配强度(strength of attraction),反映构式意义的认知语义聚类。该方法有效地结合了认知语言学的研究成果与语料库语言学的研究方法,主要由共现词素分析法、(多项)显著共现词素分析法和互为变化的共现词素分析法组成。它以量化的手段揭示构式某一个或多个槽位中共现词素的语义聚类,从而完成各类构式构式意义的深度挖掘[18]。往结构分析不同的是,搭配构式在分析中先观察同现词语结构,这种词语结构或搭配结构不是抽象的语法范畴,而是具体的词语序列,通过分析搭配位上的搭配词集来获取整个序列的意义[13]。近年来,越来越多的研究者使用构式搭配分析法对某一构式的中心语义以及词位与构式之间的语义关联和互动关系进行研究。如Giles使用构式搭配分析法分析[V + NPobj+ as + X]构式的动词槽位中的共现词素[19]。Wulff则基于BNC语料库,使用共现词素分析法,探究了[go and V]构式与[go-V]构式的构式义差别[20]。虽然国内对构式搭配分析方法认识较晚,但并不影响它的推广与应用。如詹宏伟等使用构式联接性分析方法研究语料库中的双宾构式,研究发现中国学习者和本族语者都对双宾构式的中心意义掌握得更好,学习者语言中,双宾构式的语义角色具有其特殊性[21]。田臻等运用构式搭配分析法中的共现词素分析法计算各类动词和体标记与 there 存在构式的关联强度,在美国当代英语语料库(COCA)中进行检索,以都具有普遍性语义特征的词汇体和语法体为变量,探索了 there 存现构式原型性的量化方法[22]。陈佳运用显著共现词素分析法分析COME/GO+ADJ 构式,然后发现COME/GO+ADJ 结构本质上是一类子构式,通过隐喻联接和子部类联接与基本非及物动结构式和非及物运动构式发生承继范畴化关系[12]。为了追求更为科学更为客观的研究结果,学者们更是应用了R语言中的可视化分析,结合使用了构式搭配分析与聚类分析两种方法,如邵斌等运用了构式搭配分析法中的显著共现词素分析法计算分析了英语形容词与“强化词 + 形容词”构式之间的关联强度,然后使用聚类分析,利用得到的层次树形图对强化词的语义重新分类[23]。当然也有不少学者使用构式搭配分析法对比分析中国学习者与英语本族语者在某一构式使用上的异同。房印杰运用共现词素分析法对关系代词的共现词进行分析,聚焦中国英语学习者和英语本族语者所用关系代词取舍的使用特征[24]。孙海燕探究学习者叙实类外壳名词的搭配构式发展特征[25]。此外,构式搭配分析方法对于语义韵研究也有一定的实用价值,黄莹基于语料库的历时搭配构式分析发现,absolutely与积极形容词搭配的比例在类符上明显上升[26]。也有学者使用该分析方法分析汉语语言特征,如王卫红考察与每一个汉语及物构式搭配上呈现显著搭配关系的动词,对动词进行语义编码,该结果对汉语教学带来一定启示[27]。 本文研究主要运用共现词素分析法。要进行共现词素分析,首先需要知道四个频数:a,b,c,d。以构式[N waiting to happen]为例,如表1。

表1 共现词素分析法

表1中a为N在该构式中出现的频数,b为N在该构式外出现的频数,c为除N外,其他词项在该构式中的频数,d为所有其他构式出现的频数,其中a,M,X,W四个数可以直接通过检索语料库得到,剩余数据则通过相关计算可得,得出数据则可以开始统计分析。该统计方法采用Fisher精确检验,以超几何分布为基础,与t-scores,z-scores,卡方检验及MI值相比,该方法更为精确。且上述几种统计方法都存在一定缺点,比如这些检验方法常常会高估或低估p值,尤其是当频次较低的时候,会影响统计结果。再次,自然语料往往难以满足这些统计方法的正态分布和方差同质要求。Fisher精确检验将计算出的单侧p值取以10为底的对数并前加负号作为搭配强度值。如果值是正数,槽位词素则与构式存在吸引关系,反之则为排斥关系。关联强度数值与统计学中p值的对应关系是:关联强度coll.strength>3 ,那么p<0.001; 如果coll.Strength>2 ,p<0.01; 如果coll.Strength>1.301 03,p<0.05。由此可得,在搭配强度>1.301 03时,词位与构式之间才具有比较有显著意义的相关性和吸引性。值与关联强度成正相关[12]。上文提到构式搭配分析法包括共现词素分析法、(多项)显著共现词素分析法和互为变化的共现词素分析法。除了共现词素分析法用得较多之外,其余两种应用得相对较少。(多项)显著共现词素分析法主要运用于分析两个意思相近的构式,运算方法大致与共现词素分析法相同,但是(多项)显著共现词素分析法需要的不是词素在整个构式中的频数,而是在相近构式中的频数,如某一动词在will+v.构式和be going to+v.构式中的频数。第三种互为变化的词素共现分析法则用于分析某一构式中两个不同槽位的相互关系,与传统的搭配方法有点类似,但是该方法更注重语义和句法结构层面。与前两种又略微不同,该分析法需要的频数是构式中槽位1的词素频率以及槽位2的词素频率。在构式研究中,这三种分析方法都具有相当高的实用价值,对构式义的研究提供了新的思路。

2 研究设计

2.1 研究问题

本文拟研究以下问题:(1)“become/get/go/turn+adj.”构式中的ADJ槽位吸引的词素有哪些?(2)“become/get/go/turn+adj.”构式中的ADJ槽位的语义聚类是什么?(3)“become/get/go/turn+adj.”构式搭配关联强度分析对外语教学有何启示?

2.2 研究对象及工具

查询《朗文当代英语大辞典》和柯林斯在线词典,选定研究对象为become,get,go,turn。在《牛津高阶英汉双解词典》[28]中,become,get,go,turn作为系动词时汉语意思都可译为“变成,成为”,英文解释中,作为系动词时,become定义为“to start to be sth”,get为“to reach a particular state or condition; to make sb/sth/yourself reach a particular state or condition”,go为“to become different in a particular way,especially a bad way”,turn为“to change into a particular state or condition; to make sth do this”。同样,在柯林斯在线词典中查询这组近义词,对于go作为系动词时解释为You can use go to say that a person or thing changes to another state or condition.,become为“If someone or something becomes a particular thing,they start to change and develop into that thing,or start to develop the characteristics mentioned”。Turn“If something turns a particular colour or if something turns it a particular colour,it becomes that colour及You can use turn to indicate that there is a change to a particular kind of weather”。get为“You use get with adjectives to mean ‘become’及Get is used with expressions referring to states or situations”。通过观察词典的解释,除了《牛津高阶英汉双解词典》指出go用于消极语义,以及柯林斯词典特别指出turn用于与colour和weather搭配外,词典对于这组近义词没有进一步的区分,仅从词典定义难以看出这组词义是否存在搭配和语义韵方面的差异。因此,借助大型语料库进行研究,既可探究“become/get/go/turn+adj.”构式,还对become,get,go和turn作为系动词用法时的异同研究具有一定的参考价值。选取的研究对象语料库为英语国家语料库BNC,BNC是大型在线英语语料库,注册后可在线免费使用,收集的语料达上亿词,包括口语语料和笔语语料,其中口语语料占10%,笔语语料占90%,是当代最具代表性的英语语料库之一。本研究使用构式搭配分析软件Coll,analysis 3.2a在R语言环境下进行运算,之后进行Fisher精确检验(Fisher exact test),统计出槽位中的形容词与目标构式的关联强度。R语言是成熟的编程语言,既能够灵活地进行数据检索分析,又能提供个性化的数据统计,此外还具有绘图功能[29]。

2.3 研究步骤

第一,词频统计。在线检索BNC语料库中become/get/go/turn作为系动词后接形容词,该形容词的频次,即进行[become][J*]、[get][J*]、[go][J*]和[turn][J*]的比较检索,按关联强度从高到低排序;第二,高频词条提取。选取频次排列前25的词条进行分析,所以提取的形容词总数为100,选定提取对象后整理数据,按照共现词素分析法要求将数据分别整理为txt.格式;第三,构式搭配分析,使用构式搭配分析方法,将Stefanowitsch和Gries教授所编写的程序带入R,在R语言环境下进行运算,之后进行Fisher精确检验,统计出槽位中的形容词与目标构式的关联强度;第四,语义聚类分析。

3 结果与讨论

3.1 搭配关联强度

经统计,提取的频次排列前25的100个形容词与“become/get/go/turn+adj.”构式的搭配关联强度值均大于1.30103,即均呈现强搭配关系,见表2、表3、表4、表5。

表2 become搭配词

(续表2)

表3 get 搭配词

表4 go搭配词

表5 turn搭配词

3.2 基于数据分析结果的语义分析

通过上述统计方法,结合上下文语境检索,进一步依次分析“become/get/go/turn+adj.”构式与形容词搭配的情况。

首先是become的形容词搭配。检索上下文语境对become的形容词搭配词进行深入分析,受系动词become语义影响,形容词不再单纯表示静态状态,而是凸显动态变化过程或变化过程带来的结果/影响。归纳如下:

(1)表示人对某事物/某人的认识/态度的变化。

例1:In talking to people about the election I have become aware of two areas which concern me deeply.

例2:She had never become familiar with the more colourful words that people used。

此时aware与familiar进入构式后,不再单纯地表示静态状态,而是暗含动态变化后的结果状态。

(2)表示事态随时间变化而发生变化,含有抽象运动位移,凸显时间段,语料库中与“popular、commonplace、fashionable、extinct、apparent、widespread、dominant、permanent”等形容词呈现强关联性。

例3:By the year 2000,grey seals in the Baltic may well have become extinct.

例4:That kind of anthropological writing was to become very fashionable after World War One.

(3)表示人的性格/习惯的变化,如与“accustomed,dependent,aggressive,sophisticated”等词连用。

例5:My eyes had become accustomed to the now semi-darkness,so I could pick out shapes about seventy-five.。

例6:You must avoid being manipulated by other people or letting yourself become too dependent on others for your financial security.

(4)表示人身体感觉、精神/处境状态的变化,如与“pregnant,ill,depressed,stronger,involved”等词搭配使用。

例7:In this way you'd become ill,and in a few months you'd die.

例8:Towards the shift's close,ordinary policemen and women are generally reluctant to become involved in work which requires them to extend their duty.

从语义聚类看,与become+adj.关联强度较高的形容词语义具有多样性的特点,有表示事态的,有表示身体状态的,有表示性格、习惯的,有表示认识、态度的,还有的则为其他类。

其次是get的形容词搭配,大致可以归为三类:一类是表示人物情绪、精神、性格等状态的,包括“bored,pissed,fucked,uptight,gritty,excited,over-excited,paranoid,stroppy,nitty和homesick ”,占44%。

例9:It's like my probation officer,you just get bored talking to them.

另一类是表示人物身体状态感觉等,如drunk,pregant,undressed,sweaty,sunburnt,itchy等。

例10:And then,when he was alone,he would get drunk enough to sleep without dreaming of his mother screaming.

第三类则表示不好的遭遇的状态,如hotter,wetter,mucky,mugged,stuck,x-rayed,busted等。

例11:But round here you could just walk er to the shop and get mugged or you know your girlfriend could get raped,kids can get assaulted.

其余则表示一般的事态和动作状态;经检索上下文还可发现,25个形容词中,消极语义韵有13个,约占52%,积极语义韵词素只有5个,占比2%。可见在本族语中,get作为系动词与形容词搭配时,更多与具有消极语义的词素连用,凸显遭遇不好的变化结果,例9、例10、例11都突显了由好的状态变化到不好的状态。此外,通过观察还可发现与get搭配的25个显著关联形容词中,约一半为过去分词作形容词用法,体现了构式义对词项的压制作用。get+adj.凸显遭遇不好的变化结果,形容词进入构式后,受构式义压制作用影响,也表达遭受义,所以这也能解释get后接形容词,形容词多由过去分词构成。

go的形容词搭配词中,主要以表示事态和动作状态的为主,也有表示精神状态的。

例12:I’ ll go mad in that prison.I’m not ready to go there yet.该例子是表示精神状态。

例13:However,Kimura’s interpretation of this finding did not go unchallenged.该例子表示事态。

仔细观察可以发现,与go呈现强搭配关联度的形容词中,由动词过去分词构成的有16个,占64%,且含否定前缀un的有14个,占56%。mad,bust,bankrupt和mouldy含明显消极语义,该现象与《牛津高阶英汉双解词典》中go作为系动词时定义相一致,即通过不好的方式发生某种变化、达到某种状态。此外,go+adj还可表达运动方式状态等。

例14:She told him he should not squeeze his toes in borrowed shoes,but go barefoot,and strengthen his feet.

例15:Former chairman Sir Mark Weinberg (above) plans to go head-to-head with the company he resigned from last October.

与turn共现的前25个形容词语义错综复杂,有表达身体状态发生变化的结果,如turn blind;有表达性状的,如味道turn sour;也有表达运动位移的,如turn clockwise/anti-clockwise,turn forehand等。值得注意的是,25个强搭配形容词中没有出现柯林斯词典特别指出的颜色colour和天气weather方面的形容词。

综上,“become/get/go/turn+adj.”构式的形容词语义规约呈现多样性,结合形容词的概念语义聚类分析,“become/get/go/turn+adj.”构式的概念事件语义主要可以归纳概括为三大类,通过上述形容词搭配词表可发现表达某人/某事物发生状态变化的形容词占比最大,因此该构式最核心的语义是表达某人/某事物发生状态变化的结果,核心义相同,但是核心义下因各种因素呈现的特点也不能忽视,因为这对于掌握该构式并准确运用该构式非常重要,同时也可作为区别become,get,go,turn这组近义词的一点参考。其中become表达的状态变化较为丰富,有表示事态的,有表示身体状态的,有表示性格、习惯的,有表示认识/态度的,多为中性语义韵;get+adj.特别突出表达遭受义,表达发生不好的状态变化的结果;go更倾向于与否定语义连用,但需要注意的是否定语义并不一定就是消极语义;同时特别点出的是表达味道发生变化的在研究范围内只出现在turn+adj.中;第二类是表达某人/某事物以某种方式状态到来或进行运动;最后一类是表达某人/某事物的运动位移。从隐喻思维机制方面分析,变化就是运动,因此可以说“become/get/go/turn+adj.”构式属于运动事件范畴。核心语义可以看作是运动事件的非空间隐喻义,第二种和第三种则是运动事件的具化。这是人们将空间运动体验向其他非空间抽象概念范畴映射的作用结果[12]。从认知语言学视角看,用时空的概念去理解语言,更能解释语言,也更能揭示语言的本质,这也符合时间与空间是人类体验最基本的范畴,人类自出生之日起便处于时空范畴中,自己的身体与外界事物发生的空间关系更是人类语言概念和意义产生的最直接来源。

3.3 对外语教学的启示

语言搭配现象是认知语言学研究的重要内容之一,搭配被认为是人类一种基本的语言认知手段,在无意识中构造着人类的思维、推理和经验[30]。Cruse认为,搭配意义是在实际运用中通过跨越不同语义场的心理认知模式而形成的[31]。构式搭配分析法是认知语言学与语料库语言学的有效结合,从构式角度学习语言,兼顾词汇与句法层面,能使学习者提高词汇搭配使用效率与质量,但是如何更好地将搭配与语言学习过程相结合还需要更多更深入的研究。李文中认为处于固定与自由组合之间的各种变异性搭配使用,能够体现语言使用者、语言学习者的创新能力[13]。与此同时,学习构式,语言学习者还能理解更多新奇的、特殊的、甚至是边缘的语言组合现象。因此,become/get/go/turn等变化类系动词的搭配教学可以由中心语义搭配到过渡到边缘语义搭配,引导学生注意重视和掌握构式义,丰富搭配,提高语言的创新性。同时,语言反映人们认识世界的方式,同样地,不同语言中的独有构式体现了不同族群对世界的识解方式[32]。因此,对于某一语言的某一独有构式的学习也是具有重大意义的,特别有助于语言学习者学习和了解目的语的认知世界的方式。此外,借助词典学习是语言学习过程中必不可少的方法之一,但部分词典由于受编撰时技术等方面的限制,并不能百分之百地全面给出百分之百准确的信息。因此,随着语料库的兴起,大数据时代的到来,构式搭配分析方法结合了语料库语言学与认知语言学,一方面提供大量真实语料和先进的统计方法和软件,一方面又有有力的理论支撑,为语言学习,特别是搭配学习提供了新的手段和方法,同时也有助于对构式语法理论进行进一步的定位与认识。

4 结 语

R 语言为语料库语言学和其他语言学分支的研究提供了更为科学的研究手段和方法,提供了个性化的数据检索和统计,使得研究结果更精确更让人信服。本研究基于BNC语料库,使用coll.analysis 3.2a统计工具,带入程序在R语言环境下对“become/get/go/turn+adj.”构式中形容词与构式搭配关联强度进行了统计,并从构式语法视角对数据结果进行分析,做到了定性定量相结合。研究发现,在“become/get/go/turn+adj.”构式中,形容词规约语义呈现多样性,但这些形容词进入构式后表达的语义概念具有共通之处。“become/get/go/turn+adj.”构式表达的概念语义主要可以归纳为三类,其中最中心的概念语义是表达某人/某事物发生状态变化及变化的结果,其次是某人/某事物以某种方式状态到来或进行运动,最后是表达某人/某事物的运动位移,包括具体的和抽象的。在语义韵方面,get倾向于与遭受义的形容词搭配,具有消极语义韵,go则倾向于与否定义形容词搭配。使用构式搭配分析方法研究语言,是语料库语言学与认知语言学的有效结合,既有大量真实语言实例,也有对语言数据的理论解释,对语言的教与学都具有一定的实用价值。限于篇幅因素,本研究也存在一定的改进空间,比如对于构式义的分类依旧是基于内省法,而且考虑到经济原则和可操作性,只分别选取了前25个共100个呈显著搭配关系的形容词进行分析,虽然该分析方法已具备一定的可靠性和客观性,但如果能进一步运用聚类分析法进行分析,那么结果会更加客观,更加使人信服,这也说明认知语言学的研究也越来越离不开大数据,与各种先进统计软件和各种检索工具的联系也会越来越密切。同作为新兴学科的认知语言学与语料库语言学相结合,自然会产生巨大的效应。

猜你喜欢
词素构式形容词
认识形容词
基于词素解构的高中英语词汇扩充方法分析
词素配价理论与应用
从词素来源看现代汉语词素同一性问题
“不可推导性”作为标准的虚妄:兼评“修辞构式观”
从语法构式到修辞构式再到语法构式
词素溶合与溶合词素
“XV的(不)是Y”构式探微
形容词
“有一种X叫Y”构式的语义认知考察*——从语法构式到修辞构式的接口探索