张丽明
(人民教育电子音像出版社 北京 100081)
语料库源于拉丁语“躯体/身体”,18世纪,出现文本集和作品汇总,20世纪60年代第一个机读语料库(Brown Corpus)的建立标志现代计算语料库的诞生。语料库是根据明确的语言学标准进行选择和排序的语言数据汇集,旨在作为语言的样本进行使用(Sinclair,1986;Crystal,1991)。语料库的主要特征包括电子化、真实语言、严格取样和代表性。语料库自动抓取、自定检索、自动分析的智能化特征,海量语料库、云计算和大数据分析技术,以及行业专用、一站式服务、集成化管理的专门化特征,使其在搜索引擎、智慧教育、语音处理、智能写作、机器翻译、学术研究等领域广泛应用。
LOB语料库(Lancaster-Oslo-Bergen:兰卡斯特-奥斯陆-卑尔根)是Brown Corpus的英国对等语料库,由英式英语书面语构成,其规模为1,000,000字,出版于1961年。LOB语料库样本为2,000字的文本片段,如新闻、学术和科学写作、小说等。
FLOB和FROWN语料库,是LOB语料库和BROWN语料库的弗莱堡(Freiburg)版本,在LOB语料库和BROWN语料库建成30年后的1991年建成。
London-Lund语料库由伦敦大学和隆德大学合作建设,包含435,000字英式英语口语。语料库样本为5,000字,是成年的、受过教育的、专业人士的口语语料,包括电话交谈、讲座、讨论和无线电评论。
Longman-Lancaster语料库由朗文出版商和兰卡斯特大学合作建设,语料库规模为30,000,000字,包括小说和非小说体裁。小说体裁包括文学作品和印刷书籍中的随机作品,非小说体裁包括自然科学和社会科学、世界事件、商业金融、艺术、休闲,等等。
The Bank of English语料库由伯明翰大学的COBUILD(Collins Birmingham University International Language Database科林斯伯明翰大学国际语言数据库)创建。The Bank of English语料库用于词典和语法编纂,目前大约455,000,000字,包括小说和非小说书籍、报纸、口语样本。网络应用版为50,000,000字 “CobuildDirect”。The Bank of English语料库(BoE)在线版为Word Banks Online,是个监控语料库。
BoE为付费语料库,每年需支付1,150美元。然而,BoE偏向报纸体裁,大约占到50%,这可能是因为报纸文章便于在线获得。BoE语料库中不包含学术期刊,其口语语料源自于朗读转写文本。BoE中非正式数据较少,只转写了美国之音,几乎没有包含自然的口语。由于其构成体裁分布不均衡,BoE语料库难以完全让人信赖。例如,在BoE和COCA中检索“引证词like”,发现其使用频率在COCA中是在BoE中的3.1倍(2000—2004年)、66倍(1995—1999年),BoE这个检索结果显然不符合常识。
英语国家语料库(The British National Corpus)为100,000,000字英式英语语料库,由10,000,000字口语和90,000,000字书面语构成。英语国家语料库用于大型辞书设计,例如《牛津高阶英语词典OxfordAdvancedLearner’sDictionary(OALD)》和《朗文当代英语词典LongmanDictionaryofContemporaryEnglish(LDOCE)》。
作为监控语料库,在跟踪语言变化方面,美国当代英语语料库(COCA:The Corpus of Contemporary American English)作用明显。BoE和COCA这两个语料库都十分庞大。COCA大约520,000,000字,BoE大约455,000,000字。两个语料库都比100,000,000字BNC(British National Corpus)语料库大得多。COCA和BoE的重要差别,就是COCA持续被更新,是名副其实的监控语料库。每年大约有20,000,000字被添加到COCA语料库。而BoE语料库已停止更新,最后添加文本是2005年文本。
COCA在口语、小说、流行杂志、报纸和学术期刊这五种体裁之间均衡分布,每种体裁各占20%,甚至是报纸-体育,或者学术期刊-医药这样的亚体裁分布比例也比较均衡。免费的COCA语料库是精心设计的监测语料库,可用于准确测量当代语言变迁。
语料库短语学基于局部语境,将传统的词汇和句法统一起来,以全新视角探究语言特征(李响,2016:114-119)。基本的意义单位,除了单词外,还包括较长的短语和搭配—— “扩展词汇单元(extended lexical units)”。通常情况下,引申义不仅仅与个体单词相关,而是分布到短语和搭配(Stubbs,2011)。搭配是扩展意义单位存在的最有力证据,绝大多数意义单位是由两个及以上的词语所组成的复合词项(濮建忠,2020:1)。
整体文本(whole text)不同于长文本(long text)。例如,公共场所的公示语Fire assembly point(火警集合点)、Private(私人:住宅、车道等禁止入内)、Wet paint(油漆未干)、Closed for lunch(午餐时间,暂停服务)等,这些公示语都是整体文本。甚至一个单词或短语足以判断文本类型,例如单词furlong(长度单位弗隆,相当于201米或1/8英里)用于赛马评论;短语warm front(暖锋)可能与天气预报有关。
搭配是语言使用中最基本的组织原则,学习者需要熟知搭配。例如,“round table”的意义就是round和table相加表达的意义。但是,在round table talks(圆桌会谈)、Knights of the Round Table(圆桌骑士)、drink someone under the table(酒量胜人一筹)、payment made under the table(私底下支付)、a round number(尾数是零或五的整数)、a table wine(佐餐葡萄酒)、a timetable(时刻表、课程表)、come round to my house(来我家坐坐)、come round to my way of thinking(改变主意)、a round dozen(整整一打)、a round of applause(一阵掌声)、a round of golf(一场高尔夫)、a round of drinks(一轮酒)、the doctor is on her round(医生查房)这些短语中,round和table表达了不同的意义,短语意义并不一定是单词意义的叠加,学习者需要了解单词的搭配和搭配所蕴含的文化知识和语义变化(Hamilton et al.,2016)。
2.2.1 单词Gossip的搭配
Gossip经常出现在负面含义短语中,例如baseless gossip(毫无根据的流言蜚语)、gossip-mongering(爱说闲话的人)、idle gossip(闲话)、juicy gossip(刺激的小道消息)、name-calling and malicious gossip(辱骂和恶意的流言蜚语)、scandal and gossip(丑闻和流言蜚语)、sleazy gossip(乌烟瘴气的流言蜚语)、titillating gossip(煽情的流言蜚语)、her affairs became common gossip(她的风流韵事成了常见的流言蜚语)等。而动词gossip的社会作用者,常常由女性来承担。女性说闲话、传播流言蜚语成为一个社会刻板印象(stereotype),说闲话的女性一般为mother、women,或者old woman等。例如,the mothers stood gossiping in the alleys、the women gossiped and the men smoked、a gossiping old woman等。在英语国家语料库(BNC)中检索gossip搭配,发现其搭配词为columnist、innuendo、malicious、fodder、rumour、chatter、idle、Hollywood、speculation、scandal、latest、village、exchange、piece、listen、magazine、picked、spread、women等。
其实,男性也会说闲话,但是被赞赏性地称为“male bonding(男性情谊)”。女权主义研究者Cameron(1997:45)指出,男性和女性都会参与“流言蜚语”,但是不可否认,流言蜚语的意义“具有女性属性”。
日常英语中,不同的术语用来表达不同的语言行为。研究这些术语的用法,有助于了解这些术语之间的逻辑关系和他们具备的正面或负面引申义。例如,talk是一般词汇,chat是位于talk之下的范畴,而gossip属于不同的亚范畴(Stubbs, 2001: 7-8)。
表1 Talk下义词gossip及其语义韵
表2 Talk下义词chat、chatter、prattle、babble及其语义韵
再如,下列几组词汇:
Break、burst、chip、crack、shatter、smash、snap
Shake、quake、quiver、shudder、tremble
Show、display、exhibit、expose、flaunt
Work、drudgery、labour、toil
Dirty、filthy、grimy、grubby、soiled、unclean
上述talk、break、shake、show、work、dirty这样的核心词汇(core vocabulary),是语言中最基本的词汇。
2.2.2 单词bank的搭配
Bank一般出现在指代“金钱”或“堤岸”的短语中。例如,bank account(账户)、bank balance(银行结存)、bank robbery(银行抢劫)、piggy bank(存钱罐)、canal bank(运河堤岸)、river bank(河岸)、the South Bank(伦敦泰晤士河南岸)、the Left Bank(法国左岸)、Dogger Bank(多格滩:苏格兰北部和丹麦之间的北海浅滩)、Rockall Bank(北大西洋罗科尔岛)、Icelandic Banks(大西洋渔区)。
与bank一起共现的词,一般来自金钱语义场和堤岸语义场,例如cashier、deposit、financial、money、overdraft、pay、steal;cave、cod、fish、float、headland、sailing、sea、water等。然而,也存在一些含混不清的短语,例如the Worthing bank murder case。Worthing是英格兰南部小镇,这个短语是说银行抢劫还是发生在堤案边的谋杀?意义一般由多种因素决定,意义既产生于特定短语中,又受到周围词汇串的制约。意义是思维的表征,通过语料库,可以观察证据,推测意义。词汇意义的主要证据,就是这个单词周围的其他单词,尤其是与这个词汇一起共现的重复模式。意义不能独立于环境,不能独立于上下文。词汇可以预测与其共现的相关词汇,同时,词汇上下文也可以预测词汇。语义学研究典型情况,而不是特殊案例。意义模式,可以从小型语料库中预测,这些被预测的意义模式可以在别的语料库或大型语料库中再次检验。
2.2.3 报纸征婚广告(lonely hearts ads)中的搭配
报纸征婚广告(lonely hearts ads)受到版面限制,命题内容几乎千篇一律为“X is looking for Y”,然后是请求“Please get in touch”,句法结构十分简单。最常用的词为seek和caring。seek的搭配词为female、black、male、attractive、similar、guy、lady、man、caring、professional。caring的搭配词为seek、loving、honest、sincere、make、very、more、people、children、kind。
Seeks a sincere, caring single lady
Caring, Christian-minded, romantic, seeks attractive, reliable female
Black male, 31, seeks caring lady
Various interests, own flat and car, seeks caring, ambitious lady
Kind, honest, reliable, boyish, 35, seeks caring, genuine female, for lasting relationship
个体单词不一定是意义的组成单元。有些动词几乎不携带意义,这种现象被称作词汇虚化或非词汇化(Quirk et al.,1991;胡开宝 等,2016:109-114)。例如:
Take a decision; take a look; take a shower; take a sip
Have a chat; have a drink; have a look; have a shower; have a swim; have a try
Give a scream; give a shout; give a speech
Make a mistake; make a note; make a suggestion
在上述例子中,意义几乎都由名词来实现,而动词的语义已经被虚化——语义虚化(desemanticized)。语义虚化现象在现代英语中十分普遍,最频繁使用的语义虚化动词有take、make等,例如,take place、take part、take care、make sure、make sense、make clear。
形容词通常会让名词的语义变窄。例如,red house比a house更加具体,dangerous dogs比dogs范围更小。Sinclair(1992)把形容词的这种用法称作“选择性用法”,即从大的集合中选择较小的集合。他认为,“共现词汇的意义,不同于词汇独立使用时的意义。共现词汇的语义,至少被部分地虚化了。现代英语标准短语,具有很强的语义虚化趋势。”形容词修饰名词的短语搭配中,形容词被共同选择,分享名词的部分语义。如果名词独立出现,意义一点儿也不会丧失。例如:
Physical attack, physical damage, physical proximity
Scientific analysis, scientific experiment, scientific study
General drift, general opinion, general public, general trend
Sinclair(1994)区别了形容词的选择性用法和聚焦性用法:
表3 形容词的选择性用法和聚焦性用法
例如,短语physical assault就是形容词physical的聚焦性用法。形容词physical 几乎不对名词assault添加任何意义,只是起到强调的作用,因为名词assault本身就具有physical的特点。不过,在短语intellectual assault中,形容词intellectual拥有本身独立的意义,属于增加不同意义、让名词语义变窄的选择性用法。
Lorenz(1999)讨论了短语中的聚焦性副词。例如:diametrically opposed、 firmly entrenched、heavily loaded、 instantly recognized、 irretrievably lost、 readily available、 ruthlessly exploited等。在这些例子中,副词语义虚化,仅仅用于强调,对命题意义几乎没什么贡献。
再如,副词distinctly在下列短语中,语义虚化,不增加命题意义,用于强调说者/作者对某事的不赞成,带有 明 显的 负 面 语义 韵。例 如,distinctly different、 distinctly audible、distinctly visible、distinctly alarming、 distinctly dated、 distinctly inferior、 distinctly nervous、distinctly odd、distinctly peculiar、 distinctly queasy、distinctly uncomfortable、distinctly uneasy、distinctly unimpressed。
语义韵分析旨在分析意义单位中传递的态度和感情,代表语言使用的功能和目的(李文中 等,2020:72-83)。词汇本义在风格上来说是中性的,表达词汇和世界之间客观的关系。本义是词汇意义最重要的组成部分,是最基本、最核心的意义。词汇引申义(connotation)是主观的、第二层级的、外围的意义;词汇引申义依赖词汇和说者/作者之间的关系。不过,词汇的主要意义和次要意义取决于个体观念,其最重要的功能是表达个体态度。例如,die(死亡)是中性词;pass away(逝世)试图表达说话者的同情;snuff it(断气)根本不表达丝毫的同情;其他表示死亡的词汇或短语包括expire、give up the ghost、perish、shuffle off this mortal coil等。这些替代性表达常常替代死亡禁忌语。再如,coffin(棺材)是中性词,casket(棺椁)则带有尊贵含义。
语料库检索结果表明,cause带有明显的负面语义韵。与动词cause搭配的主语或宾语为:abandonment、accident、alarm、anger、annoyance、antagonism、anxiety、apathy、apprehension、breakage、burning、catastrophe、chaos、clash、commotion、complaint、concern、confusion、consternation、corrosion、crisis、crowding、damage、danger、death、deficiency、delay、despondency、destruction、deterioration、difficulty、disaster、disease、disorganization、disruption、disturbance、disunity、doubt、errors、frustration、harm、hostility、hurt、inconvenience、interference、injury、interruption、mistake、nuisance、pain、pandemonium、quarrel、rejection、ruckus、sorrows、split、suffering、suspicion、trouble、uneasiness、upset等。
Klotz(1997)证实了动词cause的负面语义韵,同时指出了cause使用方面的限制。“动词+单宾语”结构中,作宾语的名词可以是疾病,如Smoke causes cancer,但是在“动词+双宾语”结构中,作宾语的名词不可以是疾病,不可以说*cause him cancer,双宾语结构中的名词只能是表示个体感觉的名词,例如cause you agony、cause them inconvenience。cause还有可能与amusement(消遣)搭配为cause somebody amusement,似乎不带有负面的语义韵。但是,语料库检索结果表明消遣接收者的负面态度。消遣接受者展示出屈尊降贵,自认为高人一等的态度,对消遣提供者表现出不同程度的幸灾乐祸。例如,she was listening with more amusement than respect、are also cause for sardonic amusement。
动词commit常常与adultery、atrocities、hara-kiri、offence、sin、suicide等搭配,动词subject常与scrutiny、abuse、harassment、pressure、torture、attacks、criticism、barrage搭配,动词hurl常与abuse、insults搭配,动词endure常与forced、pain搭配,具有负面语义韵。形容词soaring常与price(s)、cost(s)、unemployment、inflation、crime、deficit搭配,形容词impending常与doom、disaster、war、crisis、death、attack、warning、rumour搭配,具有负面语义韵。介词amid常与fears、speculation、allegations、concern、controversy、rumours搭配,具有负面语义韵。副词potentially常与dangerous、explosive、lethal、fatal、damaging、serious、disastrous、harmful搭配,具有负面语义韵。名词credibility常与lost、restore、gap、lack、problem、damaged、lose、undermine搭配,具有负面语义韵。
动词provide常常与information、service(s)、support、help、money、protection、food、care等搭配,动词derive常与benefits、pleasure、satisfaction、comfort搭配,具有正面语义韵。名词discoveries常与new、important、great、exciting搭配,名词expression常与freedom、artistic、creative搭配,具有正面语义韵。形容词mutual常与respect、support、understanding、trust、agreement、benefit、interest搭配,形容词roaring常与trade、fire、success、laughter搭配,具有正面语义韵(Stubbs, 2001:107-108)。
与句法结构“BE+被动式”相比,“GET+被动式”表明不愉快的事正在发生,“GET+被动式”常常与addicted、caught up in、criticized、distorted、frightened、injured、kicked out、mixed up in、picked on、turned down、hurt、embarrassed搭配,带有明显的负面语义韵。
比较little和small,我们发现,little带有儿童用语的含义,例如,pretty little girl、little tiny、beautiful little等;与little相比,small比较正式,例如,comparatively small quantity、exceedingly small等。
搭配是个体词汇的独特属性,一般难以概括。有些动词的搭配范围比较狭窄,尤其在“动词-名词短语”结构搭配中,例如:curry favour(拍马屁)、foot the bill(结账)、quash an appeal(撤销上诉)、shrug one’s shoulders(耸肩)、strike a balance(达成平衡)。Rancid、rotten、sour本义相同,但是出现在不同搭配中:rancid butter(哈喇了的黄油)、rotten eggs(臭鸡蛋)、sour milk(变质的牛奶)。Grill和toast意义相同,但是却搭配迥异,grill meat(烤肉)、toast bread(烤面包)。搭配中,有时需要一般动词(例如,make headway),有时不能使用一般动词(make、do)而必须使用具体动词(tell a story、tell/crack a joke),有时不同动词可能表达相似意义(do/take/sit an exam、perform a dance)。这种限制和偏好,不胜枚举。搭配的独特性,因语言的不同而不同,例如汉语中的刷牙,英语也使用动词“刷”(brush one’s teeth),法语中使用动词“洗”(se laver les dents),德语使用动词“清洁”(die Zahne putzen)。
英语从其他语言中借词,反映了不同民族间的历史文化接触、科技交流和重要政治事件。例如,cold war(冷战)、Sputnik(苏联人造地球卫星)、Watergate(水门事件)、 gate(—门)、perestroika(20世纪80年代末苏联政治即社会结构的改革重建)、intifada(巴勒斯坦人起义)、taikonaut(中国宇航员)等。
英语中德语外来语一般来自政治、军事、医药、工程等领域。 例如,dollar、Christmas tree、folk-song、Nazi(纳粹)、Third Reich(第三帝国)、Gestapo(盖世太保:国家秘密警察)、Blitzkrieg、flak(高射炮、抨击)、angst(对形势、事态、生活的忧虑和焦虑)、biology、chromosome(染色体)、Alzheimer’s(阿尔兹海默症)、gauss(高斯)、Yiddish(犹太意弟绪语)。
公元九世纪到14世纪,法语是英国宫廷的官方语言。在此期间,平民说古英语(middle English),而英国王室成员讲法语。英语中的法语外来语一般来自烹饪、时尚、艺术领域,如buffet(自助餐)、croissant(羊角面包)、filet(肉片)、chalet(小木屋)、ballet(芭蕾)、bikini(比基尼)、Dada(达达主义)、lingerie(女士内衣)、renaissance(文艺复兴)等。借词与文化紧密关联,例如汉语借词Chow mein、Kung fu、mah jong、pinyin,日语借词bonsai、karate、Honda、Sony等等。
语言中词汇的内在结构,为个体单词连接成串的词组。词组中单词之间的逻辑关系,或相同、相异或蕴含。有时,单词处于某个主题领域或语义场,单词之间的关系比较模糊。例如,英语中关于horse语义场的词汇搭配为:
表4 英语中的horse语义场
5.3.1 近义词
单词的本义和引申义,很少完全相同。近义词彼此共享大多数语义特征,例如:
anarchy/chaos
anxiety/depression/fear/stress/tension
chapel/church
migraine/headache
towns/cities
utterly/completely
近义词“couch、settee、sofa”本义相近,但搭配完全不同。例如,casting couch(娱乐圈中“潜规则”)、couch-potato(成天窝在沙发上看电视的人)、psychiatrist couch(心理医生的诊察台)、sofa-bed(沙发床)。
禁忌语mad,可以用意义和用法都比较相近的近义词代替,例如bananas、barmy、bonkers、crackers、crazy、cuckoo、dotty、loony、loopy、nuts、potty、unhinged等。
1066年诺曼入侵后,法语和拉丁语对英语词汇的扩展做出了重要贡献。在法律、医药及其相关知识领域和文本类型的社会机构中,产生了相应的词汇语义场。核心词汇包括日耳曼语系的body,还包括罗曼语系的corpse(法语corps、拉丁语corpus)、cadaver(法语cadavre、拉丁语cadaver)和deceased(法语deces、拉丁语decessus)。一般日耳曼语系词汇为单音节、不太正式;而罗曼语系词汇为多音节,比较正式。日耳曼语系单词可以衔接两个不同的语法结构(I gave the book to Susan./ I gave Susan the book.),而罗曼语系单词只能衔接一个语法结构(I presented the book to Susan.* I presented Susan the book.)
表示尸体的一系列近义词中,日耳曼语系的body是中性词;罗曼语系的the deceased指某人刚刚离世,蕴含对逝者的尊敬,常用于法律语境;罗曼语系的corpse带有令人不愉快的含义,常常出现在犯罪报道中;stiff是俚语,带有不尊敬的含义,风格上有一点旧式,一般仅限用于美式侦探小说;cadaver为医学术语。例如:
Lenin’s body lay in state
the family of the deceased
the corpse was barely recognizable
they found a stiff in the river
anatomical investigations of a human cadaver
carcass指大型动物尸体、供使用的畜体;如果carcass用于指人,显得特别粗鲁;carrion指代死亡动物的腐肉,是觅食动物和鸟类的食物:
the carcass of a dead buffalo
move your carcass over here (rude)
vultures and crows picking at a lion’s carcass
英文词汇中,有表示死亡人、死亡动物(可以作为食物来源)的系列词汇,还有表示死亡植物的词汇(例如log、lumber、timber)。但是,英文词汇中没有代表死亡昆虫、较小的死亡植物的词汇。上述各组词汇体现了对人类、动物、植物关注程度不断减弱的层级关系。
5.3.2 反义词
反义词dry/wet、up/down、hot/cold并不是严格的二元对立关系。例如:
dry sock(干袜子)wet sock
dry season(干季)wet or rainy season
dry wine(不含糖的干型葡萄酒)sweet wine
dry skin(干燥的皮肤)moist skin
dry humour(一本正经的幽默)unsubtle humour
a dry area(禁酒区)an area which has pubs
a dry run(排练演习)the real thing
dry land(陆地)sea
不同的短语中,dry意义不同。例如,high and dry(陷入困境)、there were few dry eyes in the house(屋里几乎没有人不掉眼泪。)
类似地,在下列短语中,wet也找不到明显的反义词。Wet blanket(令人扫兴的人/物)、wet nurse(乳母)、feel like a wet rag(感到身心疲惫)、a Tory wet(玛格丽特·撒切尔政府中观点温和的保守党人)。
white的原型反义词为black,但是在下列短语中,black显然没有立足之地:
white winered wine
white collarblue collar
white coffee(加了牛奶的咖啡,不是白色,是浅棕色)black coffee(不加牛奶的清咖)
传统意义上的反义词,是语言纵聚合关系中意义对立的词汇。然而,从横组合关系角度,可以更好地理解反义词。例如,bride最常见的搭配是其反义词groom,构成bride and groom,这两个单词不可以相互替换。在脱离语境的情况下,conventional的反义词为modern,但是在武器文本中,conventional weapon 的反义词为chemical/nuclear weapon。
5.3.3 下义词
上下义关系(hyponymy)表明词类包含的逻辑关系。Buttercup(毛茛)是一种flower,flower是一种plant;spaniel(短腿猎犬)是一种dog,dog是一种animal。
Chomsky(1986)以内部语言(I-language)和外部语言(E-language)术语,重构了语言能力和语言运用,这种区分对语料库语言学具有启示意义。内部语言涉及语言能力,即有可能的、在心理语言学方面是可行的;内部语言是第一人称、参与者视角,内部语言是知识系统,是个体心理。外部语言涉及实际的语言运用,因此是社会交往互动中系统的实现;外部语言是第三人称、观察者视角,外部语言是行为,是社会活动和社会事件。语料库收集的个体语言行为,可以被看作话语共同体中语言行为的样本。单独聚焦语料库中的频率会误导研究者,只有当频率成为典型特征时,频率才具有意义。交际能力还包括心照不宣的行为准则知识(Hymes,1992)。
Partingtong(1998:18)认为,“形式上可能”维度指代语言的脱离语境方面,而其他三个维度——“心理语言学方面可实现的和可行的”“社会语言学方面合适的”“实际上被说被写被频繁运用的”——都与语境密切相关,受到其他知识系统的限制。在词语义项、近义词、近义构式、语法标记、语序选择等方面,广泛运用多因素语境共享分析(许家金,2020:10)。
Salt常常出现在菜谱中,常见的形式为season with salt and pepper、a good sprinkling of salt and pepper、salt、pepper and mustard。在烹饪语境中,salt的反义词为salt/sugar或者salt/sweet。但是短语salt water的反义为fresh water。复数形式的salts出现在不同的搭配中,不再具有氯化钠的意义,例如,copper salts、iron salts、mineral salts、vegetable salts。Salt在谚语中的意义更是远离现代人的常规认知,例如rub salt into the wounds(在伤口上擦盐,使痛上加痛)、have to be taken with a pinch of salt(不全信,有保留地)、the salt of the earth(非常正派的人)、if he is worth his salt(称职)。Salt氯化钠本义可以解释其历史渊源,盐曾经是历史上比较有价值的商品,可以用于贮存食物。但是,这个意义逐步在不断延伸的隐喻意义中丧失,salt的延伸意义与互文性地引用《圣经》典故相关。我们虽然不能直接观察salt的意义,但是语料库数据可以提供这些意义的证据。这些意义依赖上下文中词汇与其他词汇的关系,或者依赖词汇与其他文本中其他词汇的关系(Stubbs,2001:45)。
语料库索引行让我们在横轴维度(横组合关系轴)和纵轴维度(尤其是索引行向左/向右按照字母顺序重新配列后)观察文本,寻找重复出现的文本证据(Tognini-Bonelli,1996)。索引行分析方法对词语的典型搭配、类联接、语义倾向和语义韵进行描写和归纳,为搭配研究、短语学、局部语法等领域的研究指明方向(梁茂成,2021:13-14)。
学术话语和职业话语语料库研究已经揭示,语言中存在高度惯例性的短语(phraseology)(Biber et al.,2004;Groom,2005;Charles,2006)。这些特定的、重复出现的词汇短语模式,比起某个人的语言直觉来,无疑为研究者提供有效的线索去寻求语言的本质(顾曰国,1998:2-4)。从语料库证据,归纳最频繁使用的类联接型式、词语搭配、意义和功能,可以帮助语言教师发现新的语言事实、新的意义和用法模式,提高语言教师和学习者的语言意识和语料库技能。在学科教学理论指导下,集成语料库检索技术、 网络音视频流媒体技术及人机交互界面,为语言教学提供底层数据支持(桂诗春 等,2010:419-426)。大型英语语料库的真实语言给养,可以构成数字化教学资源建设的有机成分,确保英语学习者接触更加地道的语言资源,促进数据驱动的英语语言的教与学。