主编寄语

2022-02-04 03:19赵杨
国际中文教育(中英文) 2022年2期
关键词:柯林斯语言学词典

本期专家主题论坛围绕语料库研究展开。

我当过中学和大学的英语教师。说起语料库,我首先想到的是1987年出版的《柯林斯COBUILD英语词典》(Collins COBUILD English Language Dictionary),这是一部学习词典。第一部英语学习词典是1948年出版的《牛津高阶英语词典》(Oxford Advanced Learner’s Dictionary),70多年过去了,如今已修订到第十版,服务了全球超过1亿的英语学习者。但是柯林斯词典有其独特之处:它是世界上第一部真正意义的基于语料库素材而编写的学习词典。1979年,哈珀·柯林斯出版公司与英国伯明翰大学合作创建了柯林斯-伯明翰大学国际语言数据库(Collins Birmingham University International Language Database),英文简称COBUILD,将语料库建设与商业研发结合起来,推出了这部划时代的词典,对此后的词典编写产生了巨大影响。柯林斯也由此成为紧随牛津、朗文、剑桥、麦克米伦四大英语工具书出版商之后的新秀。

COBUILD不是最早的语料库。第一个机读英语语料库是20世纪60年代美国布朗大学创建的当代美国英语标准语料库,简称布朗语料库。它是一个通用语言语料库,总计约100万个单词,由1961年在美国发表的英语作品汇编而成。布朗语料库是一个分界线,将语料研究分为前计算机阶段和后计算机阶段,前计算机阶段称为计量语言学(Quantitative Linguistics)或统计语言学(Statistical Linguistics)。1983年,在荷兰奈梅亨举行的第四届“现代和中世纪英语国际计算机档案库”(International Computer Archive of Modern and Medieval English,简称ICAME)会议,将“语料库语言学:计算机语料库在英语研究中的使用”作为主题,标志着这一新的语言学分支的诞生。在过去近40年的时间里,语料库语言学产生了大量研究成果。1998年,朗文出版社出版了《语料库语言学简介》(An Introduction to Corpus Linguistics);2006年,爱丁堡大学出版社出版了《语料库语言学术语》(A Glossary of Corpus Linguistics);2010年,《劳特利奇语料库语言学手册》(The Routledge Handbook of Corpus Linguistics)出版。剑桥大学出版社近年来出版了多本语料库语言学著作,包括2015年的《剑桥学习者语料库研究手册》(The Cambridge Handbook of Learner Corpus Research)、2018年的《语料库语言学中的统计》(Statistics in Corpus Linguistics)和2021年出版的论文集《学习者语料研究与第二语言习得》(Learner Corpus Research Meets Second Language Acquisition)。也有一些语料库语言学期刊,如《语料库语言学研究》(Research in Corpus Linguistics)、《国际语料库语言学期刊》(International Journal of Corpus Linguistics)、《语料库语言学与语言学理论》(Corpus Linguistics and Linguistic Theory)、《应用语料库语言学》(Applied Corpus Linguistics)等。国内的语料库语言学研究始于20世纪80年代,几乎与欧美同步。2014年,《语料库语言学》期刊由外研社出版发行。以上所列著作和期刊挂一漏万,但足以说明语料库研究的重要性和欣欣向荣的发展态势。

中文教学界很早就开始了语料库建设与研究。1979年到1985年,北京语言学院组织70多位教师,用人工与计算机统计相结合的方法,对180余万字各种题材、体裁的语言材料进行词频统计与分析;同时兼顾汉字字频和组词能力,于1986年出版了《现代汉语频率词典》,为中文信息处理标准化以及语言学、语言教学和相关学科的研究提供了有价值的参考材料和数据。20世纪90年代,中文作为第二语言的量化研究开始出现,而基于语料库的研究从一开始就占据了量化研究的一席之地。

中文作为母语和二语都建设了一些语料库,如CCL语料库、BCC语料库、全球汉语中介语语料库等,帮助我们在海量数据中发现语言奥妙和语言学习规律,获得具有统计学意义的结论,在描写的同时做出解释。语料库语言学强于描写,但基于大数据的描写本身也是一种解释,帮助我们窥探语言的本质。

语料库研究让我想起了生成语法。生成语法提出了制约自然语言的普遍原则,描写人类与生俱来的语言知识和语言机制,而语料库语言学揭示了现实语言使用的情况。二者从两个方向朝着揭秘语言本质的目标前进。

猜你喜欢
柯林斯语言学词典
体认社会语言学刍议
《复制性研究在应用语言学中的实践》评介
米兰·昆德拉的A-Z词典(节选)
米沃什词典
词典引发的政治辩论由来已久 精读
良心手术
书讯《百年中国语言学思想史》出版
澳大利亚“柯林斯”级潜艇将延长服役至2030年
漫画词典
NEW WORDS