摘 要: 语料库是指基于计算机数据库的电子文本集,由大量真实的语言材料和检索系统组成。基于语料库的研究是一种实证性研究,九十年代以后逐渐得到普及应用,如今已成为一大热点。语料库在英语教学科研的应用可从4个层面展开:语言结构层面、篇章结构层面、话语语用层面、文学作品分析层面。方法可遵循“点—线—面”的语境扩展分析法。
关键词: 语料库应用 辅助性 外语教研
一、语料库是外语教学研究的热点
英语的corpus(语料库,复数为corpora)一词,在《语料库应用教程》(梁茂成、李文中、许家金编著)中的解释是:来自拉丁语,本意为body[1]3。如此解释,未尝不可,但无助于理解现代英语中corpus的准确意义。
英国牛津大学出版社出版的The Advanced Learner’s Dictionary of Current English with Chinese Translation(最早版本可追溯到上世纪四十年代),还有后来七十年代出版的Longman Dictionary of Contemporary English,都清楚地标明corpus的意义为:a collection of...而后者给出的唯一的、详细的解释是:a collection of基于两个意义,一是a collection of all the writings of a special kind,on a special subject,or by a certain person,如the corpus of Shakespeare’s works;二是a collection of material or information for study,如The dictionary is based on a corpus of 10,000,000 words taken form English books and newspapers。前一条可译为“文集”,后一条可译为“语料库”。可见,corpus一词在英美词典中早不作body解,语料库的概念也早已有之。
现在所指的语料库是计算机时代的产物,是基于计算机技术的一个电子文本集(a collection of texts stored in an electronic database),是由大量真实的语言材料和计算机检索系统组成的。“语料库分析是一种客观的定量分析”[2],“为研究提供可靠的范例保证”[3],在九十年代后逐渐得到普及应用。至今,利用语料库的研究已成为一大热点。从中国知网检索近5年来(2006—2011)发表在国内各种学术期刊上篇名有《语料库》的研究论文,多达2390多篇,发表在核心期刊的有660多篇。语料库语言学作为一种新的研究方法,应引起广大教师的重视。
二、基于语料库研究的层面和方法
基于语料库的外语教学研究可以进行基本文本特征分析、词汇难度分布特点分析[4],或通过统计关键词做话语分析,等等。研究可以从四个层面展开,可以采用“点—线—面”分析法。
(一)研究的层面
语料库辅助外语教学研究可从4个层面[5]9展开:(1)语言结构层面,主要进行字词、短语、语义、句法等方面的分析。(2)篇章结构层面,如起始语、含糊语、礼貌语、结束语,语音语调的篇章功能等。(3)话语语用层面,如批判话语分析、医生与病人会话的语用分析。(4)文学作品分析,如文学批评、作品赏析、文体风格对比等。
目前很多研究从语言结构层面展开,探讨某个词项的出现频率、共现语境、邻近搭配、句法特征、篇章结构等,以及对一些规则、理论进行实证[6]。进行话语语用批评和文学作品分析的论文也不少,主要运用主题词表和搭配检索,分析语料的文本特征、作者风格、主题思想、语用含义等方面的问题[7]。
(二)研究的方法
基于语料库的研究方法可以遵循“点—线—面”的语境扩展分析法[1]216。(1)点,是从词项的检索开始,如词频、主题性统计等。(2)线,主要是对词项的使用语境展开检索,如词项的搭配和左右的共现现象、语义韵、词块检索分析等。(3)面,定量分析之后,利用检索的数据,展开一个全面的定性分析。最后一环是重要的,缺少这个环节,研究就有局限性。
“点—线—面”的分析方法一般多为话语批评和文学作品分析应用。首先是提出研究的和要解决的问题,其次是语料和检索分析系统的准备,再次是检索分析和储存数据过程,最后是对数据的讨论和分析。
三、语料库研究的辅助性
语料库在外语教学研究中主要起辅助性作用。下面介绍几个例子,足可窥其一斑。
例子1:It rains cats and dogs.
这是英语教材中常见的一个短语,各种词典都可以查到。碰到下雨天,我们也许会适时地说上一句,“Oh,It rains cats and dogs.”。但是,这个短语是否是一个常用的或者是已经死亡的短语?我们无法知道。
有一篇介绍语料库的论文提到:英国语料库语言学家Rundell曾同一位荷兰妇女用英语交谈。那位妇女讲一口流利、地道的英语,几乎不带荷兰口音。但是,当她在谈话中使用rain cats and dogs这个短语时,语言学家意识到这妇女的母语不是英语。因为,现代英语中已几乎没有这种用法。为了证实这种直觉的判断,Rundell检索语料库,在1000万词的口语材料中,这个短语一次也没有出现过;在9000万词的书面语材料中也仅出现过一次[8]。语料库给了语感的实证支持。
例子2:关于some和any的用法。
一般教科书都强调some和any的区别在于any用于否定句和疑问句,而some用于肯定句。考试也这样考,否则就会丢分。有人调查了我国初中英语教材第一册69例any,44例为否定句,25例为疑问句,无一例为肯定句。但人们不时发现any用于肯定,而some也不时用于否定,那么,去哪里搜集证据呢?语料库就帮了这个忙。国外有学者做了大量语料库调查发现,有50%的any竟用于肯定句,另有30%—40%的any用于否定句,用于疑问句的any仅有10%[5]49。就是说,教材所定的规则并不符合语言实际运用的情况。
例子3:关于cause的语义韵。
语义韵是指词项搭配的语义范围或色彩倾向。《语料库应用教程》中提到:一名在英国留学的中国研究生在论文中用了cause一词,英国导师却把cause这一词改为lead to,原文和修改文如下:
中国学生原文:Although economic improvement may be caused by tourism,the investment and operational costs of tourism must also be considered.
英国导师修改文:Although tourism may lead to economic improvement,the investment and operational costs of tourism must also be considered.
老师把cause改为lead to,再把被动语态改为主动语态。而这两个词意思是基本一致的,但为什么非要改?英国教师因此检索语料库,大量检索行证实,cause一词总是与消极的、不好色彩的词连用,而lead to的搭配词好坏参半[1]114-116。中国学生把cause与积极倾向的词汇连用,所以英语本族语者就觉得不对劲。这也说明,我们这些非英语本族语学习者所不能体会的语感直觉,语料库可以帮助我们解决。
四、结语
最后,外语教学研究可自建语料库,具备两样东西即可:语料和检索分析软件。语料库可大可小,视能否满足研究需要而定。语料是否需要标注(annotation)也应视研究的需要而定。语料库研究是辅助性的,主要为具体的研究提供客观数据,增强分析力和说服力,可用于各种研究,如分析英文摘要的语法错误[9],或对英语修辞的理论探讨[10],教学上分析大学英语四、六级考试[6]、分析教材难度[8],语料库都发挥了积极作用,所提供的客观统计数据,使外语教学研究更具可操作性和可接受性。因此,对于大多数外语教师来说,掌握语料库的基本应用技术及使用方法非常必要。
参考文献:
[1]梁茂成,李文中,许家金编著.语料库应用教程[M].北京:外语教学与研究出版社,2010.7:3,216,114-116.
[2]罗建平.析美国总统就职演说的历时语言特征——一项语料库的量化调查[J].西南农业大学学报(社科版),2011,(12):125-129.
[3]罗建平,黄伶燕.名词非范畴化与副名结构的聚合关系[J].重庆交通大学学报(社科版),2010,(3):128-132.
[4]罗建平.词汇难度分析RANGE32的可靠性考证[J].重庆科技学院学报(社科版),2011,(20):114-115.
[5]何安平.语料库语言学与英语教学[M].北京:北京大学出版社,2004:49,9.
[6]黄伶燕,罗建平.基于语料库的CET4阅读理解相关性分析[J].韶关学院学报,2011,(7):81-83.
[7]罗建平.美国总统就职演讲主题词的语料库分析[J].浙江外国语学院学报,2011,(5):46-50.
[8]谢应光.语料库语言学与外语教学[J].外语教学与研究,1996,(3):28-33.
[9]罗建平,黄伶燕.高校学报英文摘要中语法错误的分析——以自然科学版为例[J].中国科技期刊研究,2011,22(5):791-794.
[10]罗建平.语法隐喻理论在英语明喻研究中的应用[J].福建教育学院学报,2011,(3):105-107.