刘改琳 张静华 李定顺
(刘改琳 张静华:西安工业大学外国语言系。李定顺:西安工业大学外国语言系,讲师。研究方向:语料库语言学与教学法。)
《中国日报》(China Daily)除了对外宣传中华名族优秀的文化传统、风土人情、政治与经济改革之外,还辐射了我国政府的国内外方针政策,折射出了具有传统文化特点的中国政治理念。同时还以大量篇幅及时报道国际新闻事件。因而,以中国社会为背景的中国英语,就内容而言既有国际性,又具有“中国背景”的特色。利用其语料进行学习,不仅可以提高英文能力,掌握英语发展的趋向,还可以了解中国和世界大事,知晓中西方交流和变化(张健,2007)。
在结构体系上,《中国英语》同国外期刊一样,它以相对固定的栏目从不同的社会视角追踪报道中国社会的各个方面和国际社会的热点新闻。这样,对某一特定时期关注和传播的社会焦点就容易形成“新闻丛”,从而主题性比较显著。这些“新闻丛”中的语言风格,词汇选择倾向性相对一致,即同一语域的词汇同率高,有利于词汇的认知与巩固。
此外,China Daily 中国英语与汉语报纸,如《人民日报》等在内容上具有一定的同步性和协调性。由于服务目的和功能基本相同,这些报纸只是用不同语言符号在传播着同样或类似的信息。所以,中国英语学习者可以通过不同的汉语报纸,掌握语言必备的社会背景知识,为学习相应的英语知识提供了很好的条件。
利用China Daily的中国英语语料主题库进行教学,有着建构主义、图示理论、心里词库以及输入假设等理论依据。该语料库以不同主题对文本进行归类,在汉语学习环境下的中国学生可以在某一主题下选取若干文章,形成真实的语言环境来进行个体的“同化”和“顺应”,可以实现语言知识上的构建;China Daily语料库所描绘、反应的是中国学生真实的汉语学习环境。这些语料承载的主题内容,与他们的经验图式相似度高,作为学习材料时容易激活他们的图式,而且同时也可以使他们避免由于对背景知识的缺失而造成的学习困难,可以集中精力学习词汇;利用这种主题范畴,中国外语学习者可以选取其中的一篇或若干篇文章进行主题学习。通过主题词提取,构建纵向词聚语义场和横向组合共现。这种聚合有词性类聚、语义类聚(同义词类与反义词类聚合)、上下义类聚,场属类聚(如亲属场和颜色场等),它们体现的就是心理词汇的网络层次结构,利于存储、记忆;在外语学习中,绝大部分中国学习者所有是汉语言大环境,要达到本族语的“习得”和输出的流利度,存在一定的困难,需要大量的输入。不过我们可以借助一定的方法,创造适合的、能够大容量输入语言的条件,使学习者的“学得”趋近于其“习得”。根据我们的研究,通过主题性语料库可以提供给学习者大量“主题板块化”的语言输入。另一个方面,由于这些语料库的内容、背景图式学习者已经建立或容易建立,所以学习者把关注点可以放到语言形式,如词汇的学习上,再配合课堂内的学习,从而可以取得较好的“学得”效果。
语料库的具体方法涉及语言教学与研究的各个层面,如基于检索统计的搭配,句法提取、语篇分析等。这里我们只介绍主题性、搭配与词块。主题性涉及主题统计。主题是指语篇论述的话题,是语篇内容的主体和核心。而主题性在语料库语言学中是指某词项基于该话题在观察语料库和参照语料库对比中的主题显著性。主题性值的大小能够表现出主题的显著性。根据语言词汇“语域”理论,同语域的词汇倾向于出现在同一主题的语篇中,同一主题下会有大量同语域词出现,形成词网和语义场,有利于词汇系统学习。其次,搭配是指两个或多个词在文本中短距离的共现(Sinclair,1991:170)。它是语言线性组合轴上最重要组织形式之一。作为线性轴上的高频率组合,根据刘易斯的划分,搭配也是词块的一种(Lewis, 1993),所以,下面我们一并来研究。
China Daily 语料库主题库按照横向内容序列库主要分为10个子库:政治、经济、文化、生活、体育、教育、娱乐、环境、科技和军事。文本总数为156864个,形符总词数达1.125亿词次,类符数35万词。
根据库的特点和教学目的,China Daily中国英语语料库专门开发了功能强大的检索软件Word Smart 2009。该工具通过稿源(主要包括CHD、XH、AP和Reuters等)、类别(10大主题)、时间(2000-2008)和篇数四个选项提取语料库。利用该工具,教师可以给学生提前提取、处理好学习材料,再结合软件的统计,给出建议,指导学生课外自主性学习使用。
教师给学生选择和处理材料进行词汇教学主要分为下面五个环节:
1.新闻丛的提取。教师利用软件设置(主题与时间组合)调出需要的文章,进行分析,指导学生学习。如:调出2008年5月12到25日间的文章共61篇,然后提取6篇关于灾难伤亡报道( disaster coverage)为小主题的新闻丛(见Table 0)。这里我们选择词数较多的第六篇文章做一个分析,指导学生学习其它五篇。
Table 0 Clusters of casualty coverage in disaster
2.主题性词类聚合。教师通过Word Smart 2009的Keyness功能统计、计算出主题词汇和主题性,然后利用 File-based concordance和statistics功能对其检索分类,通过整理得到三个表格数据:名词主题性表,动词主题性表和形容词主题性表。副词主题性本例略去。
3.主题词图式模型。从语篇学和体裁学来看,事件性新闻要有5W和一个H,即事件类型(what)、事件对象(Who)、事件时间(When)、事件地点(where)、事件原因(Why)以及事件情况或经过(How)。根据这一特定的语篇结构,梳理主题性词表易知此例中事件类型为灾难;事件对象为地震和其相关人和物;事件时间为5月;事件原因没有分析,没有主题词;事件情况主要有消息来源、事件过程和事件描述,其具体方面包括对象描述、场所描述、程度或级别和细节描述。基于三个词表,结合体裁特征,得到主题词关系映射表。
4.词汇扩展语义场。主题图式反映了主题词之间的的聚合语义关系,如上下义、同义和和反义等。为了聚焦学习词汇,教师可以按照语义场对词汇进行分类:
上下义关系:上义词Quake?下义词earthquake,tremor,afterquake(s),aftershock(s)。
同义关系:Rise,burst,occur,hit,trigger。destroy,damage,rock
5.搭配与词块。借助于Word Smart的collocates统计功能,教师可以很快地得到显著性搭配词。如统计burst的搭配,得到统计结果。观察统计量,互信息值小而Z值大的为into,所以burst into构成显著性搭配。
Becker最早对词块进行了专门的研究,他认为语言的记忆和存储、输出和使用并不是以单个的词为单位,那些固定和半固定的模式化了的板块结构才是人类语言交际的最小单位。词块包括所有形式上具有固定性,语义上具有预制特征的多词单位。根据这一定义,教师通过检索单词,如toll,然后对检索行进行整理(也可以通过N-gram功能提取),就会发现那些明显具有预知特征的板块式结构,如death toll from和death toll rises。