王立非 钱 娟
〇外语教学
编者按:外语教学,其实就是师生共同实施母语与外语之间的转化行为。尽管对象同一,但研究维度和关注焦点却可以不同。外语教学十分复杂,的确需要多维度、多层次研究。
提 要:本文运用语料库考察中国英语学习者演讲语块使用的特点,研究发现:(1)中国英语演讲选手使用4类语块:多元词、短语架构、习俗语和句子构造框架,4类语块的使用频率存在差异,较少使用习俗语和多元词,但后者的丰富度最大;(2)中国演讲选手的语块使用与英国演讲者相比存在显著差异,在语块总体丰富度上未见显著差异,但表现出过多使用习俗语块的倾向;(3)大学生与中学生无显著差异,但大学生的语块丰富度明显高于中学生,中学生的习俗语块使用频数远远超过大学生,但丰富度却较低;(4)英语演讲典型语块错误包括母语迁移错误、习得错误、冗余错误、混用错误等。
关键词:语块;英语演讲;语料库;对比分析
中图分类号:H319.3 文献标识码:A 文章编号:1000-0100(2009)02-0115-6
A Corpus-based Study on Chunk Patterns of Chinese EFL Public Speakers
Wang Li-fei Qian Juan
(University of International Business and Economics, Beijing 100029, China)
This paper describes the patterns of chunks in unprepared public speeches by Chinese EFL learners quantitatively and qualitatively. The present study tries to address four questions: the general patterns of chunks in Chinese EFL public speakers, the differences in formulaic uses between Chinese and English speakers, the differences across secondary and tertiary Chinese EFL speakers and major types of errors and sources. The results show that Chinese EFL learners apply four types of chunks, among which sentence builders are most frequent and polywords have hightest richness; Compared with native speakers, Chinese EFL learners show no significant difference in formulaic use, except for institutionalized expressions; University speakers are much better than middle school students; Chinese EFL learners tend to make several types of errors, such as, interlingual, intralingual, redundancy, and mixed errors.
Key words:chunks; English public speaking; corpus; contrastive analysis
1 引言
近年来,语料库方法使得语块(chunks)研究更加深入,范围更为广泛。国内外的众多学者对语块都显示出了浓厚的兴趣,从各个方面开展研究,研究范围涉及以下几类:(1)成年英国演讲者的语块使用(Moon 1998, Wray 2002);(2)母语语块习得(Wray 2002);(3)二语学习者的语块使用(Weinert 1995; Granger 1998; Howarth 1998a, 1998b; 王立非 张岩 2006; 张建琴2004)等。就二语语块习得的研究而言,文献报道过书面语语块的使用和学习,本文重点研究中国学习者英语即席演讲中的语块使用特点。
2 语块理论
语块指出现频率高,可作为整体储存、提取和产出的套语序列(Wray 2002)。Skehan(1998)指出,二语学习者通过二种途径发展中介语,即规则学习(rule-based learning)和范例学习(examplar-based learning),而范例学习就是语块的构建。语块是一种兼具词汇与语法特征的语言结构,通常由多个词构成,并具有特定的话语功能。语块从结构上可分为4类(Nattinger & DeCarrico 1992):(1)多元词语块(polywords),(2)习俗语语块(Institutionalized expressions),(3)短语架构语块(phrasal constraints),(4)句子构建语块(sentence builders)。语料库语言学研究表明,那些出现频率高,不同程度词汇化的语块构成英语的基本语言单位。Altenberg(1991)发现,大约70%的日常口语都由语块构成。Lewis(1993)认为,词汇是语言的基础,语言应被视为语法化的词汇过程,而不是词汇化的语法过程。由此看出,语块对学习者的二语习得和产出十分重要,尤其它能增加二语的流利度和准确性。
目前,国外研究二语语块主要通过三种方法(王立非 张大凤 2007):(1)语法学方法,(2)语料库语言学方法,(3)心理语言学方法。这三种研究方法彼此互补,都认为语言使用者有一个整体记忆和回忆的序列库,而这种整体的处理方式在大多数情况下是首选模式。语料库语言学方法通过对大规模语料库中的出现频率来识别短语、固定搭配和其他反复出现的语块,以出现频率为基础来界定语块,根据频率再加上一些常识判断,就可决定哪些是语块,哪些是某个语言群体整体保留和记忆的惯例,但频率原则存在一定的不合理因素。Stubbs和Barth 2003探讨了高频语块的使用,他们提出一个假设,反复出现的语块可以区分小说类、纯文学类和学术类三种不同文体类型文章的特征。他们采用了三个子语料库,比较了由2-5个词构成的高频语块,结果发现,三类文体具有显著差异。该研究得出结论:小说类文章具有动词性文体的特征,使用过去式,并频繁出现属于说、看、思考和需要等词域的词汇。学术类文章具有名词性文体的特征,使用半专业词汇,缺乏文体风格的变化。在文体特征方面,纯文学类文章介于小说类和学术类之间(Stubbs & Barth 2003: 79)。Wiktorsson (2003)对瑞典二语学习者写作中的语块进行了识别和分类研究,她发现,瑞典高水平英语学习者使用的语块并不比本族语者少,但在写作中使用的英语语块具有口语化倾向,而且这些语块大多数都不太地道,属于非正式语体。此外,她还发现,(1)水平较低的学习者使用的语块比高水平的学习者少;(2)语块使用的语体错误较多;(3)语块受母语影响较强。
一些专家(Lewis 1993) 提倡在课堂上直接教授语块。Hsu(2002)开展了相关研究,探讨词汇搭配教学是否可以提高学习者的语言流利度和搭配熟练度。9名台湾大学生参加了实验。研究发现:(1)外语水平和词汇搭配使用之间显著相关;(2)词汇搭配能力受到课堂教学、学习经历、学习动机、母语/外语差异、地道性(idiomaticity)、搭配成分的语言形式复杂性和搭配要素频率的影响。Wood提出一种“以自动加工和提取常备语块为中心的”流利表达模型 (Wood 2001: 586),该模型认为,语块单位只不过是两个相邻停顿之间的序列,多词语块可以不受短期记忆容量和规则配置控制的约束而产出话语,对表达的流利度十分重要,因此语块习得要强调自动化,在这个阶段,学习者需要花很多时间模仿录音,包括模仿语块单位和模仿停顿和语调等超音位特征。从本质上讲,Wood提出的强化训练模式与Ellis提出的二语流利度是建立在加工众多语块基础上的观点完全一致。
本文采用Nattinger & DeCarrico(1992)的分类,根据结构和意义将语块分为4类,如表1 所示。
3 研究问题与研究语料
3.1 研究问题
本文考察中国学习者英语即席演讲中语块的使用特点,主要回答以下4个问题:(1)中国学生英语即席演讲中的语块使用存在何种特点;(2)与英国演讲者相比,英语演讲选手的语块使用存在何种差异;(3)不同年级的演讲选手在语块使用上是否存在差异;(4)演讲选手的语块使用是否存在错误,典型错误有几类,出错的原因是什么。
3.2 研究语料
3.21 中国学习者英语演讲语料库
中国学习者英语演讲语料库(Chinese Learner English of Public Speaking,简称CLEPS)由作者自建,语料主要来自全国最具影响力的英语演讲比赛:“CCTV杯”全国英语演讲大赛、CCTV“希望之星”英语风采大赛和“21世纪杯”全国英语演讲比赛中的优秀选手的即兴演讲部分,基本上代表我国最高层次的学生英语演讲水平。CLEPS共包括129, 175个形符,6, 613 个类符,426篇即兴演讲,其中75篇为中学生的即兴演讲,351篇为大学生的即兴演讲,话题涉及教育、个人理想、社会问题、环保等常见话题。参赛者临场抽取题目,每人有1分钟的准备时间,之后围绕这个话题即兴演讲,比赛中,选手们要合理安排演讲时间、内容及结构。
3.22 英国国家语料库
参照语料库为英国国家语料库(BNC)口语库中的即兴演讲语料。为了保证可比性,作者对语料库的规模和演讲话题都作了筛选,选择了17篇即兴演讲语料(语料编码名为DCJ, DCK, F8A, F71, JJJ, JST, JT2, JT4, KM6, FUE, FUF, G4G, KRX, G4F, GY4, FUT, FMS),总形符数为129,261,类符数为6897。两个语料库的具体信息见表2。
我们对语料库中的语块频数和分布统计时,首先界定语块的性质和分类。基于前人的研究成果(Wray 2002,Biber 2000,许家金等 2007)和本研究的目的和方法,本文的语块的操作性定义为:由2-6个词组成、出现最低频数分别达到8,6,4,2,2次、能表达相对完整意义的(非)连续的词语序列。语料库的提取采用WordSmith软件自动提取,然后进行人工筛选,剔出不符合语块界定条件的词语序列,比如,that you are, is not the, and I think the, of all I think, you for the question, all, thank you for your等。之后,根据本文采用的语块分类标准,按万分率对原始数据标准化统计并报告结果,对统计结果作卡方检验,以验证差异是否具有显著性。
4 结果与讨论
我们对学生演讲选手的语块使用总体特点、与英国演讲者的差异、不同水平演讲选手的差异和典型语块错误进行统计和分析,得到以下结果。
4.1 我国演讲选手的英语语块总体特征
表3显示,我国演讲选手的4类语块共出现了4,157次,各类语块的使用频数存在差异。所表现出的总体特征按使用频数多少依次是:句子构造框架→短语架构→习俗语→多元词,其中,句子构造框架达2,059次(159次/万词),占总频数的50%;其次为短语架构语块1,021次(79次/万词),占总频数的25%,习俗语语块和多元词语块的频数较少,分别为708次(55次/万词)和369次(29次/万词)。由此可见,中国学生在英语即兴演讲中偏爱使用句子构造框架语块和短语架构语块,而较少使用习俗语和多元词。究其原因,我们推测,参赛选手即席演讲都是口头在线加工话语,时间紧,认知负载量大,可能会趋向于使用自己比较熟悉、结构较为开放灵活、易于提取的语块类型,而句子构造框架和短语架构属于开放型句法结构,只需掌握2-3个词组成的框架,填入所要表达的单词或词组就能组成句子。而习俗语块和多元词语块属于封闭性句法结构,结构相对比较固定,结构中的每个词都不能随意改变,要求记忆精确,提取和加工都要求更加准确,学生掌握的多元词和习俗语块数量有限,演讲时只能反复使用自己特别熟悉和有把握的语块。这个推断是否正确可以从对比英国人演讲语料和分析语块错误类型中进一步得到证实。中国学生语块的使用具体见表3。
就语块的丰富度指标看,多元词语块丰富度最高(63.0),其次为短语架构语块(49.3)和句子构造框架(28.2),而习俗语语块最低(14.6)。本文对句子构造框架和习俗语语块进行排序,发现最高频的两个语块为I think和Thank you:I think出现了1082次,占句子构造框架语块总数的53%; Thank you共出现了630 次,占习俗语语块总频数的89%。由此可见,演讲选手构建话语立场和保持言语交际性和演讲流利度的主要手段依靠这两种语块。统计分析所反映出的总体倾向是,中国学生英语演讲中4类语块都出现,以多元词语块和短语架构较为常见,习俗语语块和句子构造框架较少。学生偏好使用句子构造框架,但多元词语块的丰富度最大。
4.2 与英国演讲者的语块对比分析
我们对比英国演讲者的语块使用特点后发现(见表4),总体而言,中国演讲选手的语块使用频数与英国演讲者相比存在显著差异(卡方值为4.21,p≤0.05),二者之间在语块总体丰富度上未见显著差异。学生演讲选手在多元词和短语架构两类语块的使用上少于英国演讲者,而在习俗语和句子构造框架二类语块使用上高于英国演讲者,除习俗语块外,差异均未达到显著性。二者的习俗语块使用出现了显著差异性,一个显著的特点是,中国学生演讲时过多使用习俗语块,从统计结果判断是学生过多依赖某类习俗语块,比英国演讲者高出45次/万词,而TTR指标显示,习俗语块的丰富度较差(14.60),与英国人相比,具有显著差异(卡方值为45.93**),从而证实了“习俗语块量大类少”的判断。对句子构造框架的进一步考察发现,I think在BNC中出现了317次,占句子构造框架语块总频数的19%,而在CLEPS中出现的频数为1,082次,占句子构造框架语块总频数的53%,中国学生存在过度使用I think语块的现象,这个发现再次支持了部分研究的结果(王立非 张岩2006)。
4.3 不同水平演讲选手的语块使用对比分析
通过对比分析大学组和中学组英语演讲选手的语块使用数据,我们发现以下特点(见表5)。总体上,大学生在语块使用上与中学生无显著差异,但大学生的语块丰富度明显高于中学生,差异达到了显著水平(卡方值为6.37,p≤0.05)。具体到每类语块,除了习俗语块的丰富度未见显著差异(1.83)外,其余三类语块的每万词频数均高于中学生,但没有显著差异,大学生三类语块的丰富度都明显高于中学生,二者表现出显著差异:多元词语块(卡方值为9.96,p≤0.01),短语架构语块(卡方值为5.43,p≤0.05),句子构造框架语块(卡方值为5.09,p≤0.05)。特别值得注意的是,中学生的习俗语块使用频数远远超过大学生(卡方值为4.75,p≤0.05),但丰富度却低于大学生,表明中学生在演讲中过多使用某一个或几个习俗语,个案分析发现,中学生演讲语料中最高频的习俗语块是thank you (very much) for your questions.
4.4 演讲选手典型语块的错误分析
定性分析发现,典型语块错误涉及语际错误、语内错误、冗余错误、混淆性错误等(James 2001)。举例如下:
4.41 语际错误
由于受汉语思维模式的负面影响,语际错误主要表现在的使用方面。例如:
① But, everything has two sides. The most important part is, we, the young citizens of China, know how to choose. (正确的语块为:Every coin has two sides.)
② I have, say this for example. You know, Bruno, who is a very famous astronomer in the Middle Age. He is very knowledgeable of course. (正确的动词为take this for example)
此外,由于汉语中冠词体系与英语的大不相同,中国学生英语演讲中语块冠词的错误使用也属于受母语迁移的影响。例如:
③ But I see it in a different way. On ( ) one hand, some master pieces of the rock and roll music represent maybe the most soft and touching lyrics and melodies.(正确的语块为:On the one hand)
4.42 语内错误
语内错误主要由学习者对目的语语法的不完全习得造成,其中,最为典型的一个错误就是过度概括。
④ So my point is, first of all, awareness, and second of all, law, and third of all, social moral system.(将first of all语块的规则过度概括,导致错误)
⑤ The last but not the least, I think its the affection from the parents.(Last but no the least)
⑥ First I want to say that everything has two hands and for this question well say, some schools only separated their students into good or bad and only by their exam scores.
4.43 冗余错误
学生的冗余错误主要是语块语义上的冗余、累赘或重复。
⑦ But most people as far as I am concerned, as far as I know, most people who are successful in this world, such as, Steven Hawking, say, Bill Gates, are all successes that fully depend on their own efforts, I think.
⑧ From my point of view, I think, the young people learn to be more independent is very necessary and very useful nowadays.
⑨ And for me, I think I also got problems-just now I said. For example, I also got the generationgap.
4.44 混用错误
错误主要是学生学习时,只关注意义,未能正确掌握用法,导致将其他意义相近但用法迥异的语块混淆在一起,造成混淆错误。
⑩ I think thats a really interesting and easy for me to answer question. Well, ah...like I said, my father carried our first computer home in 1995.(正确的语块为:just as I said)
(11)So I hopefully that when they return they will create a chain reaction that bring more and more foreigner people and foreigner friends to come here and see the Beijing, the new China, face-to-face.(So I hope that)
5 结论
本研究得出了以下4点结论。(1) 中国英语演讲选手使用4类语块:多元词、短语架构、习俗语和句子构造框架,4类语块的使用频数存在差异;呈现出从句子构造框架→短语架构→习俗语→多元词不断递减的总体特点,演讲中偏爱使用句子构造框架语块和短语架构语块,而较少使用习俗语和多元词,但多元词语块的丰富度最大,最高频的语块为I think 和Thank you. (2) 中国演讲选手的语块使用与英国演讲者相比存在显著差异,在语块总体丰富度上未见显著差异。多元词和短语架构二类语块少于英国演讲者,而习俗语块明显多于英国人,表现出过多使用习俗语块的倾向。(3) 大学生与中学生无显著差异,但大学生的语块丰富度明显高于中学生,中学生的习俗语块使用频数远远超过大学生,但丰富度却较低。(4) 中国学生英语演讲语块典型错误包括母语迁移错误、习得错误、冗余错误、混用错误等。以上发现对认识中介语发展和演讲教学具有一定启示意义,语块是发展中介语的重要途径,也是发展正确性与流利度的有效方法,在教学中学生应重视学习和记忆英语语块。课堂二语语块的教学可围绕以下几类展开:(1)会话保持语块,指调节和描述会话开始、继续、结束等交际规则的语块;(2)会话目的语块,指用来描述会话功能的语块,如表示客气、询问、请求、反对等;(3)话题相关语块,指日常交往中提及的话题,涉及生活、工作、学习的方方面面,围绕某一话题的惯例化表达方式,逐步形成对某一话题的交流能力;(4)话语设置语块,指连接话语结构和意义的语块,使语篇连贯流畅,衔接自然,逻辑关系分明;(5)交际策略语块,指交际者运用语言或非语言手段,为克服由于语言能力不足引起的交际困难的语块能力,包括拖延策略语块、弥补策略语块、处理话轮语块和自我修正语块等。不同类型的语块对二语口语和演讲教学具有意义,可指导学生练习,以达到提高语言水平的作用。
参考文献
金利民等. 英语演讲选评100篇[M]. 北京:外语教学与研究出版社, 2006.
王立非张 岩. 基于语料库的大学生英语议论文中的语块使用模式研究[J]. 外语电化教学, 2006(8).
王立非张大凤. 国外二语预制语块习得研究的方法进展与启示[J]. 外语与外语教学, 2006(5).
许家金等. 中国大学生英语口语中的互动话语词块研究[J]. 外语教学与研究, 2007(6).
张建琴. 中国高、中、初级英语学习者词汇短语使用的对比研究[J]. 外语界, 2004(1).
Altenberg, B. On the Phraseology of Spoken English: The Evidence of Recurrent Word-combinations [A]. In Cowie, A. P. Phraseology: Theory, Analysis and Application [C]. Oxford: Oxford University Press, 1998.
Biber, D. et al. Longman Grammar of Spoken and Written English [M]. Beijing: Foreign Language Teaching and Research Press, 2000.
Granger, S. Prefabricated Patterns in Advanced EFL Wri-ting: Collocations and Formulae [A]. In Cowie, A.P. Phraseology: Theory, Analysis and Application [C]. Oxford: Clarendon Press, 1998.
Howarth, P. Phraseology and Second Language Proficiency [J]. Applied Linguistics, 1998a(1).
Howarth, P. The Phraseology ofLearners Academic Writing [A]. In Cowie, A.P. Phraseology: Theory, Analysis, and Applications [C]. Oxford: Oxford University Press, 1998b.
Hsu, J. Development of Collocational Proficiency in a Workshop on English for General Business Purposes for Taiwanese College Students (China) [D]. Unpublished Ph.D. Dissertation in Indiana University of Pennsylvania [ProQuest Dissertation Abstracts Database], 2002.
James, C. Errors in Language Learning and Use: Exploring Error Analysis [M]. Beijing: Foreign Language Tea-ching and Research Press, 2001.
Lewis, M. The Lexical Approach[M]. Hove, England: LTP, 1993.
Moon, R. Frequencies and Forms of Phrasal Lexemes in English [A]. In Cowie, A. P.Phraseology: Theory, Analysis and Applications [C]. Oxford: Clarendon Press, 1998.
Nattinger, J. R. & DeCarrico, J. S. Lexical Phrases and Language Teaching [M]. Oxford: Oxford University Press,1992.
Schmitt, N. Formulaic Sequences: Acquisition, Processing and Use [C]. Amsterdam: John Benjamins, 2004.
Sinclair, J. Corpus, Concordance, Collocation [M]. Oxford: Oxford University Press, 1991.
Skehan, P. A Cognitive Approach to Language Learning [M]. London: Oxford University Press, 1998.
Stubbs, M., & Barth, I. Using Recurrent Phrases as Text-type Discriminators: A Quantitative Method and some Findings [J]. Functions of Language, 2003(1).
Weinert, R. The Role of Formulaic Language in Second language Acquisition: A Review [J]. Applied Linguistics, 1995(2).
Wiktorsson, M. Learning Idiomaticity: A Corpus-Based Study of Idiomatic Expressions in Learners Written Production [D]. Unpublished Ph.D. Dissertation in Lunds University, Sweden [ProQuest Dissertation Abstracts Database], 2003.
Wood, D. Formulaic Language in Acquisition and Production: Implications for Teaching [J]. TESL Canada Jour-nal, 2002(1).
Wray, A. Formulaic Language and the Lexicon [M]. Cambridge: Cambridge University Press, 2002.
收稿日期:2008-04-20
【责任编辑 李洪儒】