陈松菁
(广东药学院 外语部,广州 510655)
语料库在大学英语写作教学中的应用初探
陈松菁
(广东药学院 外语部,广州 510655)
语料库在大学英语写作教学中的作用有待发掘。英语教师可利用目前语料库的研究成果和分析手段来总结学生作文中存在的突出问题。以大学生的英语书面语语体特征为例,对比中介语的研究给我们提供了分析语料的多个角度,运用现有的理论,本文尝试考察了一次论说文写作训练的语料,初步探讨如何应用语料库辅助大学英语写作教学。
语料库研究;大学英语写作;语体特征;作文指导
在2010年9月举行的“首届广外应用语言学论坛”期间,多位国内知名学者聚首就“语料库语言学与外语教学”的关系探讨了两门学科协同发展的情况及应用前景等问题。学者们认为,“语料库语言学在外国和国内都发展很快……但是总的来说,我们的语料库研究还处在比较初级阶段,需要提高”,而“外语教学正是语料库语言学的重要应用领域”,但可惜的是,“语料库辅助的教学还未能切实进入外语教学的主流(即课堂教学)”,“普通外语教师和外语学习者充分利用语料库的人少之又少”。论坛给我们的启示是,在推动语料库语言学研究成果的应用过程中,一线语言教师要从一个被动的“语料库产品(如教材)的消费者”转变为积极的研发者、反思者和行动者。
语料库在写作教学中可发挥多元化的作用,例如:范文库、句型库、词汇用法搜索、语言错误分析等。应用语料库工具来分析学生作文中存在的问题可使作文评讲既全面又重点突出。本文将从一次大学英语教学写作训练出发,探讨语料库研究成果和分析手段在外语教学中的实践指导意义。
桂诗春、杨惠中研究中国英语学习者语料库(CLEC)时发现,中国学习者的写作基本上是“写话”,具有口语化倾向,但又非完全口语化,是一种独特的“中国学习者书面英语语体”。近20年来兴起的对比中介语研究通过学习者语料分析让我们不断加深对这种特殊语体的认识。Petch-Tyson发现高水平的二语学习者在学术写作中过度使用第一/第二人称代词,读者/作者显现度比本族语使用者高。Cobb的研究发现二语学习者过度使用2000个高频词,致使单词缺乏区分性与多样性。据此他们提出了中介语使用者书面语有口语化的倾向。在两者的研究基础上,文秋芳、丁言仁、王文宇考察了中国英语专业四个年级的学习者书面语情况,也证实了中国高水平学习者的书面语和其他中介语使用者一样存在口语化倾向,而且随着英语水平的提高,书面语中口语化倾向有弱化的趋势。吴瑾、邹青从词频密度和词频角度研究了英语专业大学生口头语和书面语的语言特征,进一步证明了“中国大学生实际上倾向使用的是一种混合语体”。这种混合语体“反映了我国英语学习者主要通过书本和正式课堂学习英语,无论教师的教学过程还是学生的学习过程都比较强调语法和词汇知识的积累,但往往忽视语境和语体的作用的现状。”
以上研究从四个角度分析了中介语的语体特征:读者/作者显现度(reader/writer visibility)、词频分布、词汇密度和词频,主要是针对高水平二语学习者(英语专业高年级学生或研究生)的语料库进行量化分析,缺乏非英语专业二语学习者的语体特征数据,如何进一步指导学习者了解和重视书面语与口头语的区别并有意识运用符合语体的表达也没有被深入探讨。
在长期的大学英语教学实践中笔者发现,非英语专业的大学生普遍缺乏或忽视语体知识,在写作文时经常使用一些口语化的表达。这些错误并非语法错误,但是同样会影响文章的质量。在以往的作文评讲中,笔者与大部分英语教师一样侧重归纳学生作文中出现的语法和词汇搭配错误,很少提及语体失误,甚至不知道这种语体失误到底有多严重,应该从哪些方面分析和给学生反馈。受到语料库的相关研究启发,笔者决定做一次新的尝试,用现有的分析手段去考察一次学生论说文训练语料的语体特征,探讨语料库辅助写作教学的可行性。
普通高校的大学英语课程只有四个学期,为提高学生整体写作水平及辅导学生准备四级考试,在第三个学期笔者在精读课上进行了四次作文训练,重点分别为描写记叙文、说明文、论说文和应用文。由于其他语体特征研究的语料库以论说文为主,因此笔者抽取了第三次作文训练的学生习作进行对比。作文题目为“How to Keep Psychologically Healthy?”,在学习完《新世纪大学英语》第三册第四单元Text A“How to Grow Old”后布置,课后完成。收到的作文共61篇,剔除4篇离题的作文再随机抽样40篇,然后逐篇准确输入,组成一个小型学生习作语料库,平均字数247字,库容9865型符,类符/型符比:5.44。在分析语料时,我们使用了语料库分析软件WordSmith tool 5.0以及网上提供的词汇分析工具Range(原名VocabProfile)与Frequency软件。
(1)读者/作者显现度。读者/作者显现度是判断书面语是否有口语化倾向的重要指标。表1所示的是本研究所选语料与其他相关语料中读者/作者显现度各指标的分布情况。其中美国大学生语料数据来自Petch-Tyson的研究(1998:112),高水平英语学习者语料数据参考的是文秋芳等的研究(2003:271)。对比发现,这次学生习作中读者/作者显现度指标达到787/万词,是高水平英语学习者的2.6倍,和本族语的每一万词出现119次相比高出6.6倍之多,但接近于文秋芳等发现的英语专业大一学生书面语特点:792/万词。从这个角度看,非英语专业的学生作文也有口语化倾向,符合潘鸣威等(2010)发现的“读者/作者显现度高是二语/外语学习者在论说文写作中普遍存在的现象”。潘鸣威等还指出:“读者/作者显现度特征有所区别的主要原因是人称代词的使用,其他的因素,如模糊词等的频数差异并不大。”表1的统计结果也证实了这一点。我们还注意到,第一人称复数在学生习作语料中的使用频数是本族语者语料的十倍多,比高水平英语学习者也高出差不多两倍。本来we等词是客观陈述的标志,本族语者书面语中这类代词与其它两类代词相比使用频数最高,说明本族语者偏好使用这类动词表达建议和说理,但是比例差别不至于如此大。针对这一异常,我们进一步用Wordsmith分析了学生习作语料中we的搭配规律。这才发现,学生习作中的we实质上是一种伪装的客观表达而已,从搭配的词来看还是个人观点的强调:检索出与we的搭配比例最高的3组依次是we should/shouldn’t(29%),we can/can’t/could/couldn’t(20%)和we will/won’t(10%)。由此可见,非英语专业的大学生虽然意识到要客观陈述观点和论据,但是由于缺乏适当的指引,致使他们的表达方式只是“表面功夫”。
表1 读者/作者显现度指标频数对比(参考了文秋芳等2003:272)
续表
(2)不同词频等级的词汇分布情况。表2列出的是学生习作使用不同词频等级的词汇分布情况。这次作文训练中,学生使用首批1000词的比例比本族语书面语高出15%,使用第二批1000词的比例高出5%,其他两类词汇比例分别高出4%和6%,由此可见,非英语专业大二的学生在平时写作文时与高水平英语学习者一样存在过度使用高频词的问题,严重程度差不多。同时,我们发现上述5篇课文的词频分布与本族语书面语也有差距,却跟中国学生的书面语词频分布接近。这似乎说明英语教材是针对学习者的水平特意挑选、改写而成的,与真实语料有差别,而学生写作时使用的词句基本来自所学的课文,词汇量有限是正常的。从这方面来看,词频分布特点是由学习者自身水平和所处的学习阶段决定的,与其片面追求学习者的用词比例与本族语者一致,还不如关注其用词是否正确。
表2 不同等级词频等级的单词分布(参考了文秋芳等2003:272)
(3)词汇密度。根据Ure(1971)提出的计算公式:词汇密度=实词数/词汇总数×100%,国外多位学者研究表明,本族语的口语语料的词汇密度一般低于40%,而书面语普遍高于40%。吴瑾、邹青发现CLEC中标为ST5的语料(英语专业四级考试书面语语料)在词汇密度方面较高,达到50.98%,但与其他书面语料以及口语语料的差别不大。参考了相关的词汇密度计算方法,我们也测量了这次学生习作的实词比例(如表3所示)。结果表明,这次平时作文的词汇密度超过40%,与范文和CLEC的词汇密度都没有显著差异,基本符合本族语书面语的语体特征。
表3 不同语料的词汇密度(参考了吴瑾、邹青,2009:10)
(4)词频。词频也可以反映书面语的语体特征。McCarthy&Carter对剑桥国际语料库(Cam-bridge International Corpus,简称CIC)中的书面语料分析后发现,本族语者书面语中使用最多的50个词均为功能词,如the,to,with,would等(见表4)。而吴瑾、邹青却发现,在中国学生的英语书面语中,排前50位的高频词既包含了功能词也包含了实词,与本族语者的口语语体特征相仿。他们列出了CLEC中书面语料的高频词作为例证(见表4)。利用Frequency软件,我们也列出了课文范文和学生习作中出现频率最高的50词,与英语专业学习者书面语和本族语书面语的词频进行对比。如表4所示,学生习作中使用最频繁的50词中竟然有13个是实词,占了26%,显然与本族语的用词规律相去甚远。
我们发现,上述高频词中出现的实词有三种异常情况。第一种情况是,在题目和提纲中出现的主题词及其常用搭配在相关语料中会反复出现,例如CLEC中的festival,学生习作中的keep,healthy,life,health,psychological,psychologically和suicide等。吴瑾等(同上)也指出,命题作文“出于阐述主题的需要,会导致一部分词汇在这些语料中出现的频率大为增加”。但我们认为,更重要的原因是学习者滥用主题词,没有使用近义词或同义表达的意识,才会导致相关实词频率过高。这似乎是二语学习者写作时的普遍问题,因此教师在点评作文时要特别提醒学生重视主题词的多样化并提供例子。
第二种情况与people的所指有关。我们利用Wordsmith检索学生习作中出现的people,共搜到72例,按照分层抽样原则每隔五行选取一例进行分析后发现,people通常位于句中,前后没有修饰语或只有笼统的some,many,different等修饰,范畴模糊。以下列举10例:
1.o do to lead a better life.If people trust the world,they
2.n see that,as the time go by,people are taking more import
元数据是地理信息系统数据库建设的基础,是一种对城市各类数据的描述性数据信息,具有数据共享的特征。随着数字化城市建设进程的加快,导致社会各行各业对准确的、详实的多源数据的需求日益增加,加之各类数据库的逐步普及,不同用户对数据需求的差异,促进不同结构数据之间的转化、更新、检索,甚至是数据集成等都离不开元数据。元数据有利于空间数据的生产和相互转化利用,使得元数据成为建设地理信息系统数据库的重要桥梁。
3.sed quickly,which shocks many people.Young adults are in t
4.be a difficult problem to some people that how to keep psych
5.lonely.In another hand,many people didn’t regard depress
6.at changes have taken place in people’s life in recent year
7.ch as the economy,technology,people’s living standard and
8.suicide,catches more and more people’s sight recently.Acc
9.e society.If we suicided,the people around us will feel f
10.ve confidence in us.Different people have different pressur
1l enjoy your company.Some old people are oppressed by the f
2hat intelligent but inflexible people don't have the right s
3 training for today's business people.As Daniel Goleman sug
4s the personal experience that people would understand the w
5s it is impossible for any two people to see the world exact
第三种情况是中国学习者动词使用过于单一。本族语者书面语中动词表现力很强,富于变化,因此很少有动词雷同的现象。相反,CLEC和学生习作中都有实义动词位列高频词表前50位,可见二语学习者在使用动词时有集中化趋势。表中列出的高频动词有:do,keep,make,feel等。参考McCarthy&Carter研究话语语料库(CANCODE)所得的结果,do在本族语口头语高频词中也榜上有名,这说明do的过度使用可能是书面语口语化的结果。其他词例都是学生习作中频繁出现的,究其原因,keep与主题词连用导致超频使用;而feel的频数高可能与命题涉及人们感受相关,两者皆受到题目的影响。但是make的过度使用显得特殊。利用Wordsmith检索,我们发现学生习作中有54处使用了make,其中69%的搭配有“使……”的意思,使动用法过度使用是典型的中式英语的表现,这个现象从一个侧面反映出非英语专业的大学生书面语不仅有书面语和口语的混合特征,而且还有中式英语的特点。
本研究应用目前对比中介语分析语料的理论和手段,考察了非英语专业大二学生的论说文习作,目的是为了找出其语体特征和作文指导的重点。主要的结果归纳如下:
(1)非英语专业大学生书面语在作者/读者显现度指标和高频词使用方面表现出口语化倾向的特征,而在词频分布和词汇密度方面则表现出符合书面语的特征,这支持了中国学生使用的书面语是一种混合语体的看法。
(2)根据语体特征研究过程中定性分析,要让学生写出符合语体要求的作文,应注意:一、指导学生合理使用人称代词,二、解释书面语与口语用语的区别,三、强调主题词多样化的必要性并举例说明,四、展示动词及动词词组同义转换的例子并多做替换练习。
[1]Cobb,T.Analyzing later interlanguage with learner corpora:Quebec replications of three European studies[J].Canadian Modern Language Review,2003,59(3):393-423.
[2]Halliday,M.Spoken and Written Language[M].Oxford:Oxford University Press,1985.
[3]Halliday,M.Spoken and written modes of meaning[A].In R.Horowitz&S.J.Samuels(eds.).Comprehending Oral and Written Language[C].New York:Academic Press,1987.
[4]Hyltenstam,K.Lexical characteristics of near-native second-language learners of Swedish[J].Journal of Multilingual and Multicultural Development,1988(9):67-84.
[5]Laurén,U.Some lexical features of immersion pupils’oral and written narration[A].InUniversity of Lund Working Papers in Linguistics50[C].Lund:Lund University Press,2002.
[6]McCarthy,M.&R.Carter.Written and spoken vocabulary[A].In N.Schmitt and M.McCarthy(eds.).Vocabulary:Description,Acquisition and Pedagogy[C].Cambridge:Cambridge University Press,1997.
[7]Petch-Tyson,S.1998.Writer/reader visibility in EFL written discourse A.In S.Granger(ed.).Learner English on Computer C.P p.107-118.
[8]Stubbs,M.Lexical density:A technique and some findings[A].In M.Coulthard(ed.).Talking about Text:Studies Presented to David Brazil on His Retirement:Discourse Analysis Monograph 13[C].Birmingham:English Language Research,1986.
[9]Ure.J.Lexical density and register differentiation[A].In G.E.Perren&I.L.M.Trim(eds.).Applications of Linguistics[C].Cambridge:Cambridge University Press,1971.
[10] 桂诗春,杨惠中.中国学习者英语语料库[M].上海:上海外语教育出版社,2003.
[11] 桂诗春,冯志伟,杨惠中,何安平,卫乃兴,李文中,梁茂成.语料库语言学与中国外语教学[J].现代汉语,2010(11):419-426.
[12] 潘鸣威,邹申.英语专业高年级学习者写作中读者/作者显现度再探——一项基于语料库的分析[J].外语教学,2010(7):48-52.
[13] 文秋芳,丁言仁,王文宇.中国大学生英语书面语中的口语化倾向— —高水平英语学习者语料对比分析[J].外语教学与研究,2003(4):268-274.
[14] 吴瑾,邹青.中国学生英语口笔语语体特征研究:词汇密度与词频[J].山东外语教学,2009(1):8-13.
An Exploration on the Application of Corpus in Teaching College English Writing
CHEN Song-jing
(Department of Foreign Studies,Guangdong Pharmaceutical University,Guangzhou 510655,China)
College English teachers do not fully realize the power of corpus in teaching EFL writing.In fact,they can apply the existing theories and approaches of corpus studies to analyze the major problems lying in their students’work.Taking register features of Chinese learners’written English for examples,the studies in the field of contrastive interlanguage analysis provide us a range of perspectives to investigate the materials.This paper examines a corpus of compositions randomly selected from a writing assignment,trying to tap on the implications of corpus studies to college English writing.
corpus study;college English writing;register feature;composition gluidence
G642
A
1009-3907(2011)08-0107-05
2011-01-06
陈松菁(1978-),女,广东广州人,讲师,硕士研究生,主要从事语篇分析方面研究。
责任编辑:刘 琳