陈丽红
(台州学院 外国语学院,浙江 临海 317000)
语料库语言学的兴起为英语教学和研究提供了新的视角。目前语料库被广泛应用于各个领域,如词典和语法书的编纂、教学大纲的设计和教材编写、词汇、语法、翻译研究和语篇分析等[1]。专业英语写作,是学习者综合语言素质的体现,也是英语专业四级考试的必备题型,其重要性不可小觑。学界对于写作的研究主要集中在教学模式、存在问题和影响因素等方面,而近年来将语料库研究方法运用于写作研究是一种趋势。有鉴于此,本文基于中国大学生英语作文语料库WECCL,从定量和定性两方面分析考察英语专业学生的写作特点,以期为专四写作教学提供有益启示。
中国大学生英语作文语料库WECCL,是“中国学生英语口笔语语料库”(Spoken and Written English Corpus of Chinese Learners)的书面语子库,由南京大学建设。语料主要来源于国内9所不同层次的高校英语专业1-4年级学生作文,语料内容为若干不同题目的英语议论文,长度为200-800词不等,约3059篇,总形符数约为100万[2]。此语料作文能大体反映英语专业学生的写作水平及特点,对专四写作教学具有启发意义。
写作,作为英语学习基本技能之一,是学习者综合语言素质的体现,也是专业英语教学不可或缺的重要内容。随着语料库在外语教学研究领域的兴起,语料库为写作研究提供了新方法和新思路,为外语学习提供了真实的语言素材,采用定量、定性相结合的方法,使专业英语写作研究更具可信性和科学性。本文基于中国大学生英语作文语料库WECCL,从词汇、句法和语篇层面对英语专业作文作一探讨。
(一)词汇特征。词汇是写作的重要特征之一。词汇水平是影响英语写作能力的一个关键因素[3]。词汇特征可从类符/形符比、平均词长等方面进行分析。类符/形符比(TTR)指一个文本所使用的不同词汇数量与语料库总词汇数量的比率。“类符/形符比值的高低与写作者词汇使用的丰富程度和多样性成正比”[4]。因两个语料库的库容量不同,采用标准类符/形符比(STTR)比较科学。平均词长可以反映文本中用词的难易和复杂程度。运用WordSmith Tools6.0,获取WECCL和LOCNESS①LOCNESS为英美大学生作文子库,该语料库所收集的书面语料全部来自英美大学生写的英语议论文,大学生均为成人英语本族语者。本研究共使用200多篇,每篇长度约为1000词,总形符数为182,830。WECCL和LOCNESS虽容量不一样,但文本体裁相同,均为具有较高英语水平的学习者所写,具有较强的可比性。基本语料信息见表1。
表1 WECCL和LOCNESS基本语料信息统计
如表1所示,WECCL的STTR明显小于LOCNESS,这表明中国大学生作文的整体用词不如英美本族语学生的作文丰富多样;WECCL的平均词长小于LOCNESS,说明中国大学生写作中较长词的使用量低于英美本族语学生,作文信息难度降低。
(二)句法特征。中国大学生英语专业写作的句法特征可通过从句或分词形式等句型特征来体现。从句和分词形式可反映句子的长度和复杂程度。从句特点可通过检索连词获得。通过AntConc3.3.5w,结合WECCL语料库的标注形式,人工剔除部分非连词词性,检索出各式连词的使用频次。限于篇幅,本文列举前10位连词的出现频次,如表2所示。
表2 WECCL前10位连词出现频次统计
连接词(connectives or connectors)是一种表示语篇内各单位之间逻辑或语义关系的衔接手段(cohesive device)[5]。连接词的使用可提高句群的连贯性和清晰度,在英语写作中不可或缺。如表2所示,WECCL中and出现频次最高,占50.87%,且前三位均为并列连词,所占比例为70.95%,远远超过其他7个连词的出现频次之和。在剩余7个连词中,表示条件、时间和原因的连词使用较频繁。这表明,中国英语专业大学生在写作时,过度使用并列句。在复合句中,条件、时间和原因等普遍性的状语从句使用比较频繁。根据英语句型特征,英语学习者一般遵从由简单句、并列句到复合句,即由简到繁的顺序来习得句型,从侧面说明中国英语专业大学生在写作时所用句型偏向简单化,句式比较单一。
表现句型特征的另一因素为分词的使用。英语分词属于非谓语动词,可分为现在分词和过去分词,两者均可作状语。当两者均作状语时,可表示时间、原因、让步等句子成分。日常交流中,语言使用者由于默认动作发出者与分词表示的动作之间的主谓或动宾关系,简化了句子结构。这种构句方式依靠的是内在的语义或语序,是一种意合的隐性衔接[6]。因此,对于英语作为中介语的学习者而言,非谓语动词,特别是分词的使用是一大难点,写作中亦是如此。运用AntConc3.3.5w,结合WECCL语料库的标注形式和通配符“*”的使用,检索出连词、现在分词和过去分词的出现频次,并进行频次标准化处理,即连词和分词分别除以文本总形符数再乘1000,使连词和分词出现频次落在共同基数上,具有可比性,如表3所示。
表3 连词和分词标准化频次统计
由表3,现在分词和过去分词的出现频次相当,但分词的出现频次总数远远小于连词,连词的标准化频次是分词的近6倍,明显说明中国英语专业大学生在写作时,比较少运用各种分词形式来表现英语句子的隐性衔接,而是更倾向于使用连词的显性衔接方式。
究其原因,较并列句和复合句,分词的使用难度更大,更难掌握。另外,并列句和表条件、时间等大众型从句,句法结构比较好掌握,又使句子不显得简短,比较受学生青睐。因此,中国英语专业大学生在写作时,避开了比较难把控的各式分词形式,倾向于使用连词组句。
(三)语篇特征。第一和第二人称出现频次是二语学习者书面语口语化的重要参数之一,中国高水平英语学习者的书面语中表现出较强的口语化倾向,与本族语大学生的书面语有着明显距离[7]。鉴于反身代词和名词性物主代词的出现频次很低,研究意义不大,故忽略不计。通过软件AntConc3.3.5w,检索出WECCL第一、第二人称代词的主格、宾格及其形容词性物主代词的出现频次,然后运用对数似然比计算工具(Log-likelihood Ratio Calculator),计算出LLR值和P值,以检验词项跨语料库差异的显著性[8]。WECCL和LOCNESS第一、第二人称出现频次统计见表4。
表4 WECCL和LOCNESS第一、第二人称出现频次统计
据表4,WECCL中第一人称出现频次总数为31657,远远超过LOCNESS中第一人称出现频次总数2365,LLR=1965.22,P=0.000<0.05,说明中国英语专业大学生作文中第一人称出现频次与英美本族语学生作文中第一人称出现频次存在显著性差异。同理,比对WECCL和LOCNESS第二人称出现频次总数,两者亦存在显著差异(LLR=1439.91,P=0.000<0.05)。这表明,中国英语专业大学生作文中第一、第二人称使用频次显著高于本族语学习者,验证了中国高级英语学习者书面语的口语化倾向[9]。
(一)词汇层面。相较于本族语学习者作文的用词,中国英语专业大学生作文用词的难度和丰富性低于本族语学习者。究其原因,中国英语专业大学生语言输入不足,词汇量有限,影响了词汇的输入能力。相关研究表明,语言水平越低者,写作中的词汇重复率就越高[10],词汇丰富度降低,反之亦然。有鉴于此,教师在专四英语写作教学中应鼓励学生制定词汇学习计划,并持之以恒地执行,有针对性地设计一些句子写作练习加以巩固消化,同时还要注重提升作文词汇的丰富性,正确区分词汇的正式和非正式语体,尽量避免句子表达的口语化倾向。
(二)句法层面。论及英语句型,从易到难不外乎简单句、并列句和复合句三大类。据WECCL前10位连词检索结果可知,中国英语专业大学生写作时过度使用并列句,复合句中比较普遍性的条件和时间状语从句使用较多。相较从句和分词形式,从句的使用率高于分词形式。究其原因,中国英语专业大学生英语句型掌握比较浅显单一,句型使用的灵活度和丰富性欠缺。针对现存问题,教师在专四英语写作教学中可设计句型写作练习以巩固英语句型的使用,有意识地引导学生在作文中正确使用简单句、并列句和复合句等各种不同句型,正确使用各式分词形式,使得作文的语言表达张弛有度,富有弹性美。
(三)语篇层面。比对WECCL和LOCNESS第一、二人称出现频次,表明中国英语专业大学生作文存在口语化倾向。鉴于英语作文写作应为书面语语体,故应消除其口语化倾向。在专四英语写作教学中,首先,教师应使学生知晓口语和书面语的差异——口语比较随意,句法结构相对松散,而书面语句法结构严谨且符合语言的逻辑规范。其次,在写作实践中,教师可设计措词和句型练习以帮助学生了解口语和书面语的不同之处。例如,分词短语和独立主格在书面语中更为常见,而其在口语中比较少用。通过从词、句到篇章这一逐步推进形式,引导学生注重词、句和段落的有序衔接,注重语篇的语体,使得专四英语写作符合书面语规范,避免其口语化倾向。
综上所述,基于WECCL作文语料库,通过分析中国英语专业大学生写作特点及其对专四写作教学的启示,我们认为,在词汇层面,中国英语专业大学生作文的整体用词不如本族语学生的作文丰富多样;在句法层面,中国英语专业大学生作文过度使用并列句,分词形式使用率较低;在语篇层面,中国英语专业大学生作文存在口语化倾向。有鉴于此,在专四写作教学中,教师应通过设计各种实践活动,丰富学生的措词,引导学生灵活运用各种句型,且使其语言表达符合书面语规范。